简介: Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费的,非商业化的,基于JAVA环境下开源的机器学习(machine learning)以及数据挖掘(data minining)软件。 Weka存储数据的...
                            
                            
                                分类:
其他好文   时间:
2014-11-05 14:18:28   
                                阅读次数:
209
                             
                         
                    
                        
                            
                            
                                Machine Learning:Linear Regression With One Variable
       机器学习可以应用于计算机视觉,自然语言处理,数据挖掘等领域,可以分为监督学习(Supervised Learning),无监督学习(Unsupervised Learning),强化学习(Reinforcement Learning)等。
       首先我们从一个简单...
                            
                            
                                分类:
系统相关   时间:
2014-11-05 00:30:58   
                                阅读次数:
256
                             
                         
                    
                        
                            
                            
                                阅读导读:
1.R语言如何检查文件或目录是否存在?如何重命名一个文件?
2.R语言如何查看和修改目录的权限?
3.R语言如何删除一个文件?
4.用R语言管理一个文件系统时,都有哪些特殊的目录?
5.如何查看R软件指定包所在目录?
1.
 文件系统介绍
计算机的文件系统是一种存储和组织计算机数据的方法,它使得对其访问和查找变得容易,文件系统使用文件和树形目录的抽象...
                            
                            
                                分类:
编程语言   时间:
2014-11-05 00:28:34   
                                阅读次数:
323
                             
                         
                    
                        
                            
                            
                                概率 理解概率最简单的方式就是把它们想像成韦恩图中的元素。首先你有一个包含全部可能输出(比如一个实验的)的全集,如今你对当中的一些子集感兴趣,即一些事件。如果我们在研究癌症,所以我们观察人们看他们是否患有癌症。在研究中,如果我们把全部參与者当成我们的全集,然后对不论什么一个个体来说都有两种可能的结论...
                            
                            
                                分类:
其他好文   时间:
2014-11-04 17:02:23   
                                阅读次数:
225
                             
                         
                    
                        
                            
                            
                                机器学习算法 原理、实践与实战 —— 感知机感知机(perceptron)是二分类的线性分类模型,输入为特征向量,输出为实例的类别,取值+1和-1。感知机学习旨在求出将训练数据进行线性划分的分离超平面,为此,引入了基于误分类的损失函数,利用梯度下降法对损失函数进行极小化,求得感知机模型。1. 感知机...
                            
                            
                                分类:
其他好文   时间:
2014-11-03 14:26:40   
                                阅读次数:
270
                             
                         
                    
                        
                            
                            
                                朴素贝叶斯(NaiveBayesian)算法的核心思想是:分别计算给定样本属于每个分类的概率,然后挑选概率最高的作为猜测结果。假定样本有2个特征x和y,则其属于分类1的概率记作p(C1|x,y),它的值无法直接分析训练样本得出,需要利用公式间接求得。其中p(Ci)表示训练样本中分类为Ci的..
                            
                            
                                分类:
编程语言   时间:
2014-11-03 10:22:12   
                                阅读次数:
246
                             
                         
                    
                        
                            
                            
                                1. Classification 这篇文章我们来讨论分类问题(classification problems),也就是说你想预测的变量 y 是一个离散的值。我们会使用逻辑回归算法来解决分类问题。 之前的文章中,我们讨论的垃圾邮件分类实际上就是一个分类问题。类似的例子还有很多,例如一个在线交易网站判...
                            
                            
                                分类:
其他好文   时间:
2014-11-02 23:44:56   
                                阅读次数:
474
                             
                         
                    
                        
                            
                            
                                LambdaMART是Learning To Rank的其中一个算法,适用于许多排序场景。它是微软Chris Burges大神的成果,最近几年非常火,屡次现身于各种机器学习大赛中,Yahoo! Learning to Rank Challenge比赛中夺冠队伍用的就是这个模型,据说Bing和Facebook使用的也是这个模型。
本文先简单介绍LambdaMART模型的组成部分,然后介绍与该模型相关的其他几个模型:RankNet、LambdaRank,接着重点介绍LambdaMART的原理,然后介绍Lambd...
                            
                            
                                分类:
其他好文   时间:
2014-11-02 18:14:11   
                                阅读次数:
450
                             
                         
                    
                        
                            
                            
                                1:简单概念描写叙述如果如今有一些数据点,我们用一条直线对这些点进行拟合(改线称为最佳拟合直线),这个拟合过程就称为回归。训练分类器就是为了寻找最佳拟合參数,使用的是最优化算法。基于sigmoid函数分类:logistic回归想要的函数可以接受全部的输入然后预測出类别。这个函数就是sigmoid函数...
                            
                            
                                分类:
其他好文   时间:
2014-11-02 16:28:04   
                                阅读次数:
263