在机器学习领域,集成学习由于可以提高学习系统的泛化能力,因此被广泛关注使用。对于集成学习可以分为两个阶段: 1)对训练数据集构造出多个基分类器。 这些基分类器的构造通常采用数据子集或者特征子集的方法进行构造,加上随机子集的方法,保证构造出的多个基分类器相互之间具有差异性 ...
                            
                            
                                分类:
其他好文   时间:
2014-11-10 21:35:02   
                                阅读次数:
1935
                             
                         
                    
                        
                            
                            
                                八、核(kernel)
如果样本点为线性不可分,那么,需要将数据映射到高维空间,使在原始空间内其线性可分变为线性可分。如下图所示:
上文提到,分类器可以写成:
}+b" alt="">
那么,如果使用一种映射的方法,将低维数据映射到高维(),使得线性不可分变为线性可分。称为特征映射函数,这样,分类器就变为:
}+b" alt="">
(1)实例
低维映射到高维能否...
                            
                            
                                分类:
其他好文   时间:
2014-11-10 13:55:52   
                                阅读次数:
421
                             
                         
                    
                        
                            
                            
                                我喜欢基于web应用来工作。实现一个从任何地方、任何设备都可运行的应用,是十分有吸引力。在过去的几个月,我一直在尝试获取一些在Javascript上运行的基础轻量级机器学习算法,然后用它们构建”智能的”web应用。随着Node的出现,在服务器端训练模型进而用这些模型在客户端做预测已经成为可能。我研究...
                            
                            
                                分类:
编程语言   时间:
2014-11-10 13:29:55   
                                阅读次数:
254
                             
                         
                    
                        
                            
                            
                                本文主要讨论了机器学习中的最大似然估计MLE,贝叶斯估计和最大后验估计MAP,以及它们的关系,是上一篇《机器学习浅析之最优解问题》的深入。
最大似然估计MLE
Frequentist Learning假定存在模型M,其中未知参数为.该参数的估计值为. 给定样本观察数据X,通过选择合适的θ值,可以使产...
                            
                            
                                分类:
其他好文   时间:
2014-11-10 13:29:51   
                                阅读次数:
276
                             
                         
                    
                        
                            
                            
                                在这篇文章中,我们一起来讨论一种叫作“神经网络”(Neural Network)的机器学习算法,这也是我硕士阶段的研究方向。我们将首先讨论神经网络的表层结构,在之后再具体讨论神经网络学习算法。 神经网络实际上是一个相对古老的算法,并且沉寂了一段时间,不过到了现在它又成为许多机器学习问题的首选技术。 ...
                            
                            
                                分类:
Web程序   时间:
2014-11-10 13:25:18   
                                阅读次数:
187
                             
                         
                    
                        
                            
                            
                                作者 Jonathan
 Allen ,译者 张晓鹏 
Splunk的用户大会已经接近尾声。三天时间的会议里,共进行了160多个主题研讨,涵盖了从安全、运营到商业智能,甚至包括物联网,会议中一遍又一遍出现相同的中心主题:大数据的关键是机器学习。
存储不再是一个问题。从运行Hadoop兼容节点的专用存储硬件,到数百台使用普通硬盘的计算机组成的集群,毫无疑问,我们具备了处理这类存储问...
                            
                            
                                分类:
其他好文   时间:
2014-11-10 12:04:34   
                                阅读次数:
165
                             
                         
                    
                        
                            
                            
                                回归1)多元线性回归(1)模型建立多元线性回归讨论的的是变量y与非随机变量x1……xm之间的关系,假设他们具有线性关系,于是有模型:y=b0+b1x1+……+bmxm+e这里的e~N(0,a2),b0,……,bn,a2都是未知数。上式矩阵表达式为:y=xb+e对于一组样本(x00……x0m,y0)……(xn0..
                            
                            
                                分类:
编程语言   时间:
2014-11-10 01:19:31   
                                阅读次数:
406
                             
                         
                    
                        
                            
                            
                                阅读导读:
1.什么是PeopleRank?
2.PeopleRank和PageRank有什么区别?
3.PR分析微博数据时,如何对微博单个账号评分?
4.R语言如何递归计算矩阵特征值?
5.如何计算粉丝的关注度?
1.
 PeopleRank和PageRank
PageRank让Google成为搜索领域的No.1,也是当今最有影响力的互联网公司之一,用技术创新改变人们...
                            
                            
                                分类:
其他好文   时间:
2014-11-09 18:05:01   
                                阅读次数:
249
                             
                         
                    
                        
                            
                            
                                尝试用最简单易懂的描述解释清楚机器学习中会用到的拉格朗日对偶性知识
                            
                            
                                分类:
其他好文   时间:
2014-11-09 15:14:58   
                                阅读次数:
188
                             
                         
                    
                        
                            
                            
                                接上一节课,这一节课的主题是如何利用 Regularization 避免 Overfitting。通过给假设集设定一些限制条件从而避免  Overfitting,但是如果限制条件设置的不恰当就会造成 Underfitting。最后讲述了选择 Regularization 的一些启发式方法。...
                            
                            
                                分类:
其他好文   时间:
2014-11-09 11:18:36   
                                阅读次数:
129