我喜欢基于web应用来工作。实现一个从任何地方、任何设备都可运行的应用,是十分有吸引力。在过去的几个月,我一直在尝试获取一些在Javascript上运行的基础轻量级机器学习算法,然后用它们构建”智能的”web应用。随着Node的出现,在服务器端训练模型进而用这些模型在客户端做预测已经成为可能。我研究...
                            
                            
                                分类:
编程语言   时间:
2014-11-10 13:29:55   
                                阅读次数:
254
                             
                         
                    
                        
                            
                            
                                本文主要讨论了机器学习中的最大似然估计MLE,贝叶斯估计和最大后验估计MAP,以及它们的关系,是上一篇《机器学习浅析之最优解问题》的深入。
最大似然估计MLE
Frequentist Learning假定存在模型M,其中未知参数为.该参数的估计值为. 给定样本观察数据X,通过选择合适的θ值,可以使产...
                            
                            
                                分类:
其他好文   时间:
2014-11-10 13:29:51   
                                阅读次数:
276
                             
                         
                    
                        
                            
                            
                                在这篇文章中,我们一起来讨论一种叫作“神经网络”(Neural Network)的机器学习算法,这也是我硕士阶段的研究方向。我们将首先讨论神经网络的表层结构,在之后再具体讨论神经网络学习算法。 神经网络实际上是一个相对古老的算法,并且沉寂了一段时间,不过到了现在它又成为许多机器学习问题的首选技术。 ...
                            
                            
                                分类:
Web程序   时间:
2014-11-10 13:25:18   
                                阅读次数:
187
                             
                         
                    
                        
                            
                            
                                作者 Jonathan
 Allen ,译者 张晓鹏 
Splunk的用户大会已经接近尾声。三天时间的会议里,共进行了160多个主题研讨,涵盖了从安全、运营到商业智能,甚至包括物联网,会议中一遍又一遍出现相同的中心主题:大数据的关键是机器学习。
存储不再是一个问题。从运行Hadoop兼容节点的专用存储硬件,到数百台使用普通硬盘的计算机组成的集群,毫无疑问,我们具备了处理这类存储问...
                            
                            
                                分类:
其他好文   时间:
2014-11-10 12:04:34   
                                阅读次数:
165
                             
                         
                    
                        
                            
                            
                                回归1)多元线性回归(1)模型建立多元线性回归讨论的的是变量y与非随机变量x1……xm之间的关系,假设他们具有线性关系,于是有模型:y=b0+b1x1+……+bmxm+e这里的e~N(0,a2),b0,……,bn,a2都是未知数。上式矩阵表达式为:y=xb+e对于一组样本(x00……x0m,y0)……(xn0..
                            
                            
                                分类:
编程语言   时间:
2014-11-10 01:19:31   
                                阅读次数:
406
                             
                         
                    
                        
                            
                            
                                阅读导读:
1.什么是PeopleRank?
2.PeopleRank和PageRank有什么区别?
3.PR分析微博数据时,如何对微博单个账号评分?
4.R语言如何递归计算矩阵特征值?
5.如何计算粉丝的关注度?
1.
 PeopleRank和PageRank
PageRank让Google成为搜索领域的No.1,也是当今最有影响力的互联网公司之一,用技术创新改变人们...
                            
                            
                                分类:
其他好文   时间:
2014-11-09 18:05:01   
                                阅读次数:
249
                             
                         
                    
                        
                            
                            
                                尝试用最简单易懂的描述解释清楚机器学习中会用到的拉格朗日对偶性知识
                            
                            
                                分类:
其他好文   时间:
2014-11-09 15:14:58   
                                阅读次数:
188
                             
                         
                    
                        
                            
                            
                                本文主要参考资料 最小错误率是在统计的意义上说的,请注意其含义。 在这里要弄清楚条件概率这个概念。P(*|#)是条件概率的通用符号,在“|”后边出现的#为条件,之前的*为某个事件,即在某条件#下出现某个事件*的概率。P(ωK|X)是表示在X出现条件下,样本为ωK类的概率。 一个事物在某条件...
                            
                            
                                分类:
其他好文   时间:
2014-11-09 12:38:23   
                                阅读次数:
223
                             
                         
                    
                        
                            
                            
                                接上一节课,这一节课的主题是如何利用 Regularization 避免 Overfitting。通过给假设集设定一些限制条件从而避免  Overfitting,但是如果限制条件设置的不恰当就会造成 Underfitting。最后讲述了选择 Regularization 的一些启发式方法。...
                            
                            
                                分类:
其他好文   时间:
2014-11-09 11:18:36   
                                阅读次数:
129
                             
                         
                    
                        
                            
                            
                                阅读导读:
1.如何设计职位推荐引擎的指标?
2.简述职位推荐引擎所需要的系统架构?
3.如何对推荐结果进行人工比较?
4.职位推荐引擎中什么情况的数据最好做排除?
1.
 Mahout推荐系统框架概述
Mahout框架包含了一套完整的推荐系统引擎,标准化的数据结构,多样的算法实现,简单的开发流程。Mahout推荐的推荐系统引擎是模块化的,分为5个主要部分组成:数据模...
                            
                            
                                分类:
其他好文   时间:
2014-11-08 23:43:08   
                                阅读次数:
501