文字总结自《Mahout in Action》中文版第六章的内容1.1 数据集介绍Wikipedia数据集:一篇文章到另外一篇文章的链接。
可以将文章看作是用户,将该文章指向的文章视为该源文章所喜欢的物品。
类型:单向布尔型偏好。
相似性评估算法:LogLikelihoodSimilarity
关于LogLikelihoodSimilarity具体算法思想见:
对数似然比相似度 - xid...
分类:
编程语言 时间:
2016-05-12 14:14:34
阅读次数:
316
Bayes贝叶斯
一、Bayes小故事
贝叶斯(约1701-1761) Thomas Bayes,英国数学家。约1701年出生于伦敦,做过神甫。1742年成为英国皇家学会会员。1761年4月7日逝世。
贝叶斯定理在概率统计是最经典的内容之一,但是本人却是一个谜团。没人知道他是怎么当选英国皇家学会会士,也没有记录表明他发表过任何科学或数学论文,据说他从事数学研究的目...
分类:
其他好文 时间:
2016-05-12 12:45:16
阅读次数:
376
最大似然函数
我们没法直接用求导解方程的办法直接求得最大值。可以采用EM算法
换成公式3形式求最大似然函数,其中Qi(z(i))用以下求,p(xi,zi;θ)为下式分子带入3中求最大似然函数的参数值为2.
其中 ,并且 也顺理成章地可以估计为 。
重复迭代前面两步,直到似然函数的值收敛为止。
下列为GMM参考代码l连接点击...
分类:
其他好文 时间:
2016-05-12 12:37:15
阅读次数:
195
Basis(基础):MSE(Mean Square Error 均方误差),LMS(LeastMean Square 最小均方),LSM(Least Square Methods 最小二乘法),MLE(MaximumLikelihood Estimation最大似然估计),QP(Quadratic Programming 二次规划), CP(Conditional Probability条件概率),...
分类:
编程语言 时间:
2016-05-07 07:58:05
阅读次数:
237
EM算法 作者:樱花猪 摘要: 本文为七月算法(julyedu.com)12月机器学习第十次次课在线笔记。EM算法全称为Expectation Maximization Algorithm,既最大期望算法。它是一种迭代的算法,用于含有隐变量的概率参数模型的最大似然估计和极大后验概率估计。EM算法经常 ...
分类:
编程语言 时间:
2016-05-05 10:51:58
阅读次数:
225
Basis(基础): MSE(Mean Square Error 均方误差),LMS(LeastMean Square 最小均方),LSM(Least Square Methods 最小二乘法),MLE(MaximumLikelihood Estimation最大似然估计),QP(Quadratic ...
分类:
其他好文 时间:
2016-05-05 07:02:42
阅读次数:
180
问题引入先思考这样一个问题:我们知道,人群中人的身高大致服从一个正态分布。那么现在,如果说我拿到了一个班的学生(就姑且假设是100人吧!)的身高,我想请你帮我估计一下,这个正态分布的参数θ:N(μ,σ)\theta:N(\mu,\sigma)。如何估计?好简单。应用极大似然估计的思想,把每一个样本拿出来相乘,求解得到概率最大的那个参数,即为我们想要的参数θ\theta好,现在我们将问题增加一点点难度...
分类:
编程语言 时间:
2016-04-29 19:29:06
阅读次数:
285
问题引入先思考这样一个问题:我们知道,人群中人的身高大致服从一个正态分布。那么现在,如果说我拿到了一个班的学生(就姑且假设是100人吧!)的身高,我想请你帮我估计一下,这个正态分布的参数θ:N(μ,σ)\theta:N(\mu,\sigma)。如何估计?好简单。应用极大似然估计的思想,把每一个样本拿出来相乘,求解得到概率最大的那个参数,即为我们想要的参数θ\theta好,现在我们将问题增加一点点难度...
分类:
编程语言 时间:
2016-04-26 21:35:52
阅读次数:
298
1.数学 2.机器学习 Java 机器学习 工具 & 库 1.处理小数据效果好 2.深度学习—大数据,超过500w;图像,语言方面效果奇好 SVD 最小二乘法 梯度下降法 局部加权回归 1.最大似然估计 2.logistic回归 3.感知器的初步—logistic的简化情节 牛顿法 1.介绍了牛顿方 ...
分类:
其他好文 时间:
2016-04-23 11:53:53
阅读次数:
699
上篇学习了PDF的参数估计方法,主要有最大似然估计和贝叶斯估计,他们主要对有确定形式的PDF进行参数估计,而在实际情况下,并不能知道PDF的确切形式,只能通过利用所有样本对整个PDF进行估计,而且这种估计只能是利用数值方法求解。...
分类:
其他好文 时间:
2016-04-22 20:12:06
阅读次数:
171