码迷,mamicode.com
首页 > 编程语言 > 详细

【机器学习】EM的算法

时间:2017-06-19 23:23:23      阅读:320      评论:0      收藏:0      [点我收藏+]

标签:函数   最大值   分析   ssi   一个   机器   高斯   聚类算法   问题   

EM的算法流程:

初始化分布参数θ;

重复以下步骤直到收敛

        E步骤:根据参数初始值或上一次迭代的模型参数来计算出隐性变量的后验概率,其实就是隐性变量的期望。作为隐藏变量的现估计值:

       技术分享

 

        M步骤:将似然函数最大化以获得新的参数值:

          技术分享

        这个不断的迭代,就可以得到使似然函数L(θ)最大化的参数θ了。那就得回答刚才的第二个问题了,它会收敛吗?

感性的说,因为下界不断提高,所以极大似然估计单调增加,那么最终我们会到达最大似然估计的最大值。理性分析的话,就会得到下面的东西:

技术分享

具体如何证明的,看推导过程参考:Andrew Ng《The EM algorithm》

http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006936.html

 EM算法另一种理解

坐标上升法(Coordinate ascent):

技术分享

       图中的直线式迭代优化的路径,可以看到每一步都会向最优值前进一步,而且前进路线是平行于坐标轴的,因为每一步只优化一个变量。

       这犹如在x-y坐标系中找一个曲线的极值,然而曲线函数不能直接求导,因此什么梯度下降方法就不适用了。但固定一个变量后,另外一个可以通过求导得到,因此可以使用坐标上升法,一次固定一个变量,对另外的求极值,最后逐步逼近极值。对应到EM上,E步:固定θ,优化Q;M步:固定Q,优化θ;交替将极值推向最大。

EM的应用

       EM算法有很多的应用,最广泛的就是GMM混合高斯模型、聚类、HMM等等。具体可以参考JerryLead的cnblog中的Machine Learning专栏:

  (EM算法)The EM Algorithm

  混合高斯模型(Mixtures of Gaussians)和EM算法

  K-means聚类算法

http://blog.csdn.net/zouxy09/article/details/8537620

【机器学习】EM的算法

标签:函数   最大值   分析   ssi   一个   机器   高斯   聚类算法   问题   

原文地址:http://www.cnblogs.com/zeze/p/7050965.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!