机器学习 —— 概率图模型

时间：2015-12-29 22:31:12 阅读：233 评论：0 收藏：0 [点我收藏+]

标签：

　　概率图模型（PGM）是一种对现实情况进行描述的模型。其核心是条件概率，本质上是利用先验知识，确立一个随机变量之间的关联约束关系，最终达成方便求取条件概率的目的。

1.从现象出发---这个世界都是随机变量

　　这个世界都是随机变量。

　　第一，世界是未知的，是有多种可能性的。

　　第二，世界上一切都是相互联系的。

　　第三，随机变量是一种映射，把观测到的样本映射成数值的过程叫做随机变量。

　　上述三条原则给了我们以量化描述世界的手段，我们可以借此把一个抽象的问题变成一个数学问题。并且借助数学手段，发现问题，解决问题。世界上一切都是未知的，都是随机变量。明天会有多少婴儿降生武汉是随机变量，明天出生婴儿的基因也是随机变量，这些孩子智商高低是随机变量，高考分数是随机变量，月薪几何是随机变量。但是这些随机变量之间完全无关么？男孩，智商高，高考低分，月薪高的概率又有多少？显然，随机变量每增多一个，样本空间就会以指数形式爆表上涨。我们要如何快速的计算一组给定随机变量观察值的概率呢？概率图给出了答案。

2.概率图---自带智能的模型

　　其实在看CRF的时候我就常常在想，基于CRF的词性分割使用了词相邻的信息；基于边缘检测的图像处理使用了像素的相邻信息；相邻信息够么？仅仅考虑相邻像素所带来的信息足够将一个观察（句子或图像）恢复出其本意么？没错，最丰富的关系一定处于相邻信息中，比如图像的边缘对分割的共线绝对不可磨灭，HMM词性分割也效果不错.......但是如果把不相邻的信息引入判断会怎样？在我苦思冥想如何引入不相邻信息的时候Deep Learning 和 CNN凭空出现，不得不承认设计这套东西的人极度聪明，利用下采样建立较远像素的联系，利用卷积将之前产生的效果累加到目前时刻上（卷积的本质是堆砌+变质）。这样就把不相邻的信息给使用上了。但是这样是不是唯一的方法呢？显然不是，还有一种不那么自动，却 not intractable方法，叫做PGM。

　　还是从快速计算条件概率来谈PGM。首先是representation，概率图的表达是一张。。。图。。。图当然会有节点，会有边。节点则为随机变量（一切都是随机变量），边则为依赖关系（现在只谈有向图）。一张典型的概率图如下所示：

技术分享