PLSA模型的再理解以及源码分析
之前写过一篇PLSA的博文,其中的收获就是知道PLSA是LSA在概率层面的扩展,知道了PLSA是一种主题模型,知道了PLSA中的参数估计使用的是EM算法。当时我就认为,这样子经典好用的算法,我是会回头再来理解它的,这样子才会有更加深刻的心得。所以有了这篇PLSA模型的再理解。
1. 两种思路解PLSA模型
参考了很多...
分类:
其他好文 时间:
2015-01-30 22:50:32
阅读次数:
663
一般在设备默认情况下cisco与中兴三层设备通过OSPF协议连接,在低于500的包是可以ping通的,但是一旦超过500,就将丢包。这是因为ppp封装的时候cisco设备默认将包分片,中兴设备不支持分片重组,所以导致接受数据无法匹配。但如果将MTU减小到500之后,cisco设备即使分片,也是..
分类:
系统相关 时间:
2015-01-28 10:00:48
阅读次数:
209
接着上一节介绍控件拖放的设计。 通过前面的介绍知道,我们的区域类型的容器控件有三种:Card、Table、Mixed。 Card 可以支持几乎所有的常用控件,包括:文本TextField、多文本TextArea、数字NumberField、金额NumberField、日期DateField、...
分类:
Web程序 时间:
2015-01-28 00:52:21
阅读次数:
375
1.请参见图示。“O*E2 0.0.0.0/0 [110/1] via 192.168.1.1, 00:05:34, Serial0/0”一行中的“O*E2”代表什么含义?
内部第 2 类 OSPF 路由。
距离至少两跳远的外部 OSPF 路由。
来自两个不同源的外部 OSPF 路由。
不会增加开销的外部 ...
分类:
其他好文 时间:
2015-01-24 21:27:33
阅读次数:
679
之前,在交换机(vxworks系统)测试的时候报了一个很诡异的问题:运行ospf路由协议的时候造成设备重启,而打印的break信息是在ripng模块死机。经过了多天的跟踪测试,终于发现是由于ospf任务中存在大量终端导致栈空间溢出进而修改了ripng模块的全局变量,后来把栈空间改大点就没问题了。但是这个问题是怎么发现的呢?在任务切换(vxworks是基于任务的)时加钩子函数,判断那个全局变量是否已...
分类:
其他好文 时间:
2015-01-22 15:39:55
阅读次数:
214
配置ospf域间可以互相通信,以及ospf到rip之间的通信1.基本配置:R1:noipdomainlookupintloopback0ipadd1.1.1.1255.255.255.255ints0/0ipadd12.1.1.1255.255.255.0clora64000\\配置时钟noshR2:noipdomainlookupintloopback0ipadd2.2.2.2255.255.255.255ints0/0ipadd12.1.1.225..
分类:
其他好文 时间:
2015-01-20 18:21:21
阅读次数:
290
实验拓扑图:步骤:一,使用VPCS配置各PC机的IP地址:二,在各路由器上配置IP地址和路由协议R1:R1(config)#intf0/0R1(config-if)#ipadd192.168.20.2255.255.255.0R1(config-if)#noshutR1(config)#intf0/1R1(config-if)#ipadd192.168.30.1255.255.255.0R1(config-if)#noshutR1(..
分类:
其他好文 时间:
2015-01-20 06:41:26
阅读次数:
489
SVD分解SVD分解是LSA的数学基础,本文是我的LSA学习笔记的一部分,之所以单独拿出来,是由于SVD能够说是LSA的基础,要理解LSA必须了解SVD,因此将LSA笔记的SVD一节单独作为一篇文章。本节讨论SVD分解相关数学问题,一个分为3个部分,第一部分讨论线性代数中的一些基础知识,第二部分讨论...
分类:
其他好文 时间:
2015-01-13 14:16:41
阅读次数:
160
基于概率统计的PLSA模型,并且用EM算法学习模型参数。PLSA的概率图模型如下
其中D代表文档,Z代表隐含类别或者主题,W为观察到的单词,表示单词出现在文档的概率,表示文档中出现主题下的单词的概率,给定主题出现单词的概率。并且每个主题在所有词项上服从Multinomial
分布,每个文档在所有主题上服从Multinomial 分布。整个文档的生成过程是这样的:
(1) 以的概率选中文...
分类:
其他好文 时间:
2015-01-09 22:26:13
阅读次数:
347
LSA and SVD
LSA(隐性语义分析)的目的是要从文本中发现隐含的语义维度-即“Topic”或者“Concept”。我们知道,在文档的空间向量模型(VSM)中,文档被表示成由特征词出现概率组成的多维向量,这种方法的好处是可以将query和文档转化成同一空间下的向量计算相似度,可以对不同词项赋予不同的权重,在文本检索、分类、聚类问题中都得到了广泛应用,在基于贝叶斯算法及KNN算法的ne...
分类:
其他好文 时间:
2015-01-09 20:59:37
阅读次数:
265