对于上次说的LSA模型,它能解决多个单词一个意义,但是不能解决多个意义一个单词,就是多义词的问题,而PLSA模型能较好的解决这个问题,首先说下,这个模型的假设:
1 假设生成一个单词的过程是这样的:首先选择一篇文章di,然后再次基础上选择一个潜变量zk,最后在此基础上再在选择一个单词。如果p(di,wj)表示第i个文本中第j个单词的概率,根据假设有:
2 另外一个非常重要的假设是,单词wj...
分类:
其他好文 时间:
2014-12-13 21:55:00
阅读次数:
308
个人浏览网页的时候,有打标签的习惯。最近整理以往的标签的时候,发现积累了一些有关七牛公司存储策略的网页,遂决定整理一篇文章处理,以备记忆。当然,也希望对他人有用。 因为七牛公司的存储策略主要基于纠删...
分类:
编程语言 时间:
2014-12-13 21:54:53
阅读次数:
162
一直懒得把项目从svn切换到git的一个重要原因就是不会使用git. 最近觉得必须研究研究了,然后遇到了各种问题,也读了很多文章。 ? ? ? 本文讲讲关于 push tag 失败的问题——搞笑的引用名称。错误信息...
分类:
其他好文 时间:
2014-12-13 21:54:17
阅读次数:
413
个人浏览网页的时候,有打标签的习惯。最近整理以往的标签的时候,发现积累了一些有关七牛公司存储方案的网页,遂决定整理一篇文章处理,以备记忆。当然,也希望对他人有用。
引言:何为纠删码
数据的爆炸式增长使得存储系统的规模不断增加,存储设备的可靠性却一直没有得到显著提高(SSD 从SLC 到MLC 和TLC 可靠性不断下降,磁盘随着单位面积写入数据更多导致可靠性无法提升),从而给数据的持...
分类:
编程语言 时间:
2014-12-13 21:53:17
阅读次数:
413
目录[-]引言:何为纠删码纠删码中运算的基础域———有限域七牛的存储方案 个人浏览网页的时候,有打标签的习惯。最近整理以往的标签的时候,发现积累了一些有关七牛公司存储策略的网页,遂决定整理一篇文章处理,以备记忆。当然,也希望对他人有用。 因为七牛公司的存储策略主要基于纠删码(Erasure Co.....
分类:
编程语言 时间:
2014-12-13 21:45:44
阅读次数:
231
今天看到一篇文章<>, 我个人是认为这个说法是不成立的,但这里面的一些特性对比引起了我的兴趣。
我想尝试下,Go语言所带的一些东西,在C++11中是如何做的,应当很有意思。所以刷刷刷,就有了下面的东西。
目录:
字符串字面值
变量初始化
lambda
值顺序递增
...
分类:
编程语言 时间:
2014-12-13 20:33:40
阅读次数:
214
最近在用ubuntu,ubuntu默认是有安装firefox的 但是是低版本的 而且还是英文的 弄了好久也没弄成中文 没错 我这篇文章就是在ubuntu下面的firefox下所编辑的 (默认输入法实在是太烂了 ) 好了 我们说正题的 ,怎么自己安装一个全新的中文的firefox
首先 先把自带的firefox卸载了
sudo apt-get remove firefox...
分类:
系统相关 时间:
2014-12-13 19:24:33
阅读次数:
260
来到周末,小匹夫终于有精力和时间来更新下博客了。前段时间小匹夫读过一份代码,对其中各种数据结构灵活的使用赞不绝口,同时也大大激发了小匹夫对各种数据结构进行梳理和总结的欲望。正好最近也拜读了若干大神的文章,觉得总结下常用的数据结构以供自己也能灵活的使用变得刻不容缓。那么还是从小匹夫的工作内容入手,就谈...
分类:
编程语言 时间:
2014-12-13 19:20:39
阅读次数:
277
说句实话,写这个真够无聊的.本来看了某位大虾的类似文章,腹诽了几句也就算了.但是昨天晚上有个客户拿着这篇文章问我:你丫的自己做外包,你算几段PHPer?遂感觉那篇文章对某些半通不通之人的误导之深.无法,只有写此文章表明我对PHPer的水平区分的立场.关于具体收入水平,总的来说因为这几年PHP培训班的...
分类:
Web程序 时间:
2014-12-13 19:18:39
阅读次数:
269
今天将跟大家一起分享SCCM中最为重要的一个功能---操作系统分发(OSD),在此文章中会讨论到OSD的初始化配置、镜像的导入、任务序列的创建编辑。并解决大家经常遇到的分发windows7系统分区盘符为D和分发系统时非常慢等待这些问题。1.前提条件在开始操作系统分发之前请大家确保..