最大概率分词是一种最基本的统计方法分词。一个待分割的字符串有多种分词结果,最大概率分词的原则是将其中概率最大的那个作为该字符串的分词结果。
第一部分 理论基础
如对一个字符串:
S:有意见分歧
分词结果1: w1:有/ 意见/ 分歧/
分词结果2: w2:有意/ 见/ 分歧/
最大概率分...
分类:
其他好文 时间:
2014-07-19 11:22:44
阅读次数:
161
在最大概率法分词的程序中,由于每个词出现的次数分布非常不均匀,而且我们要计算每个词出现的概率,对于出现次数比较少的词概率就很小,求句子中词的概率之积的时候,需要将好多非常小的数作乘法,可能会将超出计算机所能表示的数的最小范围。为了便于计算,常常要将每个词的概率求对数后在进行计算,但是由于对概率求对数后变为负值,因此要求对应的相反数。所以一个词出现的次数越多,最后求得对应的值越小,我们将这个值称为这...
分类:
其他好文 时间:
2014-07-19 02:46:06
阅读次数:
236
#include #include int in[9]={1,2,3,4,5,6,7,8,9};int s[9];int re[3][3];int sum(int su[]){ int i,re=0; for(i=0;su[i];i++) re+=su[i]; ret...
分类:
编程语言 时间:
2014-07-13 22:08:59
阅读次数:
342
#include using namespace std;//概率计算PIint
main(){ int inside=0; double val; int i; for ( i=0; i<100000000; i++) {
double x = (dou...
分类:
其他好文 时间:
2014-05-04 11:47:49
阅读次数:
262