PHPAnalysis是目前广泛使用的中文分词类,使用反向匹配模式分词,因此兼容编码更广泛,现将其变量与常用函数详解如下:一、比较重要的成员变量$resultType = 1 生成的分词结果数据类型(1 为全部, 2为 词典词汇及单个中日韩简繁字符及英文, 3 为词典词汇及英文) ...
                            
                            
                                分类:
Web程序   时间:
2014-06-15 09:39:46   
                                阅读次数:
196
                             
                         
                    
                        
                            
                            
                                /*
*Copyright (c) 2013, 烟台大学计算机学院
* All rights reserved.
* 作    者:马广明
* 完成日期:2014 年 6 月 7 日
* 版 本 号:v1.0
* 问题描述:电子词典
*/
#include 
#include 
#include 
#include 
using namespace std;
clas...
                            
                            
                                分类:
其他好文   时间:
2014-06-14 17:52:17   
                                阅读次数:
209
                             
                         
                    
                        
                            
                            
                                拼音输入法输出的候选分成两个部分,系统词以及短句(智能组词),智能组词是通过model以及解码弄出来的,后续再说。
系统词就是那些常用的词(词组)收录到词典中,用户的输入和词典中的词match时,直接吐出来,而不需要解码获得。
系统词以及对应的rank(score)对输入法的体验很大,毕竟大多数用户还是继续短词输入。
系统词包含几个部分:
1.基础词
2.高频短串
3....
                            
                            
                                分类:
其他好文   时间:
2014-06-10 19:17:09   
                                阅读次数:
231
                             
                         
                    
                        
                            
                            
                                twitter对存档的tweet使用lucene做全量索引,新发的推文则是实时索引,实时检索(10秒之内索引)。实时索引和检索系统叫EarlyBird。
感觉写得比较清楚简洁,只要这些信息足够真实可信,完全可以做实现参考。
我简单做了几个记录: 
1)基于lucene + java,michael busch是lucene committer
2)词典直接用哈希表,因此不支持term的pr...
                            
                            
                                分类:
其他好文   时间:
2014-06-08 05:51:59   
                                阅读次数:
482
                             
                         
                    
                        
                            
                            
                                一、中文分词:分词就是利用计算机识别出文本中词汇的过程。 
1.典型应用:汉字处理:拼音输入法、手写识别、简繁转换 ;信息检索:Google 、Baidu ;内容分析:机器翻译、广告推荐、内容监控 
;语音处理:语音识别、语音合成 。 2.分词难点:歧义、新词等。 3.分词技术:机械分词(查词典FMM/...
                            
                            
                                分类:
其他好文   时间:
2014-06-07 06:04:35   
                                阅读次数:
511
                             
                         
                    
                        
                            
                            
                                1.failed to lock XXXXX.spl文件
这是你建索引的时候会出现的问题,是你没有把打开的的searchd服务给关闭,因为你打开searchd服务时,他会建立一个叫xxx.spl的临时文件,建索引的时候就会出现冲突
2.FATAL: Tokenizer initialization failure.
词典路径不对,修改实际安装字典路径,默认使用相对路径,建议使用绝对路径。
...
                            
                            
                                分类:
其他好文   时间:
2014-06-05 04:32:19   
                                阅读次数:
324
                             
                         
                    
                        
                            
                            
                                1、、、、、、,作为标题使用,并且依据重要性递 减。 
是最高的等级。2、作为段落利用行高(line-height)很容易的定义出行间距3、、、无序列表,有序列表也挺常用。在web标准化过程中,还被更多的用于导航条,本来导航条就是个列表。4、、、dl就是“定义列表”。比如说词典里面的词的解释、定义就可...
                            
                            
                                分类:
Web程序   时间:
2014-06-04 18:47:11   
                                阅读次数:
307
                             
                         
                    
                        
                            
                            
                                (Linux)有道词典命令行版配置教程:先看效果:使用命令:#youdao 
要查询的单词就可以获取该单词的释义教程开始:(1)去现在有道词典的开源版本(仅110行代码,不要惊讶)下载地址:http://sourceforge.net/projects/yodao-free/(2)安装python。这...
                            
                            
                                分类:
其他好文   时间:
2014-06-02 13:36:24   
                                阅读次数:
254
                             
                         
                    
                        
                            
                            
                                http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
http://www.w3.org/1999/xhtml">
在线词典
在线词典精彩无限
查询英文
请输入英文:
查询中文
请输入中文:
  山东省邵氏科技股份有限公司
  地址:山东省济南市山大北路。...
                            
                            
                                分类:
Web程序   时间:
2014-06-02 04:43:21   
                                阅读次数:
305
                             
                         
                    
                        
                            
                            
                                男人的担当在词典中,“担当”是接受并负起责任的意思,是作为动词出现的,意在强调行为的重要性。人们常说“要敢于担当”,其实,“担当” 
如果要与勇气挂钩,则就忽略了其作为品质的根本。因为在一些特殊的关头,只有品质才会自然而然地发挥作用。在这种意义上,责任也是一种意识。我写此文的目的是想让男人们明白,在遇...
                            
                            
                                分类:
其他好文   时间:
2014-05-24 11:28:42   
                                阅读次数:
189