Trie树,也叫字典树、前缀树。可用于”predictive text”和”autocompletion”,亦可用于统计词频(边插入Trie树边更新或添加词频)。
在计算机科学中,trie,又称前缀树或字典树,是一种有序树,用于保存关联数组,其中的键通常是字符串。与二叉查找树不同,键不是直接保存在节点中,而是由节点在树中的位置决定。一个节点的所有子孙都有相同的前缀,也就是这个节点对应的字符串...
分类:
编程语言 时间:
2014-10-28 13:54:45
阅读次数:
366
Trie树,也叫字典树、前缀树。可用于”predictive text”和”autocompletion”,亦可用于统计词频(边插入Trie树边更新或添加词频)。在计算机科学中,trie,又称前缀树或字典树,是一种有序树,用于保存关联数组,其中的键通常是字符串。与二叉查找树不同,键不是直接保存在节点...
分类:
其他好文 时间:
2014-10-28 13:51:40
阅读次数:
546
PHP 原生的similar_text()函数、levenshtein()函数对中文汉字支持不好,我自己写了一个similar_text()中文汉字版 1 $d[$mb_len1][$mb_len2], 'count_same_letter' => $count_same_letter);...
分类:
Web程序 时间:
2014-10-26 22:31:06
阅读次数:
276
在使用 readdir() 遍历指定目录时,使中文目录和文件名都正常显示需要使用 iconv() 进行文件编码转换: 1 ';13 echo '目录'.$dirname.'下面的内容';14 echo '';15 echo '文件名文件大小文件类型修改时间';16 17 while($file = ...
分类:
Web程序 时间:
2014-10-26 13:06:04
阅读次数:
225
Pinyin4j只能算是Java开源类库,但是在Android的应用开发中也经常被用到。大家都用过手机的通讯录,通讯录的搜索联系人的功能,用pinyin4j就可以实现。下面我给大家带来这个例子,使用pinyin4j实现搜索联系人功能。
首先先对pinyin4j做一个简单的介绍:
pinyin4j是一个流行的Java库,支持中文字符和拼音之间的转换,拼音的输出格式也可以定制,并且支持汉字的多音字...
分类:
移动开发 时间:
2014-10-24 20:46:25
阅读次数:
319
搜集了一些资料,与同学一起进行了简单的測试,总结例如以下。分词工具特点支持语言原理词典及扩展性StandardAnalyzer中文、英文(unicode)中文:单字符切分英文:依据空格切分ChineseAnalyzer中文,不支持中文和英文及数字混合的文本分词按字分词,与StandardAnalyz...
分类:
其他好文 时间:
2014-10-24 20:43:52
阅读次数:
270
支付本地化,相信很多人对这个概念还有点陌生,但相信对语言本地化这个词语就很熟悉了,大多数国家使用的语言都不同,当你的用户来自全球各地,只支持一种语言是不够的,如果面向中国市场最好支持中文,如果你做德国市场,那么德语将是必不可少的,巴西则需要葡萄牙语...
语言本地化很重要,那支付呢?也是一个道理。支付的本地化的重要性主要有以下几个原因:...
分类:
其他好文 时间:
2014-10-22 18:17:24
阅读次数:
322
今天做silverlight打印实现时,发现一个问题,就是sl打印处理的文字很模糊 这样肯定不行撒,于是开始找解决办法,首先想到的是silverlight中文显示的问题,好嘛, 参照网上的解决方案将支持中文的宋体包引入并应用后台代码:样式:发布,测试打印之后,咳咳,还是不行...好吧,换台打印机.....
分类:
Web程序 时间:
2014-10-22 12:39:49
阅读次数:
163
安装Git以及TortoiseGit两者结合使用比较好,需要注意的是,Git默认是不支持中文,需要修改配置文件来支持修改方法:http://blog.csdn.net/son_of_god/article/details/7341928另外还需要注意的是,如果之后,进行了git的更新,之前的修改会被...
分类:
其他好文 时间:
2014-10-20 21:06:22
阅读次数:
211