本人由于英语渣,在linux底下经常看文档,但是有没有想有道词典这种软件,所以遇到不懂的单词只能手动复制粘贴在网上查找,这样就很不方便,学了python之后,就试着自己尝试下个在命令行下查找单词翻译的脚本。 在我眼里,实现上面这个要求的脚本语言分几块完成: 一是选好一个单词翻译的网站,优先选择GE....
分类:
编程语言 时间:
2014-07-08 23:27:20
阅读次数:
334
搜集了一些资料,与同学一起进行了简单的測试,总结例如以下。分词工具特点支持语言原理词典及扩展性StandardAnalyzer中文、英文(unicode)中文:单字符切分英文:依据空格切分ChineseAnalyzer中文,不支持中文和英文及数字混合的文本分词按字分词,与StandardAnalyz...
分类:
其他好文 时间:
2014-07-08 23:15:59
阅读次数:
231
不戚戚于贫贱,不汲汲于富贵 ---五柳先生Given a stringsand a dictionary of wordsdict, determine ifscan be segmented into a space-separated sequence of one or more dict.....
分类:
其他好文 时间:
2014-07-03 20:21:27
阅读次数:
225
1.引言
题目的意思应该是:在一个给定的字典中,求与给定的字符串的编辑距离不大于2的所有的单词。原先写过两片关于此问题的文章,那两片篇章文章给出两种解决思路:其一是暴力求解法,这种方法最容易想到。就是将词典中的词一一与给定的字符串计算编辑距离,不大于2的输出,大于2的舍弃,这种方法思路简单但是很费时间。其二根据词典中这些词之间的编辑距离建立一个以单词为节点的Trie树,遍历的...
分类:
其他好文 时间:
2014-06-27 23:31:21
阅读次数:
241
elasticsearch本身的中文分词插件效果都不理想,手动添加词典可以在一定程度上进行弥补。
经过多次实验发现,mmseg的分词机制采用正向最长匹配算法,例如,针对“小时代”这个单词,其自带的词典中没有包含该词,故当用户搜索小时代时,检索不到任何结果。
在咸鱼老婆的虚心指导下,我终于找到了解决办法。
手动添加该词到mmseg的词库中,有两种方法:
1、将该词加入到自带的某个词典中(非停...
分类:
其他好文 时间:
2014-06-27 09:30:33
阅读次数:
232
搜集了一些资料,与同学一起进行了简单的測试,总结例如以下。分词工具特点支持语言原理词典及扩展性StandardAnalyzer中文、英文(unicode)中文:单字符切分英文:依据空格切分ChineseAnalyzer中文,不支持中文和英文及数字混合的文本分词按字分词,与StandardAnalyz...
分类:
其他好文 时间:
2014-06-26 16:38:46
阅读次数:
160
搜集了一些资料,与同学一起进行了简单的測试,总结例如以下。分词工具特点支持语言原理词典及扩展性StandardAnalyzer中文、英文(unicode)中文:单字符切分英文:依据空格切分ChineseAnalyzer中文,不支持中文和英文及数字混合的文本分词按字分词,与StandardAnalyz...
分类:
其他好文 时间:
2014-06-26 00:11:42
阅读次数:
259
泛化允许你定义一个宽松、可重用的函数或类型,泛化也能避免代码的重复,能以更清楚和抽象的方式来表达意图。
泛化是Swift语言提供的强大功能之一,Swift提供的许多标准库都使用泛化来创建,如Swift提供的数组和词典类型。通过使用泛化,你能使用一个数组和词典来包含和存储任何类型的元素。
1.1 泛化函数
使用Swift语言你能定义一...
分类:
移动开发 时间:
2014-06-24 15:31:55
阅读次数:
364
网上有一些同学问我的项目和具体情况,了解实习的机会, 等等. 这是我目前 (2014年春夏之交) 在必应团队具体管的项目:中国区:必应输入法 (PC 版本) (安卓版)必应词典客户端 (PC/Android/WP/iPhone/iPad/Surface)必应搜索 App (iPhone / iPad...
分类:
其他好文 时间:
2014-06-18 15:10:20
阅读次数:
221
搜集了一些资料,与同学一起进行了简单的測试,总结例如以下。分词工具特点支持语言原理词典及扩展性StandardAnalyzer中文、英文(unicode)中文:单字符切分英文:依据空格切分ChineseAnalyzer中文,不支持中文和英文及数字混合的文本分词按字分词,与StandardAnalyz...
分类:
其他好文 时间:
2014-06-18 14:09:29
阅读次数:
162