在go 的程序中调用 c 代码, golang 提供了两种方法: ? cgo, swing 。gstreamer 是开源跨平台的多媒体框架库,主要是在gnome 基础核心库 glib 之上构建。下面有一个简单的使用cgo 包装 gstreamer playbin 插件的...
分类:
其他好文 时间:
2015-02-02 18:22:12
阅读次数:
167
时间总是在不经意之间,从手中溜走,甚至什么都不会告诉你,2014年又过去了,这一年是离别的一年,也是收获的一年,即将就要毕业,在提高班的日子也要三年了,英语的学习也坚持了一年多了,今天主要是英语总结,说说英语的变化。
从学习英语,当时是《体验儿童英语图解学习词典》,点词典是在501最快乐的日子,将自己当成没有学习过英语的孩子,盲目的点,盲目的记,总是在怀疑这样做的目的是什么,看着SB文档...
分类:
其他好文 时间:
2015-01-31 20:41:36
阅读次数:
187
很久之前遇到过因为金山词霸和其他软件冲突导致的程序无响应的情况。没想到今天情况重现,VS2013在可视化编辑NumbericUpDown控件的时候,又出现了”未响应“,发现又是有道词典惹的祸。可见屏幕取词功能还是应该好好研究的,希望微软和有道之间能协调解决一下!!!转自:http://blog.cs...
题目描述:给出一个词典,找出所有的复合词,即恰好有两个单词连接而成的单词。输入每行都是一个由小写字母组成的单词。输入已按照字典序从小到大排序,且不超过12000个单词。输出所有的复合词按照字典序从小到大排列。
思路:用set存储所有的单词,对于每个单词,遍历所有可能子单词组合,然后判断在set中是否都已经存储,若是则输出该单词。算法复杂度为O(n*lgn*|S|),其中|S|表示单词最大长度。
...
分类:
其他好文 时间:
2015-01-28 14:44:22
阅读次数:
131
标准的说法是在词典中取出与给定字符串编辑距离最短的词.首先是编辑距离Levenshtein distance的计算, 通过建立两个字符串的矩阵得到, 优化算法是Wagner–Fischer algorithm, 通过DP可以将计算量降低到O(n2)因为计算编辑距离需要耗费相当的时间, 所以这个问题的...
分类:
其他好文 时间:
2015-01-25 06:28:51
阅读次数:
2430
IKAnalyzer1.3.4要自定义我们自己的词库,而且我们可以随时新增分词,网上查了一圈没有相关资料,看来只有自己搞定了。观察了下IKAnalyzer分词器的配置文件IKAnalyzer.cfg.xml发现其中有这样一个选项:
,而且作者做了注释说这个就是扩展远程词典的。于是打开IKAnalyzer的源码查看,最后在Dictronary这类下找到这个方法:getRemoteWords。经过查...
分类:
其他好文 时间:
2015-01-23 18:34:17
阅读次数:
232
#1014 : Trie树时间限制:10000ms单点时限:1000ms内存限制:256MB描述小Hi和小Ho是一对好朋友,出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助,在编程的学习道路上一同前进。这一天,他们遇到了一本词典,于是小Hi就向小Ho提出了那个经典的问题:“小Ho,你...
分类:
其他好文 时间:
2015-01-21 20:04:07
阅读次数:
149
时间限制:20000ms单点时限:1000ms内存限制:512MB描述前情回顾上回说到,小Hi和小Ho接受到了河蟹先生伟大而光荣的任务:河蟹先生将要给与他们一篇从互联网上收集来的文章,和一本厚厚的河蟹词典,而他们要做的是判断这篇文章中是否存在那些属于河蟹词典中的词语。当时,小Hi和小Ho的水平还是十...
分类:
其他好文 时间:
2015-01-20 15:18:26
阅读次数:
305
实现功能——输入N,M,提供一个共计N个单词的词典,然后在最后输入的M个字符串中进行多串匹配(关于AC自动机算法,此处不再赘述,详见:Aho-Corasick 多模式匹配算法、AC自动机详解。考虑到有时候字典会相当稀疏,所以引入了chi和bro指针进行优化——其原理比较类似于邻接表,这个东西本身和n...
分类:
编程语言 时间:
2015-01-20 00:56:51
阅读次数:
186
http://www.hankcs.com/nlp/corpus/several-revenue-segmentation-system-used-set-of-source-tagging.html我发现几个民间的分词项目的词典很乱,ansj分词的作者承认arrays.dic是从结巴分词抄过来的,...
分类:
其他好文 时间:
2015-01-15 12:35:19
阅读次数:
280