国家语言文字工作委员会重点项目《现代汉语规范词典》完成新一轮修订,推出第3版。这是国内首部全面贯彻《通用规范汉字表》的中型语文词典。“微信”“失联”“正能量”“吐槽”“拍砖”收入,“吊丝”“白富美”“超女”等落选。 此次《现代汉语规范词典》(第3版)在修订过程中,可谓与时俱进,增补了上百条体现...
分类:
其他好文 时间:
2014-08-28 16:50:20
阅读次数:
179
词典的格式设计词典中所保存的信息主要是三部分:Term字符串Term的统计信息,比如文档频率(Document Frequency)倒排表的位置信息其中Term字符串如何保存是一个很大的问题,根据上一章基本原理的表述中,我们知道,写入文件的Term是按照字典顺序排好序的,那么如何将这些排好序的Ter...
分类:
其他好文 时间:
2014-08-28 11:21:39
阅读次数:
404
javascript的函数式编程是多么引人入胜,jQuery使代码尽可能的精简,intelligent!defer - 必应词典:v.迁延;听从;扣存;【军】使延期入伍,所以deferred对象的含义就是"延迟"到未来某个点再执行。jQuery的官方文档给出了用jQuery.ajax()发送请求...
分类:
编程语言 时间:
2014-08-27 23:26:48
阅读次数:
366
一、兼容类库ActionBarSherlock: Action Bar是Android 3.0后才开始支持的,ActionBarSherlock是让Action Bar功能支持2.X后的所有平台,而且他会自动的判断是调用原生Action Bar还是使用扩展ActionBar。在我的小熊词典里有用到这...
分类:
移动开发 时间:
2014-08-27 18:20:58
阅读次数:
406
接上一讲。本节我们把词典功能基本实现,首先上一个效果图,我发现大家比较关心界面方面的东西,我之前写的一个关于QQ界面的项目就很受欢迎,当然我现在能写出远比那个好看的界面。但是我想一个应用最核心的东西不完全在界面,一个好的创意,一个好的后台服务才是成功的关键,这也是我不断学习的方向。 另外我发现...
分类:
移动开发 时间:
2014-08-26 22:48:58
阅读次数:
489
神经概率语言模型,内容分为三块:问题,模型与准则,实验结果。[此节内容未完待续...]1,语言模型问题 语言模型问题就是给定一个语言词典包括v个单词,对一个字串做出二元推断,推断其是否符合该语言表达习惯。也就是的取值为0或者为1。 概率语言模型放松了对取值的限制,让其在0~1之间取值(语言模...
分类:
其他好文 时间:
2014-08-24 23:45:53
阅读次数:
361
做检索怎么都绕不过中文分词去,学习一下用IKAnalyzer分词器做中文分词。Game Starts参考文档 1) 中文分词之Java实现使用IK Analyzer实现 2) IKAnalyzer 独立使用 配置扩展词典 依赖jar包 1) IKAnalyzer2012FF_u1.jar 最...
分类:
其他好文 时间:
2014-08-21 00:03:03
阅读次数:
240
最近写了一个查单词的类似有道词典的软件,里面就有一个自动补全功能(即当你输入一个字母时,就会出现几个候选项)。这个自动补全功能十分常见,百度搜索关键词时就会出现。不过它们这些补全功能都是与你输入的进行首字匹配,有时也会不方便。例如,如果我输入一个“好”,如果是首字匹配的话会出现下图:
如果是句中匹配的话,则是这种情况:
你可以根据自己的要求进行选择哪一种模式。...
分类:
其他好文 时间:
2014-08-20 00:07:05
阅读次数:
416
最近实习在做一个跟语音相关的项目,就在度娘上搜索了很多关于语音的API,顺藤摸瓜找到了科大讯飞,虽然度娘自家也有语音识别、语义理解这块,但感觉应该不是很好用,毕竟之前用过百度地图的API,有问题也找不到人帮忙解决(地图开发者群里都是潜水的)...不得不说,科大讯飞在语音这块尤其是中文识别方面做的.....
首先是关于希腊字符的发音,每个字符对应有一个单词,通过单词则可在词典中听它们的发音,下图给出每个字符的发音,当然英语读音和原始的希腊读音肯定是有区别的,不过还是以英语发音为主吧。关于希腊字符的写法就比较麻烦,有自己的风格就好,不用太强求,下面是是正确的笔顺,来自http://www.founda.....
分类:
其他好文 时间:
2014-08-19 14:28:24
阅读次数:
609