本文旨在介绍CoNLL格式的中文依存语料库(汉语依存树库)、CoNLL格式相关工具,以及提供两个公开的中文依存语料库下载。最近做完了分词、词性标注、命名实体识别、关键词提取、自动摘要、拼音、简繁转换、文本推荐,感觉HanLP初具雏形。现在希望拿下依存句法分析,这样我就做出了史上第一个(?)民间句法分...
分类:
其他好文 时间:
2014-11-19 21:59:55
阅读次数:
256
词性标注(Part-of-Speech tagging 或POS tagging),又称词类标注或者简称标注,是指为分词结果中的每个单词标注一个正确的词性的程序,也即确定每个词是名词、动词、形容词或其他词性的过程。在汉语中,词性标注比较简单,因为汉语词汇词性多变的情况比较少见,大多词语只有一个词性,...
分类:
其他好文 时间:
2014-11-19 17:56:35
阅读次数:
152
无事也要记三分,勤劳的开始总是成功的好兆头。今天读一篇文章,"Spectral Curvature Clustering",我瞎猜作者应该是个华人,因为写作的风格很有那么点程式化的味道,一二三,firt ,then next,the end.....有板有眼。看过一些文章之后,发现反而老外写起学术文章来,对文章的结构并不如我们这些母语汉语的人那么严格要求,对其重点阐述的问题,往往事无巨细,说的明白...
分类:
其他好文 时间:
2014-11-16 23:08:06
阅读次数:
187
字头字母与之前军牌相对应汉字所对应单位V军军委、四总部、大区级军直单位K空空军H海海军B北北京军区S沈沈阳军区L兰兰州军区J济济南军区N南南京军区G广广州军区C成成都军区 可以看出,除了军委、四总部以及大区级军直单位所用的字母为“V”字外,其它均采用了单位名称第一个字的汉语拼音首字母作为新式军用车....
分类:
其他好文 时间:
2014-11-16 22:52:48
阅读次数:
445
有些人用vm安装centos的时候,使用简易安装.结果就是进入界面后就傻眼了.如果英文不好的,看到满屏幕的英文估计会直接宕机.时间:11/14--16:18目的:将centos汉化.条件:root用户操作:1、打开终端(右键或alt+ctrl+F2)2、vi/etc/sysconfig/i18n3、改为“LANG="zh_CN.UTF-8"”UTF-8..
分类:
其他好文 时间:
2014-11-14 18:02:50
阅读次数:
196
汉语拼音不好怎么办?网站拼音搜索怎么搞?一切尽在转换神器~软件和源码先发布,等我有时间再讲解~软件下载:http://pan.baidu.com/s/1kTMIxOb 源码下载:http://pan.baidu.com/s/1gdGKVVd 本期推荐:codesmith三层模板英朗大字典 下一期:....
什么是索引拿汉语字典的目录页(索引)打比方:正如汉语字典中的汉字按页存放一样,SQL Server中的数据记录也是按页存放的,每页容量一般为4K 。为了加快查找的速度,汉语字(词)典一般都有按拼音、笔画、偏旁部首等排序的目录(索引),我们可以选择按拼音或笔画查找方式,快速查找到需要的字(词)。同理,...
分类:
数据库 时间:
2014-11-13 09:14:47
阅读次数:
314
前面说了信息与数据的概念,这里要说的是与之关系密切的问题——通信。
通信
何为通信?在英文中,通信用Communication表示,这个词也有交流的意思。实际上,通信和交流确实是一样的意思。不过在汉语中,交流常用来表示人与人之间的交流;而通信一般用于比较专业正式的场合,也就是所谓的术语。
人与人之间的交流,是信息交换的过程;微机系统或模块之间的通信,就是数据传输的过程了。
...
分类:
其他好文 时间:
2014-11-12 19:44:16
阅读次数:
317
这个方法对于已经在汉语字符串周围使用tr()宏的人来说比较有效。按照说明的方法定义一个宏,将其放到全局可见的地方,然后把所有的tr替换成宏的名字即可/*在一个汉字字符串可见的地方声明一个QTextCodeC指针,例如某个对话框要显示汉字,那么可以将其声明为该对话框的成员变量*/QTextCodec ...
分类:
其他好文 时间:
2014-11-12 14:59:45
阅读次数:
168
原文:SQL——索引
1. 什么是索引 索引是SQlServer编排数据的内部方法,是检索表中数据的直接通道。它类似汉语词典里面
的拼音目录,通过它可以快速查找到某个字词。 索引页是数据库中存储说要的数据页。索引页存放检索数据行的关键字页及数据行的地址指针。索引页类似于汉语字典中按拼音或笔画排序的目...
分类:
数据库 时间:
2014-11-10 13:33:59
阅读次数:
220