如果你刚接触自然语言处理并对她感兴趣,最好读几本这方面的书籍,除了能让你知道自然语言处理各个领域是干什么的外,还能培养一下NLP的感觉。以下四本书是我读研期间阅读和接触过的,如果您还有好书推荐,欢迎补充。1、 《自然语言处理综论》(Speech and Language Processing: A....
分类:
编程语言 时间:
2015-06-22 12:19:14
阅读次数:
147
一、 什么是StandfordParser?StandfordParser是Stanford NLP小组提供的一系列工具之一,是用来完成语法分析的任务。StanfordParser可以找出句子中词语之间的dependency关联信息,并且以StanfordDependency格式输出,包括有向图及树...
分类:
其他好文 时间:
2015-06-13 22:48:40
阅读次数:
526
Reference:http://licstar.net/archives/328 (比较综合的词向量研究现状分析)起源:One-hot Representation、PCA序:为什么NLP在模式识别里面比较难?Licstar的文章开头这么提到:语言(词、句子、篇章等)属于人类认知过程中产生的高层认...
分类:
其他好文 时间:
2015-06-12 22:01:12
阅读次数:
21115
继上次分享了经典统计语言模型,最近公众号中有很多做NLP朋友问到了关于word2vec的相关内容, 本文就在这里整理一下做以分享。 本文分为
概括word2vec
相关工作
模型结构
Count-based方法 vs. Directly predict
几部分,暂时没有加实验章节,但其实感觉word2vec一文中实验还是做了很多工作的,希望大家有空最好还是看一下。...
分类:
其他好文 时间:
2015-06-07 17:33:51
阅读次数:
480
preface:在走着走着的道路上,总会有些想法或者总结的念头,便想要记录下来,以备不时之需。ps:卤主搞自然语言处理相关,仅这块有些想法。
一、学好理论基础
卤主等有想法再些。
二、从数据入手,分析数据,看准需要实现的目标
无论科研还是工作,大同小异:做东西。在掌握基本方法(SVM, HMM, CRF, RF, LR等分类,聚类,回归工具)与工具(语言工具python,分...
分类:
其他好文 时间:
2015-06-02 18:03:01
阅读次数:
154
preface: 最近在做一个多分类的问题,数据格式要求跟libsvm接受的格式很像,为图方便,试着用下libsvm, 习惯用python, 那就用python版本的吧。
工欲擅其事,必先利其器。Libsvm下载:http://www.csie.ntu.edu.tw/~cjlin/libsvm/,Download LIBSVM那一栏,下载libsvm包。也可以从网盘下载:http://pan...
分类:
编程语言 时间:
2015-05-30 12:14:45
阅读次数:
1146
写英语论文很折磨人。平时用英语写的少,关键时候写的头痛死。记起前段时间在知乎上看了一个哥们写的NLP潜在热门方向,介绍了自动语法错误校正(具体名称记不起来了,当时没有收藏,现在找不到了)。就不知道怎么想到NLPCC2014上新加坡国立大学Hwee
Tou Ng教授的特邀报告Automated Grammatical Error Correction: The State of the Art。...
分类:
其他好文 时间:
2015-05-26 23:28:45
阅读次数:
555
在自然语言处理(NLP)技术上处于领先地位的公司Teragram 被商业智能和分析软件供应商SAS收购(08年3月17日),宣称使用自然语言处理搜索技术的Powerset被微软收购(08年7月1日),在文本分析方面领先的Inxight被...
分类:
编程语言 时间:
2015-05-25 16:54:11
阅读次数:
5722
首次处理英文语料,需要进行一些基础的NLP处理,首选工具当然是Stanford CoreNLP。由于Stanford CoreNLP官方示例的解析结果不宜直接使用,所以我在它的基础上进行修改,最终将解析结果转为json格式,并依照哈工大ltp的解析结果的格式,将依存句法的解析结果也添加到json中。
1、Stanford CoreNLP的安装
最新版的Stanford CoreNLP仅支持jd...
分类:
Web程序 时间:
2015-05-25 14:32:57
阅读次数:
259