摘要:写本文的初衷源于基于HMM模型序列标注的一个实验,实验完成之后,迫切想知道采用的序列标注模型的好坏,有哪些指标可以度量。于是,就产生了对这一专题进度学习总结,这样也便于其他人参考,节约大家的时间。本文依旧旨在简明扼要梳理出模型评估核心指标,重点达到实用。本文布局如下:第一章采用统计学习角度介绍... ...
分类:
其他好文 时间:
2016-07-19 20:28:08
阅读次数:
535
Pooling 为了解决convolved之后输出维度太大的问题 在convolved的特征基础上采用的不是相交的区域处理 http://www.wildml.com/2015/11/understanding-convolutional-neural-networks-for-nlp/ 这里有一个... ...
分类:
其他好文 时间:
2016-07-17 11:40:24
阅读次数:
281
一、今天学习Python自然语言处理(NLP processing) 需要安装自然语言工具包NLTK Natural Language Toolkit 按照教程在官网https://pypi.python.org/pypi/nltk#downloads下载的EXE文件运行,电脑出现缺少: api-m ...
摘要:最早接触马尔可夫模型的定义源于吴军先生《数学之美》一书,起初觉得深奥难懂且无什么用场。直到学习自然语言处理时,才真正使用到隐马尔可夫模型,并体会到此模型的妙用之处。马尔可夫模型在处理序列分类时具体强大的功能,诸如解决:词类标注、语音识别、句子切分、字素音位转换、局部句法剖析、语块分析、命名实体... ...
分类:
其他好文 时间:
2016-07-12 15:08:46
阅读次数:
146
摘要:最早接触马尔可夫模型的定义源于吴军先生《数学之美》一书,起初觉得深奥难懂且无什么用场。直到学习自然语言处理时,才真正使用到隐马尔可夫模型,并体会到此模型的妙用之处。马尔可夫模型在处理序列分类时具体强大的功能,诸如解决:词类标注、语音识别、句子切分、字素音位转换、局部句法剖析、语块分析、命名实体... ...
分类:
其他好文 时间:
2016-07-11 23:42:54
阅读次数:
430
如何产生好的词向量? 词向量、词嵌入(word vector,word embedding)也称分布式表示(distributed representation),想必任何一个做NLP的研究者都不陌生。如今词向量已经被广泛应用于各自NLP任务中,研究者们也提出了不少产生词向量的模型并开发成实用的工具 ...
分类:
其他好文 时间:
2016-06-26 11:38:24
阅读次数:
786
Accessing Text Corpora and Lexical Resources(文本语料库和词汇资源) 常用文本预料和词汇资源,如何通过python访问这些资源。 2.1 Accessing Text Corpora 语料:大量的文本资源。 访问语料的三个接口: raw(fileids) ...
分类:
编程语言 时间:
2016-06-24 00:04:19
阅读次数:
230
Ch1 Language Processing with Python 1.1 Computing with Language: Texts and Words 将文本看作是待处理的原始数据。 Searching Text nltk.text.Text.concordance(self,word): ...
分类:
编程语言 时间:
2016-06-19 21:21:34
阅读次数:
234
Preface 自然语言经过一代又一代的处理,很难依靠明确的规则来表述。简单的NLP:通过比较词频来比较不同的写作风格;复杂的nlp:理解人类语言,并给出相应。 NLP应用:手写字符识别,搜索引擎,机器翻译等; NLP在学术界,又叫做计算语言学; 本书组织 Ch1-3:python处理nlp的简单介 ...
分类:
编程语言 时间:
2016-06-19 12:51:39
阅读次数:
124
CS224d:Deep Learning for Natural Language Processing 中文翻译:深度学习与自然语言处理 CS224u:Natural Language Understanding CS224n:Natural Language Processing CS246:M ...
分类:
其他好文 时间:
2016-06-18 12:42:59
阅读次数:
804