【摘要】:条件随机场用于序列标注,数据分割等自然语言处理中,表现出很好的效果。在中文分词、中文人名识别和歧义消解等任务中都有应用。本文源于笔者做语句识别序列标注过程中,对条件随机场的了解,逐步研究基于自然语言处理方面的应用。成文主要源于自然语言处理、机器学习、统计学习方法和部分网上资料对CRF介绍的... ...
分类:
其他好文 时间:
2016-08-03 09:00:33
阅读次数:
197
你在控制流程,因为你自己决定调用函数的顺序。但是使用事件时,你将函数绑定到事件上,然后触发事件,通过框架反过来调用函数。这时候控制反转到由框架来定义而不是你自己手写代码。DI是一个具体的IoC类型。组件不需要关心它自己的依赖项,依赖关系由框架来提供。条件随机场用于序列标注,数据分割等自然语言处理中,... ...
分类:
其他好文 时间:
2016-08-02 17:03:56
阅读次数:
143
【摘要】:条件随机场用于序列标注,数据分割等自然语言处理中,表现出很好的效果。在中文分词、中文人名识别和歧义消解等任务中都有应用。本文源于笔者做语句识别序列标注过程中,对条件随机场的了解,逐步研究基于自然语言处理方面的应用。成文主要源于自然语言处理、机器学习、统计学习方法和部分网上资料对CRF介绍的... ...
分类:
其他好文 时间:
2016-08-02 15:11:54
阅读次数:
171
一: 正则在Perl、Py森、Ruby、Java等语言中文本的正则表达式几乎是一样的 以前常用到的在网上都有现成的例子拿来用,比如电话格式、邮箱格式之类的。 但是自然语言处理中往往会根据自己的需求来制定一个表达式,如果正则的知识掌握的比较片面,在编写自然语言处理程序时可能会觉得苦恼。 在《自然语言处 ...
分类:
其他好文 时间:
2016-08-01 22:49:26
阅读次数:
273
这篇课堂笔记将介绍不同类型的RNN(递归神经网络),并介绍它在NLP领域的应用和优势。
在这篇课笔记中,我们会一起学习一种新的模型,这种模型绝对是以前介绍的那种递归神经网络的加强版!递归神经网络(RNNs)十分适用于有层次的、本身就有递归结构的数据集。...
分类:
编程语言 时间:
2016-07-31 00:24:45
阅读次数:
301
yu Code 15 Comments 机器学习(ML),自然语言处理(NLP),信息检索(IR)等领域,评估(Evaluation)是一个必要的 工作,而其评价指标往往有如下几点:准确率(Accuracy),精确率(Precision),召回率(Recall)和F1-Measure。(注: 相对来 ...
分类:
其他好文 时间:
2016-07-22 21:07:15
阅读次数:
940
说明:本文为斯坦福大学CS224d课程的中文版内容笔记,已得到斯坦福大学课程@Richard Socher教授的授权翻译与发表
1.语言模型
语言模型用于对特定序列的一系列词汇的出现概率进行计算。一个长度为m的词汇序列{w1,…,wm}的联合概率被表示为P(w1,…,wm)。由于在得到具体的词汇之前我们会先知道词汇的数量,词汇wi的属性变化会根据其在输入文档中的位置而定,而联合概率P(w1,…,wm)的计...
分类:
编程语言 时间:
2016-07-19 10:47:20
阅读次数:
311
本文为斯坦福大学CS224d课程的中文版内容笔记,已得到斯坦福大学课程@Richard Socher教授的授权翻译与发表...
分类:
编程语言 时间:
2016-07-19 10:07:15
阅读次数:
456
随着人们对机器学习在很多关键领域的应用如数据挖掘、自然语言处理、图像识别和专家系统等方面所扮演的重要角色的认识越来越深入,机器学习变得如火如荼。机器学习能够在所有这些和更多的领域提供潜在的解决方案,并且将成为我们未来文明的支柱。 机器学习是什么? 那么机器学习到底是什么呢?机器学习实际上包括很多很多 ...
分类:
其他好文 时间:
2016-07-18 03:01:14
阅读次数:
146
一、今天学习Python自然语言处理(NLP processing) 需要安装自然语言工具包NLTK Natural Language Toolkit 按照教程在官网https://pypi.python.org/pypi/nltk#downloads下载的EXE文件运行,电脑出现缺少: api-m ...