在学习nlp自然语言处理的过程中,免不了要使用中文分词资源作为分词依据或前期调研。所以想研究中文分词,第一步需要解决的就是资源问题。 作为中文信息处理的壁垒,中文分词在国内的关注度似乎远远超过了自然语言处理的其他研究领域。在中文分词中,资源的重要性又不言而喻,最大匹配法(正向、逆向)等需要一个好的词 ...
分类:
其他好文 时间:
2016-09-03 14:56:01
阅读次数:
197
最近在看《Python自然语言处理》中文版这本书,可能由于是从py2.x到py3.x,加上nltk的更新的原因,或者作者的一些笔误,在书中很多代码都运行不能通过,下面我就整理一下一点有问题的代码。 第一章: p3.该处为小建议,书中没有错误:关于nltk.book的下载,最好下载到'/nltk_da ...
分类:
编程语言 时间:
2016-08-31 15:19:33
阅读次数:
466
卷积神经网络(Convolution Neural Network, CNN)在数字图像处理领域取得了巨大的成功,从而掀起了深度学习在自然语言处理领域(Natural Language Processing, NLP)的狂潮。2015年以来,有关深度学习在NLP领域的论文层出不穷。尽管其中必定有很多 ...
分类:
编程语言 时间:
2016-08-25 23:56:56
阅读次数:
232
转载请注明地址(http://blog.csdn.net/xinzhangyanxiang/article/details/8522078) 学习概率的时候,大家一定都学过马尔科夫模型吧,当时就觉得很有意思,后来看了数学之美之隐马模型在自然语言处理中的应用后,看到隐马尔科夫模型竟然能有这么多的应用, ...
分类:
其他好文 时间:
2016-08-22 16:06:58
阅读次数:
161
C#编程实现 这篇文章做了什么 朴素贝叶斯算法是机器学习中非常重要的分类算法,用途十分广泛,如垃圾邮件处理等。而情感分析(Sentiment Analysis)是自然语言处理(Natural Language Progressing)中的重要问题,用以对文本进行正负面的判断,以及情感度评分和意见挖掘 ...
分类:
编程语言 时间:
2016-08-08 00:56:04
阅读次数:
390
一周乱谈(第八周) - 中文分词 中文分词 NLP(Natural language processing)自然语言处理一直都是比较热门的领域,现在不管是搜索,推荐神马的基本都需要和nlp打交道,而中文的nlp处理的第一步就是分词了,所以中文分词一直扮演者举足轻重的角色。当然了,分词的算法也是层出不 ...
分类:
其他好文 时间:
2016-08-08 00:45:38
阅读次数:
195
中文分词 NLP(Natural language processing)自然语言处理一直都是比较热门的领域,现在不管是搜索,推荐神马的基本都需要和nlp打交道,而中文的nlp处理的第一步就是分词了,所以中文分词一直扮演者举足轻重的角色。当然了,分词的算法也是层出不穷,从最初的字典匹配到后来的统计模 ...
分类:
其他好文 时间:
2016-08-06 20:34:56
阅读次数:
182
最近准备学习自然语言处理相关的知识,推荐大家阅读《统计自然语言处理·宗成庆》和《Natural Language Processing with Python》,第一篇主要介绍的是NLP的基础知识和概念介绍,希望对大家有所帮助。
一. 概念介绍
二. 自然语言处理基本方法...
分类:
编程语言 时间:
2016-08-05 01:04:17
阅读次数:
323
8月18日,国内首个数据可视化搜索平台——“数趣”将正式上线,它标志着东湖大数据交易中心打通数据变现的“最后一公里”,完成了大数据全产业链的关键布局。数趣网(www.dataqu.cn)是东湖大数据依托大数据采集技术、智能图片识别、中文自然语言处理、主题聚类算法等技术,通..
分类:
其他好文 时间:
2016-08-04 19:41:24
阅读次数:
308
【摘要】:条件随机场用于序列标注,数据分割等自然语言处理中,表现出很好的效果。在中文分词、中文人名识别和歧义消解等任务中都有应用。本文源于笔者做语句识别序列标注过程中,对条件随机场的了解,逐步研究基于自然语言处理方面的应用。成文主要源于自然语言处理、机器学习、统计学习方法和部分网上资料对CRF介绍的... ...
分类:
其他好文 时间:
2016-08-03 20:28:24
阅读次数:
298