码迷,mamicode.com
首页 >  
搜索关键字:nltk    ( 189个结果
python 自然语言处理(四)____词典资源
词典或者词典资源是一个词和/或短语及其相关信息的集合,例如:词性和词意定义等相关信息。词典资源附属于文本,而且通常在文本的基础上创建和丰富。下面列举几种nltk中的词典资源。 1. 词汇列表语料库 nltk中包括了一些仅仅包含词汇列表的语料库。词汇语料库是UNIX中的/usr/dict/words文 ...
分类:编程语言   时间:2017-02-19 00:09:21    阅读次数:531
python 自然语言处理(二)____获得文本语料和词汇资源
一, 获取文本语料库 一个文本语料库是一大段文本。它通常包含多个单独的文本,但为了处理方便,我们把他们头尾连接起来当做一个文本对待。 1. 古腾堡语料库 nltk包含古腾堡项目(Project Gutenberg)电子文本档案的一小部分文本。要使用该语料库通常需要用Python解释器加载nltk包, ...
分类:编程语言   时间:2017-02-17 00:17:30    阅读次数:319
python NLTK 环境搭建
这里是我之前亲自操作过安装nltk,安装成功了。当时记得是参考这篇博文:http://www.tuicool.com/articles/VFf6Bza 其中,nltk安装时,遇到模块未找到,依次根据提示对应下载了四五个模块,才成功安装。后来装语料库,也是离线安装的。 1.安装Python(我安装的是 ...
分类:编程语言   时间:2017-01-12 12:59:32    阅读次数:217
【NLP】干货!Python NLTK结合stanford NLP工具包进行文本处理
摘要:NLTK是由宾夕法尼亚大学计算机和信息科学使用python语言实现的一种自然语言工具包,其收集的大量公开数据集、模型上提供了全面、易用的接口,涵盖了分词、词性标注(Part-Of-Speech tag, POS-tag)、命名实体识别(Named Entity Recognition, NER... ...
分类:编程语言   时间:2016-11-07 01:12:27    阅读次数:377
NLTK的安装
Python version 2.7 required, which was not found in the registry 新建一个register.py 文件,把一下代码贴进去, 显示“python 2.7 is already registered” 再安装setuptools的时候,就能 ...
分类:其他好文   时间:2016-10-28 23:14:09    阅读次数:201
一些资料
python的nltk中文使用和学习资料汇总帮你入门提高 blog.csdn.net/huyoo/article/details/12188573 PYTHON自然语言处理中文翻译 NLTK 中文版.pdf http://ishare.iask.sina.com.cn/f/23996193.html ...
分类:其他好文   时间:2016-10-27 19:43:32    阅读次数:132
NLTK中的词性
NOUN n,VERB v ,ADJ a, ADV r, ADJ_SAT s NOUN: [('s', ''), ('ses', 's'), ('ves', 'f'), ('xes', 'x'), ('zes', 'z'), ('ches', 'ch'), ('shes', 'sh'), ('men ...
分类:其他好文   时间:2016-10-24 13:54:26    阅读次数:344
NLP自然语言处理学习笔记二(初试)
前言: 用Python对自然语言处理有很好的库。它叫NLTK。下面就是对NLTK的第一尝试。 安装: 1.安装Pip 比较简单,得益于CentOS7自带的easy_install。执行一行命令就可以搞定。 *在终端控制台->easy_install pip 2.检验Pip是否可用 Pip是Pytho ...
分类:编程语言   时间:2016-10-20 09:52:18    阅读次数:166
NLP笔记
词性标注器 CC 并列连词 RB 副词 IN 连词 JJ 形容词 帮助文档使用 nltk.help.upenn_tagset( 'RB*') text = nltk.Text(word.lower() for word in nltk.corpus.brown.words()) text.simil ...
分类:其他好文   时间:2016-10-18 17:59:17    阅读次数:227
自然语言处理3.1——从网络和硬盘访问文本
文本的最重要来源无疑是网络。探索现成的文本集合是很方便的,然而每个人都有自己的文本来源,需要学习如何去访问他们。 首先,我们要学习从网络和硬盘访问文本。 1.电子书 NLTk语料库集合中存有古腾堡项目的一小部分样例文本,如果你对古腾堡项目其他的文本感兴趣,可以在http://www.gutenber ...
分类:编程语言   时间:2016-10-10 23:29:30    阅读次数:658
189条   上一页 1 ... 11 12 13 14 15 ... 19 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!