1、python的nltk中文使用和学习资料汇总帮你入门提高http://blog.csdn.net/huyoo/article/details/12188573
分类:
其他好文 时间:
2015-09-24 19:22:18
阅读次数:
129
NumPy丰富的数值计算SciPy科学计算NLTK自然语言处理MLpy基于最上面两种的机器学习模块Shogun大规模机器学习工具箱OpenStack完全用python实现的开源的laaS的解决方案参考社区:华蟒用户组在模块第一行加上#!/usr/bin/python指的是用python去运行文件,用./module.py既可以运行这..
分类:
其他好文 时间:
2015-08-28 02:23:03
阅读次数:
243
之前下载过一个PDF,书名是《用python进行自然语言处理》,挺有意思的,加上NLP和机器学习目前大热,想趁着暑假涉猎一下。于是开始了入门NLP之旅。安装环境:Ubuntu14.04桌面版,python版本:2.7第一步:安装nltk,首先要安装pip工具:sudo apt-get install...
分类:
其他好文 时间:
2015-08-27 15:11:35
阅读次数:
136
NLTK是Python的一个自然语言处理的模块,其中实现了朴素贝叶斯分类算法。以下,就使用上一篇文中提到的数据,来应用这个模块实现朴素贝叶斯分类。NLTK的实现更加泛化,所以在应用到我们的数据上时需要做一点的转化。
首先来看一下NLTK官方文档中给出的一个简单明了的例子,在了解这个例子之后,再设法将同样的模型应用到自己的数据集上。官方给出的例子是英文名中,在知道名字中最后一个字母后,判断...
分类:
其他好文 时间:
2015-08-10 20:10:15
阅读次数:
651
基于python 自然语言处理工具包 :NLPT(natural language processing toolkit)? ,安装时 sudo pip -U install nltk NLPT的网址 Natural language processing toolkits Name Language License Creators Website ...
分类:
其他好文 时间:
2015-08-10 16:21:46
阅读次数:
143
《python自然语言处理时》第28页有这样一个命令--text3.generate()---功能是:产生一些与text3风格类似的随机文本。
用NLTK3.0.4和Python2.7.6来实现时却出现错误:'Text' object has no attribute 'generate' .
探索一下后发现问题所在:
打开nltk文件夹中的text.py发现了,原来新版本的NLTK...
分类:
编程语言 时间:
2015-08-09 14:10:22
阅读次数:
156
出现unicode decode error解决办法是修改nltk包internals.py的java()下增加cmd的参数,cmd = ["-Dfile.encoding=UTF-8"] + cmd,(https://github.com/nltk/nltk/issues/929)另外需要注意un...
分类:
其他好文 时间:
2015-07-20 10:49:34
阅读次数:
104
preface: 最近忙着的项目想试着用斯坦福的parser,来解析句子生成句法分析树,然后分析子树,与treekernal结合起来,训练。stanford parser神器下载下来了,可使用却是蛋疼。一大堆说明,却没个方便快捷关于总的介绍。
一、必先利其器
stanford parser主页:http://nlp.stanford.edu/software/lex-parser.sh...
分类:
其他好文 时间:
2015-07-12 00:20:50
阅读次数:
244
3.加工原料文本3.1 字符串:最底层的文本处理我们侧重于将文本作为一个词链表。通过使用NLTK 中的语料库接口,我们可以忽略这些文本所在的文件。一个词的内容,一个文件的内容在编程语言中是由一个叫做字符串的基本数据类型来表示的。3.2使用Unicode进行文字处理Unicode 支持超过一百万种字符...
分类:
编程语言 时间:
2015-07-01 17:21:33
阅读次数:
964
1.自然语言工具包(NLTK)NLTK 创建于2001 年,最初是宾州大学计算机与信息科学系计算语言学课程的一部分。从那以后,在数十名贡献者的帮助下不断发展壮大。如今,它已被几十所大学的课程所采纳,并作为许多研究项目的基础。表P -2 列出了NLTK 的一些最重要的模块。这本书提供自然语言处理领域非...
分类:
编程语言 时间:
2015-07-01 13:41:18
阅读次数:
291