1、nltk.text.Text common_context([x1,x2]):列出text中,词a和b拥有相同上下文的次,例如:a x1 boy, a x2 boy.那函数结构就是a_boy,中间横线就是这两者都行2、nltk.text.Text similar(x1)查询和x1相似的词。 但是...
分类:
其他好文 时间:
2015-02-27 01:26:32
阅读次数:
182
包括Python,eclipse,jdk,pydev,pip,setuptools,beautifulsoup,pyyaml,nltk,mysqldb的下载安装配置。*************************************************python下载:python-2....
分类:
编程语言 时间:
2015-02-26 18:08:07
阅读次数:
183
爬虫:scrapy,beautifulsoup自然语言处理:nltk,Pattern(Google,Twitter,andWikipediaAPIs,awebcrawler,aHTMLDOMparser),结巴分词科学计算:NumPy,SciPy,matplotlib机器学习、数据挖掘:scikit-learn,pandas,MDP(neuralnetworks),PyBrain(neuralnetworks),Theano(GPU,deeplearn..
分类:
编程语言 时间:
2015-02-07 19:02:28
阅读次数:
185
原文:http://www.52nlp.cn/python-网页爬虫-文本处理-科学计算-机器学习-数据挖掘曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python。离开腾讯创业后,第一个作品课程图...
分类:
编程语言 时间:
2015-02-03 10:43:59
阅读次数:
241
曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python。离开腾讯创业后,第一个作品课程图谱也是选择了Python系的Flask框架,渐渐的将自己的绝大部分工作交给了Python。这些年来,接触和使...
分类:
编程语言 时间:
2015-01-31 07:05:41
阅读次数:
327
python版本3.4.2:1、书上的例子是from nltk.corpus import wordnet as wnwn.synset('car.n.01').lemma_names #获得同义词集wn.synset('car.n.01').definition #获得定义在3.4.2下执行得.....
分类:
其他好文 时间:
2015-01-15 01:38:45
阅读次数:
644
功能描述:
获取某个路径下的所有文件,提取出每个文件中出现频率最高的前300个字。保存在数据库当中。
前提,你需要配置好nltk
#!/usr/bin/python
#coding=utf-8
'''
function : This script will create a database named mydb then
abstract keywo...
分类:
编程语言 时间:
2014-12-18 13:41:20
阅读次数:
135
系统环境是win7(64bit)+python3.4(64bit)+numpy1.82+vs20121.假设用sourceforge上编译好的32bit的exe安装,会提示‘python version ** required,which was not found in the registry’...
分类:
其他好文 时间:
2014-10-14 19:37:15
阅读次数:
268
python自然语言处理包 NLTK 环境搭建...
分类:
编程语言 时间:
2014-09-30 11:52:19
阅读次数:
209
步骤1:构建语料库: #!/usr/bin/env?python
#-*-coding=utf-8-*-
#数据源目录(二级目录)
sourceDataDir=‘data‘
#数据源文件列表
fileLists?=?[]
import?os
from?gensim?import?corpora,?models,?s...
分类:
其他好文 时间:
2014-09-26 20:13:58
阅读次数:
330