码迷,mamicode.com
首页 >  
搜索关键字:nltk    ( 189个结果
关于遇到NLTK下载路径的一个小问题。
Resource punkt not found. Please use the NLTK Downloader to obtain the resource: > import nltk > nltk.download(
分类:其他好文   时间:2019-08-24 09:52:51    阅读次数:425
NLTK实现文本切分
之前已经了解了使用nltk库,将文本作为参数传入相应函数进行切分的方法,下面看看使用正则表达式如何来进行文本切分。 1. 使用正则表达式切分 1.1 通过RegexpTokenizer 进行切分。先导入 RegexpTokenizer 模块,然后构建一个与文本中的标识符相匹配的正则表达式。将此正则表 ...
分类:其他好文   时间:2019-05-16 15:16:53    阅读次数:106
Python机器学习及实践+从零开始通往Kaggle竞赛之路
内容简介 本书面向所有对机器学习与数据挖掘的实践及竞赛感兴趣的读者,从零开始,以Python编程语言为基础,在不涉及大量数学模型与复杂编程知识的前提下,逐步带领读者熟悉并且掌握当下最流行的机器学习、数据挖掘与自然语言处理工具,如Scikitlearn、NLTK、Pandas、gensim、XGBo ...
分类:编程语言   时间:2019-05-14 09:29:45    阅读次数:160
scikit_learn,NLTK导入分类器相关流程命令
...
分类:其他好文   时间:2019-04-29 20:37:57    阅读次数:108
nltk分词
1.安装nltk 2.运行如下 >>>import nltk>>> nltk.download('punkt') 3.代码: 4.结果 ...
分类:其他好文   时间:2019-04-25 16:16:28    阅读次数:132
NLTK基础
Python上著名的?然语?处理库 ?带语料库,词性分类库 ?带分类,分词,等等功能 强?的社区?持 还有N多的简单版wrapper 安装语料库 # 方式一 import nltk nltk.download() showing info https://raw.githubusercontent. ...
分类:其他好文   时间:2019-03-29 00:39:39    阅读次数:238
nltk 的分词器punkt: ssl问题无法下载
报错: LookupError: ********************************************************************** Resource punkt not found. Please use the NLTK Downloader to ob ...
分类:其他好文   时间:2019-03-16 18:05:39    阅读次数:434
机器学习入门-文本数据-构造词频词袋模型 1.re.sub(进行字符串的替换) 2.nltk.corpus.stopwords.words(获得停用词表) 3.nltk.WordPunctTokenizer(对字符串进行分词操作) 4.np.vectorize(对函数进行向量化) 5. CountVectorizer(构建词频的词袋模型)
函数说明: 1. re.sub(r'[^a-zA-Z0-9\s]', repl='', sting=string) 用于进行字符串的替换,这里我们用来去除标点符号 参数说明:r'[^a-zA-Z0-9\s]' 配对的模式,^表示起始位置,\s表示终止位置,[]表示取中间部分,这个的意思是找出除字符串 ...
分类:其他好文   时间:2019-01-26 19:32:16    阅读次数:1824
02 NLTK 分句、分词、词干提取、词型还原
NLTK 分句、分词、词干提取、词型还原 ...
分类:其他好文   时间:2019-01-19 20:01:46    阅读次数:305
词云分析之英文
from pyecharts import WordCloud import jieba import re import nltk with open(r'F:\算法\others\merry.txt', 'r', encoding='utf-8') as f: text = f.readline... ...
分类:其他好文   时间:2018-12-25 18:14:43    阅读次数:398
189条   上一页 1 ... 3 4 5 6 7 ... 19 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!