1.下载一中文长篇小说,并转换成UTF-8编码。 2.使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。 3.排除一些无意义词、合并同一词。 4.对词频统计结果做简单的解读。 ...
分类:
其他好文 时间:
2017-09-30 00:33:27
阅读次数:
97
中文分词 解读: 讲的是三藏与大圣美猴王的故事 ...
分类:
其他好文 时间:
2017-09-30 00:31:42
阅读次数:
131
1.下载一中文长篇小说,并转换成UTF-8编码。 2.使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。 3.排除一些无意义词、合并同一词。 4.对词频统计结果做简单的解读。 ...
分类:
其他好文 时间:
2017-09-30 00:21:58
阅读次数:
185
1)下载一中文长篇小说,并转换成UTF-8编码 2)使用jieba库,进行中文词频统计 3)输出TOP20的词及出现次数 4)排除一些无意义词、合并同一词 import jieba txt = open('A.txt','r',encoding='utf-8').read()#转换成UTF-8编码 ...
分类:
其他好文 时间:
2017-09-29 23:14:02
阅读次数:
447
1.下载一中文长篇小说,并转换成UTF-8编码。 2.使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。 3.排除一些无意义词、合并同一词。 《悟空传》 ...
分类:
其他好文 时间:
2017-09-29 23:01:52
阅读次数:
204
import jieba print('top20词汇出现的次数:') #读入文本文件 txt=open('G:\wgd.txt','r',encoding='utf-8').read() #清除无意义符号 for i in ',。!、 \n “” ;': txt=txt.replace(i,'')... ...
分类:
其他好文 时间:
2017-09-29 22:53:55
阅读次数:
169
中文分词 1.下载一中文长篇小说,并转换成UTF-8编码。 2.使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。 3.排除一些无意义词、合并同一词。 4.对词频统计结果做简单的解读。 ...
分类:
其他好文 时间:
2017-09-29 22:48:01
阅读次数:
156
中文分词 下载一中文长篇小说,并转换成UTF-8编码。 使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。 排除一些无意义词、合并同一词。 对词频统计结果做简单的解读。 中文分词 ...
分类:
其他好文 时间:
2017-09-29 21:28:59
阅读次数:
206
import jieba a=open('C:/1.txt','r',encoding='utf-8').read() for i in '\n,.\()。,123"?': a=a.replace(i,' ') b=jieba.cut(a) d=list(b) exc={' ','和','你','使... ...
分类:
其他好文 时间:
2017-09-29 21:19:41
阅读次数:
117
import jiebafr = open('tridebody.txt','r',encoding = 'utf-8')str = fr.read()fr.close()words = jieba.cut(str)words = list(words)print('{0:-^50)'.format ...
分类:
其他好文 时间:
2017-09-29 19:54:38
阅读次数:
179