中文分词 1.下载一中文长篇小说,并转换成UTF-8编码。 2.使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。 3.排除一些无意义词、合并同一词。 4.对词频统计结果做简单的解读。 截图: 分析:在大数据时代,人们利用机器人去分析,计算,规划,决策,可想而知大大提高社会生产效率, ...
分类:
其他好文 时间:
2017-09-29 17:45:36
阅读次数:
314
中文分词 足以看出红楼梦中的主角以宝玉、贾母、凤姐、王夫人、老太太和黛玉为主,并有多次众人相聚聊天。 ...
分类:
其他好文 时间:
2017-09-29 16:40:39
阅读次数:
172
中文分词 下载一中文长篇小说,并转换成UTF-8编码。 b=open('book.txt','r',encoding='utf-8') book=b.read() b.close() 使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。 import jieba b=open('boo ...
分类:
其他好文 时间:
2017-09-29 14:59:06
阅读次数:
149
中文分词 下载一中文长篇小说,并转换成UTF-8编码。 使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。 排除一些无意义词、合并同一词。 对词频统计结果做简单的解读。 import jieba news=open('jane.txt','r',encoding='utf-8').r ...
分类:
其他好文 时间:
2017-09-29 14:00:34
阅读次数:
116
中文分词 下载一中文长篇小说,并转换成UTF-8编码。 使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。 排除一些无意义词、合并同一词。 对词频统计结果做简单的解读。 import jieba a=open('呼啸山庄.txt','r',encoding='utf-8').read ...
分类:
其他好文 时间:
2017-09-29 13:59:51
阅读次数:
109
.中文分词 下载一中文长篇小说,并转换成UTF-8编码。 使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。 排除一些无意义词、合并同一词。 对词频统计结果做简单的解读。 .中文分词 ...
分类:
其他好文 时间:
2017-09-29 13:24:33
阅读次数:
131
中文分词 从词频统计结果出来可以看出此小说是西游记,主要人物有唐僧,八戒等,讲述他们取西经的过程。 ...
分类:
其他好文 时间:
2017-09-29 13:24:25
阅读次数:
120