码迷,mamicode.com
首页 > 编程语言 > 详细

jieba库应用 python

时间:2020-02-09 16:33:19      阅读:84      评论:0      收藏:0      [点我收藏+]

标签:nbsp   ==   gbk   item   continue   highlight   形式   http   png   

技术图片

 

 

 

应用实例:

准备一个txt文件

import jieba
txt = open("三国演义.txt","r", encoding = ‘gbk‘,errors=‘ignore‘).read()  #读取已存好的txt文档
words = jieba.lcut(txt)          #进行分词
counts = {}
for word in words:
    if len(word)== 1:            #去掉标点字符和其它单字符
        continue
    else:
        counts[word] = counts.get(word, 0) + 1  #计数
items = list(counts.items())    #把对象对象转化为列表形式,利于下面操作

#sort()  函数用于对原列表进行排序,如果指定参数,则使用比较函数指定的比较函数
#reverse 排序规则,reverse = True 降序, reverse = False 升序(默认)
#key 是用来比较的参数

items.sort(key=lambda x: x[1], reverse = True)
for i in range(1000):
    word, count= items[i]
    print("{0:<10}{1:>5}".format(word, count))

 结果

技术图片

 

jieba库应用 python

标签:nbsp   ==   gbk   item   continue   highlight   形式   http   png   

原文地址:https://www.cnblogs.com/1061321925wu/p/12287413.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!