码迷,mamicode.com
首页 >  
搜索关键字:jieba    ( 462个结果
jieba(结巴)常用方法
python jieba库的基本使用 第一步:先安装jieba库 输入命令:pip install jieba jieba库常用函数: jieba库分词的三种模式: 1、精准模式:把文本精准地分开,不存在冗余 2、全模式:把文中所有可能的词语都扫描出来,存在冗余 3、搜索引擎模式:在精准模式的基础上 ...
分类:其他好文   时间:2019-05-18 18:41:37    阅读次数:3408
反贪风暴4-猫眼影评从爬取到可视化
我感觉学习python有一个阶段就是熟悉它的各种第三方库的使用,这次我们用jieba分词,用wordcloud生成词云,用pyecharts生成柱状图,来看看吧~ 若您有需要,所有文件已上传到我的github(左上角图标直达)~ 从爬虫开始好了,猫眼电影电脑网页版只能看热门影评。其实为了获取更多影评 ...
分类:其他好文   时间:2019-04-30 13:51:15    阅读次数:143
识别同音字词pypinyin, 分词 jieba
一.pypinyin 在处理语音输入指令时, 比如 请给圆圆发消息,那么转化为文字识别时, 无法确定转换的是圆圆还是园园或是源源, 为了解决这个问题, 就把指令转换为拼音来处理,这样就可以处理同音字了.用到的库为pypinyin 简单使用, TONE,TONE2,TONE3为不同转换模式 二 jie ...
分类:其他好文   时间:2019-04-28 15:57:24    阅读次数:458
python——jieba分词过程
1 import jieba 2 """函数2:分词函数""" 3 def fenci(training_data): 4 """------------------------------------------------------- 5 seg_list = jieba.cut("他来到上海... ...
分类:编程语言   时间:2019-04-24 23:32:13    阅读次数:175
jieba库
一、jieba 库简介 (1) jieba 库的分词原理是利用一个中文词库,将待分词的内容与分词词库进行比对,通过图结构和动态规划方法找到最大概率的词组;除此之外,jieba 库还提供了增加自定义中文单词的功能。 (2) jieba 库支持3种分词模式: 精确模式:将句子最精确地切开,适合文本分析。 ...
分类:其他好文   时间:2019-04-15 00:42:17    阅读次数:248
jieba.NET与Lucene.Net的集成
首先声明:我对Lucene.Net并不熟悉,但搜索确实是分词的一个重要应用,所以这里还是尝试将两者集成起来,也许对你有一参考。 看到了两个中文分词与Lucene.Net的集成项目:Lucene.Net.Analysis.PanGu和Lucene.Net.Analysis.MMSeg,参考其中的代码实 ...
分类:Web程序   时间:2019-04-10 17:52:46    阅读次数:163
win 10 的wordcloud的安装
这两天为了安装wordcloud库可谓是“一把辛酸”,各种出错 jieba什么就不说了,安装和使用都很简单只需要一句代码就可以实现了,而wordcloud在安装之前,本以为也像jieba那样的简单,但是结果却让我心累,在安装的过程各种错误,无奈之下看各种博主的办法,一下总结了他们的办法 其实最主要的 ...
分类:Windows程序   时间:2019-04-05 12:49:37    阅读次数:185
运用jieba库分词
恢复内容开始 运用jieba库分词 一、jieba库基本介绍 1、jieba库概述 jieba是优秀的中文分词第三方库 - 中文文本需要通过分词获得单个的词语 - jieba是优秀的中文分词第三方库,需要额外安装 - jieba库提供三种分词模式,最简单只需掌握一个函数 2、jieba分词的原理 J ...
分类:其他好文   时间:2019-04-04 22:58:40    阅读次数:242
使用jieba库与wordcloud库第三方库进行词频统计
一、jieba库与wordcloud库的使用 1.jieba库与wordcloud库的介绍 jieba 库的分词原理是利用一个中文词库,将待分词的内容与分词词库进行比对,通过图结构和动态规划方法找到最大概率的词组;除此之外,jieba 库还提供了增加自定义中文单词的功能。 wordcloud是优秀的 ...
分类:其他好文   时间:2019-04-04 00:04:50    阅读次数:376
jieba 库的使用和好玩的词云
jieba库的使用: (1) jieba库是一款优秀的 Python 第三方中文分词库,jieba 支持三种分词模式:精确模式、全模式和搜索引擎模式,下面是三种模式的特点。 精确模式:试图将语句最精确的切分,不存在冗余数据,适合做文本分析 全模式:将语句中所有可能是词的词语都切分出来,速度很快,但是 ...
分类:其他好文   时间:2019-04-04 00:03:40    阅读次数:221
462条   上一页 1 ... 16 17 18 19 20 ... 47 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!