码迷,mamicode.com
首页 >  
搜索关键字:jieba    ( 462个结果
数据挖掘——文本挖掘-关键字提取
基于jieba包的自动提取 关键方法:jieba.analyse.extract_tags(content,topK=n) 具体思路:通过jieba包自带的extract_tags方法,在遍历读取文件内容时,获得每篇文档前n个关键字 使用的包: 过程: 最终得到包含文件路径,文件内容,和每篇5个关键 ...
分类:其他好文   时间:2018-09-22 17:04:17    阅读次数:585
Matplotlib学习---用wordcloud画词云(Word Cloud)
画词云首先需要安装wordcloud(生成词云)和jieba(中文分词)。 先来说说wordcloud的安装吧,真是一波三折。首先用pip install wordcloud出现错误,说需要安装Visual C++ 14.0。折腾半天安装好Visual C++后,还是不行,按网上指点,下载第三方包安 ...
分类:其他好文   时间:2018-09-21 13:35:41    阅读次数:354
python的jieba分词
# 官方例程 # encoding=utf-8 import jieba seg_list = jieba.cut("我来到北京清华大学", cut_all=True) print("Full Mode: " + "/ ".join(seg_list)) # 全模式 输出: 【全模式】: 我/ 来到 ...
分类:编程语言   时间:2018-09-17 10:22:03    阅读次数:191
Python 模块 - jieba
安装 jieba jieba 支持三种分词模式: 精确模式:将句子最精确地切开,适合文本分析 全模式:把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义 搜索引擎模式:在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词 jieba.cut 方法有三个参数,第一个 ...
分类:编程语言   时间:2018-09-09 00:45:24    阅读次数:207
sphinx-doc的中文搜索
第一,你的系统需要安装jieba类库, pip install jieba 第二,接下来修改sphinx的conf.py文件,为项目设置为中文的搜索配置。 第三,可选配置 第四,接下来重新编译生成文档。make html 原文地址:https://www.chenyudong.com/archive ...
分类:其他好文   时间:2018-09-08 23:33:04    阅读次数:454
xgboost实例代码
1 # -*- coding: utf-8 -*- 2 import xgboost as xgb 3 import csv 4 import jieba 5 jieba.load_userdict('wordDict.txt') 6 import numpy as np 7 from sklear... ...
分类:其他好文   时间:2018-09-08 22:37:30    阅读次数:624
词云分析《天龙八部》人物出现次数
一.需要的三方库 1.安装词云: pip install wordcloud 2.安装结巴 pip install jieba 3.安装matplotlib pip install matplotlib 二.实现代码 三.实现效果 ...
分类:其他好文   时间:2018-09-04 23:35:04    阅读次数:294
将QQ聊天记录创建为词云
1. 导出并清洗qq聊天记录 将qq聊天记录从电脑版qq导出 去掉聊天中的图片表情以及时间戳 具体代码如下: 2. 准备其他素材 准备要生成图云的照片 准备生成词云的字体(没有的话,会造成中文字体不显示的问题) 3. 准备使用到的python库 numpy : 处理图片文件 jieba : 聊天记录 ...
分类:其他好文   时间:2018-08-19 22:02:46    阅读次数:280
jieba结巴分词
pip install jieba安装jieba模块如果网速比较慢,可以使用豆瓣的Python源:pip install -i https://pypi.douban.com/simple/ jieba一、分词:import jiebaseg_list = jieba.cut("从没见过我这么弱的垃 ...
分类:其他好文   时间:2018-08-14 00:22:38    阅读次数:181
Python 词云 【中/英】小白简单入门教程
1. 分析 构建词云需要具备: 原料即文章等内容 将内容进行分词 将分词后的内容利用构建词云的工具进行构建 保存成图片 2. 需要的主要模块 jieba 中文分词 wordcloud 构建词云 3. 模块原理 wordcloud的实现原理 文本预处理 词频统计 将高频词以图片形式进行彩色渲染 jie ...
分类:编程语言   时间:2018-08-06 00:34:36    阅读次数:248
462条   上一页 1 ... 22 23 24 25 26 ... 47 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!