码迷,mamicode.com
首页 >  
搜索关键字:jieba    ( 462个结果
利用jieba分词进行词频统计
jieba分词用法 sorted函数按key值对字典排序 先来基本介绍一下sorted函数,sorted(iterable,key,reverse),sorted一共有iterable,key,reverse这三个参数。 其中iterable表示可以迭代的对象,例如可以是dict.items()、d ...
分类:其他好文   时间:2017-12-14 22:54:10    阅读次数:919
python处理汉字转拼音pypinyin
主要是pypinyin 包,官网: http://pypinyin.readthedocs.io/zh_CN/master/index.html jieba包,主要是用来分词的,我之前的博文有介绍:http://www.cnblogs.com/dahu-daqing/p/7491343.html 官 ...
分类:编程语言   时间:2017-12-12 17:36:17    阅读次数:274
文字云
Python +wordcloud 生成词云 什么是词云 词云又叫文字云,是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思。 准备工作: python开发环境、wordcloud、jieba、matplotl ...
分类:其他好文   时间:2017-12-09 16:57:32    阅读次数:901
jieba分词基本使用
1 import jieba 2 with open('lagoujobdatails.txt',encoding='utf-8') as f: 3 tmp_line=f.read() 4 jieba_cut=jieba.cut(tmp_line) 5 ans=' '.join(jieba_cut)... ...
分类:其他好文   时间:2017-12-06 16:15:15    阅读次数:144
nltk基本
from nltk.corpus import PlaintextCorpusReader import nltk corpus_root=r"C:\Users\sun\AppData\Roaming\nltk_data\corpora\jieba" file_pattern=r".*/.*\.tx... ...
分类:其他好文   时间:2017-12-06 16:09:41    阅读次数:153
NLTK和jieba这两个python的自然语言包(HMM,rnn,sigmoid
HMM(Hidden Markov Model,隐马尔可夫模型) CRF(Conditional Random Field,条件随机场), RNN深度学习算法(Recurrent Neural Networks,循环神经网络)。输入条件连续 LSTM(Long Short Term Memory)则 ...
分类:编程语言   时间:2017-12-05 17:51:41    阅读次数:518
jieba分词的原理
jieba介绍: 一、支持三种分词模式: 精确模式,试图将句子最精确地切开,适合文本分析; 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; 搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。 二、jieba自带了一个叫做dict.t ...
分类:其他好文   时间:2017-12-03 21:53:45    阅读次数:442
python常用库函数 - 备忘
本文描述了 正则模块re、参数解析模块argparse、分词工具jieba 的一些简单使用方法。(未完待补充) ...
分类:编程语言   时间:2017-11-10 12:55:43    阅读次数:253
jieba分词/jieba-analysis(java版)
简介 支持分词模式Search模式,用于对用户查询词分词Index模式,用于对索引文档分词特性支持多种分词模式全角统一转成半角用户词典功能conf 目录有整理的搜狗细胞词库因为性能原因,最新的快照版本去除词性标注,也希望有更好的 Pull Request 可以提供该功能。 简单使用 获取jieba- ...
分类:编程语言   时间:2017-11-07 16:26:25    阅读次数:316
python 分词
import jieba text = '我来到北京清华大学' default_mode =jieba.cut(text) full_mode = jieba.cut(text,cut_all=True) search_mode = jieba.cut_for_search(text) print ... ...
分类:编程语言   时间:2017-11-01 13:35:41    阅读次数:231
462条   上一页 1 ... 31 32 33 34 35 ... 47 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!