搜索关键字：jieba，搜索到462个结果！码迷,mamicode.com！

文本挖掘——jieba分词

python 结巴分词(jieba)学习特点 1，支持三种分词模式： a,精确模式，试图将句子最精确地切开，适合文本分析； b,全模式，把句子中所有的可以成词的词语都扫描出来, 速度非常快，但是不能解决歧义； c,搜索引擎模式，在精确模式的基础上，对长词再次切分，提高召回率，适合用于搜索引擎分词。 ...

分类：其他好文时间：2017-03-19 14:19:45 阅读次数：224

每日技术 | 毕设

python结巴分词用jieba分词不仅可以做最基础的分词，还可以添加自定义词典和用来做词性标注！详细用法：http://www.tuicool.com/articles/QV36ru ...

分类：其他好文时间：2017-03-11 13:58:39 阅读次数：172

结巴分词功能

功能 1)：分词 jieba.cut方法接受两个输入参数: 1) 第一个参数为需要分词的字符串 2）cut_all参数用来控制是否采用全模式 jieba.cut_for_search方法接受一个参数：需要分词的字符串,该方法适合用于搜索引擎构建倒排索引的分词，粒度比较细注意：待分词的字符串可以是g ...

分类：其他好文时间：2017-03-09 18:24:59 阅读次数：197

初窥wordcloud之老司机带你定制词云图片

抓紧上车啦来看看依照原图来的模板根据这个模板的到黑色的词云是不是很炫酷。因为python2.7的蛋疼的中文编码问题。如果是中文文档的话，可以用jieba分词对文件进行次频处理在生成词云。挖个坑，以后填。。 ...

分类：其他好文时间：2017-03-08 18:44:54 阅读次数：2856

利用余弦定理计算文本的相似度

#!/usr/bin/env python # -*- coding: utf-8 -*- from __future__ import division import jieba.analyse from math import sqrt class Similarity(): def __ini... ...

分类：其他好文时间：2017-01-25 17:25:40 阅读次数：231

R文本挖掘之jiebaR包

library(jiebaRD)library(jiebaR) ##调入分词的库cutter <- worker()mydata =read.csv(file.choose(),fileEncoding = 'UTF-8',stringsAsFactors = FALSE,header=FALSE) ...

分类：其他好文时间：2017-01-24 14:44:56 阅读次数：329

Python自然语言处理学习——jieba分词

jieba——“结巴”中文分词是sunjunyi开发的一款Python中文分词组件，可以在Github上查看jieba项目。要使用jieba中文分词，首先需要安装jieba中文分词，作者给出了如下的安装方法： 1.全自动安装：easy_install jieba 或者 pip install ji ...

分类：编程语言时间：2017-01-19 04:10:29 阅读次数：349

转]python 结巴分词(jieba)学习

原文 http://www.gowhich.com/blog/147 主题中文分词 Python 源码下载的地址：https://github.com/fxsjy/jieba 演示地址：http://jiebademo.ap01.aws.af.cm/ 特点 1，支持三种分词模式： a,精确模式，试 ...

分类：编程语言时间：2017-01-12 12:58:34 阅读次数：248

用Python玩转词云

第一步：引入相关的库包：第二部：导入分好词的西游记txt文件：第三部：统计分词结果并去掉停用词：第四部：统计词频：第五步：显示词云第六步：自定义词云形状 ...

分类：编程语言时间：2016-12-27 13:25:07 阅读次数：933

基于hash的文档判重——simhash

本文环境： python3.5 ubuntu 16.04 python3.5 ubuntu 16.04 第三方库： jieba 文件寄于github: https://github.com/w392807287/angelo_tools.git simhash介绍没多久就要写毕业论文了，据说需要查 ...

分类：其他好文时间：2016-12-23 01:45:50 阅读次数：246

共462条上一页 1 ... 41 42 43 44 45 ... 47 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)