码迷,mamicode.com
首页 >  
搜索关键字:结巴    ( 91个结果
结巴中文分词使用学习(python)
中文分词工具:结巴分词 github地址:https://github.com/fxsjy/jieba一、分词功能 精确模式(默认):试图将句子最精确地切开,适合文本分析; 全模式,把句子中所有的可以成词的词语都扫描出来,但是不能解决歧义; 搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,该方法适合用于搜索引擎构建倒排索引的分词,粒度比较细。注意:jieba.cut以及jieba.c...
分类:编程语言   时间:2016-05-22 12:32:43    阅读次数:268
隐马尔科夫模型python实现简单拼音输入法
在网上看到一篇关于隐马尔科夫模型的介绍,觉得简直不能再神奇,又在网上找到大神的一篇关于如何用隐马尔可夫模型实现中文拼音输入的博客,无奈大神没给可以运行的代码,只能纯手动网上找到了结巴分词的词库,根据此训练得出隐马尔科夫模型,用维特比算法实现了一个简单的拼音输入法。githuh地址:https://g ...
分类:编程语言   时间:2016-04-01 01:03:16    阅读次数:279
NLP文本情感分类
文本情感分类:文本情感分类(一):传统模型 http://spaces.ac.cn/index.php/archives/3360/测试句子:工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的安装工作分词工具测试结果结巴中文分词工信处/ 女干事/ 每月/ 经过/ 下属/ 科室/ 都/...
分类:其他好文   时间:2015-11-02 15:15:56    阅读次数:789
ictclas,ansj,结巴分词,StanfordNLP中文分词以及所用词性标注集
NLPIR(ICTCLAS),参见java实现NLPIR(ICTCLAS)分词:http://www.bubuko.com/infodetail-665665.html,词性标注使用北大词性标注集。在Linux系统中的使用方法:http://jingyan.baidu.com/article/915...
分类:其他好文   时间:2015-10-24 00:09:55    阅读次数:744
阿里巴巴于锋研究员校园观后感
10月8日,贵州大学礼堂里阿里巴巴的分布式数据库研究员于锋做了一场云计算的演讲。 说实话,于锋样貌平平常常,演讲的时候也有些结巴,措辞也有很多欠妥的地方,但是讲到他曾经做过的项目,一下子换了一个人,引经据典,谈笑风生。 下面没人鼓掌,于锋慢慢的讲着,于无声处听惊雷! 12306网站以前经常...
分类:其他好文   时间:2015-10-14 21:35:41    阅读次数:234
六、打哪指哪
脸上常带微笑,说话从不结巴的王二觅得一份电视台节目主持人的工作,还有一个星期就要开始上班。这一档晚上七点开始的股市评论的节目,收视率很高。王二为了熟悉工作内容,提前进入状态,每天晚上一到七点钟,就会守在电视机旁,两眼发直口水直流地盯着前任主持人面带微笑有条不紊地分析当日的股市变化。受到欧美股市昨天下挫的拖累,今天沪深两市低开低走。虽然上周欧美股市下跌,今日沪深两市在大盘股的带动下,仍有小幅上升。受...
分类:其他好文   时间:2015-10-14 10:33:30    阅读次数:217
有些事关于敏捷
昨。和一位同事,像敏捷的问题和需求文件,有一点争议。我结结巴巴,未能充分表达我的观点。回到他的想法整理,写下来。首先要说的是,敏捷与需求文档的关系。敏捷并不是排斥需求,它仅仅是给用户一个舒适地表述需求的环境。其实,敏捷相对于古老的RUP模式,更是把需求和測试抬到了一个前所未有的高度。传统的软件pro...
分类:其他好文   时间:2015-10-04 14:46:29    阅读次数:159
.net 的一个分词系统(jieba中文分词的.NET版本:jieba.NET)
简介平时经常用Python写些小程序。在做文本分析相关的事情时免不了进行中文分词,于是就遇到了用Python实现的结巴中文分词。jieba使用起来非常简单,同时分词的结果也令人印象深刻,有兴趣的可以到它的在线演示站点体验下(注意第三行文字)。.NET平台上常见的分词组件是盘古分词,但是已经好久没有更...
分类:Web程序   时间:2015-09-11 00:13:39    阅读次数:546
(转)jieba中文分词的.NET版本:jieba.NET
简介平时经常用Python写些小程序。在做文本分析相关的事情时免不了进行中文分词,于是就遇到了用Python实现的结巴中文分词。jieba使用起来非常简单,同时分词的结果也令人印象深刻,有兴趣的可以到它的在线演示站点体验下(注意第三行文字)。.NET平台上常见的分词组件是盘古分词,但是已经好久没有更...
分类:Web程序   时间:2015-09-09 09:47:17    阅读次数:256
中文分词
jieba中文分词的.NET版本:jieba.NET2015-09-08 20:05 by Anders Cui,191阅读,3评论,收藏,编辑简介平时经常用Python写些小程序。在做文本分析相关的事情时免不了进行中文分词,于是就遇到了用Python实现的结巴中文分词。jieba使用起来非常简单,...
分类:其他好文   时间:2015-09-09 01:04:41    阅读次数:507
91条   上一页 1 ... 5 6 7 8 9 10 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!