1、中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容?(认真想一想回答) a、关于这门课的相关工作经历 b、自己对于这门课的看法 2、中文分词 a、之前的英文练习将要测试词频的文章放在一个TXT里, 然后引用 结果如下 b、测试jieba c、这次我选择的是对于小说雪山飞狐的 ...
分类:
其他好文 时间:
2017-09-25 14:38:49
阅读次数:
153
1.我希望老师能讲一点python在数据挖掘,数据分析领域的应用,最好能举些实例,或者说带我们实际操作一波。 2.中文分词 输出结果: 词云显示结果: ...
分类:
其他好文 时间:
2017-09-25 13:29:27
阅读次数:
526
1.中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容?(认真想一想回答) 希望能讲一些大数据相关内容,深入了解一下。 2.中文分词 (**两项选做,此次作业要求不能雷同。) ...
分类:
其他好文 时间:
2017-09-25 13:24:30
阅读次数:
90
1.中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容?(认真想一想回答) 细说numpy库的使用 2.中文分词 输出结果: (**两项选做,此次作业要求不能雷同。) ...
分类:
其他好文 时间:
2017-09-25 13:18:40
阅读次数:
137
jieba是python下的一个检索库, 有人将这个库移植到了asp.net 平台下, 完全可以替代lucene.net以及盘古分词的搭配 之所以写这个, 其实是因为昨天面试时, 被问到网站的关键字检索你怎么做?我就是说了下sql模糊查询以及sql语句优化, 缓存。以前接触过关键字分词, 但是在.n ...
分类:
Web程序 时间:
2017-09-24 17:23:29
阅读次数:
164
官网:https://pynlpir.readthedocs.io/en/latest/ github:https://github.com/tsroten/pynlpir NLPIR分词系统前身为2000年发布的ICTCLAS词法分析系统,从2009年开始,为了和以前工作进行大的区隔,并推广NLP... ...
分类:
编程语言 时间:
2017-09-21 16:44:55
阅读次数:
230
安装ELASTICSERARCH yum install bzip2 automake libtool gcc-c++ java-1.8.0-openjdk -y mkdir -p /home/ELK/e mkdir /home/ELK/e/{data,logs} useradd elktar zx ...
分类:
其他好文 时间:
2017-09-18 15:48:17
阅读次数:
432
运行elasticsearch5.5.2需要jdk1.8版本以上 1.elasticsearch可以去官网或github下载,window系统推荐zip压缩版 2.解压后 进入bin目录运行elasticsearch.bat启动服务 3.访问localhost:9500测试是否成功 4.安装中文分词 ...
分类:
其他好文 时间:
2017-09-09 12:57:59
阅读次数:
251
paoding: 庖丁解牛最新版在 https://code.google.com/p/paoding/ 中最多支持Lucene 3.0,且最新提交的代码在 2008-06-03,在svn中最新也是2010年提交,已经过时,不予考虑。 mmseg4j:最新版已从 https://code.googl ...
分类:
其他好文 时间:
2017-09-03 16:06:37
阅读次数:
244
继上次匆匆搭建起结合solr和nutch的所谓站内搜索引擎之后,虽当时心中兴奋不已,可是看了看百度,再只能看看我的控制台的打印出每个索引项的几行文字,哦,好像差距还是有点大…… 简陋的信息显示环境最起码给了我一个信号,这条路没有走错,好吧,让我们来继续探索搜索引擎的奥秘吧。 上期回顾:上次主要是介绍 ...
分类:
其他好文 时间:
2017-09-03 00:31:10
阅读次数:
274