码迷,mamicode.com
首页 >  
搜索关键字:elasticsearch ik 中文分词    ( 5835个结果
关于中文分词
眼下全量索引17G,不到1300万document花费大约25分钟的时间(Lucene 4.0),吞吐量远远低于lucene nightly build宣称的170G/h的量。换用StandardAnalyzer,有34%的提高,比較下使用的KAnalyzer,mmseg4j1.9.2-snapsh...
分类:其他好文   时间:2014-08-12 21:45:54    阅读次数:193
Elasticsearch 搭建
最近需要用到Elasticsearch。下面简单介绍下Elasticsearch的搭建过程: ElasticSearch 使用java编写, 所以需要安装 Java 6以上 环境来运行. 并且确保设置好环境变量 JAVA_HOME 进到Elasticsearch所在目录 1、安装elastic...
分类:其他好文   时间:2014-08-11 20:51:22    阅读次数:188
58.有一个已经排好序的数组。现输入一个数,要求按原来的规律将它插入数组中
#includeusing namespace std;int main(){ int n,k; int temp; int a[11]={1,4,6,9,11,13,35,44,46,50}; cout>n; for(int i=0;ik+1;j--) { ...
分类:其他好文   时间:2014-08-11 20:33:42    阅读次数:193
使用NLPIR-ICTCLAS2014分词系统
使用NLPIR-ICTCLAS2014分词系统...
分类:其他好文   时间:2014-08-04 14:18:57    阅读次数:258
Windows下面安装和配置Solr 4.9(三)支持中文分词器
首先将下载解压后的solr-4.9.0的目录里面找到lucene-analyzers-smartcn-4.9.0.jar文件,将它复制到solr的应用程序里面D:\apache-tomcat-7.0.54\webapps\solr\WEB-INF\lib,备注:网上很多文章使用IK中文分词器(IK_...
分类:Windows程序   时间:2014-08-03 12:39:15    阅读次数:386
java读取中文分词工具(三)
import java.io.EOFException; import java.io.File; import java.io.FileNotFoundException; import java.io.IOException; import java.io.RandomAccessFile; import java.util.ArrayLis...
分类:编程语言   时间:2014-08-01 23:14:42    阅读次数:309
java读取中文分词工具(四)
import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.IOException; import java.io.InputStreamReader; import java.io.RandomAccessFile; import java.io.Serial...
分类:编程语言   时间:2014-08-01 23:14:32    阅读次数:271
二阶和三阶隐马尔柯夫过程(HMM)进行中文分词的效果对比
第一部分 引言         关于隐马尔柯夫模型的详细内容在此就不详细介绍了,介绍HMM模型的文章很多,请读者自行去学习。二阶隐马尔柯夫模型解决问题有两个假设:其一是当前的状态仅与它前面相邻的状态有关;其二是状态转换和从某个状态发射某个观察符号的概率与时间t无关(即不动性假设)。HMM是在这两个假设的前提下解决各种各样的问题的。        对于第二个假设,我们不去讨论它。现在来看第一...
分类:其他好文   时间:2014-08-01 20:02:22    阅读次数:372
log4net.redis+logstash+kibana+elasticsearch+redis 实现日志系统
前端时间写了个随笔 log4net.NoSql +ElasticSearch 实现日志记录 ,因项目原因需要把日志根java平台的同事集成采用logstash+kibana+elasticsearch+redis结构实现日志统计分析,所以需要一个将log4net日志输出到redis的组件。没有找到现...
分类:Web程序   时间:2014-08-01 13:21:35    阅读次数:491
记一次被劫持挂马经历--Elasticsearch的远程执行漏洞
起因:公司使用的是Ucloud的云主机服务,今天上午突然被告知有一台服务器的出口流量激增,对外发包量短时间内达到了100万,而且都是UDP类型的,第一感觉就是:诶呀,莫不是被黑了,被当肉鸡了呀!探究:立马登录对应的服务器,首先使用iftop查看流量状况可以看出出口流量好吓人..
分类:其他好文   时间:2014-07-30 03:29:24    阅读次数:289
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!