眼下全量索引17G,不到1300万document花费大约25分钟的时间(Lucene 4.0),吞吐量远远低于lucene nightly build宣称的170G/h的量。换用StandardAnalyzer,有34%的提高,比較下使用的KAnalyzer,mmseg4j1.9.2-snapsh...
分类:
其他好文 时间:
2014-08-12 21:45:54
阅读次数:
193
最近需要用到Elasticsearch。下面简单介绍下Elasticsearch的搭建过程: ElasticSearch 使用java编写, 所以需要安装 Java 6以上 环境来运行. 并且确保设置好环境变量 JAVA_HOME 进到Elasticsearch所在目录 1、安装elastic...
分类:
其他好文 时间:
2014-08-11 20:51:22
阅读次数:
188
#includeusing namespace std;int main(){ int n,k; int temp; int a[11]={1,4,6,9,11,13,35,44,46,50}; cout>n; for(int i=0;ik+1;j--) { ...
分类:
其他好文 时间:
2014-08-11 20:33:42
阅读次数:
193
使用NLPIR-ICTCLAS2014分词系统...
分类:
其他好文 时间:
2014-08-04 14:18:57
阅读次数:
258
首先将下载解压后的solr-4.9.0的目录里面找到lucene-analyzers-smartcn-4.9.0.jar文件,将它复制到solr的应用程序里面D:\apache-tomcat-7.0.54\webapps\solr\WEB-INF\lib,备注:网上很多文章使用IK中文分词器(IK_...
import java.io.EOFException;
import java.io.File;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.RandomAccessFile;
import java.util.ArrayLis...
分类:
编程语言 时间:
2014-08-01 23:14:42
阅读次数:
309
import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.RandomAccessFile;
import java.io.Serial...
分类:
编程语言 时间:
2014-08-01 23:14:32
阅读次数:
271
第一部分 引言
关于隐马尔柯夫模型的详细内容在此就不详细介绍了,介绍HMM模型的文章很多,请读者自行去学习。二阶隐马尔柯夫模型解决问题有两个假设:其一是当前的状态仅与它前面相邻的状态有关;其二是状态转换和从某个状态发射某个观察符号的概率与时间t无关(即不动性假设)。HMM是在这两个假设的前提下解决各种各样的问题的。
对于第二个假设,我们不去讨论它。现在来看第一...
分类:
其他好文 时间:
2014-08-01 20:02:22
阅读次数:
372
前端时间写了个随笔 log4net.NoSql +ElasticSearch 实现日志记录 ,因项目原因需要把日志根java平台的同事集成采用logstash+kibana+elasticsearch+redis结构实现日志统计分析,所以需要一个将log4net日志输出到redis的组件。没有找到现...
分类:
Web程序 时间:
2014-08-01 13:21:35
阅读次数:
491
起因:公司使用的是Ucloud的云主机服务,今天上午突然被告知有一台服务器的出口流量激增,对外发包量短时间内达到了100万,而且都是UDP类型的,第一感觉就是:诶呀,莫不是被黑了,被当肉鸡了呀!探究:立马登录对应的服务器,首先使用iftop查看流量状况可以看出出口流量好吓人..
分类:
其他好文 时间:
2014-07-30 03:29:24
阅读次数:
289