本文转载http://blog.csdn.net/jspamd/article/details/8194919 不同的Lucene分析器Analyzer,它对TokenStream进行分词的方法是不同的,这需要根据具体的语言来选择。比如英文,一般是通过空格来分割词条,而中文汉字则不能通过这种方式,....
分类:
Web程序 时间:
2015-11-12 19:43:09
阅读次数:
373
1.上周已经对web攻击方式进行了总结,并完善攻击的正则表达式。2.本周的工作是对设备和主机的攻击进行调研与总结a.分析对设备和主机的攻击包括哪几种类型b.调研当下企业日志审计系统的情况,找到适合的系统进行分析。c.确定使用ManageEngine Firewall Analyzer、ManageE...
分类:
其他好文 时间:
2015-11-06 20:59:17
阅读次数:
148
下载http://git.oschina.net/wltea/IK-Analyzer-2012FF 解压之后将dist/IKAnalyzer2012FF_u1.jar复制到tomcat的solr的lib文件夹下 将IKAnalyzer.cfg.xml和stopword.dic复制到solr/home的collection1\conf文件夹下...
分类:
其他好文 时间:
2015-11-06 00:23:14
阅读次数:
222
MAT Memory Analyzer Tool 插件安装 myeclipse10
分类:
系统相关 时间:
2015-11-05 18:34:33
阅读次数:
411
原文:http://tivan.iteye.com/blog/1487855前言在平时开发、测试过程中、甚至是生产环境中,有时会遇到OutOfMemoryError,Java堆溢出了,这表明程序有严重的问题。我们需要找造成OutOfMemoryError原因。一般有两种情况:1、内存泄露,对象已经死...
分类:
系统相关 时间:
2015-11-05 18:10:12
阅读次数:
192
使用Eclipse Memory Analyzer进行内存泄漏分析三部曲
分类:
系统相关 时间:
2015-11-05 18:05:03
阅读次数:
367
前言在平时开发、测试过程中、甚至是生产环境中,有时会遇到OutOfMemoryError,Java堆溢出了,这表明程序有严重的问题。我们需要找造成OutOfMemoryError原因。一般有两种情况:1、内存泄露,对象已经死了,无法通过垃圾收集器进行自动回收,通过找出泄露的代码位置和原因,才好确定解...
分类:
系统相关 时间:
2015-11-01 16:37:17
阅读次数:
265
solr本身对中文分词的处理不是太好,所以中文应用很多时候都需要额外加一个中文分词器对中文进行分词处理,ik-analyzer就是其中一个不错的中文分词器。一、版本信息solr版本:4.7.0需要ik-analyzer版本:IK Analyzer 2012FF_hf1ik-analyzer下载地址:...
分类:
其他好文 时间:
2015-10-31 14:17:21
阅读次数:
247
index : ??? analysis : ??????? analyzer : ??????????? descAnalyzer : ??????????????? tokenizer : [standard,lang,letter,whitespace,uax_url_email] ????????...
分类:
其他好文 时间:
2015-10-25 06:25:37
阅读次数:
370
类型常用的也就这些了,还有一些类型大家可以参考官网,另外一个比较重的方面的就是分词了(analyzer),不管在目前任何检索系统是分词决定这检索 的查全与查准及索引的膨涨率等。在Es中analyze...
分类:
其他好文 时间:
2015-10-24 06:49:01
阅读次数:
2277