文章转载自:http://www.cnblogs.com/dennisit/archive/2013/04/07/3005847.html 方案一: 基于配置的词典扩充 项目结构图如下:IK分词器还支持通过配置IKAnalyzer.cfg.xml文件来扩充您的专有词典。谷歌拼音词库下载: http: ...
分类:
Web程序 时间:
2016-07-05 20:35:56
阅读次数:
406
先来一个标准分词(standard),配置如下: index:local type:article default analyzer:stem (filter:小写、停用词等) field:title 测试: 例如: 分词如下: 部署ik分词器 在elasticsearch.yml中配置 index ...
分类:
其他好文 时间:
2016-06-29 07:47:17
阅读次数:
331
先说一下安装mvn步骤,如果已安装可以忽略; 在tmp目录下 1.建立mvn目录 mkdir mvn cd /tmp/mvn 2.下载 wget http://apache.fayea.com/maven/maven-3/3.3.9/binaries/apache-maven-3.3.9-bin.t... ...
分类:
其他好文 时间:
2016-06-06 23:29:23
阅读次数:
157
IK分词器如果配置成 本人测试切分词可以,但是同义词,扩展词库用不了, 网上查各种资料说IK分词器有个BUG,要自己把jar文件改一下,于是找到IK的源码,里面只有IKAnalyzer的源码,代码如下 自己加了一个IKAnalyzerSolrFactory,代码如下 这样一来就能在配置文件中配置成I ...
分类:
其他好文 时间:
2016-06-04 16:27:30
阅读次数:
1218
https://github.com/medcl/elasticsearch-analysis-ikhttps://www.elastic.co/downloads/past-releases/elasticsearch-2-3-2es:2.3.2ik:1.9.2一安装es:wget 'https: ...
分类:
其他好文 时间:
2016-05-28 17:45:51
阅读次数:
370
下载 ik分词包 地址:http://http://pan.baidu.com/s/1c1RcnAw 1.修改 pom.xml 修改成你使用的版本,保存 解压后在工程目录内 打开命令窗口 输入 mvn -DskipTests clean package 完成后 2.部署项目 把生成的jar 放到 s ...
分类:
其他好文 时间:
2016-05-17 19:16:39
阅读次数:
318
网上试了很多种方案都不灵!
最后准于被我使出来了。记录下来,希望能帮到其他的人!
ik分词器地址:https://github.com/medcl/elasticsearch-analysis-ik
1、下载 elasticsearch-analysis-ik-1.4.1.zip
2、解压,进入目录:命令行执行:mvn compile package (确保机器上...
分类:
其他好文 时间:
2016-05-07 07:42:47
阅读次数:
220
ik git 地址 https://github.com/medcl/elasticsearch-analysis-ik readme 包含各个版本ik对应的 es 版本 下载对应的ikzip包 命令如下 https://github.com/medcl/elasticsearch-analysis ...
分类:
其他好文 时间:
2016-05-04 21:13:13
阅读次数:
166
一、IK简介 IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。从3.0版本开 始,IK发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化 ...
分类:
其他好文 时间:
2016-05-01 16:04:12
阅读次数:
228
IK分词器相对于mmseg4J来说词典内容更加丰富,但是没有mmseg4J灵活,后者可以自定义自己的词语库。IK分词器的配置过程和mmseg4J一样简单,其过程如下: 1.引入IKAnalyzer.jar包到solr应用程序的WEB-INF/lib/目录下 2.打开solr的home/conf目录下 ...
分类:
其他好文 时间:
2016-04-16 18:39:53
阅读次数:
124