特别注意:版本问题(IK Analyzer的版本中注意各个版本的细微区别,小编就是栽在IK Analyzer2012_U5 和IK Analyzer2012FF上了)
版本匹配:
1、IK Analyzer 2012_U5 支持的是 lucene 3.2-3.6版本
2、IK Analyzer2012 FF(你问啥是FF,其实就是For 4.0,在API和功能上保持不变,只是让其支持了L...
分类:
Web程序 时间:
2015-07-31 16:29:54
阅读次数:
198
1、在mvnrepository里面找IKAnalyzer,这个中文分词包,一直没有找到,找到github,发现是一个国人写的,
http://mvnrepository.com/search?q=IKAnalyzer
2、转换成maven包,安装到本地,找到有现成的maven工程,拿来主义,clone到本地
https://github.com/wks/ik-analyzer
...
分类:
其他好文 时间:
2015-07-17 21:08:33
阅读次数:
831
16配置IK中文分词器。
1.下载最新的Ik中文分词器。
下载地址:http://ik-analyzer.googlecode.com/files/IK%20Analyzer%202012FF_hf1.zip
2.解压IK Analyzer 2012FF_hf1.zip,获得IK Analyzer 2012FF_hf1。将该目录下的IKAnalyzer.cfg.xml,stopword....
分类:
其他好文 时间:
2015-07-05 09:35:45
阅读次数:
168
在web项目的src目录下创建IKAnalyzer.cfg.xml文件,内容如下 IK Analyzer 扩展配置 use.dic.dic;googlepy.dic dicdata/ext_stopword.dic 注意:1. use.dic的格式是无...
分类:
Web程序 时间:
2015-05-27 15:15:03
阅读次数:
214
solr本身对中文分词的处理不是太好,所以中文应用很多时候都需要额外加一个中文分词器对中文进行分词处理,ik-analyzer就是其中一个不错的中文分词器。
一、版本信息
solr版本:4.7.0
需要ik-analyzer版本:IK Analyzer 2012FF_hf1
ik-analyzer下载地址:http://code.google.com/p/ik-analyzer/dow...
分类:
其他好文 时间:
2015-05-22 13:33:37
阅读次数:
165
cws_evaluation是一个Java开源项目,用于对中文分词器的分词效果进行评估对比,目前支持9大中文分词器。分别是:word分词器、ansj分词器、mmseg4j分词器、ik-analyzer分词器、jcseg分词器、fudannlp分词器、smart...
分类:
其他好文 时间:
2015-05-12 11:48:11
阅读次数:
295
运行环境:CentOS6.4?????? Tomcat7.0??? JDK1.7 软件版本: solr-4.9.1?? 下载链接:http://apache.fayea.com/lucene/solr/ IK-Analyzer-2012FF????下载链接:http://git.oschina.net/wltea/IK-A...
分类:
系统相关 时间:
2015-04-03 01:40:46
阅读次数:
306
IK Analyzer 是一个开源的,基于java语言开发的轻量级的中文分词工具包。可与lucene配合使用。
项目地址:http://www.oschina.net/p/ikanalyzer/
下载页面:http://git.oschina.net/wltea/IK-Analyzer-2012FF
示例代码:
{CSDN:CODE:602681}
该代码的工程结构:下图...
分类:
其他好文 时间:
2015-02-11 18:44:37
阅读次数:
193
配置的过程中出现了一些小问题,一下将详细讲下IK Analyzer的配置过程,配置非常的简单,但是首先主要你的Solr版本是哪个,如果是3.x版本的用IKAnalyzer2012_u6.zip如果是4.x版本的用IK Analyzer 2012FF_hf1.zip,一定要对应上,要不然会配置失败。以下是详细步骤:
1、下载IK Analyzer。
下载地址为:http://code.googl...
分类:
其他好文 时间:
2015-02-03 19:28:06
阅读次数:
223
针对solr的分词器比较多,其中最常用的的两个是mmseg4j和ik-analyzer,至于他们的区别可以网上查找比较下,这两个分词器都挺好用。我搭建的solr环境(上一篇)是4.10.3的最新版本,以下将详细说下mmseg4j的配置。
1.首先下载对应的jar包。
版本号一定要对应上否则可能会报错,下载地址为:http://code.google.com/p/mmseg4j/ 但是这个网址好...
分类:
其他好文 时间:
2015-01-25 11:12:29
阅读次数:
172