在上一篇文章中我们学习了solr的快速入门和针对mysql数据库建立索引,今天我们介绍如何为solr添加中文分词
1、 在百度搜索ik-analyzer,找到后下载,我下载的是【IKAnalyzer 2012FF_hf1.zip】,解压后会看到如下目录
2、 把IKAnalyzer2012FF_u1.jar拷贝到webapps下solr的lib文件夹下,把IKAnal...
分类:
其他好文 时间:
2015-08-05 10:32:28
阅读次数:
238
1、在mvnrepository里面找IKAnalyzer,这个中文分词包,一直没有找到,找到github,发现是一个国人写的,
http://mvnrepository.com/search?q=IKAnalyzer
2、转换成maven包,安装到本地,找到有现成的maven工程,拿来主义,clone到本地
https://github.com/wks/ik-analyzer
...
分类:
其他好文 时间:
2015-07-17 21:08:33
阅读次数:
831
16配置IK中文分词器。
1.下载最新的Ik中文分词器。
下载地址:http://ik-analyzer.googlecode.com/files/IK%20Analyzer%202012FF_hf1.zip
2.解压IK Analyzer 2012FF_hf1.zip,获得IK Analyzer 2012FF_hf1。将该目录下的IKAnalyzer.cfg.xml,stopword....
分类:
其他好文 时间:
2015-07-05 09:35:45
阅读次数:
168
IKAnalyzer词典扩充最近工作使用到lucene,需要对中文分词,分词器是IKAnalyzer,自带的词典包含了27万词条,能满足一般的分词要求,但是如果应用到特定的专业领域,还需要扩展专业词库,以达到更好的分词效果:IKAnalyzer词典扩充
IKAnalyzer分词API
智能分词
最细粒度切分
词库扩展
通过配置文件扩展词典
通过API扩展词典IKAnalyzer分词API...
分类:
其他好文 时间:
2015-06-15 11:20:57
阅读次数:
272
转载:http://www.cnblogs.com/madyina/p/4131751.html一、下载Solr4.10.2我们以Windows版本为例,solr-4.10.2.zip是目前最新版本,下载地址:http://www.apache.org/dyn/closer.cgi/lucene/s...
分类:
其他好文 时间:
2015-06-11 18:51:00
阅读次数:
230
q条件默认分词(org.apache.solr.analysis.TokenizerChain) "parsedquery"IK分词(org.wltea.analyzer.lucene.IKAnalyzer) "parsedquery"title:李大霄title:招商银行"title:李 t...
分类:
其他好文 时间:
2015-05-29 20:16:07
阅读次数:
191
在Solr中配置中文分词IKAnalyzer1、在配置文件schema.xml(位置{SOLR_HOME}/config/下),配置信息如下: 2、在IKAnalyzer相关的jar包(IKAnalyzer2012_u6.jar 本博客不提供下载)放在{SOLR_HOME}...
分类:
其他好文 时间:
2015-05-28 15:59:39
阅读次数:
218
在web项目的src目录下创建IKAnalyzer.cfg.xml文件,内容如下 IK Analyzer 扩展配置 use.dic.dic;googlepy.dic dicdata/ext_stopword.dic 注意:1. use.dic的格式是无...
分类:
Web程序 时间:
2015-05-27 15:15:03
阅读次数:
214
package my.IKAnalyzer;import java.io.BufferedReader;import java.io.File;import java.io.FileReader;import java.io.IOException;import java.io.StringReader;import java.util.Vector;import org.wltea.analyz...
分类:
其他好文 时间:
2015-05-18 09:09:43
阅读次数:
135