李克华云计算高级群: 292870151 交流:Hadoop、NoSQL、分布式、lucene、solr、nutch 在Solr中配置中文分词IKAnalyzer1、在配置文件schema.xml(位置{SOLR_HOME}/config/下),配置信息如下: ...
分类:
其他好文 时间:
2014-12-05 17:02:09
阅读次数:
148
上次在使用Lucene建立索引时使用的时自带的StandAnalyzer分词器,而这个分词器在对中文进行分词时只是机械的按字进行划分,因此使用它lucene就不能很好的对中文索引,也就不能实现对中文关键词的检索了,因此其实上次的实践只能对英文进行。
为了解决这个问题,可以使用IKAnalyzer,它是以开源项目Lucene为应用主体的,结合词典分词和文法分析算法的中文分词组件。它支持中英文等分词...
分类:
Web程序 时间:
2014-12-03 19:18:59
阅读次数:
299
一、下载Solr4.10.2 我们以Windows版本为例,solr-4.10.2.zip是目前最新版本,下载地址: http://www.apache.org/dyn/closer.cgi/lucene/solr/4.10.2 二、 Solr安装: 1、解压solr-4.10.2.z...
分类:
其他好文 时间:
2014-11-29 20:15:51
阅读次数:
227
一、 JDK 1.5+ 、Tomcat是solr运行的必须环境。 二、 ?下载Solr,得到solr-4.10.2.tgz ?http://lucene.apache.org/solr/ ? 三、 ??安装: 1、解压solr-4.10.2.tgz tar? –zxvf ?solr-4.10.2.tgz? 得到s...
分类:
其他好文 时间:
2014-11-13 11:04:54
阅读次数:
240
没有开头语我会死啊~好的,IK是啥、怎么用相信看这篇文章的人都不需要我过多解释了,我也解释不好。下面开始正文: IK的官方结构图: 从上至下的来看: 最上层是我们不需要过度关心的,它们是一些Adapter供Lucen...
分类:
其他好文 时间:
2014-11-03 22:45:07
阅读次数:
386
全文索引服务solr搭建。公司最近要用到。我又是个java小白。做环境的什么的不再行。就此几下操作。
大部分是看官方提供的reference.pdf来做的,也google了不少。公司还有个大哥指点。。。。笨的可以。
环境如下
OS: centos6.5
java环境: jdk1.7.0_51
tomcat版本: apache-tomcat-7.0.55
solr版本: solr...
分类:
其他好文 时间:
2014-09-13 22:49:56
阅读次数:
430
在使用solr4.9的过程中,使用了IKAnalyzer分词器,其中遇到了不少问题,现在做个记录,以备后续只用。 ? ? ?首先使用IKAnalyzer是看到群里有人介绍,但是貌似现在IKAnalyzer已经没人更新了。。。不知道...
分类:
其他好文 时间:
2014-09-11 09:45:52
阅读次数:
234
1. IKAnalyzer3.0介绍 IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词...
分类:
其他好文 时间:
2014-09-10 12:47:00
阅读次数:
374
本文主要讲解IKAnalyzer(以下简称‘IK’)在Lucene中的具体使用,关于Lucene和IK分词器的背景及其作用在这里就不再熬述。不得不感叹下Lucene版本变更的快速,如今最新已经到了4.9.0,相信任何技术的发展壮大都不...
分类:
其他好文 时间:
2014-09-02 18:16:05
阅读次数:
331
在网上下载了lucene当前最新版本4.0,以及IKAnalyzer中文分词器的完整发布包。 运行之后发现异常:Exception in thread "main" java.lang.VerifyError: class org.wltea.analyzer.lucene.IKAnalyzer overrides fi...
分类:
其他好文 时间:
2014-08-26 11:58:26
阅读次数:
216