码迷,mamicode.com
首页 > Web开发 > 详细

apache solr配置

时间:2015-09-15 20:18:42      阅读:225      评论:0      收藏:0      [点我收藏+]

标签:windows   example   软件   新建   硬件   

硬件环境

window版本为:windows 7 64位 

软件环境

JDK版本:1.6.0_13

solr版本:4.10.4

tomcat版本:tomcat 6


安装过程


         步骤一:复制%solr%\dist\solr-4.10.3.war到tomcat安装目录下的webapp目录,并修改其名称为:solr.war

         启动tomcat   目的解压出solr 目录


步骤二:将下载好的solr-4.10.4.zip解压,新建solr_home,解压后拷贝%solrhome%\example\solr该目录下所有文件到D:\tomcat\webapps\solr\solr_home



步骤三:修改D:\tomcat\webapps\solr\solr_home\collection1\conf目录下solrconfig.xml文件,将dataDir节点的值指向步骤一所配置的文件路径。如下图所示:

技术分享




步骤四:修改%tomcat%\webapp\solr\WEB-INF\web.xml文件,如下所示:


技术分享


步骤五:拷贝%solr%\dist\solrj-lib 目录下所有jar包到%tomcat%\lib目录下


步骤六:拷贝%solr%\example\lib\ext 目录下所有jar包和数据库jar包到%tomcat%\webapp\solr\WEB-INFlib目录下。

              

步骤七:在D:\tomcat\webapps\solr\solr_home\collection1\conf 下新建data-config.xml文件

 技术分享

步骤八:将下载的solr-4.10.4文件夹下的dist, contrib文件夹复制到TomCat根目录下:


步骤九:然后再次修改刚才编辑过的solrconfig.xml增加两个文件夹的配置并修改一些参数:

大约在75行默认有8个路径,但是路径不一定全对,顺着这个配置的路径去找文件夹,根据查找的层数修改这个路径配置,另增加一个新的配置,全文如下:

     技术分享

这个配置是根据本机推导出来的,大家根据自己的实际情况去修改。


步骤十: 将dist文件夹下的技术分享技术分享

复制到webapps\solr\WEB-INF\lib下。

步骤十一:配置schema信息(约120多行处):D:\tomcat\webapps\solr\solr_home\collection1\conf\schema.xml

技术分享

配置id name 和 innername

 还有约270多行处

技术分享配置id name 和 innername


最后启动tomcat,在浏览器中输入http://localhost:8080/solr 即可访问solr管理页面,如下图:

技术分享


值得注意的是,在使用solr的过程中,为了避免因为中文乱码导致搜索不到结果,需要修改tomcat的config/server.xml中Connector的配置:


技术分享



集成ikanalyzer中文分词器

1、在谷歌http://code.google.com/p/ik-analyzer/downloads/list下载IK Analyzer 2012FF_hf1解压后得到如下目录结构:

         技术分享

2、将IKAnalyzer2012FF_u1.jar包copy到 apache-tomcat-7.0.56/webapps/solr/WEB-INF/lib 下。

在apache-tomcat-7.0.56/webapps/solr/WEB-INF/下创建classes目录

将IKAnalyzer.cfg.xml、stopword.dic  copy到 apache-tomcat-7.0.56/webapps/solr/WEB-INF/classes

3、修改apache-tomcat-7.0.56/webapps/solr/solr_home/collection1/conf/schema.xml

在第一个节点内添加如下配置:

<fieldType name="text_ik" class="solr.TextField"><analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/><analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
 </fieldType>

将对应需要用ik分词的字段的type改为以上定义的name值 text_ik(大约120行处):

   <field name="sku" type="text_en_splitting_tight" indexed="true" stored="true" omitNorms="true"/>
   <field name="name" type="text_ik" indexed="true" stored="true"/>
   <field name="manu" type="text_ik" indexed="true" stored="true" omitNorms="true"/>

配置完成,重启tomcat并访问http://localhost:8080/solr。 发现左边可以选择分词器

      技术分享

根据我们配置的中文分词器,选择Manu:

     技术分享

分析一个熊孩子造的句子:小明吃完水果然后喝水

 技术分享

发现非常智能的构建出关键词了。


版权声明:本文为博主原创文章,未经博主允许不得转载。


本文出自 “贾小仙” 博客,请务必保留此出处http://hackerxian.blog.51cto.com/9240575/1695029

apache solr配置

标签:windows   example   软件   新建   硬件   

原文地址:http://hackerxian.blog.51cto.com/9240575/1695029

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!