1、首先导入solrj需要的的架包 2、需要注意的是低版本是solr是使用SolrServer进行URL实例的,5.0之后已经使用SolrClient替代这个类了,在添加之后首先我们需要根据schema.xml配置一下我们的分词器 这里的msg_all还需要在schema.xml中配置 它的主要作用 ...
分类:
编程语言 时间:
2016-10-01 00:31:47
阅读次数:
477
1、solr自带的分词器远远满足不了中文分词的需求,经查使用最多的分词器是solr是mmseg4j分词器,具体整合大家可以参考 https://github.com/zhuomingliang/mmseg4j 一定要注意版本 2、将这两个包直接拷贝到tomcat下的solr/lib中 3、在solr ...
分类:
其他好文 时间:
2016-10-01 00:07:23
阅读次数:
201
转载请注明出处:http://www.cnblogs.com/zhuxiaojie/p/5764680.html 本教程基于solr5.5 前言 至于为什么要用solr5.5,因为最新的6.10,没有中文的分词器支持,这里使用的是ik分词器,刚好支持到5.5 ik分词器下载地址 :https://g ...
分类:
其他好文 时间:
2016-09-19 22:24:18
阅读次数:
291
1、什么是分词器采用一种算法,将中英文本中的字符拆分开来,形成词汇,以待用户输入关健字后搜索2、为什么要分词器因为用户输入的搜索的内容是一段文本中的一个关健字,和原始表中的内容有差别,但作为搜索引擎来讲,又得将相关的内容搜索出来,此时就得采用分词器来最大限度..
分类:
Web程序 时间:
2016-09-14 23:30:19
阅读次数:
234
1、什么是索引库索引库是Lucene的重要的存储结构,它包括二部份:原始记录表,词汇表原始记录表:存放的是原始记录信息,Lucene为存入的内容分配一个唯一的编号词汇表:存放的是经过分词器拆分出来的词汇和该词汇在原始记录表中的编号2、为什么要将索引库进行优化在默认情况下..
分类:
Web程序 时间:
2016-09-14 08:26:23
阅读次数:
266
为了更好的排版, 所以将IK分词器的安装重启了一篇博文, 大家可以接上solr的安装一同查看.[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例一: http://www.cnblogs.com/wang-meng/p/5814798.html8, 打开浏览器查看sol ...
分类:
系统相关 时间:
2016-08-28 13:56:55
阅读次数:
263
今天 不知自己装的centos 出现了什么问题, 一直卡在 启动界面, 找了半天没找见原因(最后时刻还是发现原因, 只因自己手欠一怒之下将centos删除了, 而且选择的是在本地磁盘也删除. ..让我哭一会..)..于是便重新安装, 可是问题来了, 之前安装及配置好的zookeeper/redis/ ...
分类:
系统相关 时间:
2016-08-28 13:54:47
阅读次数:
310
在这里一下讲解着三个的安装和配置, 是因为solr需要使用tomcat和IK分词器, 这里会通过图文教程的形式来详解它们的安装和使用.注: 本文属于原创文章, 如若转载,请注明出处, 谢谢.关于设置IK分词器的文章 IK分词器: http://www.cnblogs.com/wang-meng/p/ ...
分类:
系统相关 时间:
2016-08-28 13:48:07
阅读次数:
272
在上一篇[Linux] linux下安装配置 zookeeper/redis/solr/tomcat/IK分词器 详细实例. 我们已经将redis所需tar包拷贝到了linux下的root 根目录下, 接着我们只需要解压就可以了. 先将Redis的tar包拷贝到Linux下的根目录然后解压到redi ...
分类:
系统相关 时间:
2016-08-28 09:52:48
阅读次数:
241
solr中配有分词器,但分词器里面有大写转换为小写的过滤器时,数字就会被过滤。比如123中国ABC。123就会被过滤掉了,所以才查1|12|123都会失败。 《Solr 数字字符不能搜索的一个问题》这篇博文说得还算详细,我就是学这篇文章的。 根据账号来搜索,当账号在数据库中是整型变量时,导入到sol ...
分类:
其他好文 时间:
2016-08-10 18:55:24
阅读次数:
989