我的solr版本是5.3.0 1将jar包ik-analyzer-solr5-5.x.jar放入sor的web-inf的lib里面 2 在web-inf下面新建classes目录,再新增三个配置文件: IKAnalyzer.cfg.xml mydict.dic ext_stopword.dic 3在 ...
分类:
其他好文 时间:
2018-04-26 12:11:36
阅读次数:
177
第一步下载分词器https://pan.baidu.com/s/1X8v65YZ4gIkNQXsXfSULBw 第二歩打开已经解压的ik分词器文件夹 将ik-analyzer-solr5-5.x.jar,IKAnalyzer.cfg.xml复制到 apache-tomcat-8.5.24\webap ...
分类:
其他好文 时间:
2018-04-21 17:41:42
阅读次数:
185
一. 问题: 在使用solr时, 分词器解析中文的时候, 是一个一个字解析的. 这并不是我们想要的结果. 而在lucene中, 使用的中文分词器是 IKAnalyzer. 那么在solr里面, 是不是任然可以用这个呢. 二. 整合 ik 1. 修改schema配置文件 打开如下路径中的managed ...
分类:
其他好文 时间:
2017-12-27 23:54:07
阅读次数:
210
1.有关搜索功能的构思(有关solr 以及 IK Analyzer 的下载链接 http://pan.baidu.com/s/1i43DOW1 密码:u5gg) 1.1 配置solr服务,设置端口为8080 然后在solr服务加入所需要的字段 1.2 建立jingxi-reach项目 1.3 写一个 ...
分类:
其他好文 时间:
2017-10-22 01:38:22
阅读次数:
142
1.准备阶段 操作系统:CentOS 6.8 安装包:/home/test solr-4.10.3.tgz.tar IK Analyzer 2012FF_hf1.zip jdk-8u121-linux-i586.tar.gz apache-tomcat-6.0.51.tar.gz 2.jdk和tom... ...
分类:
系统相关 时间:
2017-05-20 15:29:39
阅读次数:
294
本文主要是记录Elasticsearch5.3.1 IK分词,同义词/联想搜索设置,本来是要写fscrawler的多种格式(html,pdf,word...)数据导入的,但是IK分词和同义词配置还是折腾了两天,没有很详细的内容,这里决定还是记录下来。IK Analyzer是一个开源的,基于java语... ...
分类:
其他好文 时间:
2017-05-16 00:34:21
阅读次数:
668
一、扩展停用词字典IK Analyzer默认的停用词词典为IKAnalyzer2012_u6/stopword.dic,这个停用词词典并不完整,只有30多个英文停用词。可以扩展停用词字典,新增ext_...
分类:
Web程序 时间:
2017-02-06 13:32:50
阅读次数:
254
转自:http://blog.csdn.net/linzhiqiang0316/article/details/51554217,表示感谢。 由于前面没有设置分词器,以至于查询的结果出入比较大,并且无法进行正确的高亮显示。现在配置一下分词器来解决相关问题。 solr6.0中进行中文分词器IK Ana ...
分类:
其他好文 时间:
2016-10-02 00:45:38
阅读次数:
222
如今做任何一个系统都有搜索,而搜索界有著名的三剑客: solr/elasticsearch/sphinx solr/elasticsearch 为同一类的,都是基于lucene开发的产品,本人也早在几年前用过solr做过类似中关村的产品搜索,faceting功能非常好用. 近期手头上又有个项目要搭建 ...
分类:
数据库 时间:
2016-06-22 20:37:11
阅读次数:
619
IK简介 IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始, IKAnalyzer已经推出了4个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。从3.0版本开 始,IK发展为面向Jav ...
分类:
其他好文 时间:
2016-06-04 15:00:33
阅读次数:
547