之前安装了几次没有成功, PengYi <notifications@github.com>,这哥们发email说: 看源代码里面,ltp是一个link。所以,git clone下来,这个目录下面是空的。需要进入源代码目录。把ltp删掉,然后在执行 git clone git@github.com: ...
分类:
系统相关 时间:
2018-10-14 19:15:26
阅读次数:
316
elasticsearch 自定义分词器 安装拼音分词器、ik分词器 拼音分词器: https://github.com/medcl/elasticsearch-analysis-pinyin/releases ik分词器:https://github.com/medcl/elasticsearch ...
分类:
编程语言 时间:
2018-10-04 17:24:58
阅读次数:
399
solr的域要先定义后使用, 哪些数据需要导入? 分词器 1 分词器jar包复制 , cp IK\ Analyzer\ 2012FF_hf1/IKAnalyzer2012FF_u1.jar 中文分词器配置文件和字典 cp ext_stopword.dic IKAnalyzer.cfg.xml myd ...
分类:
其他好文 时间:
2018-09-30 14:42:43
阅读次数:
169
一、IK简介 ElasticSearch(以下简称ES)默认的分词器是标准分词器Standard,如果直接使用在处理中文内容的搜索时,中文词语被分成了一个一个的汉字,因此引入中文分词器IK就能解决这个问题,同时用户可以配置自己的扩展字典、远程扩展字典等。 二、IK安装 1、首先前往GitHub下载安 ...
分类:
其他好文 时间:
2018-09-28 12:50:25
阅读次数:
181
一、es 第一步:搜索docker search elasticsearch第二步:下载镜像第三步:创建数据文件夹和配置文件宿主服务器创建文件夹mkdir -p /docker/es1/datavim /docker/es1/es.yml输入配置内容:http.host: 0.0.0.0#集群名称 ...
分类:
其他好文 时间:
2018-09-26 22:13:59
阅读次数:
342
1 public class WordCount { 2 static Directory directory; 3 // 创建分词器 4 static Analyzer analyzer = new IKAnalyzer(); 5 static IndexWriterConfig config =... ...
分类:
编程语言 时间:
2018-09-24 20:03:17
阅读次数:
237
ElasticSearch评分分析 explian 解释和一些查询理解 按照 "es ik分析器" 安装了ik分词器。然后创建了一个索引用来演示,创建索引: 。索引的结构如下: 实验环境为:单台的ElasticSearch6.3.2版本。索引配置如下: 由此可知,ElasticSearch创建索引时 ...
分类:
其他好文 时间:
2018-09-23 16:32:27
阅读次数:
184
2018-8-25未命名文件新建模板小书匠type(None) 16:35:39elasticSearch解决大数据量字段模糊查询,建立数据索引库,全文检索方式查询。全文检索:检索文本中的每个词与搜索项进行对此。全文索引:采用分词器,对文本每个词进行切分,建立词条,方便进行查找。Lucene 就是一... ...
分类:
其他好文 时间:
2018-08-25 23:01:00
阅读次数:
218
本文通过为Solr配置IK中文分词器、配置业务域以及配置DIH --- 从MySQL数据库中导入数据并建立索引, 简单演示了Solr在实际项目中的应用. ...
分类:
其他好文 时间:
2018-08-21 21:14:30
阅读次数:
237
一)新建maven工程 1.1)项目结构如下: 1.2)IKAnalyzer.cfg.xml内容如下: 1.3)在pom文件中添加如下jar 三)运行结果如下: 可在extend.dic 与 stopword.dic 之间进行调整 分词 ...
分类:
其他好文 时间:
2018-08-20 13:42:54
阅读次数:
152