ik分词是一款流行的elasticsearch 中文分词器,安装ik分词器版本一定要与所安装es版本一致。 安装步骤: 1、解压ik分词器安装包到plugin目录下,并删除压缩包。 2、重启elasticsearch进程即可。 3、如果是es集群的话,每台es都需要安装ik分词器。 测试: Curl ...
分类:
其他好文 时间:
2020-02-23 18:35:15
阅读次数:
92
什么是分词 把文本转换为一个个的单词,分词称之为analysis。es默认只对英文语句做分词,中文不支持,每个中文字都会被拆分为独立的个体。 示例 如果想在某个索引下进行分词 es内置分词器 standard:默认分词,单词会被拆分,大小会转换为小写。 simple:按照非字母分词。大写转为小写。 ...
分类:
其他好文 时间:
2020-02-09 12:03:10
阅读次数:
87
发车 为什么要在elasticsearch中要使用ik这样的中文分词呢,那是因为es提供的分词是英文分词,对于中文的分词就做的非常不好了,因此我们需要一个中文分词器来用于搜索和使用。今天我们就尝试安装下IK分词。 上车 1、去github 下载对应的分词插件https://github.com/me ...
分类:
其他好文 时间:
2020-01-17 13:33:44
阅读次数:
74
本篇文章使用的ES版本是6.6.0,使用的在线安装;本文只是针对一个一个容器进行安装的,当然可以使用Dockerfile将IK做成新的镜像的,这篇文章就不介绍了。 1、进入容器 2、在线下载并安装 注意:版本号要一致,使用的 6.6.0版本; 进入到 plugins 目录可以看到IK分词器已经安装成 ...
分类:
其他好文 时间:
2020-01-01 11:53:20
阅读次数:
123
进入到我们ik分词器安装目录下的config目录 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd"><properties> <comm ...
分类:
其他好文 时间:
2019-12-25 23:37:10
阅读次数:
120
0、默认分词器。 默认分词器,查询的时候会把中文一个汉字当作一个关键字拆分,这样是不符合我们的需求的,所以需要安装分词器。 1、下载分词器。 当前有多种分词器可下载,据说比较好用的是IK分词器。 注意,下载分词器的时候,版本必须要与Elasticsearch安装的版本一致,否则会出现不可描述的错误。 ...
分类:
其他好文 时间:
2019-12-25 23:36:15
阅读次数:
192
主要问题 一定要保证ElasticSearch和ElasticSearch插件的版本一致 我是用的是ElasticSearch是5.6.11版本 对应elasticsearch-analysis-ik-5.6.11 安装插件 在线安装 进入容器 docker exec -it elasticsear ...
分类:
其他好文 时间:
2019-12-16 17:34:31
阅读次数:
88
solr 基本介绍Apache Solr (读音: SOLer) 是一个开源的搜索服务器。Solr 使用 Java 语言开发,主要基于 HTTP 和 Apache Lucene 实现。Apache Solr 中存储的资源是以 Document 为对象进行存储的。每个文档由一系列的 Field 构成,... ...
分类:
其他好文 时间:
2019-12-14 10:05:08
阅读次数:
149
此文摘自https://www.cnblogs.com/hengzhi/p/9290667.html ES默认对英文文本的分词器支持较好,但和lucene一样,如果需要对中文进行全文检索,那么需要使用中文分词器,同lucene一样,在使用中文全文检索前,需要集成IK分词器。 可以从GitHub上获取 ...
分类:
其他好文 时间:
2019-11-21 16:45:12
阅读次数:
69
IK分词器的使用 首先我们通过 发送 请求查询分词效果 得到如下结果,可以发现es的默认分词器无法识别中文中 、`银行`这样的词汇,而是简单的将每个字拆完分为一个词,这显然不符合我们的使用要求。 首先我们访问 https://github.com/medcl/elasticsearch analys ...
分类:
其他好文 时间:
2019-11-07 11:24:57
阅读次数:
77