前排 本文参考-使用Docker安装IK中文分词器 前提 es已经启动 安装ik分词器 ##第一步 下载ik分词器 ik分词器官方下载地址 下载比较慢 这里提供一下 ik7.10.1下载链接 下载对应自己es的ik分词器 第二步 上传ik分词器到服务器 新建文件夹 mkdir -p /data/el ...
分类:
其他好文 时间:
2021-01-11 11:28:47
阅读次数:
0
文章搜索我现在使用的是mysql的模糊查询like搜索标题关键字。 之前也有用全文索引,但是全文索引的效率比较低,所以,后期就没有在对文章内容进行匹配。 后来接触到中文分词器,感觉他刚好能解决我的问题:目前比较好的支持PHP的分词器大概有solr(基于Java开发),sphinx(基于C++开发) ...
分类:
其他好文 时间:
2021-01-11 10:52:57
阅读次数:
0
下载eslasticSearch(本次使用6.5.4的windows版本) https://www.elastic.co/cn/downloads/past-releases 下载ik中文分词器(对应es的版本 下载zip) https://github.com/medcl/elasticsearc ...
分类:
其他好文 时间:
2020-08-01 12:35:01
阅读次数:
94
DockerFile构建ElasticSearch镜像安装IK中文分词器插件 为什么要安装IK中文分词器? ES提供的分词是英文分词,对中文做分词时会拆成单字而不是词语,非常不好,因此索引信息含中文时需要使用中文分词器插件。 一、环境及文件准备 环境准备 VMWare版本:15.5.5 操作系统:C ...
分类:
其他好文 时间:
2020-07-29 17:44:12
阅读次数:
85
1,讲分词器的文件夹放入es安装包的plugins,重新启动elasticsearch //查询es运行中的进程pid ps -aux|grep elasticsearch //杀死进程 kill -9 pid //使用es账户启动 nohup ./elasticsearch & 2,重启es,然后 ...
分类:
其他好文 时间:
2020-07-17 19:24:23
阅读次数:
67
1,讲分词器的文件夹放入es安装包的plugins,重新启动elasticsearch //查询es运行中的进程pid ps -aux|grep elasticsearch //杀死进程 kill -9 pid //使用es账户启动 nohup ./elasticsearch & 2,重启es,然后 ...
分类:
其他好文 时间:
2020-07-17 16:22:28
阅读次数:
69
本篇对中文分词器IK作了简单的讲解,市面上流行的中文分词器很多,如果我们遇到有中文分词的需求,货比三家是永远不过时的道理,调研可能要花费一些时间,但能挑到适合自己项目的分词器,还是划算的
分类:
其他好文 时间:
2020-06-11 12:05:12
阅读次数:
61
一直到今天,才打算写这篇文章。我使用的es服务器,是使用docker进行安装的,不像传统的那种安装,分词器要添加到docker里,一直有些头疼。 es整体都整理好了,进行补充没有实现的一些es知识点。 1.参考地址 github:https://github.com/medcl/elasticsea ...
分类:
其他好文 时间:
2020-05-04 00:32:36
阅读次数:
96
Elasticsearch 6.4.3 logstash 6.4.3 及 ik 6.4.3 中文分词器下载 elasticsearch-6.4.3.tar.gz logstash-6.4.3.tar.gz elasticsearch-analysis-ik-6.4.3.zip 下载链接 链接:htt ...
分类:
其他好文 时间:
2020-04-19 17:36:26
阅读次数:
200
众所周知, 斯坦福大学自然语言处理组 出品了一系列NLP工具包,但是大多数都是用Java写得,对于Python用户不是很友好。几年前我曾基于斯坦福Java工具包和NLTK写过一个简单的中文分词接口: Python自然语言处理实践: 在NLTK中使用斯坦福中文分词器 ,不过用起来也不是很方便。深度学习 ...
分类:
编程语言 时间:
2020-04-15 13:47:31
阅读次数:
191