全文搜索介绍 全文搜索两个最重要的方面是: 相关性(Relevance) 它是评价查询与其结果间的相关程度,并根据这种相关程度对结果排名的一种能力,这 种计算方式可以是 TF/IDF 方法、地理位置邻近、模糊相似,或其他的某些算法。 分词(Analysis) 它是将文本块转换为有区别的、规范化的 t ...
分类:
其他好文 时间:
2020-06-13 13:21:20
阅读次数:
86
elasticsearch 单节点搭建与爬坑记录 prepare 虚拟机或者云服务器(这里用的是阿里云ECS) linux centos7 安装完毕的jdk 相应的安装包(在https://www.cnblogs.com/G-Aurora/p/13099459.html中有快速下载的镜像站) ps. ...
分类:
其他好文 时间:
2020-06-13 00:41:54
阅读次数:
55
解决只能通过localhost访问Elasticsearch的问题 在默认情况下Elasticsearch是无法通过外网访问的 需要绑定地址,原因如下: 具体方法为: vim /opt/es/elasticsearch-5.1.2/config/elasticsearch.yml 注意前面是我自己的 ...
分类:
其他好文 时间:
2020-06-13 00:22:29
阅读次数:
221
1 /** 2 * 批量更新文档 3 * 4 * @param index ES索引 5 * @param documents 待提交的批量文档 6 * @param uuidKey 文档中ID字段对应的key值 7 */ 8 public BulkResponse updateDocumentsA ...
分类:
其他好文 时间:
2020-06-12 11:13:28
阅读次数:
119
1 import com.alibaba.fastjson.JSON; 2 import lombok.extern.slf4j.Slf4j; 3 import org.apache.commons.collections4.CollectionUtils; 4 import org.apache. ...
分类:
其他好文 时间:
2020-06-12 11:13:07
阅读次数:
56
Elasticsearch(ES)是一款基于Lucene的开源分布式搜索引擎。由于其稳定、可靠、快速、安装使用方便等优良特性,目前在业界已广泛使用。ES用途主要分两个方向:分布式实时文件存储以及分布式实时分析搜索引擎。一、为什么需要查询代理屏蔽复杂的DSL某二手交易平台使用ES,主要用来支持商品、用户等(以下统称文档)的搜索和分析。ES为查询功能提供了基于Json的完整QueryDSL,功能非常强
分类:
其他好文 时间:
2020-06-12 09:17:53
阅读次数:
50
ElasticHD两种安装方式 1、ElasticHD介绍 ElasticHD 支持 ES监控、实时搜索,Index template快捷替换修改,索引列表信息查看, SQL converts to DSL工具等 2、安装 ElasticHD是gitHub上的一个开源项目,没有官方网站,需要安装直接 ...
分类:
其他好文 时间:
2020-06-12 01:01:29
阅读次数:
214
/** * Creates a new unsorted {@link PageRequest}. * * @param page zero-based page index. * @param size the size of the page to be returned. * @since 2 ...
分类:
其他好文 时间:
2020-06-11 21:42:06
阅读次数:
73
Elasticsearch(ES)是一款基于Lucene的开源分布式搜索引擎。由于其稳定、可靠、快速、安装使用方便等优良特性,目前在业界已广泛使用。ES用途主要分两个方向:分布式实时文件存储 以及 分布式实时分析搜索引擎。 一、为什么需要查询代理 屏蔽复杂的DSL 某二手交易平台使用ES,主要用来支 ...
分类:
其他好文 时间:
2020-06-11 19:41:53
阅读次数:
48
本篇对中文分词器IK作了简单的讲解,市面上流行的中文分词器很多,如果我们遇到有中文分词的需求,货比三家是永远不过时的道理,调研可能要花费一些时间,但能挑到适合自己项目的分词器,还是划算的
分类:
其他好文 时间:
2020-06-11 12:05:12
阅读次数:
61