增加新内容的时候,或者删除的时候我们需要对索引进行增删改查来进行索引的维护。 先上代码: package come.me.lucene; //索引维护 import java.io.File; import org.apache.lucene.analysis.Analyzer; import or ...
分类:
Web程序 时间:
2020-02-01 23:15:50
阅读次数:
95
在之前的程序中我们发现分词不太准确,因此我们可以使用支持中文分词。 分析器的执行过程: 从一个reader字符流开始,创建一个基于reader的tokenizer分词器,经过三个tokenfilter(第一个大写变小写,第二个用回车替换空格,去掉不需要的a,the,and,逗号等)生成tokens。 ...
分类:
Web程序 时间:
2020-02-01 21:10:22
阅读次数:
99
创建完索引之后,我们需要查询。 百度的查询接口及结果如图所示: 具体步骤已经在上个博客中写到,直接上代码:(由于是一个完整的程序,我把创建索引的代码也post上) package come.me.lucene; import static org.junit.jupiter.api.Assertio ...
分类:
Web程序 时间:
2020-02-01 20:59:33
阅读次数:
95
Flask之RESTFul API前后端分离 一:虚拟环境搭建的两种方式 1 pipenv的使用 pip install --user pipenv安装pipenv在用户目录下 py -m site --user-site通过此命令找到用户基础目录,结果为C:\Users\u14e\AppData\ ...
【承接上文】1、问:Lucene优点?答:a、Lucene定义了一套以9字节为基础的索引文件格式,使得兼容系统或者不同平台的应用能够共享建立的索引文件。b、在传统倒排索引的基础上,实现了分块索引。【ps:这里说明一下什么是倒排索引】实际应用中需要根据属性值来查找记录,这种索引表中的每一项都包括一个属性值和对应的记录地址。由于是由属性值来确定记录位置,因而被称为倒排索引。c、用户无需编写代码即可使用
分类:
Web程序 时间:
2020-01-31 18:55:36
阅读次数:
80
【前言】从前年的时候,我都在心里有个想法。我想自己做一套搜索功能。在心里我是这么想的:1、有个资源信息库,供我查询,这个资源库可能包含各种途径生成的统一格式的数据库。2、查询时,我先整段匹配资源库找到资源。3、接下来就是分词了,这里我联想到了一些输入法的细胞词库。也就是说能不能按照细胞词库先匹配我们的搜索内容,然后将分词后的搜索条件进行匹配查询。4、按照匹配度的高低进行排序。直到昨天,在工作中刚刚
分类:
Web程序 时间:
2020-01-31 16:09:51
阅读次数:
101
什么是RESTful? Representational State Transfer(表象层状态转变),是一种架构方式的约束和规则。在实际应用中,API开发可以参考RESTful的标准但是也没必要完全遵守。 在实际工作中,RESTful对api接口规范,命名规则,返回值,授权验证等做了一定的约束, ...
1. ES 1.1 ES定义 ES=elaticsearch简写, Elasticsearch是一个开源的高扩展的分布式全文检索引擎,它可以近乎实时的存储、检索数据;本身扩展性很好,可以扩展到上百台服务器,处理PB级别的数据。 Elasticsearch也使用Java开发并使用Lucene作为其核心 ...
分类:
其他好文 时间:
2020-01-30 17:13:38
阅读次数:
71
实际集成 获取restTemplate实例,封装方法 增加一个MessageConverter 参考 简介: spring框架提供的RestTemplate类可用于在应用中调用rest服务,它简化了与http服务的通信方式,统一了RESTful的标准,封装了http链接,我们只需要传入url及返回值 ...
分类:
编程语言 时间:
2020-01-29 21:40:39
阅读次数:
119
curl -XPOST "http://localhost:9200/_bulk?pretty" --data-binary @books.json 这句话在书中是以crul的命令启动的,而不是使用Kibana. 其次,他说使用了books.json,在P183页说保存为books.json这个文件 ...
分类:
Web程序 时间:
2020-01-29 21:31:31
阅读次数:
92