码迷,mamicode.com
首页 >  
搜索关键字:lucene    ( 2421个结果
搜索引擎系列四:Lucene提供的分词器、IKAnalyze中文分词器集成
一、Lucene提供的分词器StandardAnalyzer和SmartChineseAnalyzer 1.新建一个测试Lucene提供的分词器的maven项目LuceneAnalyzer 2. 在pom.xml里面引入如下依赖 3. 新建一个标准分词器StandardAnalyzer的测试类Luc ...
分类:Web程序   时间:2018-05-05 12:34:28    阅读次数:201
搜索引擎系列二:Lucene(Lucene介绍、Lucene架构、Lucene集成)
一、Lucene介绍 1. Lucene简介 最受欢迎的java开源全文搜索引擎开发工具包。提供了完整的查询引擎和索引引擎,部分文本分词引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便在目标系统中实现全文检索功能,或者是以此为基础建立起完整的全文检索 ...
分类:Web程序   时间:2018-05-04 23:24:31    阅读次数:379
ElasticSearch(一)-- 简介
ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可 ...
分类:其他好文   时间:2018-05-03 23:37:36    阅读次数:393
Lucene的基本使用
一、全文检索与Lucene介绍 1、全文检索 将非结构化数据中的一部分信息提取出来,重新组织,使其变得有一定结构,然后对此有一定结构的数据进行搜索,从而达到搜索相对较快的目的。这部分从非结构化数据中提取出然后重新组织的信息,我们称之索引。 这种先建立索引,再对索引进行搜索的过程就叫全文检索(Full ...
分类:Web程序   时间:2018-05-02 11:18:45    阅读次数:298
lucene动态分片简介
最近开发的搜索引擎中,需要对索引进行分片。根据项目的需求,我们提供了两种分片方式。过程博客记录一下。Hash算法原理很简单,通过行键(_id)的Hash值确定所在的分片,然后再进行操作。举个栗(例)子,现在有个索引,初始化5个分片,分别为shard0, shard1, shard2, shard3, shard4。现在需要保存一行数据,_id为0001000000123,_id的HashCode为
分类:Web程序   时间:2018-04-28 19:26:31    阅读次数:200
lucene笔记
lucene全文检索 全文检索是计算机程序通过扫描文章中的每一个词, 对每一个词建立一个索引, 指明该词在文章中出现的次数和位置。 当用户查询时根据建立的索引查找,类似于通过字典的检索字表查字的过程 ...
分类:Web程序   时间:2018-04-28 14:08:42    阅读次数:154
搜索(转)
1. 深入浅出搜索架构引擎、方案与细节(上) 文字很多,有宏观,有细节,对于大部分不是专门研究搜索引擎的同学,记住以下几点即可: 1). 全网搜索引擎系统由spider, search&index, rank三个子系统构成 2). 站内搜索引擎与全网搜索引擎的差异在于,少了一个spider子系统 3 ...
分类:其他好文   时间:2018-04-22 20:04:07    阅读次数:166
lucene索引查看工具luke和文本提取工具Tika
luke可以方便的查看lucene的索引信息,当然也可以查看solr和es中的索引信息(基于lucene实现)。 查看索引前,要注意lucene版本的问题,高版本的lucene用低版本的luke工具就可能无法打开。 记得以前用luke还可以实现索引修复的功能,会把有错误的段segment删掉,使用前 ...
分类:Web程序   时间:2018-04-14 23:42:21    阅读次数:301
Solr Cloud
Solr集群: Lucene是一个Java语言编写的利用倒排原理实现的文本检索类库; Solr是以Lucene为基础实现的文本检索应用服务; SolrCloud是Solr4.0版本开发的,基于Solr和Zookeeper的分布式搜索方案,主要思想是使用Zookeeper作为集群的配置信息中心。 So ...
分类:其他好文   时间:2018-04-13 20:36:29    阅读次数:179
CentOS7搭建solr7.2
  solr介绍一、Solr它是一种开放源码的、基于 Lucene Java 的搜索服务器,易于加入到 Web 应用程序中。 二、Solr 提供了层面搜索(就是统计)、命中醒目显示并且支持多种输出格式(包括XML/XSLT 和JSON等格式)。它易于安装和配置,而且附带了一个基于 HTTP 的 管理界面。Solr已经在众多大型的网站中使用,较为成熟和稳定。 三、Solr 包装并
分类:其他好文   时间:2018-04-13 19:05:28    阅读次数:182
2421条   上一页 1 ... 44 45 46 47 48 ... 243 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!