1.分析器的执行过程: 第一个 TokenFilter将大写字母变为小写,第二次分词去掉空格并换行,第三次去掉不要的 and或者标点符号 2.中文分词器介绍: (1)lucene自带的 (2)第三方的 3.查看标准分词器对中文的分词效果: 最终决定使用的是IKAnalyzer()分词器,支持中文扩展 ...
分类:
Web程序 时间:
2017-08-05 19:45:09
阅读次数:
386
ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,作为当前流行的企业级搜索引擎,用于云计算中,能够达到实时搜索,并且具有稳定,可靠,快速安装,使用方便等多种优点,得到 ...
分类:
编程语言 时间:
2017-08-05 10:58:28
阅读次数:
303
lucene入门程序环境搭建及入门代码 1.1 需求 使用lucene完成对数据库中图书信息的索引和搜索功能。 1.2 环境准备 l Jdk:1.7及以上 l Lucene:4.10(从4.8版本以后,必须使用jdk1.7及以上) l Ide:indigo l 数据库:mysql 5 1.3 工程搭 ...
分类:
Web程序 时间:
2017-08-02 19:13:21
阅读次数:
172
有个新的技术需求,需要对Lucene4.x的源码进行扩展,把如下的有时间位置的文本写入倒排索引,为此,我扩展了一个TimeTokenizer分词器,在这个分词器里将时间信息写入 偏移量Offset中。扩展了一个Filter,最后查询时通过filter把时间信息传进去过滤想要的时间范围之内的结果。 L ...
分类:
Web程序 时间:
2017-08-01 22:58:31
阅读次数:
208
?? solr是基于lucene的一个全文检索服务器,提供了一些类似webservice的API接口,用户可以通过http请求solr服务器,进行索引的建立和索引的搜索。索引建立的过程:用户提交的文本会经过分词器进行分词,分词后的关键字会存到索引库里,索引库是关键字和目标文档的映射集。索引搜索的过程 ...
分类:
系统相关 时间:
2017-07-31 11:23:32
阅读次数:
345
本节内容: Elasticsearch介绍 Elasticsearch集群安装部署 Elasticsearch优化 安装插件:中文分词器ik 一、Elasticsearch介绍 Elasticsearch是一个分布式搜索服务,提供Restful API,底层基于Lucene,采用多shard的方式保 ...
分类:
其他好文 时间:
2017-07-23 16:48:52
阅读次数:
176
1mysql导入数据到solr方式一:创建项目,查询出数据,一条一条add到solr中;(不推荐)方式二:通过配置复制数据到solr中以上已完成了在本地window8中对solr的部署,为solr添加了一个自定义的coredemo,并且引入了ik分词器。那么该如何将本地的mysql的数据导入到solr中呢?1.1准..
分类:
数据库 时间:
2017-07-10 16:41:21
阅读次数:
198
1新建demo-solr关闭运行的solr应用。进入solr目录:D:\solr-4.10.2\example1、在example目录下创建demo-solr文件夹;2、将./solr下的solr.xml拷贝到demo-solr目录下;3、在demo-solr下创建demo目录,并且在demo目录下创建conf和data目录;4、将example\solr\collection1\core.p..
分类:
其他好文 时间:
2017-07-10 16:28:18
阅读次数:
290
前面介绍过schema.xml的一些配置信息,本章介绍solrconfig.xml的配置,以及怎样安装smartcn分词器和IK分词器,并介绍主要的查询语法。 1、 solr配置solrconfig.xml solrconfig.xml这个配置文件能够在你下载solr包的安装解压文件夹的D:\sol ...
分类:
其他好文 时间:
2017-07-08 14:15:00
阅读次数:
223
简介:当前讲解的IK分词器包的version为1.8。一、下载zip包。下面有附件链接【ik-安装包.zip】,下载即可。二、上传zip包。下载后解压缩,如下图。打开修改修改好后打成zip包。#‘elasticsearch.version‘versionofelasticsearchcompiledagainst#Youwillhavetoreleaseanewversion..
分类:
其他好文 时间:
2017-06-28 14:33:10
阅读次数:
288