码迷,mamicode.com
首页 >  
搜索关键字:分词器    ( 431个结果
使用 Elasticsearch ik分词实现同义词搜索(转)
1、首先需要安装好Elasticsearch 和elasticsearch-analysis-ik分词器 2、配置ik同义词 Elasticsearch 自带一个名为 synonym 的同义词 filter。为了能让 IK 和 synonym 同时工作,我们需要定义新的 analyzer,用 IK ...
分类:其他好文   时间:2016-08-06 19:09:33    阅读次数:137
Lucene整合项目
1:导入Lucene相关的jar包 其中: lucene-core-3.6.2.jar(核心包) lucene-analyzers-3.6.2.jar(分词器) lucene-highlighter-3.6.2.jar(高亮) lucene-memory-3.6.2.jar(高亮) IKAnalyz ...
分类:Web程序   时间:2016-07-20 19:28:25    阅读次数:216
隐含马尔可夫模型HMM的中文分词器 入门-1
http://sighan.cs.uchicago.edu/bakeoff2005/ http://www.52nlp.cn/中文分词入门之资源...
分类:其他好文   时间:2016-07-17 16:54:19    阅读次数:1176
【Lucene】Apache Lucene全文检索引擎架构之中文分词和高亮显示
前面总结的都是使用Lucene的标准分词器,这是针对英文的,但是中文的话就不顶用了,因为中文的语汇与英文是不同的,所以一般我们开发的时候,有中文的话肯定要使用中文分词了,这一篇博文主要介绍一下如何使用smartcn中文分词器以及对结果的高亮显示。1. 中文分词使用中文分词的话,首先到添加中文分词的jar包。 ...
分类:Web程序   时间:2016-07-12 23:30:51    阅读次数:275
elasticsearch集群&&IK分词器&&同义词
wgethttps://download.elastic.co/elasticsearch/release/org/elasticsearch/distribution/tar/elasticsearch/2.3.3/elasticsearch-2.3.3.tar.gz集群安装:三个节点:master,slave1,slvae2vielasticsearch.ymlcluster.name:my-applicationnode.name:node-3(节点独有的名称,注..
分类:其他好文   时间:2016-07-12 15:37:35    阅读次数:152
elasticsearch插件大全
Elasticsearch扩展性非常好,有很多官方和第三方开发的插件,下面以分词、同步、数据传输、脚本支持、站点、其它这几个类别进行划分。 分词插件 Combo Analysis Plugin (作者 Olivier Favre, Yakaz) 简介:组合分词器,可以把多个分词器的结果组合在一起。 ...
分类:其他好文   时间:2016-07-11 00:56:06    阅读次数:223
带 IK 分词器的 Luke 和 搜索应用服务器solr
首先在网上查了一下: Solr Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果。 Solr引擎 Solr ...
分类:其他好文   时间:2016-07-06 17:50:08    阅读次数:166
Lucene使用IKAnalyzer分词实例 及 IKAnalyzer扩展词库
文章转载自:http://www.cnblogs.com/dennisit/archive/2013/04/07/3005847.html 方案一: 基于配置的词典扩充 项目结构图如下:IK分词器还支持通过配置IKAnalyzer.cfg.xml文件来扩充您的专有词典。谷歌拼音词库下载: http: ...
分类:Web程序   时间:2016-07-05 20:35:56    阅读次数:406
elasticsearch ik插件
先来一个标准分词(standard),配置如下: index:local type:article default analyzer:stem (filter:小写、停用词等) field:title 测试: 例如: 分词如下: 部署ik分词器 在elasticsearch.yml中配置 index ...
分类:其他好文   时间:2016-06-29 07:47:17    阅读次数:331
自定义Lucene分词器示例
集团的内部通讯工具搜同事时,需要根据姓名后缀进行搜索。譬如“徐欢春”,我们要能根据“欢春”搜出这个人;“黄继刚”,要根据“继刚”为关键字搜出“黄继刚”。这是个很人性化的用户体验,当我们有同事的名字是三个字的时候,我们通常会叫他们名字的最后两个字。Lucene本身并没有提供这种分词器,只能自己照着Lucene已有的分词器进行模仿开发。    参照ngram分词器进行开发。    实现一个Tokeni...
分类:Web程序   时间:2016-06-20 12:55:01    阅读次数:261
431条   上一页 1 ... 27 28 29 30 31 ... 44 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!