码迷,mamicode.com
首页 >  
搜索关键字:分词器    ( 431个结果
IK分词器 整合solr4.7 含同义词、切分词、停止词
IK分词器如果配置成 本人测试切分词可以,但是同义词,扩展词库用不了, 网上查各种资料说IK分词器有个BUG,要自己把jar文件改一下,于是找到IK的源码,里面只有IKAnalyzer的源码,代码如下 自己加了一个IKAnalyzerSolrFactory,代码如下 这样一来就能在配置文件中配置成I ...
分类:其他好文   时间:2016-06-04 16:27:30    阅读次数:1218
solr中文分词器IK-analyzer安装
solr本身对中文是不支持的,所以需要下载中文分词器IK-analyzer下载地址https://code.google.com/archive/p/ik-analyzer/downloads。自己本地系统是centos6.7,所以下载了https://storage.googleapis.com/google-code-archive-downloads/v2/code.google.com/ik-analyzer/IK%20An..
分类:其他好文   时间:2016-05-17 20:00:17    阅读次数:447
[Nutch]Solr配置自定义的中文分词器mmseg4j
上一篇博文我们有使用LUKE工具来查看使用solrindex产生的索引的具体内容,从里面可以看到,默认的分词很乱,所以这篇博文我们就使用mmseg4j中文分词器。1. 下载mmseg4j点击mmseg4j-1.8.5 .zip,进入下载页面。2. 解压mmseg4j-1.8.5.zip将下载的mmseg4j-1.8.5.zip文件放到workspace目录下面,在workspace目录使用如下命令解...
分类:其他好文   时间:2016-05-13 03:36:00    阅读次数:255
[Nutch]指定LUKE的分词器
在上一篇博文我们有介绍给Solr配置中文分词器mmseg4j,那么我们在LUKE工具中如何配置对应的中文分词器进行查看呢?本篇博文将详细进行解释。1. 下载中文分词器由于我们使用的luke是4.0版本的,只能使用mmseg4j的1.9.1版本,因为1.8.5的mmseg4j版本与4.0版本的luke有冲突,请点击下载1.9.1版本的mmseg4j-1.9.1.2. luke设置mmseg4j2.1...
分类:其他好文   时间:2016-05-12 23:44:31    阅读次数:225
全文索引----中文分词器mmseg4j
通常情况下,我们根据整个字段来索引数据,字段最长时,也不过十个字;但是还有一种情况,如果我们索引的是一篇文章呢?这时候如何处理这个字段,分词器很好的解决了这个问题。...
分类:其他好文   时间:2016-05-12 12:34:07    阅读次数:161
elasticsearch1.7.2安装ik分词器
网上试了很多种方案都不灵! 最后准于被我使出来了。记录下来,希望能帮到其他的人! ik分词器地址:https://github.com/medcl/elasticsearch-analysis-ik  1、下载 elasticsearch-analysis-ik-1.4.1.zip 2、解压,进入目录:命令行执行:mvn compile package (确保机器上...
分类:其他好文   时间:2016-05-07 07:42:47    阅读次数:220
elasticsearch入门 (三 ik 分词器安装)
ik git 地址 https://github.com/medcl/elasticsearch-analysis-ik readme 包含各个版本ik对应的 es 版本 下载对应的ikzip包 命令如下 https://github.com/medcl/elasticsearch-analysis ...
分类:其他好文   时间:2016-05-04 21:13:13    阅读次数:166
lucene包结构
lucene 2.2包结构: analysis不做详细介绍,因为在实际开发中会使用对中文支持的庖丁分词来做为分词器。 document:是写索引的时候的非常重要的一个工具,要把原始数据转为一个个document,然后进行write. index:写索引的核心包 queryParser:搜索时候的解析 ...
分类:Web程序   时间:2016-05-04 18:59:37    阅读次数:184
Lucene 查询(Query)子类
QueryParser(单域查询)QueryParser子类对单个域查询时创建查询query,构造方法中需要传入Lucene版本号,检索域名和分词器。QueryParser parser = new QueryParser(Version.LUCENE_43, field, analyzer);// 查询字符串 Query query = parser.parse("key");MultiField...
分类:Web程序   时间:2016-04-29 19:00:08    阅读次数:260
Lucene 查询(Query)子类
QueryParser(单域查询)QueryParser子类对单个域查询时创建查询query,构造方法中需要传入Lucene版本号,检索域名和分词器。QueryParser parser = new QueryParser(Version.LUCENE_43, field, analyzer);// 查询字符串 Query query = parser.parse("key");MultiField...
分类:Web程序   时间:2016-04-26 21:11:18    阅读次数:145
431条   上一页 1 ... 28 29 30 31 32 ... 44 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!