码迷,mamicode.com
首页 >  
搜索关键字:分词器    ( 431个结果
Solr系列二:Solr与mmseg4j的整合
mmseg4j是一个很好的中文分词器,solr与mmseg4j的整合也非常简单。如下: 第一步:下载mmseg4j的jar包,网上搜索一下有很多下载地址,如下是csdn上的一个连接:http://download.csdn.net/detail/nrs12345/6986585 第二步:将下载的mm ...
分类:其他好文   时间:2016-04-25 22:32:36    阅读次数:267
Elasticsearch
Elasticsearch初步使用(安装、Head配置、分词器配置) 1.ElasticSearch简单说明 a.ElasticSearch是一个基于Lucene开发的搜索服务器,具有分布式多用户的能力,ElasticSearch是用Java开发的开源项目(Apache许可条款),基于Restful ...
分类:其他好文   时间:2016-04-21 08:38:19    阅读次数:213
Elasticsearch初步使用(安装、Head配置、分词器配置)
1.ElasticSearch简单说明 a.ElasticSearch是一个基于Lucene开发的搜索服务器,具有分布式多用户的能力,ElasticSearch是用Java开发的开源项目(Apache许可条款),基于Restful Web接口,能够达到实时搜索、稳定、可靠、快速、高性能、安装使用方便 ...
分类:其他好文   时间:2016-04-19 18:51:48    阅读次数:717
Solr和IK分词器的整合
IK分词器相对于mmseg4J来说词典内容更加丰富,但是没有mmseg4J灵活,后者可以自定义自己的词语库。IK分词器的配置过程和mmseg4J一样简单,其过程如下: 1.引入IKAnalyzer.jar包到solr应用程序的WEB-INF/lib/目录下 2.打开solr的home/conf目录下 ...
分类:其他好文   时间:2016-04-16 18:39:53    阅读次数:124
搜索技术:solr+IK分词器配置
一、搭建solr服务器1、Apache官网下载solr,本次使用4.9.1版本2、解压solr,找到example,将webapps中的war包复制到tomcat的webapps下3、运行tomcat,关闭tomcat,得到解压后的solr文件夹,删除war包4、将example\lib\ext\* ...
分类:其他好文   时间:2016-04-07 18:25:50    阅读次数:146
Solr配置中文分词器IKAnalyzer及增删改查调用
一、配置IKAnalyzer中文分词器Solr版本5.2.1IKAnalyzer2012_u6.jar报错,用IKAnalyzer2012_FF_hf1.jar替换可解决解决lucene4.0与IKAnalyzer的冲突。解决Exceptioninthread"main"java.lang.VerifyError:classorg.wltea.analyzer.lucene.IKAnalyzeroverridesfinalmethodtokenStrea..
分类:其他好文   时间:2016-03-20 18:09:01    阅读次数:1197
lucene-一篇分词器介绍很好理解的文章
本文来自这里在前面的概念介绍中我们已经知道了分析器的作用,就是把句子按照语义切分成一个个词语。英文切分已经有了很成熟的分析器: StandardAnalyzer,很多情况下StandardAnalyzer是个不错的选择。甚至你会发现StandardAnalyzer也能对中文进行分词。但是我们的焦点是
分类:Web程序   时间:2016-03-01 22:15:22    阅读次数:165
lucene定义自己的分词器将其分成单个字符
问题描写叙述:将一句话拆分成单个字符。而且去掉空格。 package com.mylucene; import java.io.IOException; import java.io.Reader; import org.apache.lucene.analysis.Tokenizer; impor
分类:Web程序   时间:2016-02-22 17:38:30    阅读次数:176
Elasticsearch 2.2.0 分词篇:中文分词
在Elasticsearch中,内置了很多分词器(analyzers),但默认的分词器对中文的支持都不是太好。所以需要单独安装插件来支持,比较常用的是中科院ICTCLAS的smartcn和IKAnanlyzer效果还是不错的,但是目前IKAnanlyzer还不支持最新的Elasticsearch2.2.0版本,但是smartcn中文分词器..
分类:其他好文   时间:2016-02-20 10:33:20    阅读次数:228
IK分词器原理与源码分析
原文:http://3dobe.com/archives/44/ 引言 做搜索技术的不可能不接触分词器。个人认为为什么搜索引擎无法被数据库所替代的原因主要有两点,一个是在数据量比较大的时候,搜索引擎的查询速度快,第二点在于,搜索引擎能做到比数据库更理解用户。第一点好理解,每当数据库的单个表大了,就是
分类:其他好文   时间:2016-02-18 11:59:22    阅读次数:203
431条   上一页 1 ... 29 30 31 32 33 ... 44 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!