码迷,mamicode.com
首页 >  
搜索关键字:ik分词    ( 140个结果
solr添加中文IK分词器,以及配置自定义词库
Solr是一个基于Lucene的Java搜索引擎服务器。Solr提供了层面搜索、命中醒目显示并且支持多种输出格式(包括XML/XSLT和JSON格式)。它易于安装和配置,而且附带了一个基于HTTP的管理界面。Solr已经在众多大型的网站中使用,较为成熟和稳定。Solr包装并扩展了Lucene,所以Solr的..
分类:其他好文   时间:2015-05-08 13:10:49    阅读次数:183
solr添加中文IK分词器,以及配置自定义词库
Solr是一个基于Lucene的Java搜索引擎服务器。Solr 提供了层面搜索、命中醒目显示并且支持多种输出格式(包括XML/XSLT 和 JSON 格式)。它易于安装和配置,而且附带了一个基于 HTTP 的管理界面。Solr已经在众多大型的网站中使用,较为成熟和稳定。Solr 包装并扩展了 Lucene,所以Solr的基本上沿用了Lucene的相关术语。更重要的是,Solr 创建的索引与...
分类:其他好文   时间:2015-05-08 13:07:59    阅读次数:137
solr添加中文IK分词器,以及配置自定义词库
Solr是一个基于Lucene的Java搜索引擎服务器。Solr提供了层面搜索、命中醒目显示并且支持多种输出格式(包括XML/XSLT和JSON格式)。它易于安装和配置,而且附带了一个基于HTTP的管理界面。Solr已经在众多大型的网站中使用,较为成熟和稳定。Solr包装并扩展了Lucene,所以S...
分类:其他好文   时间:2015-05-08 12:56:56    阅读次数:138
CentOS 6.5+Nutch 1.7+Solr 4.7+IK 2012
环境Linux版本:CentOS6.5JDK版本:JDK1.7Nutch版本:Nutch1.7Solr版本:Solr4.7IK版本:IK-Analyzer2012目录1.安装JDK2.安装Solr3.为Solr配置IK分词4.安装Nutch内容1.安装JDK1.1在/usr/下创建java/目录,下载JDK包并解压[root@localhost~]#mkdir/usr/java [root@localhost~]#c..
分类:其他好文   时间:2015-05-06 15:27:09    阅读次数:126
Solr配置中文分词器IK Analyzer详解
配置的过程中出现了一些小问题,一下将详细讲下IK Analyzer的配置过程,配置非常的简单,但是首先主要你的Solr版本是哪个,如果是3.x版本的用IKAnalyzer2012_u6.zip如果是4.x版本的用IK Analyzer 2012FF_hf1.zip,一定要对应上,要不然会配置失败。以下是详细步骤: 1、下载IK Analyzer。 下载地址为:http://code.googl...
分类:其他好文   时间:2015-02-03 19:28:06    阅读次数:223
IK分词源码讲解(七)-TokenStream以及incrementToken属性处理
首先介绍下在lucene中attributeSource的类层次: org.apache.lucene.util.AttributeSource ·        org.apache.lucene.analysis.TokenStream (implementsjava.io.Closeable) ·        org.apache.lucene.analysis.NumericTok...
分类:其他好文   时间:2014-12-11 19:14:11    阅读次数:388
IK分词源码讲解(一)-初始篇
IK分词全名为IK Analyzer,是由java编写的中文分词工具包,目前在lucene以及solr中用的比较多,本系列的文章主要对ik的核心源码进行解析讲解,与大家分享,如果有错误的地方还望指教。 先来个整体概况: 其实从上面的图可以看出,真实的ik的代码其实并不多,这样给我们开始接触心里压力就小的多。 先打开IKAnalzyerDemo.java文件,先大体看看IK的工作流...
分类:其他好文   时间:2014-12-09 19:46:10    阅读次数:287
Lucene使用IKAnalyzer中文分词笔记
本文主要讲解IKAnalyzer(以下简称‘IK’)在Lucene中的具体使用,关于Lucene和IK分词器的背景及其作用在这里就不再熬述。不得不感叹下Lucene版本变更的快速,如今最新已经到了4.9.0,相信任何技术的发展壮大都不...
分类:其他好文   时间:2014-09-02 18:16:05    阅读次数:331
Solr3.6.2和Solr4.9.0常用配置
介绍solr3.6.2和solr4.9.0在tomcat7.0.55下的基本配置。包括IK分词器、主从配置。可以满足工作中的最基本需求。...
分类:其他好文   时间:2014-08-28 18:11:25    阅读次数:295
solr4.x配置IK2012FF智能分词+同义词配置
本文配置环境:solr4.6+ IK2012ff +tomcat7在Solr4.0发布以后,官方取消了BaseTokenizerFactory接口,而直接使用Lucene Analyzer标准接口TokenizerFactory。因此IK分词器2012 FF版本也取消了org.wltea.analy...
分类:其他好文   时间:2014-07-23 20:20:15    阅读次数:288
140条   上一页 1 ... 12 13 14
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!