码迷,mamicode.com
首页 >  
搜索关键字:lucene    ( 2421个结果
Lucene教程具体解释
注明:本文是由本人在开发有关基于lucene资源检索系统时的一点总结,当中一部分是自己依据开发过程自己总结的,也有部分是摘自网络,因无法获取当时摘文的地址,所以在此没有写源地址。转载请声明出处Lucene-3.0.0配置一、Lucene开发环境配置step1.Lucene开发包下载step2.Jav...
分类:其他好文   时间:2014-07-24 17:07:56    阅读次数:262
开发,从需求出发 · 之三 春天在哪里
从需求出发并不是一句空话,在开发过程中也是如此。 从需求出发,实质上是暗合了极限编程和测试驱动开发的一些思想。 鉴于网站开发是一个比较流行的方向,我打算从一个网站开始,阐述一下自己对“需求驱动开发“的理解,并将其引申到一个更广泛的领域。...
分类:其他好文   时间:2014-07-24 10:37:26    阅读次数:395
开发,从需求出发 · 之四 春天在这里
从需求出发并不是一句空话,在开发过程中也是如此。 从需求出发,实质上是暗合了极限编程和测试驱动开发的一些思想。 鉴于网站开发是一个比较流行的方向,我打算从一个网站开始,阐述一下自己对“需求驱动开发“的理解,并将其引申到一个更广泛的领域。...
分类:其他好文   时间:2014-07-24 10:35:53    阅读次数:373
【Solr基础教程之X】配置文件:Solr.xml SolrConfig.xml Schema.xml
1、关于默认搜索域 If you are using the Lucene query parser, queries that don't specify a field name will use the defaultSearchField. The DisMax and Extended DisMax query parsers do not use this value.  ...
分类:其他好文   时间:2014-07-23 22:38:28    阅读次数:279
重写lucene.net的分词器支持3.0.3.0版本
lucene.net中每个分词器都是一个类,同时有一个辅助类,这个辅助类完成分词的大部分逻辑。分词类以Analyzer结尾,辅助类通常以Tokenizer结尾。分类词全部继承自Analyzer类,辅助类通常也会继承某个类。首先在Analysis文件夹下建立两个类,EasyAnalyzer和EasyT...
分类:Web程序   时间:2014-07-23 22:24:47    阅读次数:268
solr4.x配置IK2012FF智能分词+同义词配置
本文配置环境:solr4.6+ IK2012ff +tomcat7在Solr4.0发布以后,官方取消了BaseTokenizerFactory接口,而直接使用Lucene Analyzer标准接口TokenizerFactory。因此IK分词器2012 FF版本也取消了org.wltea.analy...
分类:其他好文   时间:2014-07-23 20:20:15    阅读次数:288
转:ElasticSearch的安装和相关插件的安装
原文来自于:http://blog.csdn.net/whxaing2011/article/details/18237733本文主要介绍如下内容: 1、ElasticSearch的安装(Windows 和 Linux) 2、ElasticSearch插件安装 3、ElasticSearch源码集成...
分类:其他好文   时间:2014-07-23 15:10:16    阅读次数:300
RESTful API 设计最佳实践
RESTful API 设计最佳实践摘要:目前互联网上充斥着大量的关于RESTful API(为了方便,以后API和RESTful API 一个意思)如何设计的文章,然而却没有一个”万能“的设计标准:如何鉴权?API格式如何?你的API是否应该加入版本信息?背景目前互联网上充斥着大量的关于RESTf...
分类:Windows程序   时间:2014-07-23 12:33:26    阅读次数:412
中文分词技术(中文分词原理)
一、为什么要进行中文分词?词是最小的能够独立活动的有意义的语言成分,英文单词之间是以空格作为自然分界符的,而汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。Lucene中对中文的处理是基于自动切分的单字切分,或者二元切分。除此之外,还有最大切分(...
分类:其他好文   时间:2014-07-23 12:20:06    阅读次数:263
基于Lucene3.5.0怎样从TokenStream获得Token
通过学习Lucene3.5.0的doc文档,对不同release版本号 lucene版本号的API修改做分析。最后找到了有价值的修改信息。LUCENE-2302: Deprecated TermAttribute and replaced by a new CharTermAttribute. Th...
分类:其他好文   时间:2014-07-22 00:36:33    阅读次数:258
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!