Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。
...
分类:
编程语言 时间:
2015-01-30 22:50:07
阅读次数:
293
http://lucene.apache.org/core/4_0_0/MIGRATE.html 本文详细介绍了lucene的版本升级过程中的重大改进与调整。 比如:灵活的索引改变了低水平的域、词、文档、位置枚举API.
分类:
Web程序 时间:
2015-01-30 16:50:13
阅读次数:
119
转自http://blog.itpub.net/8912125/viewspace-1120496/
分类:
Web程序 时间:
2015-01-30 08:57:57
阅读次数:
576
通过java程序去连接数据库时,使用的协议是TCP/IP协议,TCP/IP协议需要进行3次握手。如果每一次数据库操作都需要创建一个新的连接,都要进行3次握手,这是十分浪费资源的,程序的效率也不是很高,数据库连接池就很好的解决了这个问题...
分类:
数据库 时间:
2015-01-29 17:42:03
阅读次数:
210
lucene实现索引的创建与检索;ikanalyzer实现对中文的分词;光到这里已经能够实现中文的检索了,但是光这样还不够,很多项目中的检索,应该还能够对同义词进行处理,比如索引库中有“计算机”,“电脑”这样的词条,搜索“笔记本”应该也能把“计算机”,“电脑”这样的词条匹配出来,这就涉及到对同义词的索引检索了。
两种方案:
1、在建立索引时,拆词建索引时就把同义词考虑进去,将同义词的词...
分类:
Web程序 时间:
2015-01-29 00:08:42
阅读次数:
311
今天我们实现一个简单的分词器,仅仅做演示使用功能如下:
1、分词按照空格、横杠、点号进行拆分;
2、实现hi与hello的同义词查询功能;
3、实现hi与hello同义词的高亮显示;
MyAnalyzer实现代码:
public class MyAnalyzer extends Analyzer {
private int analyzerType;
public MyAna...
分类:
Web程序 时间:
2015-01-28 11:14:45
阅读次数:
193
今天我们实现一个简单的分词器,仅仅做演示使用功能如下:
1、分词按照空格、横杠、点号进行拆分;
2、实现hi与hello的同义词查询功能;
3、实现hi与hello同义词的高亮显示;
MyAnalyzer实现代码:
public class MyAnalyzer extends Analyzer {
private int analyzerType;
public MyAna...
分类:
Web程序 时间:
2015-01-28 11:14:12
阅读次数:
172
介绍将字符串转化为数值的工具类ParseUtil 和 获取request参数值类ParseRequest,这两个类在做后台项目中还是比较有用的。...
分类:
Web程序 时间:
2015-01-27 23:33:23
阅读次数:
208
介绍ClassUtil类和CharsetUtil类,这两个也是项目中比较常用的类,一个用于指定文件路径,一个用于检测文件的编码方式。...
分类:
Web程序 时间:
2015-01-27 21:56:35
阅读次数:
194