本文转载自:http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623597.htmlLucene的索引里面存了些什么,如何存放的,也即Lucene的索引文件格式,是读懂Lucene源代码的一把钥匙。当我们真正进入到Lucene源代码之中...
分类:
Web程序 时间:
2014-12-23 15:23:10
阅读次数:
178
本文参考:http://www.cnblogs.com/lakelight/p/3166612.html1,系统准备安装ant和ivy,到官方下载apache-ant-1.9.1-bin和apache-ivy-2.3.0-bin,将ant的bin目录加入到环境变量PATH中,将ivy-2.3.0.j...
分类:
Web程序 时间:
2014-12-23 13:47:27
阅读次数:
231
本章翻译自Elasticsearch官方指南的Controlling Relevance一章。
控制相关度(Controlling Relevance)
对于仅处理结构化数据(比如日期,数值和字符枚举值)的数据库,它们只需要检查一份文档(在关系数据库中是一行)是否匹配查询即可。
尽管布尔类型的YES|NO匹配也是全文搜索的一个必要组成,它们本身是不够的。我们还需要...
分类:
其他好文 时间:
2014-12-23 10:32:51
阅读次数:
216
本文转载自:http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623596.htmlLucene总的来说是:一个高效的,可扩展的,全文检索库。全部用Java实现,无须配置。仅支持纯文本文件的索引(Indexing)和搜索(Search)...
分类:
Web程序 时间:
2014-12-23 10:20:39
阅读次数:
220
commons-logging commons-logging 1.1.2 org.apache.lucene lucene-core ...
分类:
Web程序 时间:
2014-12-22 23:56:26
阅读次数:
343
1.北京圣思Java培训教学视频(资源共享网)2.Lucene/WebService/SVN/Ant/SpringMVC视频(学习资料库网)3.JUnit和Ant视频教程(VeryCD社区)4.《张孝祥JAVA视频教程》完整版[RMVB](东西网)5.历经5年锤炼(史上最适合初学者入门的Java基础...
分类:
其他好文 时间:
2014-12-22 21:16:29
阅读次数:
308
在CSDN,博客园找了一番Lucene.Net相关资料后,最后发现还是没有自己想要的,毕竟lucene.net版本一直在变,这里我用的是Lucene.Net 3.0的版本,demo是在http://www.dotlucene.net/ 网站里面找到的。方法很完善,API也比较全面,http://www.dotlucene.net/30648/lucene-net-api-search-demo。
...
分类:
Web程序 时间:
2014-12-22 18:09:24
阅读次数:
227
package com.lin.lucene;
import java.io.File;
import java.io.IOException;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.queryparser....
分类:
Web程序 时间:
2014-12-22 18:07:09
阅读次数:
144
内容就是标题了。是要重构下上一节的代码,大体上按如下的思路: 功能拆分; 创建必要的工具类; 两个工具类StringUtils和TxtUtils。 StringUtils,主要是获取当前系统的换行符: package com.zhyea.util; public class StringUtils ...
分类:
Web程序 时间:
2014-12-22 17:42:15
阅读次数:
209
前段时间,在学习lucene的时候,遇到了读取txt文档遇到编码错误的问题。学了几个解决方案,大部分是将文件转十六进制(可以使用UE的Ctrl+H来查看),读取开头的四个标志位来判断。可是总有些文本文件无法识别(我遇到的是部分使用UTF-8编码的文件),后来发现了JCharDet。JCharDet是...
分类:
其他好文 时间:
2014-12-22 17:37:36
阅读次数:
182