今天 用lucene完成了 一个简单的web应用,提取了早期编写的一个测试类, 首先简介下lucene几个常用包;
lucene 包的组成结构:对于外部应用来说索引模块(index)和检索模块(search)是主要的外部应用入口
org.apache.Lucene.search/ 搜索入口
org.apache.Lucene.index/ 索引入口
org.apache.Lucene.analysis/ 语言分析器
org.apache.Lucene.queryParser/ 查询分析器
org....
分类:
Web程序 时间:
2014-11-05 21:34:26
阅读次数:
247
转:http://www.cnblogs.com/wangs/p/3282183.html项目名称项目描述ASMJava bytecode manipulation frameworkAspectWerkzAspectWerkz - Dynamic AOP for JavaAxisAxis - an...
分类:
编程语言 时间:
2014-11-05 19:25:18
阅读次数:
353
link(http://en.wikipedia.org/wiki/Web_crawler)Web crawlerNot to be confused withoffline reader. For thesearch engineof the same name, seeWebCrawler.AW...
分类:
Web程序 时间:
2014-11-05 19:17:05
阅读次数:
518
最近在用Arrays的asList()生成的List时,List元素的个数时而不正确。Java代码一:Arrays.asList(数组)该方法是将数组转化为集合(该方法主要用于Object对象数组,如果是基本类型该方法获得的.size()长度都为1)//经多次测试,只要传递的基本类型的数组,生成Li...
分类:
编程语言 时间:
2014-11-05 19:09:25
阅读次数:
167
ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便1、下载jdk-7u71-linux-x64.gz2、Tarzxvfjdk-7u71-linux-x64.gz3、mvjdk1.7.0_71//home/work/local/java/4、vim/etc/profileexportJAV..
分类:
其他好文 时间:
2014-11-05 15:01:19
阅读次数:
223
怎样处理海量数据在实际的工作环境下,很多人会遇到海量数据这个复杂而艰巨的问题,它的主要难点有下面几个方面:一、数据量过大,数据中什么情况都可能存在。假设说有10条数据,那么大不了每条去逐一检查,人为处理,假设有上百条数据,也能够考虑,假设数据上到千万级别,甚至过亿,那不是手工能解决的了,必须通过工具...
分类:
其他好文 时间:
2014-11-05 14:19:00
阅读次数:
996
高级查询
在介绍了更多的高级映射功能之后,是时候回顾一下之前介绍过的查询功能了,看看如何借助这些高级的映射功能来使用一些高级的查询功能。本文会通过以下几个方面进行介绍:
如何在不和数据库进行任何交互的前提下,借助Lucene的力量来动态的筛选结果如何通过使用基于投影(Projection)的查询来获取需要的属性,从而避免与数据库的交互如何使用分面搜索(Faceted Search)对搜...
分类:
Web程序 时间:
2014-11-05 10:54:41
阅读次数:
339
http://www.nowamagic.net/librarys/veda/detail/1767Hadoop是什么Hadoop原来是Apache Lucene下的一个子项目,它最初是从Nutch项目中分离出来的专门负责分布式存储以及分布式运算的项目。简单地说来,Hadoop是一个可以更容易开发和...
分类:
其他好文 时间:
2014-11-05 10:48:11
阅读次数:
181
http://www.oschina.net/p/solrApache Solr (读音: SOLer) 是一个开源的搜索服务器。Solr 使用 Java 语言开发,主要基于 HTTP 和 Apache Lucene 实现。Apache Solr 中存储的资源是以 Document 为对象进行存储的...
分类:
其他好文 时间:
2014-11-05 10:24:48
阅读次数:
166
解析(Analysis)
当一个实体域被Lucene索引时,往往还会经历一个语法分析(Parsing)和转换(Conversion)的步骤,这些步骤被称为解析。在前文中,我们提到过Hibernate Search会默认对字符串类型的实体域进行分词,而这个分词过程就需要用到解析器(Analyzer)。在需要对实体域进行排序的场合,需要禁用这个默认的分词行为。
在解析过程中,还可以借助Ap...
分类:
Web程序 时间:
2014-11-04 11:09:20
阅读次数:
279