搜索文档 利用 Lucene 进行搜索就像建立索引一样也是非常方便的。在上面一部分中,我们已经为一个目录下的文本文档建立好了索引,现在我们就要在这个索引上进行搜索以找到包含某个关键词或短语的文档。Lucene 提供...
分类:
Web程序 时间:
2014-11-06 13:15:36
阅读次数:
150
建立索引 为了对文档进行索引,Lucene 提供了五个基础的类,他们分别是 Document, Field, IndexWriter, Analyzer, Directory。下面我们分别介绍一下这五个类的用途: Document Document 是用来描述文档的,这里的...
分类:
Web程序 时间:
2014-11-06 11:12:11
阅读次数:
179
这里是我整理的一些自己知道的信息检索知识的备忘document: 相当于数据块里的一条记录field: 相当于数据库里的一列term: 指某个field的词,英文单词一般会转词的原型tf:term在field内的词频率函数df:term在全文档集合内的频率函数idf:term在全文档集合内的逆向频率...
分类:
其他好文 时间:
2014-11-06 01:59:40
阅读次数:
174
我们准备来实现互斥的锁,按照官网的思路,给定一个锁的路径,如/Lock,所有要申请这个锁的进程都在/Lock目录下创建一个/Lock/lock-的临时序列节点,并监控/Lock的子节点变化事件。当子节点发送变化时用get_children()获取子节点的列表,如果发现进程发现自己拥有最小的一个序号,则获得锁。处理业务完毕后需要释放锁,此时只需要删除该临时节点即可。简单来说就是永远是拥有最小序号的进程获得锁。...
分类:
其他好文 时间:
2014-11-05 23:12:24
阅读次数:
247
今天 用lucene完成了 一个简单的web应用,提取了早期编写的一个测试类, 首先简介下lucene几个常用包;
lucene 包的组成结构:对于外部应用来说索引模块(index)和检索模块(search)是主要的外部应用入口
org.apache.Lucene.search/ 搜索入口
org.apache.Lucene.index/ 索引入口
org.apache.Lucene.analysis/ 语言分析器
org.apache.Lucene.queryParser/ 查询分析器
org....
分类:
Web程序 时间:
2014-11-05 21:34:26
阅读次数:
247
转:http://www.cnblogs.com/wangs/p/3282183.html项目名称项目描述ASMJava bytecode manipulation frameworkAspectWerkzAspectWerkz - Dynamic AOP for JavaAxisAxis - an...
分类:
编程语言 时间:
2014-11-05 19:25:18
阅读次数:
353
link(http://en.wikipedia.org/wiki/Web_crawler)Web crawlerNot to be confused withoffline reader. For thesearch engineof the same name, seeWebCrawler.AW...
分类:
Web程序 时间:
2014-11-05 19:17:05
阅读次数:
518
最近在用Arrays的asList()生成的List时,List元素的个数时而不正确。Java代码一:Arrays.asList(数组)该方法是将数组转化为集合(该方法主要用于Object对象数组,如果是基本类型该方法获得的.size()长度都为1)//经多次测试,只要传递的基本类型的数组,生成Li...
分类:
编程语言 时间:
2014-11-05 19:09:25
阅读次数:
167
java使用Synchronized关键字实现互斥,而同时有Lock支持。这两个的效果是等同的,Synchronized性能的起伏较大,而lock比较收敛。为了代码的可读性,Synchronized更建议使用。
分类:
编程语言 时间:
2014-11-05 17:09:41
阅读次数:
198
package?com.xsz.demo;
import?java.util.concurrent.locks.Condition;
import?java.util.concurrent.locks.Lock;
import?java.util.concurrent.locks.ReentrantLock;
/**
?*?兩個線程交替執行
?*?@au...
分类:
编程语言 时间:
2014-11-05 15:15:50
阅读次数:
255