码迷,mamicode.com
首页 >  
搜索关键字:lucene    ( 2421个结果
lucene3.5通过NRTManager和SearchManager实现近实时搜索
实时搜索(近实时搜索)      完全的实时搜索:只要数据库一变动,马上要更新索引,writer.commit来操作     近实时搜索:当用户修改了信息之后,先把索引保存到内存中,然后在一个统一的时间对内存中的所有的索引进行提交操作。 reopen,NRTManager(near-real-time) lucene通过NRTManager这个类来实现近实时搜索,所谓近实时搜索...
分类:Web程序   时间:2015-04-07 15:39:02    阅读次数:1267
lucene中Field.Index,Field.Store详解
lucene在doc.add(new Field("content",curArt.getContent(),Field.Store.NO,Field.Index.TOKENIZED));Field有两个属性可选:存储和索引。通过存储属性你可以控制是否对这个Field进行存储;通过索引属性你可以控制...
分类:Web程序   时间:2015-04-07 15:04:41    阅读次数:141
空间向量模型lucene
把一篇文档看作是一系列词元的集合,每个词元都有一个权重,如下: Document A= {termX, termY, termZ …… termN} Document B= {termX, termY, termZ …… termN} DocumentVector = {weight1, weight2, weight3...
分类:Web程序   时间:2015-04-07 13:59:32    阅读次数:155
ElasticSearch的部署、同步与调优
ElasticSearch是一个强大的搜索服务器,基于Apache Lucene的全文搜索引擎开发,具有高性能、分布式和零配置的优点。在当前的项目中,我们希望ES能承担亿级文档的搜索,而ES也证明了即便面对这样的数据规模,也能实现十分迅速的搜索响应。 概念 节点(Node):节点是一个ES的实例,一般一台主机上部署一个节点-集群(Cluster):集群由若干节点组成,和任意节点...
分类:其他好文   时间:2015-04-06 21:56:28    阅读次数:208
利用Lucene和 XPDF 来处理pdf文件
/* * 利用Lucene和 XPDF 来处理pdf文件 * */ package pdfbox; import java.io.File; import java.io.IOException; public class Pdf2Test { //PDF文件名 private File pdffi...
分类:Web程序   时间:2015-04-06 06:22:37    阅读次数:227
按照范围过滤所使用的类是Lucene的RangeFilter
/* * 按照范围过滤所使用的类是Lucene的RangeFilter * 可以按照上下文所规定的范围进行对文本的过滤 * */ package filter; import java.io.IOException; import java.util.BitSet; import org.apach...
分类:Web程序   时间:2015-04-06 06:21:55    阅读次数:451
利用Lucene和 XPDF 来处理pdf文件
/*  * 利用Lucene和 XPDF 来处理pdf文件  * */ package pdfbox; import java.io.File; import java.io.IOException; public class Pdf2Test { //PDF文件名 private File pdffile; //转换器的存放位置,默认为E:\\xpdf下 ...
分类:Web程序   时间:2015-04-05 17:33:30    阅读次数:143
Lucene对office的word, Excel操作
首先说明Lucene如果想对office进行操作的话,需要额外的包 这里有几种方法 一是使用POI 二是使用jacob 这里的代码使用的是jacob对于word进行处理 代码: package jacob; import com.jacob.activeX.ActiveXComponent; import com.jacob.com.Dispatch...
分类:Web程序   时间:2015-04-05 17:31:37    阅读次数:143
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!