Solr高亮使用了很多Lucene的源码,在Lucene源码org.apache.lucene.search.highlight包的Highlighter.java里的方法: public final TextFragment[] getBestTextFragments( ? ? TokenStream tokenStream, ? ? ...
分类:
其他好文 时间:
2015-08-26 22:45:08
阅读次数:
275
一直想抽点时间系统的学习下Lucene ,今天把Lucene 源码学习环境搭建了一下。下面描述一下环境搭建过程。开发环境的配置(lucene-4.10.2 + Eclipse):1:下载最新源码:把jar包lucene-4.10.2,和java源码lucene-4.10.2-src 都下载下来。 ....
分类:
Web程序 时间:
2014-12-10 19:43:19
阅读次数:
360
SegmentInfo包含除了delCount和delGen之外的段其他信息
SegmentInfoPerCommit既包含SegmentInfo,也包含delCount和delGen信息。
SegmentInfos是SegmentInfoPerCommit的集合,此外还包含counter,generation,user data信息。
addIndexes(Directory...)操作过...
分类:
其他好文 时间:
2014-07-18 13:29:06
阅读次数:
177
原来看lucene4.0的posting格式(http://blog.csdn.net/jollyjumper/article/details/30017581),发现这还是比较简单的VInt格式,据说VInt压缩解压都不错(medium),但解压时分支太多打乱CPU流水线因而不够高效,流行的索引压缩有很多,for,simple9,simple16,PForDelta是比较流行的一种,发现luce...
分类:
其他好文 时间:
2014-06-16 22:35:40
阅读次数:
355