/*
* 这里的类实现的功能是对多个字段进行排序
* 比单个难度要大,但是有相应的方法,可以满足不同项目的不同需求
* */
package score;
import java.io.IOException;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apac...
分类:
编程语言 时间:
2015-04-03 11:19:15
阅读次数:
184
本文通过对纵横小说简介页源代码的分析,介绍了如何通过CrawlBase来采集相关信息...
分类:
Web程序 时间:
2015-04-03 11:17:15
阅读次数:
262
/*
* 通过改变boost的值来改变文档的得分
* 在这个例子中Doc3的得分是最少的,
* 加入我想把doc3的得分变高,把他放到网页的第一条,
* 那么就是用doc3.setBoost(2f);方法就可以实现
* */
package score;
import java.io.IOException;
import org.apache.lucene.an...
分类:
Web程序 时间:
2015-04-03 09:17:16
阅读次数:
147
运行环境:CentOS6.4?????? Tomcat7.0??? JDK1.7 软件版本: solr-4.9.1?? 下载链接:http://apache.fayea.com/lucene/solr/ IK-Analyzer-2012FF????下载链接:http://git.oschina.net/wltea/IK-A...
分类:
系统相关 时间:
2015-04-03 01:40:46
阅读次数:
306
最近,需要对项目进行lucene版本升级。而原来项目时基于lucene 3.0的,很古老的一个版本的了。在老版本中中,我们主要用了几个lucene的东西: 1、查询lucene多目录索引。 2、构建RAMDirectory,把索引放到内存中,以提高检索效率。 3、构建Lucene自定义分词...
分类:
Web程序 时间:
2015-04-02 18:33:25
阅读次数:
135
Spellcheck是Lucene新版本的功能,在介绍spellcheck之前,我们需要弄清楚Spellcheck支持几种数据源。Spellcheck构造函数需要传入Dictionary接口: package org.apache.lucene.search.spell;/* * Licens...
分类:
Web程序 时间:
2015-04-02 18:14:50
阅读次数:
157
本文一纵横中文小说网的更新列表页为例,详细的介绍了如何通过HttpClient去采集更新列表页的内容,介绍如何使用自建类CrawlListPageBase以及如何处理非预期BUG...
分类:
Web程序 时间:
2015-04-02 15:09:16
阅读次数:
160
分布式搜索引擎Elasticsearch 介绍 Elasticsearch是一个基于Lucene的开源分布式搜索引擎,具有分布式多用户能力。Elasticsearch是用java开发,提供Restful接口,能够达到实时搜索、高性能计算;同时Elasticsearch...
分类:
其他好文 时间:
2015-04-01 22:09:31
阅读次数:
352
在全文索引工具中,都是由这样的三部分组成
1.索引部分
2.分词部分
3.搜索部分
----------------------------------
索引创建域选项
----------------------------------
Field.Store.YES或者NO(存储域选项)
YES:表示会把这个域中的内容完全存储到文件中,方便进行还原[对于主键,标题可以是这种方式...
分类:
Web程序 时间:
2015-04-01 17:47:16
阅读次数:
162