<strong><span style="font-size:18px;">/*** * @author YangXin * @info 使用Doublemetaphone函数对Twitter优化。 * Doublemetaphone函数能够为发音类似的单词创建同样的键 * */ package u ...
分类:
Web程序 时间:
2017-07-05 19:51:23
阅读次数:
211
1solr简介solr官方文档:http://wiki.apache.org/solr/DataImportHandler下载地址:http://www.apache.org/dyn/closer.cgi/lucene/solr/2solr入门我们使用的是:solr4.10.2,下载zip压缩包,解压到指定目录下解压:2.1solr安装1,将解压的solr-4.10.2/文件夹复制到D盘下;2,进..
分类:
其他好文 时间:
2017-07-05 13:21:50
阅读次数:
159
1 lucene简介1.1 什么是luceneLucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。1.2 lucene能做什么要 回答这个问题,先要了解lucene的本质。实际 ...
分类:
Web程序 时间:
2017-07-04 15:31:03
阅读次数:
274
遇到一个集团需求,要求在地址查询时候提供拼音搜索,第一反应应该不难,不过实现过程中却一波三折。 1、第一步是讲字段首字母进行索引,具体可以使用Pinyin4j提供的方法完成。 2、原来系统用的lucene3.0,分词用的ikanalyzer3.2 ,不支持连续字母和数字的分词,网上搜索下 ikana ...
分类:
Web程序 时间:
2017-07-04 14:44:16
阅读次数:
278
其实接下来就是贴一下代码,熟悉一下Lucene的正常工作流程,或者说怎么使用这个API,更深层次的东西这篇文章不会讲到。 上一篇文章也说了maven的配置,只要你电脑联网就可以下载下来。我贴一下代码。 其实就是这几部,建立阅读器--建立索引--查找索引--获得结果--输出结果。 大概就是这些流程。L ...
分类:
Web程序 时间:
2017-07-03 13:54:28
阅读次数:
152
刚开始做全文检索也是找了很多资料但是网上的都不是很齐全luence是个很不多的工具 Lucene4.0的官网文档:http://lucene.apache.org/core/4_0_0/core/overview-summary.html 这个工具跟新很快很多风格不一样比如,以前版本的申请Index ...
分类:
其他好文 时间:
2017-07-03 11:55:18
阅读次数:
185
1 Lucene介绍 1.1 什么是Lucene Lucene是apache下的一个开源的全文检索引擎工具包。它为软件开发人员提供一个简单易用的工具包(类库),以方便的在目标系统中实现全文检索的功能。 1.2 全文检索的应用场景 1.2.1 搜索引擎 ©注意: Lucene和搜索引擎是不同的,Luc ...
分类:
Web程序 时间:
2017-07-02 23:22:49
阅读次数:
262
1 Solr介绍 1.1 什么是solr Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器。Solr可以独立运行在Jetty、Tomcat等这些Servlet容器中。 Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索 ...
分类:
其他好文 时间:
2017-07-02 23:12:13
阅读次数:
414
我模仿lucene的BytesRef写了一个CharsRefIntHashMap,实測效果并不如HashMap<String, Integer>。代码例如以下: package com.dp.arts.lucenex.utils; import org.apache.lucene.util.Char ...
分类:
其他好文 时间:
2017-07-01 14:30:43
阅读次数:
98
发现gnuplot在mac上编译安装相当方便,在线下为了測试java老堆和lucene索引大小,须要绘制两条线,可是直接点连的线很难看,所以后面使用贝塞尔曲线。 脚本例如以下: #! /usr/local/bin/gnuplot -p set terminal canvas; set output ...
分类:
其他好文 时间:
2017-06-30 18:50:22
阅读次数:
190