码迷,mamicode.com
首页 >  
搜索关键字:lucene    ( 2421个结果
lucene查询排序结果原理总结
参考文章Lucene3.0结果排序原理+操作+示例Lucene的排序算法一句话总结lucene排序算法是什么样的关键几个概念参考文档:http://lucene.apache.org/core/4_10_3/core/org/apache/lucene/search/similarities/TFI...
分类:编程语言   时间:2015-02-06 16:23:06    阅读次数:182
Lucene索引文件学习
最近在做搜索,抽空看一下lucene,资料挺多的,不过大部分都是3.x了……在对着官方文档大概看一下。优化后的lucene索引文件(4.9.0)一、段文件1.段文件:segments_5p和segments.gen。segments.gen保存当前段文件版本信息。segments.gen: GenH...
分类:Web程序   时间:2015-02-05 12:56:51    阅读次数:148
Hadoop学习篇1 快速入门
Hadoop是Apache Lucene创始人Doug Cutting创建的,Hadoop起源于Apache Nutch,一个开源的网络搜索引擎。最先引起注意是2003年google的一篇论文,该论文实现了谷歌分布式文件系统,也就是GFS,2004年,他们开始着手实现一个开源的实现,也就是HDFS,...
分类:其他好文   时间:2015-02-04 23:15:13    阅读次数:309
地理空间距离计算优化(转)
原文:http://tech.meituan.com/lucene-distance.html1 地理空间距离计算面临的挑战打开美团app,不管是筛选团购还是筛选商家,默认的排序项都是“离我最近”或者“智能排序”(如下图所示)。不管是“离我最近”还是“智能排序”,都涉及到计算用户位置与各个团购单子或...
分类:其他好文   时间:2015-02-04 23:09:02    阅读次数:405
compass和paoding分词器的基本使用
1.实现搜索的技术:数据库查询:like查询;lucene全文检索技术;1)在数据量比较大,查询字段比较多的情况下,如果采用数据库like sql查询,性能比较差;采用lucene来查询,性能相对于数据库like sql查询要好些;2)如果采用lucene进行搜索,搜索到的结果相关度比较高,而且会把...
分类:其他好文   时间:2015-02-03 21:13:09    阅读次数:267
lucene自定义评分
要实现自定义评分,想把我们认为应该排在前面成为top,lucenen给我们留了一个扩展类就是CustomScoreQuery 首先。我们创建评分的时候要先定义一个我们自己要改变的评分域 FieldScoreQuery fieldScoreQuery=new FieldScoreQuery("score", Type.INT);//设置评分域为socre 然后indexSearch.searc...
分类:Web程序   时间:2015-02-03 19:39:30    阅读次数:191
lucene分词流程
这一个星期花时间好好学习了一下lucene/solr,今天好好总结一下,写点文章记录点重要的东西,以便日后不至于丈二和尚摸不着头脑, 这一篇文章主要是简单的介绍一下lucene分词过程中的分词流程,和一些简单原理的讲解,希望不妥这处读者能够指正,不胜感激!! (一)主要分词器 WhitespaceAnalyzer、StopAnalyzer、SimpleAnalyzer、Key...
分类:Web程序   时间:2015-02-03 17:15:53    阅读次数:181
lucene如何写自己的同义词分词器
前一篇文章 lucene分词流程讲解了分词的一些流程,我们也对分词流程有了一个初步的了解,知道一个分词器由多个Tokenizer和TokenFilter组成,这篇文章讲解的就是我们利用这两个特性实现自己的一个简单的同义词分词器,不妥之处请大家指出 (一)分析 如何实现同义词呢?比如重庆可以叫做山城,我们搜索山城的时候也应该要搜索要包含重庆这个单词的文章。那么我们就必须要了解lucene只怎么处...
分类:Web程序   时间:2015-02-03 17:10:14    阅读次数:226
分布式搜索elasticsearch 搜索结果排序不一致性问题
想象这一种情况,如果搜索结果中得分出现相同的情况下:由于搜索会在分片的副本之间均衡的轮询请求,可能会出现请求在不同的副本之间返回的循序不同,从而影响排序结果的稳定性。 搜索接口有提供preference参数:curl localhost:9200/_search?preference=xyzabc123。 可以使用的参数: _primary,_primary_first,_local,_onl...
分类:编程语言   时间:2015-02-03 11:09:49    阅读次数:167
Lucene自定义扩展QueryParser
Lucene版本:4.10.2在使用lucene的时候,不可避免的需要扩展lucene的相关功能来实现业务的需要,比如搜索时,需要在满足一个特定范围内的document进行搜索,如年龄在20和30岁之间的document中搜索并排序。其实lucene自带的NumericRangeQuery类已经能实...
分类:Web程序   时间:2015-02-02 17:49:31    阅读次数:224
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!