码迷,mamicode.com
首页 >  
搜索关键字:lucene    ( 2421个结果
ElasticSearch入门介绍之会当凌绝顶(一)
ElasticSearch也是一款非常优秀的开源的全文检索框架,以大名鼎鼎的Apache Lucene为基础,高度封装了更丰富,易用的API,同时与Apache Solr一样,提供了非常强大的分布式集群功能!有不懂ElasticSearch(下文简称es)是干啥的朋友,可以点此链接在百科上先大致了解...
分类:其他好文   时间:2014-12-26 21:30:33    阅读次数:261
(转)ElasticSearch学习
ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过HTTP使用JSON进行数据索引。官方站点:http://www.elasticsearch.com/中文站点:http://es-...
分类:其他好文   时间:2014-12-26 16:05:14    阅读次数:275
JFBlog 1.0 发布,基于 JFinal 的 Java 轻博客
1、简单介绍 JFinal + mysql + jsp druid 连接池 ehcache 缓存 require.js ajaxfileupload 上传 ztree 树形插件 KindEditor 编辑器 Tinymce 编辑器 syntaxhighlighter 代码高亮 Lucene 全文检索 IK Analyzer 分词...
分类:编程语言   时间:2014-12-26 09:47:20    阅读次数:236
[Elasticsearch] 控制相关度 (四) - 忽略TF/IDF
本章翻译自Elasticsearch官方指南的Controlling Relevance一章。 忽略TF/IDF 有时我们不需要TF/IDF。我们想知道的只是一个特定的单词是否出现在了字段中。比如我们正在搜索度假酒店,希望它拥有的卖点越多越好: WiFi花园(Garden)泳池(Pool) 而关于度假酒店的文档类似下面这样: { "descript...
分类:其他好文   时间:2014-12-26 01:02:19    阅读次数:342
IndexWriterConfig的各个配置项说明(转)
1.Analyzer:分析器 2.matchVersion:所用Lucene的版本 3.ramBufferSizeMB:随机内存 默认为16M. 用于控制buffer索引文档的内存上限,如果buffer的索引文档个数到达该上限就写入硬盘。当然,一般来说越大索引速度越快 4.max...
分类:其他好文   时间:2014-12-25 17:55:57    阅读次数:133
大型门户网站实现的十四大技术
一、全文搜索 Lucene框架 二、缓存 实现页面级的URL缓存 三、生成静态文件 比如说,一个首页可能会员由多个部分组成,每个模块生成一个静态文件,然后才用服务器端包含SSI技术进行组装,其默认的后缀是.shtml 四、静态文件分布存储于独立的服务器 CSS,JS,图片,文件等,用...
分类:Web程序   时间:2014-12-25 14:32:41    阅读次数:206
[Elasticsearch] 控制相关度 (三) - 通过查询结构调整相关度以及boosting查询
本章翻译自Elasticsearch官方指南的Controlling Relevance一章。 通过查询结构调整相关度 ES提供的查询DSL是相当灵活的。你可以通过将单独的查询子句在查询层次中上下移动来让它更重要/更不重要。比如,下面的查询: quick OR brown OR red OR fox 我们可以使用一个bool查询,对所有词条一视同仁:...
分类:其他好文   时间:2014-12-25 01:30:42    阅读次数:251
[Elasticsearch] 控制相关度 (二) - Lucene中的PSF(Practical Scoring Function)与查询期间提升
本章翻译自Elasticsearch官方指南的Controlling Relevance一章。 Lucene中的Practical Scoring Function 对于多词条查询(Multiterm Queries),Lucene使用的是布尔模型(Boolean Model),TF/IDF以及向量空间模型(Vector Space Model)来将它们结合...
分类:Web程序   时间:2014-12-24 11:53:03    阅读次数:273
Lucene学习之四:Lucene的索引文件格式(2)
本文转载自:http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623599.html 略有删减和补充四、具体格式上面曾经交代过,Lucene保存了从Index到Segment到Document到Field一直到Term的正向信息,也包括...
分类:Web程序   时间:2014-12-23 19:16:50    阅读次数:287
Lucene学习之四:Lucene的索引文件格式(3)
本文转载自:http://www.cnblogs.com/forfuture1978/archive/2010/02/02/1661436.html,略有删改和备注。四、具体格式4.2. 反向信息反向信息是索引文件的核心,也即反向索引。反向索引包括两部分,左面是词典(Term Dictionary)...
分类:Web程序   时间:2014-12-23 18:59:46    阅读次数:287
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!