ElasticSearch也是一款非常优秀的开源的全文检索框架,以大名鼎鼎的Apache Lucene为基础,高度封装了更丰富,易用的API,同时与Apache Solr一样,提供了非常强大的分布式集群功能!有不懂ElasticSearch(下文简称es)是干啥的朋友,可以点此链接在百科上先大致了解...
分类:
其他好文 时间:
2014-12-26 21:30:33
阅读次数:
261
ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过HTTP使用JSON进行数据索引。官方站点:http://www.elasticsearch.com/中文站点:http://es-...
分类:
其他好文 时间:
2014-12-26 16:05:14
阅读次数:
275
1、简单介绍 JFinal + mysql + jsp druid 连接池 ehcache 缓存 require.js ajaxfileupload 上传 ztree 树形插件 KindEditor 编辑器 Tinymce 编辑器 syntaxhighlighter 代码高亮 Lucene 全文检索 IK Analyzer 分词...
分类:
编程语言 时间:
2014-12-26 09:47:20
阅读次数:
236
本章翻译自Elasticsearch官方指南的Controlling
Relevance一章。
忽略TF/IDF
有时我们不需要TF/IDF。我们想知道的只是一个特定的单词是否出现在了字段中。比如我们正在搜索度假酒店,希望它拥有的卖点越多越好:
WiFi花园(Garden)泳池(Pool)
而关于度假酒店的文档类似下面这样:
{ "descript...
分类:
其他好文 时间:
2014-12-26 01:02:19
阅读次数:
342
1.Analyzer:分析器 2.matchVersion:所用Lucene的版本 3.ramBufferSizeMB:随机内存 默认为16M. 用于控制buffer索引文档的内存上限,如果buffer的索引文档个数到达该上限就写入硬盘。当然,一般来说越大索引速度越快 4.max...
分类:
其他好文 时间:
2014-12-25 17:55:57
阅读次数:
133
一、全文搜索 Lucene框架 二、缓存 实现页面级的URL缓存 三、生成静态文件 比如说,一个首页可能会员由多个部分组成,每个模块生成一个静态文件,然后才用服务器端包含SSI技术进行组装,其默认的后缀是.shtml 四、静态文件分布存储于独立的服务器 CSS,JS,图片,文件等,用...
分类:
Web程序 时间:
2014-12-25 14:32:41
阅读次数:
206
本章翻译自Elasticsearch官方指南的Controlling
Relevance一章。
通过查询结构调整相关度
ES提供的查询DSL是相当灵活的。你可以通过将单独的查询子句在查询层次中上下移动来让它更重要/更不重要。比如,下面的查询:
quick OR brown OR red OR fox
我们可以使用一个bool查询,对所有词条一视同仁:...
分类:
其他好文 时间:
2014-12-25 01:30:42
阅读次数:
251
本章翻译自Elasticsearch官方指南的Controlling
Relevance一章。
Lucene中的Practical Scoring Function
对于多词条查询(Multiterm Queries),Lucene使用的是布尔模型(Boolean
Model),TF/IDF以及向量空间模型(Vector
Space Model)来将它们结合...
分类:
Web程序 时间:
2014-12-24 11:53:03
阅读次数:
273
本文转载自:http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623599.html 略有删减和补充四、具体格式上面曾经交代过,Lucene保存了从Index到Segment到Document到Field一直到Term的正向信息,也包括...
分类:
Web程序 时间:
2014-12-23 19:16:50
阅读次数:
287
本文转载自:http://www.cnblogs.com/forfuture1978/archive/2010/02/02/1661436.html,略有删改和备注。四、具体格式4.2. 反向信息反向信息是索引文件的核心,也即反向索引。反向索引包括两部分,左面是词典(Term Dictionary)...
分类:
Web程序 时间:
2014-12-23 18:59:46
阅读次数:
287