Fromhttp://www.elasticsearch.org/guide/en/elasticsearch/reference/current/glossary.htmlglossary of termsanalysisAnalysis is the process of convertingf...
分类:
其他好文 时间:
2015-01-12 16:23:07
阅读次数:
136
全文搜索(Full Text Search)现在我们已经讨论了搜索结构化数据的一些简单用例,是时候开始探索全文搜索了 - 如何在全文字段中搜索来找到最相关的文档。对于全文搜索而言,最重要的两个方面是:相关度(Relevance)查询的结果按照它们对查询本身的相关度进行排序的能力,相关度可以通过TF/...
分类:
其他好文 时间:
2015-01-12 00:15:49
阅读次数:
231
一)安装elasticsearch1)下载elasticsearch-0.90.10,解压,运行\bin\elasticsearch.bat (windwos)2)进入http://localhost:9200/如下图安装成功!二)插件——headelasticsearch-head是一个elast...
分类:
其他好文 时间:
2015-01-11 22:59:16
阅读次数:
831
全文搜索(Full Text Search)现在我们已经讨论了搜索结构化数据的一些简单用例,是时候开始探索全文搜索了 - 如何在全文字段中搜索来找到最相关的文档。对于全文搜索而言,最重要的两个方面是:相关度(Relevance)查询的结果按照它们对查询本身的相关度进行排序的能力,相关度可以通过TF/...
分类:
其他好文 时间:
2015-01-11 22:53:15
阅读次数:
335
本章翻译自Elasticsearch官方指南的Looking at Time一章。
时间数据处理(Looking at Time)
如果在ES中,搜索是最常见的行为,那么创建日期柱状图(Date Histogram)肯定是第二常见的。为什么要使用日期柱状图呢?
想象在你的数据中有一个时间戳。数据是什么不重要-Apache日志事件,股票交易日期,棒球比赛时间-任何拥...
分类:
其他好文 时间:
2015-01-11 01:01:35
阅读次数:
365
系统是Windows server 2003。ElasticSearch是一个基于Lucene的稳定的、分布式、RESTFul的搜索引擎。其实所谓的RestFul就是它提供URL供你调用(建立索引和进行检索),不过直接这样使用实在是太凶残了。所以,它也提供了一系列client包,相当于将curl请求...
分类:
Web程序 时间:
2015-01-10 23:31:43
阅读次数:
565
网络爬虫架构在Nutch+Hadoop之上,是一个典型的分布式离线批量处理架构,有非常优异的吞吐量和抓取性能并提供了大量的配置定制选项。由于网络爬虫只负责网络资源的抓取,所以,需要一个分布式搜索引擎,用来对网络爬虫抓取到的网络资源进行实时的索引和搜索。搜 索引擎架构在ElasticSearch之上,...
分类:
其他好文 时间:
2015-01-10 19:37:13
阅读次数:
1115
基础概念 Elasticsearch有几个核心概念。从一开始理解这些概念会对整个学习过程有莫大的帮助。 接近实时(NRT) Elasticsearch是一个接近实时的搜索平台。这意味着,从索引一个文档直到这个文档能够被搜索到有一个轻微的延迟(通常是1秒)。 集群(cluster) ...
分类:
其他好文 时间:
2015-01-10 17:58:47
阅读次数:
206
首先下载最新的elasticsearch安装版本:elasticsearch下载。下载最新的elasticsearch 0.90.1版本。下载完成后。解压缩在安装目录。在cmd命令行进入安装目录,再进入 bin目录,运行elasticsearch.bat命令:启动成功后。在浏览器中输入:http:/...
创建条形图(Building Bar Charts)
聚合的一个令人激动的性质是它能够很容易地被转换为图表和图形。在本章中,我们会使用前面的样本数据集来创建出各种分析案例。我们也会展示聚合能够支持的种类。
柱状图桶(Histogram Bucket)非常有用。柱状图在本质上就是条形图,如果你创建过一份报告或者分析面板(Analytics Dashboard),毫无疑问其中会有一些条形图...
分类:
其他好文 时间:
2015-01-09 01:36:37
阅读次数:
245