http://fuxiaopang.gitbooks.io/learnelasticsearch/content/ (中文)在Elasticsearch中,文档术语一种类型(type),各种各样的类型存在于一个索引中。你也可以通过类比传统的关系数据库得到一些大致的相似之处:关系数据库 ? 数...
分类:
其他好文 时间:
2014-12-18 10:18:33
阅读次数:
268
前段时间为公司基于Elasticsearch(下面简称ES)做了一套检索平台,下面将这段时间积累的一些知识与大家分享,如有不对之处,欢迎大家多多批评与建议。针对Elasticsearch由于东西还是比较多的,我会做成一个系列。下面是这个系统的目录:环境准备 本系列文章以Centos6.3系统为基础,...
分类:
其他好文 时间:
2014-12-18 10:10:51
阅读次数:
213
本文使用Github中的Elasticsearch-rtf,已经集成了众多的插件,例如必须使用的中文分词等,可以简单的通过配置来启用中文分词。本文主要分为以下几部分: 1、配置和启用中文分词; 2、定义索引的mapping 3、java客户端jest创建和检索索引 4、高亮检索结果 5、集群配置 工...
分类:
编程语言 时间:
2014-12-18 00:01:49
阅读次数:
280
提高性能
短语和邻近度查询比简单的match查询在性能上更昂贵。match查询只是查看词条是否存在于倒排索引(Inverted Index)中,而match_phrase查询则需要计算和比较多个可能重复词条(Multiple possibly repeated)的位置。
在Lucene Nightly Benchmarks中,显示了一个简单的term查询比一个短语查询快大概10倍,比一...
分类:
其他好文 时间:
2014-12-17 12:54:34
阅读次数:
290
elasticsearch? ulimit: error setting limit 解决: My understanding is that /etc/security/limits.conf applies to login shells - but if you‘ve installed docker via apt-get, it‘s started by Upstart. ...
分类:
其他好文 时间:
2014-12-16 13:38:59
阅读次数:
228
多值字段(Multivalue Fields)
在多值字段上使用短语匹配会产生古怪的行为:
PUT /my_index/groups/1
{
"names": [ "John Abraham", "Lincoln Smith"]
}
运行一个针对Abraham Lincoln的短语查询:
GET /my_index/groups/_search
{
"q...
分类:
其他好文 时间:
2014-12-16 10:04:15
阅读次数:
236
本文翻译自Elasticsearch官方指南的Proximity Matching一章。
邻近匹配(Proximity Matching)
使用了TF/IDF的标准全文搜索将文档,或者至少文档中的每个字段,视作"一大袋的单词"(Big bag of Words)。match查询能够告诉我们这个袋子中是否包含了我们的搜索词条,但是这只是一个方面。它不能告诉我们关于单词间关...
分类:
其他好文 时间:
2014-12-15 12:11:17
阅读次数:
205
在网上很难找到logstash中文资料,ruby也没了解过,看官方文档太吃力,而我的要求也不高,使用loggstash可以提取想要的字段即可。以下内容纯粹想当然的理解:logstash配置格式#官方文档:http://www.logstash.net/docs/1.4.2/
input{
...#读取数据,logstash已提供非常多的插..
分类:
编程语言 时间:
2014-12-14 07:17:28
阅读次数:
2023
filter-json:http://www.logstash.net/docs/1.4.2/filters/jsonjson数据:{"account_number":995,"balance":21153,"firstname":"Phelps","lastname":"Parrish","age":25,"gender":"M","address":"666MillerPlace","employer":"Pearlessa","email":"phelpsparrish@pearlessa.co..
分类:
Web程序 时间:
2014-12-13 06:21:29
阅读次数:
176
mutate:http://www.logstash.net/docs/1.4.2/filters/mutate使用logstash提取oracle的alter日志的ora错误。日志格式如下:alterdatabaseopen
Errorsinfiled:\oracle\diag\rdbms\hxw168\hxw168\trace\hxw168_ora_6148.trc:
ORA-01589:要打开数据库则必须使用RESETLOGS或NORESETL..
分类:
其他好文 时间:
2014-12-13 06:19:46
阅读次数:
738