elasticsearch本身的中文分词插件效果都不理想,手动添加词典可以在一定程度上进行弥补。
经过多次实验发现,mmseg的分词机制采用正向最长匹配算法,例如,针对“小时代”这个单词,其自带的词典中没有包含该词,故当用户搜索小时代时,检索不到任何结果。
在咸鱼老婆的虚心指导下,我终于找到了解决办法。
手动添加该词到mmseg的词库中,有两种方法:
1、将该词加入到自带的某个词典中(非停...
分类:
其他好文 时间:
2014-06-27 09:30:33
阅读次数:
232
http://www.zlovezl.cn/articles/40/简介: Zookeeper 分布式服务框架是 Apache Hadoop 的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。具体简介可以参照这....
分类:
编程语言 时间:
2014-06-26 18:43:35
阅读次数:
281
zookeeper java调用 及 权限管理...
分类:
编程语言 时间:
2014-06-26 10:30:19
阅读次数:
206
Hbase是一个分布式,版本化(versioned),构建在 Apache Hadoop和 Apache ZooKeeper上的列数据库.本文使用默认的Zookeeper,构造HDFS基础上的分布式Hbase。1 安装环境操作系统:Ubuntu-12.04 JDK版本:jdk1.7.0_51 计算....
分类:
其他好文 时间:
2014-06-26 00:31:04
阅读次数:
302
Elasticsearch本身是沒有安全性的功能, 我們得透過plugin來安裝, 這次我選擇了elasticsearch-jetty,此外也有人用nginx反向代理來進行控制.首先我們得先注意到Elasticsearch與Jetty Plugin的版本號對應, 在這裡可以查看, 如果版本號沒對應上...
分类:
其他好文 时间:
2014-06-25 15:46:44
阅读次数:
231
本文详细讲解了Spark在Standalone模式下的Master的HA的源码分析。
为了解决Standalone模式下的Master的SPOF,Spark采用了ZooKeeper提供的选举功能。Spark并没有采用ZooKeeper原生的Java API,而是采用了Curator,一个对ZooKeeper进行了封装的框架。采用了Curator后,Spark不用管理与ZooKeeper的连接,这些对于Spark来说都是透明的。Spark仅仅使用了100行代码,就实现了Master的HA。当然了,Spark是...
分类:
其他好文 时间:
2014-06-25 07:59:09
阅读次数:
183
DownloadadninstallthePublicSigningKeyrpm--importhttp://packages.elasticsearch.org/GPG-KEY-elasticsearchAddthefollowinginyour/etc/yum.repos.d/directory
inafilenamed(forexample)elasticsearch.repo[elasticsearch-1.2]
name=Elasticsearchrepositoryfor1.2.xpackages..
分类:
其他好文 时间:
2014-06-25 06:04:21
阅读次数:
308
1.Zookeeper是什么?
ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务。ZooKeeper的设计非常易于编程,它使用的是类似于文件系统那样的树形数据结构。他的数据都存在内存中,所以速度非常快,当然为了避免内存数据的丢失,所以数据也可以同时保存在硬盘上。
2.Zookeeper能做什么?
场景一:有一组服务器向客户端提供某种服务(例如:我前面做的分布式网...
分类:
其他好文 时间:
2014-06-22 16:55:46
阅读次数:
216
elasticsearch Faceted search Multi tenancy Geo spatial search...
分类:
其他好文 时间:
2014-06-22 06:37:41
阅读次数:
245