前言: 作为Hadoop生态系统中重要的一员, HBase作为分布式列式存储, 在线实时处理的特性, 备受瞩目, 将来能在很多应用场景, 取代传统关系型数据库的江湖地位. 本篇主要讲述面向时间序列/面检索的应用场景时, 如何利用HBase的特性去处理和优化. 构造应用场景 某气象局对各个站点...
分类:
其他好文 时间:
2014-07-26 16:49:51
阅读次数:
381
Ganglia监控软件主要是用来监控系统性能的软件,如:cpu 、mem、硬盘利用率, I/O负载、网络流量情况等,通过曲线很容易见到每个节点的工作状态,对合理调整、分配系统资源,提高系统整体性能起到重要作用。
本言讲解如何利用ganglia监控hbase指标,过滤无用的指标,并实现单独管理 hadoop metrics system 的功能,修改指标配置不用重启hbase。...
分类:
其他好文 时间:
2014-07-26 02:41:16
阅读次数:
385
1 hbase.hregion.max.filesize应该设置多少合适2 autoflush=false的影响3 从性能的角度谈table中family和qualifier的设置4 hbase.regionserver.handler.count详解1 hbase.hregion.max.file...
分类:
其他好文 时间:
2014-07-26 01:08:36
阅读次数:
194
1、主要是设置Reduce端输出的value类型直接上代码吧:注释就免了吧,大家应该很熟悉了。package hbase;import java.io.IOException;import java.util.StringTokenizer;import org.apache.hadoop.conf...
分类:
其他好文 时间:
2014-07-25 19:04:02
阅读次数:
271
1、搭建环境 复制linux下已配置搭建好的hbase目录进入windows里面,当然使用linux开发的可以不用。 新建java工程,将hbase目录下的jar和lib下的jar包添加到类路径下。 同时增加外部Class Folder将hbase的conf目录增加进来 多数连接操作就是因为没...
分类:
其他好文 时间:
2014-07-25 16:48:41
阅读次数:
266
1、从content域中搜索
从solr的example中得到的solrConfig.xml中,qf的定义如下:
[html] view
plaincopy
str name="qf">
text^0.5 features^1.0 name^1.2 sku^1.5 id^10.0 manu^1.1 cat^1.4...
分类:
其他好文 时间:
2014-07-24 23:31:23
阅读次数:
211
最近在XX项目的测试过程中,接触到一些HBase的东西,希望能站在测试的角度,把过程记录下来,期望对快速了解它有点帮助。作为一个初次接触它的人来说,需要迫切掌握其中基本的概念,这里就不赘述了。HBase Shell是HBase提供的便捷的访问方式,首先你需要搭建HBase的环境,可以参考http:/...
分类:
其他好文 时间:
2014-07-24 22:37:03
阅读次数:
214
HQueue:基于HBase的消息队列凌柏?1. HQueue简介HQueue是一淘搜索网页抓取离线系统团队基于HBase开发的一套分布式、持久化消息队列。它利用HTable存储消息数据,借助HBase Coprocessor将原始的KeyValue数据封装成消息数据格式进行存储,并基于HBase ...
分类:
其他好文 时间:
2014-07-24 22:31:52
阅读次数:
290
在jsp商城开发中两者都被设计用于管理非常大的数据集。HBase文件声称一个HBase数据库可以拥有数亿个,甚至是数十亿个行。此外,用户还被建议继续使用关系型数据库。
分类:
其他好文 时间:
2014-07-24 21:48:52
阅读次数:
210
hbaseregion,store,storefile和列簇,的关系关于hbase的read操作的深入研究region到storefile过程
分类:
其他好文 时间:
2014-07-23 21:25:57
阅读次数:
169