HBase通常安装在Hadoop HDFS上,但也可以安装在其他实现了Hadoop文件接口的分布式文件系统上,如KFS。glusterfs是一个集群文件系统可扩展到几peta-bytes。它集合了各种存储在infiniband rdma或互连成一个大型并行网络文件系统。存储可以由任何商品等硬件x86_64服务器和sata-ii和infiniband HBA。GlusterFS比Hadoop HDFS可以提供更高的性能,HBase也因此可以获得更高的性能。将HBase安装在GlusterFS上,是可行的。该方...
分类:
系统相关 时间:
2014-10-19 23:22:18
阅读次数:
372
两个field,一个是KFC数据 一个列放的内容是“same”每条数据都flushSLF4J: Failed to load class "org.slf4j.impl.StaticLoggerBinder".SLF4J: Defaulting to no-operation (NOP) logge...
分类:
其他好文 时间:
2014-10-19 14:17:30
阅读次数:
304
HBase ShellHBase shell使用起来最方便,进入HBase shell控制台就可以使用。$ $HBASE_HOME/bin/hbase shell常见操作有create(创建表)/put(插入或更新数据)/get(依据rowkey查询)/scan(范围查询)/delete(删除列)/...
分类:
编程语言 时间:
2014-10-18 20:52:22
阅读次数:
241
MemStore简介:上图为HBase的读写过程的大概描述;写请求过程:client---------->WAL(WriteAheadLOG)----------->MemStore------------->HFile--------->END读请求过程:client---------->MemStore-------->BlockCache------->HFile------------>ENDMe..
分类:
其他好文 时间:
2014-10-18 18:32:25
阅读次数:
310
最近两天给一个项目搭建linux下的大数据处理环境,系统是CentOS 6.3。主要是配置JDK,安装Tomcat,Hadoop、HBase和Zookeeper软件,本人在Hadoop这方面也是新手,配置这个环境遇到过许多问题,查了许多资料,这里做一个总结,以便日后回顾。
首先是账户权限的修改,安装软件环境需要上传文件和一些系统文件的修改权限,所以最好设置成root权限
权限修改方法:http...
分类:
其他好文 时间:
2014-10-17 22:03:55
阅读次数:
225
因官方Book Performance Tuning部分章节没有按配置项进行索引,不能达到快速查阅的效果。所以我以配置项驱动,重新整理了原文,并补充一些自己的理解,如有错误,欢迎指正。配置优化zookeeper.session.timeout 默认值:3分钟(180000ms) 说明:RegionS...
分类:
其他好文 时间:
2014-10-17 18:30:05
阅读次数:
248
oracle数据库导入导出命令!Oracle数据导入导出imp/exp 功能:Oracle数据导入导出imp/exp就相当与oracle数据还原与备份。大多情况都可以用Oracle数据导入导出完成数据的备份和还原(不会造成数据的丢失)。Oracle有个好处,虽然你的电脑不是服务器,但是你装了orac...
分类:
数据库 时间:
2014-10-17 11:39:34
阅读次数:
201
一、基本介绍 1、FilterList代表一个过滤器列表 FilterList.Operator.MUST_PASS_ALL --> 取交集 相当一and操作 FilterList.Operator.MUST_PASS_ONE --> 取并集 相当于or 操...
分类:
其他好文 时间:
2014-10-16 22:31:13
阅读次数:
293
我们知道,在第一次海量数据批量入库时,我们会选择使用BulkLoad的方式。
简介一下BulkLoad原理方式:(1)通过MapReduce的方式,在Map或者Reduce端将输出格式化为HBase的底层存储文件HFile。(2)调用BulkLoad将第一个Job生成的HFile导入到对应的HBase表中。
ps:请注意(1)HFile方式是所有的加载方案里面是最快的,前提是:数据必须第一个导...
分类:
其他好文 时间:
2014-10-16 20:16:53
阅读次数:
283
hadoop jar hbase-server-0.98.1-cdh5.1.3.jar importtsv -Dimporttsv.columns=HBASE_ROW_KEY,cf:imsi,cf:imei -Dimporttsv.bulk.output=/user/libc/tmp1 -Dimpo...
分类:
其他好文 时间:
2014-10-16 01:06:01
阅读次数:
274