Apache Phoenix 是 HBase 的 SQL 驱动。Phoenix 使得 HBase 支持通过 JDBC 的方式进行访问,并将你的 SQL 查询转成 HBase 的扫描和相应的动作。
兼容性:
Phoenix 2.x - HBase 0.94.x
Phoenix 3.x - HBase 0.94.x
Phoenix 4.x - HBase 0.98.1+...
分类:
其他好文 时间:
2014-09-13 00:50:44
阅读次数:
412
今天在hbase中创建快照的时候遇到了如下错误:
hbase(main):004:0> snapshot 'booking', 'booking-snapshot-20140912'
ERROR: org.apache.hadoop.hbase.snapshot.HBaseSnapshotException: Snapshot { ss=booking-snapshot-20140912 ta...
分类:
其他好文 时间:
2014-09-12 17:21:23
阅读次数:
876
分布式系统的现状,难以区分一个响应慢的节点和一个死掉的节点,所有的rpc流程都是基于timeout机制,我们期望更少的超时时间,则意味着有更高的误判率,误判的情况下hbase容错性虽然很好,但总要付出一些数据恢复的代价。 故障恢复主要牵涉到的组件有zk,hmaster namenode。zk承担锁....
分类:
其他好文 时间:
2014-09-12 16:47:23
阅读次数:
414
最近在做binlog日志采集同步到数据平台的事。刚开始需要借助sqoop将从库数据表数据初始化到hbase中,整个过程都需要自动化进行,尽量减少人为干预。但是,由于历史原因,线上存在两种字符集格式的数据库(表),而导入到hbase的数据我们需要统一采用utf-8格式存储。sqoop直接导入的话,没法控制中文字符转码工作。所以需要对sqoop源码进行简单改动支持这种方式。
大体思路是,通过定义一个...
分类:
数据库 时间:
2014-09-11 19:26:02
阅读次数:
573
运行在YARN平台上面的RPC。当前存在非常多的开源RPC框架,比较著名的有Thrift、Protocol Buffers 和 AVRO。他们均有两部分构成:对象序列化和远程过程调用。重要类:YarnRPCHadoopYarnRPCRpcFactoryProvider。RpcClientFact.....
分类:
其他好文 时间:
2014-09-10 17:16:50
阅读次数:
217
方法1: /** * 添加一行数据 * * @param tableName * 表名 * @param columnFamily * 列族名 * @param rowKey * ...
分类:
其他好文 时间:
2014-09-10 17:09:30
阅读次数:
493
一、Split触发条件
1、 有任一一个Hfile的大小超过默认值10G时,都会进行split
2、 达到这个值不在拆分,默认为int_max,不进行拆分
3、compaction时,如果compact的store的大小超过了,则进行split
4、 flush之前会检测区域中HStoreFile数目是否超过hbase.h...
分类:
其他好文 时间:
2014-09-10 10:52:00
阅读次数:
266
1. 表的设计1.1 Pre-Creating Regions默认情况下,在创建HBase表的时候会自动创建一个region分区,当导入数据的时候,所有的HBase客户端都向这一个region写数据, 直到这个region足够大了才进行切分。一种可以加快批量写入速度的方法是通过预先创建一些空的reg...
分类:
其他好文 时间:
2014-09-09 17:40:49
阅读次数:
203
启动HiveServer2:cd $HIVE_HOME/bin以后台方式默认端口启动HiveServer2(默认端口是10000):hiveserver2 &以后台方式指定端口的方式启动:hiveserver2 --hiveconf hive.server2.thrift.port=14000 &使...
分类:
数据库 时间:
2014-09-09 15:28:58
阅读次数:
1080