原创作品,出自 “深蓝的blog” 博客,欢迎转载,转载时请务必注明出处,否则追究版权法律责任。
深蓝的blog:
【目标】
利用kettle中的资源库功能,把ktr文件统一存储到数据库中,方便本地进行版本管理
ktr:使用kettle编辑的转换,被称为ktr;
转换:添加功能模块,实现ETL的项目称为转换。
一路确定后,点击ok完成资源库的...
分类:
数据库 时间:
2015-05-28 09:29:28
阅读次数:
265
hbase提供了一个shell的终端给用户交互。使用命令hbaseshell进入命令界面。通过执行help可以看到命令的帮助信息。以网上的一个学生成绩表的例子来演示hbase的用法。namegradcoursemathartTom59787Jim48980这里grad对于表来说是一个只有它自己的列族,course对于表来说是一个有两..
分类:
系统相关 时间:
2015-05-27 19:18:12
阅读次数:
292
hbase提供了一个shell的终端给用户交互。使用命令hbaseshell进入命令界面。通过执行 help可以看到命令的帮助信息。
以网上的一个学生成绩表的例子来演示hbase的用法。
name
grad
course
math
art
T...
分类:
系统相关 时间:
2015-05-27 19:09:39
阅读次数:
389
1、为何要BulkLoad 导入?传统的HTableOutputFormat 写 HBase 有什么问题?我们先看下 HBase 的写流程:通常 MapReduce 在写HBase时使用的是 TableOutputFormat 方式,在reduce中直接生成put对象写入HBase,该方式在大数据量...
分类:
其他好文 时间:
2015-05-27 19:00:52
阅读次数:
146
hbase提供了一个shell的终端给用户交互。使用命令hbaseshell进入命令界面。通过执行help可以看到命令的帮助信息。以网上的一个学生成绩表的例子来演示hbase的用法。namegradcoursemathartTom59787Jim48980这里grad对于表来说是一个只有它自己的列族...
分类:
系统相关 时间:
2015-05-27 18:45:54
阅读次数:
244
本文出自:http://wuyudong.com/archives/154在上篇文章《HBase简介》中,已经提到过,HBase中的Table中的所有行都按照row key的字典序排列,Table 在行的方向上分割为多个Hregion:region按大小分割的,每个表一开始只有一个region,随着...
分类:
其他好文 时间:
2015-05-27 15:35:03
阅读次数:
119
一、HBase简介
HBase(Hadoop Database)是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。
HBase利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据,利用Zookeeper作为协调工具。二、HBASE基础知识表(table),是...
分类:
其他好文 时间:
2015-05-27 12:17:17
阅读次数:
274
本文出自:http://wuyudong.com/archives/119? 对于全分布式的HBase安装,需要通过hbase-site.xml文档来配置本机的HBase特性,由于各个HBase之间通过zookeeper来进行通信,因此需要维护一组zookeeper系统,关于z...
分类:
其他好文 时间:
2015-05-26 21:36:48
阅读次数:
262
HBaseIntegration:通过Hive读写HBase...
分类:
其他好文 时间:
2015-05-26 21:22:27
阅读次数:
139
本文出自:http://wuyudong.com/archives/119对于全分布式的HBase安装,需要通过hbase-site.xml文档来配置本机的HBase特性,由于各个HBase之间通过zookeeper来进行通信,因此需要维护一组zookeeper系统,关于zookeeper的安装使用...
分类:
其他好文 时间:
2015-05-26 20:49:35
阅读次数:
167