码迷,mamicode.com
首页 > 其他好文 > 详细

Kettle 5.x使用指南

时间:2014-10-12 23:32:38      阅读:168      评论:0      收藏:0      [点我收藏+]

标签:etl   kettle   pentaho   hbase   

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。

Kettle中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。

Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。

Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。

Kettle可以在http://kettle.pentaho.org/网站下载到。

注:ETL,是英文Extract-Transform-Load 的缩写,用来描述将数据从来源端经过萃取(extract)、转置(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。

Kettle 5.x使用指南下载网址:http://download.csdn.net/detail/fan_hai_ping/8030177

本教程使用的软件版本信息如下:

1)Hadoop(1.2.1)

2)Pantaho DataIntegration(5.2.0)

3)HBase(0.94.19)。

注:如果在教程的阅读或实际使用中遇到问题,欢迎一起讨论!!

Kettle 5.x使用指南

标签:etl   kettle   pentaho   hbase   

原文地址:http://blog.csdn.net/fan_hai_ping/article/details/40022367

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!