看大家分享了好多hadoop相关的一些内容,我为大家介绍一款ETL工具——Kettle。 Kettle是pentaho公司开源的一款ETL工具,跟hadoop一样,也是java实现,其目的就是做数据整合中时数据的抽取(Extract)、转换(Transformat)、加载(Load)工作。Kett....
分类:
其他好文 时间:
2015-07-03 18:47:39
阅读次数:
473
SSIS是Microsoft SQL Server Integration Services的简称,是生成高性能数据集成解决方案(包括数据仓库的提取、转换和加载 (ETL) 包)的平台。ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extrac...
分类:
其他好文 时间:
2015-07-03 11:49:21
阅读次数:
123
1、查询分析器 --下班了,明天写! 2、报表科目与查询分析字段映射 --下班了,明天写! 3、ETL工具 ??????? 我使用的是Scriptella,这个工具的好处是,我不用去把查找指定数据的SQL用xml工具去重新解析封装...
分类:
其他好文 时间:
2015-07-02 17:58:52
阅读次数:
136
1. Storm是什么,怎么做,如何做的更好?Storm是一个开源的分布式实时计算系统,它可以简单、可靠地处理大量的数据流。Storm有很多应用场景,如实时分析、在线机器学习、持续计算、分布式RPC、ETL,等等。Storm支持水平扩展,具有高容错性,保证每个消息都会得到处理,而且处理速度很快(在一...
分类:
其他好文 时间:
2015-06-28 21:25:04
阅读次数:
233
参考文章:
Mongo hadoop connector
https://github.com/mongodb/mongo-hadoop
wiki
https://github.com/mongodb/mongo-hadoop/wiki
ppt
http://www.slideshare.net/mongodb/hadoop-webinar?from_embed_lead_cta=t...
分类:
数据库 时间:
2015-06-27 09:52:19
阅读次数:
231
从Oracle收购sunopsis看ETL和ELT产品的趋势日期:2008-6-17来源:amteam我要评论大|中|小投稿打印导读:本文主要从Oracle收购sunopsis分析ETL和ELT产品的趋势以及说明ELT工具比ETL工具能够处理大数据量效率更高的原因。关键词:Oraclesunopsi...
分类:
数据库 时间:
2015-06-14 18:22:47
阅读次数:
171
导读:ETL,Extraction-Transformation-Loading的缩写,即数据抽取(Extract)、转换(Transform)、装载(Load)的过程,它是构建数据仓库的重要环节。关键词:ETL数据仓库OLTPOLAP ETL,Extraction-Transformation-....
分类:
其他好文 时间:
2015-06-14 18:08:12
阅读次数:
163
ETL和Kettle简介ETL即数据抽取(Extract)、转换(Transform)、装载(Load)的过程。它是构建数据仓库的重要环节。数据仓库是面向主题的、集成的、稳定的且随时间不断变化的数据集合,用以支持经营管理中的决策制定过程。数据仓库系统中有可能存在着大量的噪声数据,引起的主要原因有:滥...
分类:
其他好文 时间:
2015-06-13 12:41:37
阅读次数:
262
1 开源数据汇集工具 1.1 Talend Open Studio Talend Open Studio 是一个 ETL (Extract, Transform, and Load) 工具,可执行数据仓库到数据库之间的数据同步,提供基于 Eclipse RCP 的图形操作界面。 项目源码:http:...
分类:
其他好文 时间:
2015-06-10 13:41:32
阅读次数:
336