kettle中转换和作业的执行顺序: 1、一个作业内的转换,是顺序执行的。 2、一个转换内的步骤是并行执行的。 3、作业内不支持事务,转换内支持事务。根据业务需要,通常需要在转换内顺序执行,小技巧如下: 1、执行SQL是优先于所有步骤。 2、使用“阻塞数据直到步骤都完成”,确保其他数据步骤...
分类:
其他好文 时间:
2015-07-08 20:22:03
阅读次数:
1001
1 引言:项目最近要引入大数据技术,使用其处理加工日上网话单数据,需要kettle把源系统的文本数据load到hadoop环境中2 准备工作:1 首先要了解支持hadoop的Kettle版本情况,由于kettle资料网上较少,所以最好去官网找,官网的url:http://wiki.pentaho.c...
分类:
其他好文 时间:
2015-07-08 00:24:10
阅读次数:
198
jsp本质是servlet(一个特殊的Java类),由两部分内容组成:动态内容,静态内容静态:与html页面相同动态:由java脚本动态生成工作原理:Client-->jsp server-->第一次收到请求,则编译jsp文件,生成对应的servlet。 如果该jsp已经有对应...
分类:
Web程序 时间:
2015-07-04 10:52:47
阅读次数:
142
首先建立转换:从数据库表到日志表输入的设置:日志设置:新建job:转换选择刚才建好的输出日志转换。变量设置如下:此ID就是转换中的${ID},执行job,可以看到控制台输出日志结果:黑色字体部分中只写出了id=1的一条记录。最后补充,将转换的日志写到数据库中:打开转换>ctrl+t>日志选项卡>转换...
分类:
数据库 时间:
2015-07-03 19:01:49
阅读次数:
380
1,Kettle跨平台使用。例如:在AIX下(AIX是IBM商用UNIX操作系统,此处在LINUX/UNIX同样适用),运行Kettle的相关步骤如下:1)进入到Kettle部署的路径2)执行 chmod *.sh,将所有shell文件添加可执行权限3)在Kettle路径下,如果要执行transfo...
分类:
其他好文 时间:
2015-07-03 18:51:50
阅读次数:
143
看大家分享了好多hadoop相关的一些内容,我为大家介绍一款ETL工具——Kettle。 Kettle是pentaho公司开源的一款ETL工具,跟hadoop一样,也是java实现,其目的就是做数据整合中时数据的抽取(Extract)、转换(Transformat)、加载(Load)工作。Kett....
分类:
其他好文 时间:
2015-07-03 18:47:39
阅读次数:
473
Msyql到Vertica1、mysql中在openshop 数据库中选择其中一个300W左右数据的表create table ip_records_tmp_01ASSELECT * FROM ip_records_tmp tWHERE t.datetime '2015-05-01';删除:dele...
分类:
其他好文 时间:
2015-07-03 12:02:30
阅读次数:
1095
本文主要介绍我了解的kettle源码结构,当使用时遇到bug能快速定位到具体代码,有常规修改思路。
分类:
其他好文 时间:
2015-06-28 01:15:46
阅读次数:
345