来自我们牛逼哄哄的东哥的笔记 1. 2. 3. 选择数据库链接 贴报表SQL 4. 文件名:选择路径,excel文件由kettle自动创建,自己只需输入创建文件的名称。 拓展名:后缀写上 5. 此为sheet页名称 6. 根据自己的情况选择不同excel格式 7. 8. 邮件发送分为job和ktr里 ...
分类:
其他好文 时间:
2017-02-16 11:26:40
阅读次数:
375
1、实时性要求不高,采用全删全插的方式(适合于维度表、大数据量表) 2、有时间维度,直接从事实表同步的数据,可以采用根据时间字段进行筛选,增量同步。这个网上有很多例子,就不重复写了。 3、没有时间维度,同时表数据量比较大,且不能采用全删全插方式的,可以采用增量更新的方法。 在第三种方法中,尤其需要注 ...
分类:
其他好文 时间:
2017-02-16 11:22:15
阅读次数:
197
1.kettle 5.4 使用JDBC连接的时候报错(测试不同的数据库,发现只是连接11gRAC 的时候会报JDBC的错误) 具体报错如下 使用sqlplus 进一步测定发现数据库功能正常,尝试其他的连接方式。 2.尝试用ODBC的方式连接: 管理工具-->数据源--用户DSN--添加--选择ora ...
分类:
数据库 时间:
2017-02-09 23:55:12
阅读次数:
2945
首先我们有一个正常安装的,桌面版的Linux. Kettle的应用程序是Linux版本与Windows版本在同一个文件夹下共存的,所以可以直接把本机上的Kettle解压,通过FTP工具上传到Linux目录下。 我们这里直接运行Kettle目录下的Spoon.sh看能不能进入Kettle的设计界面,发 ...
分类:
系统相关 时间:
2017-02-09 23:28:30
阅读次数:
444
kettle常见的资源库有3种:数据库资源库、文件资源库、pentaho资源库。 文件资源库是在一个文件目录下定义一个资源库,因为kettle使用的是虚拟文件系统(Apache VFS),所以这里的文件目录是一个广泛的概念,包括了zip文件、web服务、FTP服务。 pentaho资源库是一个插件( ...
分类:
数据库 时间:
2017-02-03 15:29:52
阅读次数:
342
环境需求:JDK 1.8 ,KETTLE 7.0。win7 64位环境 配置java环境。 配置KETTLE环境。 去官网下载kettle。 解压。 运行spoon.bat文件。 ...
分类:
其他好文 时间:
2017-01-25 15:29:43
阅读次数:
146
一、背景 公司在用kettle做数据etl,每做完一个job或transformation发布上线想要立即执行看数据效果的话每次都是找运维同学登陆服务器打开kettle找到对应的文件点击执行,整个过程效率低下,不仅占用运维时间,期间自己也在白白等待,浪费生命。 google “kettle remo ...
分类:
Web程序 时间:
2017-01-25 12:39:00
阅读次数:
840
场景:假设有一张表数据量很大,需要按一个时间来循环增量抽取 方法:主要是通过JOB自身调用,实现循环调用,类似于 函数自调用 的循环。 1.JOB全图: 2.获取增量时间,并设置增量时间环境变量 3.通过增量环境变更,获取本次 增量数据 4.判断增量时间是否大于当前时间,判断是否继续执行一次的增量 ...
分类:
其他好文 时间:
2017-01-12 08:16:07
阅读次数:
315
1.设计一个增量 配置表ETL_INCREMENTAL,用于配置表的增量时间等数据 2.增量JOB全图如下: 2.1获取增量时间变量,并设置增量变量 2.2 表的增量转换,在表中引用2.1的增量变量 2.3 完成增量后,修改配置表ETL_INCREMENTAL ...
分类:
其他好文 时间:
2017-01-12 03:04:22
阅读次数:
193
一、 解压kettle包 1、把包拷到Linux系统下 还有mysql的驱动包 2、解压zip后缀的包 输入命令:unzip /software/pdi-ce-7.0.0.0-25.zip 可以把原来的包删了 输入命令:rm -f pdi-ce-7.0.0.0-25.zip 二、 创建数据库和表 三 ...
分类:
数据库 时间:
2017-01-11 15:58:40
阅读次数:
525