ETL是什么?为什么要使用ETL?KETTLE是什么?为什么要学KETTLE? ETL是数据的抽取清洗转换加载的过程,是数据进入数据仓库进行大数据分析的载入过程,目前流行的数据进入仓库的过程有两种形式,一种是进入数据库后再进行清洗和转换,另外一条路线是首先进行清洗转换再进入数据库,我们的ETL属于后 ...
分类:
其他好文 时间:
2016-04-12 07:19:16
阅读次数:
1190
不知不觉Kettle以及到了6.0,名字似乎也变了Pentaho官方的名称是 Pentaho Data Integration,于是就下载了最新的版本,下载地址为: Pentaho Data Integration 各版本下载 然后设置了PENTAHO_JAVA_HOME环境变了,启动Spoon.b ...
分类:
其他好文 时间:
2016-04-11 18:31:43
阅读次数:
174
问题描述: 1:oracle数据库连接登陆时突然变得很慢;sqldeveloper链接数据库很慢; 2:Kettle-spoon etl程序访问数据库,任务执行时报 :数据库连接 IO错误 :Socket Time Out 错误。 解决: 1:lsnrctl status 用命令查看oracle监听 ...
分类:
数据库 时间:
2016-04-09 18:57:44
阅读次数:
2105
各个数据库之间的类型 定义还是有差别的 一下是我在工作中遇到的一个很奇葩的问题 mysql 中的 tinyint 类型 插入到sqlserver 的tinyint 类型 插入到 sqlserver的 指定类型字段(tinyint ) 值全部是 1 解决步骤: 1、在DB连接那里配置数据库连接的高级- ...
分类:
数据库 时间:
2016-04-08 18:20:27
阅读次数:
957
在做ETL的时候,连接MySQL读取含有timestamp类型的表,出现如下错误: 经Google,据说是MySQL自身的问题。解决方法也很简单,在Spoon的数据库连接中,打开选项,加入一行命令参数: 如图所示: 问题解决。 转自: 《Pentaho Spoon (Kettle) 出现 Times ...
分类:
其他好文 时间:
2016-04-08 18:02:41
阅读次数:
278
kettle參数、变量具体解说 kettle 3.2 曾经的版本号里仅仅有 variable 和 argument,kettle 3.2 中。又引入了 parameter 概念。variable 即environment variables(环境变量或全局变量)。即使是不同的转换它们也拥有相同的值; ...
分类:
其他好文 时间:
2016-04-04 22:28:06
阅读次数:
136
原创作品。出自 “深蓝的blog” 博客,深蓝的blog:http://blog.csdn.net/huangyanlong/article/details/46876783 把kettle中carte创建成windows服务项 提示:Carte的作用是用于远程web监控kettle抽取状态的子se ...
分类:
其他好文 时间:
2016-03-27 12:39:18
阅读次数:
317
kettle中使用javascript步骤和fireToDB函数实现自己定义数据库查询 如果你须要实现非传统的数据库查询操作。为了讨论这样的情景,我们如果你须要读取数据库中的正則表達式,然后检查输入的每行的字段匹配表达式的个数。 在javascript步骤运行数据库查询
分类:
数据库 时间:
2016-03-13 12:50:46
阅读次数:
439
kettle中调用java类 有时须要在kettle调用java类,如:验证、查询或自己定义加密等。有时甚至连主要的数据訪问都不那么简单,如获取一个存储文件或使用一个数据库连接,某些数据源可能封装在应用程序中,手工使用自己定义的javaclient訪问是唯一的方法。本文介绍怎样在kettle中调用j
分类:
编程语言 时间:
2016-03-09 12:30:31
阅读次数:
171
原文地址:http://www.cnblogs.com/limengqiang/archive/2013/01/16/KettleApply1.html 本系列文章主要索引如下: 一、ETL利器Kettle实战应用解析系列一【Kettle使用介绍】 二、ETL利器Kettle实战应用解析系列二 【应
分类:
其他好文 时间:
2016-03-02 09:33:36
阅读次数:
160