码迷,mamicode.com
首页 >  
搜索关键字:数据抽取    ( 211个结果
kettle安装部署基本操作及实操文档
一、kettle是什么? Kettle,简称ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),是一款国外开源的ETL工具,纯Java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定,对于企业或行业应用来说,我们经常会遇到各 ...
分类:其他好文   时间:2020-01-11 11:48:10    阅读次数:183
SpringBoot集成Mybatis动态多数据源后,MybatisPlus的IPage失效的问题解决方案
背景 之前做数据抽取的时候,搭了一个mybatis动态数据源切换的架子。方便他们写抽取的代码。今天同事问我,架子里面的mybatisplus的IPage失效了是什么问题。想了一下,应该是写动态数据源的时候,我自定义的mybatis的配置覆盖了已有的配置。于是我让他先把我写的配置进行删除,看是否正常。 ...
分类:编程语言   时间:2020-01-07 21:22:20    阅读次数:179
在Windows下安装Kettle
Kettle是一款国外开源的ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,数据抽取高效稳定。 它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。 Kettle中有两种脚本文件,transformation和job,tra ...
分类:Windows程序   时间:2019-12-29 18:53:14    阅读次数:90
灵活运用SQL Server2008 SSIS变量
在SSIS开发ETL(Extract-Transform-Load),数据抽取、转换、装载的过程。我们需要自己定义变量 一、SSIS变量简介 SSIS(SQL Server Integration Services,SQL Server整合服务)变量分分为两种,一种是系统变量,一种用户定义的变量。系 ...
分类:数据库   时间:2019-12-29 10:51:19    阅读次数:74
ETL讲解
业务系统中,各个业务系统的数据库服务器运行什么DBMS,是否存在手工数据,手工数据量有多大,是否存在非结构化的数据等等,当收集完这些信息之后才可以进行数据抽取的设计。 1、对于与存放DW的数据库系统相同的数据源处理方法 这一类数据源在设计上比较容易。一般情况下,DBMS(SQLServer、Orac ...
分类:其他好文   时间:2019-12-25 15:43:17    阅读次数:67
HIVE SQL产生的文件数量及参数调优
产生背景:sqoop抽取oracle数据到hive表时,只能写入到固定分区(--hive-partition-key #hive分区字段 --hive-partition-value #hive分区值)。于是先把数据抽取到一张增量表,然后从增量表动态写入分区表。 set hive.exec.dyna ...
分类:数据库   时间:2019-12-19 23:26:48    阅读次数:305
Visual Studio 2019安装SSIS
因为公司系统因各地分公司都是独立的系统,但现在有需求需要进行从各地公司有针对性的把数据抽取出来,这些数据需要进行科研分析。本来一开始准备使用kettle工具的,后来想起原来sql2008里有SSIS。然后又去微软官网上看了看VS2019现在支持了,正好我们的整个环境也是VS2019的,就先踩踩坑,试 ...
分类:其他好文   时间:2019-12-05 13:28:23    阅读次数:457
【python数据分析实战】电影票房数据分析(二)数据可视化
在上一部分 "《【python数据分析实战】电影票房数据分析(一)数据采集》" 已经获取到了2011年至今的票房数据,并保存在了mysql中。 本文将在实操中讲解如何将mysql中的数据抽取出来并做成动态可视化。 [toc] 图1 每年的月票房走势图 第一张图,我们要看一下每月的票房走势,毫无疑问要 ...
分类:编程语言   时间:2019-10-27 12:36:59    阅读次数:87
kettle下载、配置及入门使用-数据库表的复制
1,定义 kettle是一款开源的ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。需要java环境才能运行。 2,官网下载地址 https://community.hitachivantara.com/s/article/data-int ...
分类:数据库   时间:2019-09-01 22:04:40    阅读次数:111
如何才能让数仓构建成本降低80%,维护成本降低70%?
构建数据仓库的核心是建模,在数据仓库的构建中,ETL贯穿于项目始终,它是整个数据仓库的生命线。从数据源中抽取数据,然后对这些数据进行转化,最终加载到目标数据库或者数据仓库中去,这也就是我们通常所说的 ETL 过程(Extract,Transform,Load)。 通常数据抽取工作分抽取、清洗、转换、 ...
分类:其他好文   时间:2019-08-05 13:47:31    阅读次数:144
211条   上一页 1 2 3 4 5 ... 22 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!