码迷,mamicode.com
首页 >  
搜索关键字:数据仓库    ( 1540个结果
数据立方体----维度与OLAP
前面的一篇文章——数据仓库的多维数据模型中已经简单介绍过多维模型的定义和结构,以及事实表(Fact Table)和维表(Dimension Table)的概念。多维数据模型作为一种新的逻辑模型赋予了数据新的组织和存储形式,而真正体现其在分析上的优势还需要基于模型的有效的操作和处理,也就是OLAP(O...
分类:其他好文   时间:2014-12-10 17:38:11    阅读次数:850
《BI那点儿事—数据的艺术》理解维度数据仓库——事实表、维度表、聚合表
原文:《BI那点儿事—数据的艺术》理解维度数据仓库——事实表、维度表、聚合表事实表 在多维数据仓库中,保存度量值的详细值或事实的表称为“事实表”。一个按照州、产品和月份划分的销售量和销售额存储的事实表有5个列,概念上与下面的示例类似。 Sate Product Mouth Units Dollars...
分类:其他好文   时间:2014-12-10 14:08:58    阅读次数:298
《BI那点儿事》ETL中的关键技术
原文:《BI那点儿事》ETL中的关键技术 ETL(Extract/Transformation/Load)是BI/DW的核心和灵魂,按照统一的规则集成并提高数据的价值,是负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步骤。 ETL过程中的主要环节就是数据抽取、数据转换和加工、数据...
分类:其他好文   时间:2014-12-10 14:05:23    阅读次数:215
Kettle的一些常见问题
摘要:本文主要介绍使用kettle设计一些ETL任务时一些常见问题,这些问题大部分都不在官方FAQ上,你可以在kettle的论坛上找到一些问题的答案    1. Join   我得到A 数据流(不管是基于文件或数据库),A包含field1 , field2 , field3 字段,然后我还有一个B数据流,B包含field4 , field5 , field6 , 我现在想把它们 ‘加’ 起...
分类:其他好文   时间:2014-12-10 10:50:33    阅读次数:239
hbase基本结构
HBASE 基本结构一。overview1. hbase NOSQL 不错,hbase 就是某种类型的nosql 数据库,唯一的区别就是他支持海量的数据。 hbase的基本功能: 1) 强一致性的读写,而非“最终一致性”(eventually consistent)的数据仓库。基于此,hbase非....
分类:其他好文   时间:2014-12-09 13:46:13    阅读次数:514
数据挖掘概述
最近看了比较多的关于大数据处理方面的知识,但是例如Hadoop,Spark,Storm等平台大都是对于数据的存储和管理操作,并不是对于数据进行分析和处理的。所以这里就衍生出了另外一种对于数据的处理,数据挖掘。学习数据挖掘也非常偶然,首先毕竟本人一直在做的是数据方面的工作,数据挖掘相当于是对数据处理后的下一步操作,学习一下数据挖掘的基本知识,了解了解常用的一些数据挖掘算法,对我来说也是一件不错的事。...
分类:其他好文   时间:2014-12-05 17:27:05    阅读次数:151
列式数据库
最早的商业列式数据库是在1995年发布的Sybase IQ,但是一直到1999年左右才慢慢稳定到能够投入生产环境。现在的大多数分析型数据库都是在2003-2005年从Postgresql 分支出来的。其中尤其是Vertica 为代表的列数据库已经在大规模数据仓库环境中证明其特别为数据仓库环境设计的思...
分类:数据库   时间:2014-12-05 16:50:18    阅读次数:181
etl数据提取、转换和加载
ETL负责将分散的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。ETL一词较常出现在数据仓库,但其对象并不局限于数据仓库。ETL是数据仓库中的非常重要的一环。它是承前启后的必要的一步。相对于关系...
分类:其他好文   时间:2014-12-05 14:09:04    阅读次数:197
《BI那点儿事》ETL中的关键技术
ETL(Extract/Transformation/Load)是BI/DW的核心和灵魂,按照统一的规则集成并提高数据的价值,是负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步骤。ETL过程中的主要环节就是数据抽取、数据转换和加工、数据装载。为了实现这些功能,各个ETL工具一般会...
分类:其他好文   时间:2014-12-04 21:15:15    阅读次数:370
【跟我学Puppet】1.3 Puppet 3.7 使用PuppetDB做数据仓库
1.环境准备OS:CentOS6.4关闭selinux和iptables部署Puppet:1.0Puppet3.7部署安装Puppet源:http://yum.puppetlabs.com/puppetlabs-release-el-6.noarch.rpm完成PuppetMaster/Agent的部署,证书签署...PuppetDB是一个数据仓库,可以通过RESTfulHTTP的方式查询nodes、facter、re..
分类:数据库   时间:2014-12-04 06:30:50    阅读次数:203
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!