码迷,mamicode.com
首页 >  
搜索关键字:数据仓库    ( 1540个结果
DimDate populate data
日期维度 任何一个数据仓库都应该有一个日期维度。 因为很少有不需要通过日期维度看数据的情况存在。 日期维度的好处是,你可以通过他连接各个事实表,然后在报表端传送报表参数的时候, 直接自动过滤日期维度的相关值,而不需要自己写query. 去掉了西班牙语和法语的那些列。 You know that th...
分类:其他好文   时间:2015-01-24 17:08:03    阅读次数:135
Hive-1-Hive介绍和工作原理
1、 什么是Hive   hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。 2、 Hive的工作流程图   3、 使用场...
分类:其他好文   时间:2015-01-24 15:55:45    阅读次数:209
扫盲贴:数据挖掘(Data mining)是什么?
数据挖掘有什么用途?数据挖掘和数据仓库之间有什么样的联系?数据挖掘和市场调研、数据分析又有什么样的联系?……一扫盲篇研究结果表明,企业处理的数据每5年就会成倍增长,导致企业数据过度的重复和不一致,如何在这些数据中获取有利信息就促进数据挖掘技术发展。1、数据挖掘的相关概念谢邦昌教授在《数据挖掘 cle...
分类:其他好文   时间:2015-01-23 13:16:36    阅读次数:255
数据仓库英文缩写攻略
背书随着大数据的到来,经常听到相关的词汇,维度、指标、BI、PV、UV等等,如果不知道啥意思,不好意思出来混呀,今天我整理了这些词汇,可以让大家快速融入相关话题。DWDW是Data Warehouse的缩写,即数据仓库。数据仓库大都存储在各种数据库中。DW要区别于普通数据库,数据仓库用于支持决策,面...
分类:其他好文   时间:2015-01-23 10:59:15    阅读次数:192
DW Basic Knowledge1
以下内容,常读常新,每次都有新的感悟和认识。 数据仓库必须使组织机构的信息变得容易存取。 数据仓库的内容需要是容易理解的,数据对业务人员也必定是直观的,明显的。 数据仓库重新组织了原来OLTP数据库的结构,根据业务需求,但又结合数据建模的一些特性。数据仓库必须一致地展示组织机构的信息。 数据仓库中....
分类:其他好文   时间:2015-01-22 23:06:34    阅读次数:179
简述网络游戏的数据挖掘数据分析路线图
网络游戏的数据挖掘数据分析路线图顺序:1)搭建基础数据仓库;2)对用户体系进行输理: a)用户信息真伪识别判断 b)用户分群,将整体用户细分为具有特定属性特征的群体3) 整理数据分析目的,对相关业务流程明确定义和描述4) 数据准备,将与目的目标对应的数据提取和标准化注:其中3与4反复多次后,进行.....
分类:其他好文   时间:2015-01-21 12:59:55    阅读次数:131
数据仓库系列-为什么要维度建模
凡是建设数据仓库,一定会提到维度建模方法。这一方法是Kimball最先提出的,其最简单的描述就是,按照事实表、维度表来构建数据仓库、数据集市。在维度建模方法体系中,维度是描述事实的角度,如日期、商品、地址等,事实是要度量的指标,如用户数、销售额等。按照一般书籍的介绍,维度建模还会分为星型模型、雪花模...
分类:其他好文   时间:2015-01-20 13:43:28    阅读次数:156
当传统企业遇上大数据
大数据绝对可以算得上当下的流行话题,购物要大数、出行要大数、看病要大数、上学要大数……,好像什么行业都能与大数据搭上边,又似乎一切都可以大数据了。对于经历过多年企业信息化的传统企业来说,大数据对于他们既清晰、又迷茫,他们有过数据仓库、数据挖掘、商业智能(BI)概念的洗礼,但又看不懂“大数据”与之前的...
分类:其他好文   时间:2015-01-20 13:37:04    阅读次数:126
三个例子,让你看懂数据仓库多维数据模型的设计
事实星座模式是数据仓库最长使用的数据模式,尤其是企业级数据仓库(EDW)。这也是数据仓库区别于数据集市的一个典型的特征,从根本上而言,数据仓库数据模型的模式更多是为了避免冗余和数据复用,套用现成的模式,是设计数据仓库最合理的选择。当然大数据技术体系下,数据仓库数据模型的设计,还是一个盲点,探索中。
分类:其他好文   时间:2015-01-20 10:10:16    阅读次数:152
ETL模型设计
传统的关系数据库一般采用二维数表的形式来表示数据,一个维是行,另一个维是列,行和列的交叉处就是数据元素。关系数据的基础是关系数据库模型,通过标准的SQL语言来加以实现。 数据仓库是多维数据库,它扩展了关系数据库模型,以星形架构为主要结构方式的,并在它的基础上,扩展出理论雪花形架构和数据星座等方...
分类:其他好文   时间:2015-01-17 15:12:02    阅读次数:201
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!