为什么需要数据仓库? 传统的数据库中,存放的数据都是一些定制性数据较多,表是二维的,一张表可以有很多字段,字段一字排开,对应的数据就一行一行写入表中,特点就是利用二维表表现多维关系。 但这种表现关系的上限和下限就定死了,比如QQ的用户信息,直接通过查询info表,对应的username、introd ...
分类:
其他好文 时间:
2019-08-23 19:37:09
阅读次数:
102
1. Redux使用场景 1. 某个组件的状态,需要共享 2. 不同组件之间通信 2. Redux 特点 2.1 Store store是一个数据仓库,一个应用中store是唯一的,它里面封装了state状态,当用户想访问state的时候,只能通过 来取得state对象。 2.2 action ac ...
分类:
其他好文 时间:
2019-08-23 13:10:46
阅读次数:
84
vuex 状态的管理状态,它采用集中式存储管理应用的所有组件的状态,尤其是在中大型项目,则是很好的开发利器 vuex 的流程图 vuex 的优势: 1. vuex 的存储状态,响应式的 2. 他是所有组件状态的集合 vuex 的四种状态 state :就是数据仓库;也是我们仓库存放数据的地方 mut ...
分类:
其他好文 时间:
2019-08-20 18:13:01
阅读次数:
86
为什么要有Sqoop? 将数据从别的数据库导到Hadoop、Hbase或Hive太麻烦了。 什么是Sqoop? Sqoop就是Hadoop、Hive、HBase等数据仓库与数据库之间传输数据的工具。,就是将导入(输入)和导出(输出)的命令映射成MR程序。 导入:MySQL等数据库数据导入到HDFS、 ...
分类:
其他好文 时间:
2019-08-20 01:07:48
阅读次数:
88
Hive简介 什么是Hive 1. Hive由Facebook实现并开源 2. 是基于Hadoop的一个数据仓库工具 3. 可以将结构化的数据映射为一张数据库表 4. 提供HQL(Hive SQL)查询功能 5. 底层数据是存储在HDFS上 6. Hive的本质是将SQL语句转换为MapReduce ...
分类:
其他好文 时间:
2019-08-19 00:02:27
阅读次数:
94
背景 相较传统的重量级OLAP数据仓库,“数据湖”以其数据体量大、综合成本低、支持非结构化数据、查询灵活多变等特点,受到越来越多企业的青睐,逐渐成为了现代数据平台的核心和架构范式。 数据湖的核心功能,简单地可以分为数据存储与数据查询计算两个部分,在云端可以有多种的实现选择。在之前的文章中,我们曾介绍 ...
分类:
其他好文 时间:
2019-08-18 11:24:20
阅读次数:
105
参考: https://aws.amazon.com/cn/redshift/pricing/?sc_channel=PS&sc_campaign=acquisition_CN&sc_publisher=baidu&sc_category=pc&sc_medium=redshift_nb&sc_co ...
分类:
其他好文 时间:
2019-08-17 20:28:36
阅读次数:
157
一、数据仓库的架构 数据仓库(Data Warehouse DW)是为了便于多维分析和多角度展现而将数据按特定的模式进行存储所建立起来的关系型数据库,它的数据基于OLTP源系统。数据仓库中的数据是细节的、集成的、面向主题的,以OLAP系统的分析需求为目的。 数据仓库的架构模型包括了星型架构(图二:p ...
分类:
其他好文 时间:
2019-08-17 20:25:27
阅读次数:
115
仓库的主要区别:数据仓库是企业级的,能为整个企业各个部门的运行提供决策支持手段;而数据集市则是一种微型的数据仓库,它通常有更少的数据,更少的主题区域,以及更少的历史数据,因此是部门级的,一般只能为某个局部范围内的管理人员服务,因此也称之为部门级数据仓库。 数据仓库 数据集市 数据的来源 生产系统、外 ...
分类:
其他好文 时间:
2019-08-17 20:01:26
阅读次数:
103
一、引言 最近在整理理大数据模式下的数据仓库数据模型,资料来自互联网和读过的数据仓库理论和实践相关。 二、3NF (1)1NF-无重复的列 数据库表的每一列都是不可分割的基本数据项,同一列中不能有多个值,即实体中的某个属性不能有多个值或者不能有重复的属性。 如果出现重复的属性,就可能需要定义一个新的 ...
分类:
其他好文 时间:
2019-08-17 19:54:50
阅读次数:
84