1、简述数据仓库有哪些特征。 面向主题、集成、稳定性即非易失的、随时间而变化即时变的 2、简述数据仓库与传统数据库的主要区别。 一个是数据库、一个是数据仓库,就不是一个东西,怎么区别嘛。 数据仓库是建立在数据库之上的一个数据环境。 3、为什么需要分离的数据仓库? 不影响生产, 操作型数据是时刻变化的 ...
分类:
其他好文 时间:
2018-01-14 21:18:18
阅读次数:
181
非常高-1 规则19: 放宽时间约束 规则25: 利用对象缓存 规则29: 不能回滚注定失败 规则32: 正确使用数据库锁 规则35: 避免选择所有列 规则46: 警惕第三方方案 规则50: 保持竞争力 高-2 规则1: 避免过度涉及 规则7: X轴扩展 规则10: 向外扩展 规则11: 用商品化系 ...
分类:
其他好文 时间:
2018-01-01 19:39:31
阅读次数:
214
Hive是基于Hadoop的数据仓库工具,可对存储在HDFS上的文件中的数据集进行数据整理、特殊查询和分析处理,提供了类似于SQL语言的查询语言–HiveQL,可通过HQL语句实现简单的MR统计,Hive将HQL语句转换成MR任务进行执行。 一、概述 1-1 数据仓库概念 数据仓库(Data War ...
分类:
其他好文 时间:
2017-10-25 11:27:48
阅读次数:
174
Pentaho Data Integration (Kettle) 一套基于Java的开源ETL工具集,是商务智能套件Pentaho的一部分。 社区主页:http://community.pentaho.com/projects/data-integration 帮助文档:https://help. ...
分类:
其他好文 时间:
2017-09-05 19:04:13
阅读次数:
196
下载地址:网盘下载 内容简介编辑 内容简介 本书介绍了以数据仓库、数据挖掘和联机分析为核心技术的商务智能的基本概念、基本原理、开发方法、开发工具、应用领域和管理方法等内容。全书共分为10章,包括商务智能基本概念、数据仓库开发模型、数据仓库开发应用过程、联机分析、数据挖掘基本原理和技术、数据挖掘应用工 ...
分类:
其他好文 时间:
2017-09-01 16:59:29
阅读次数:
189
Greenplum 数据库是最先进的分布式开源数据库技术,主要用来处理大规模的数据分析任务,包含数据仓库、商务智能(OLAP)和数据挖掘等。自2015年10月正式开源以来。受到国内外业内人士的广泛关注。本文就社区关心的Greenplum数据库技术架构进行介绍。 一. Greenplum数据库简单介绍 ...
分类:
数据库 时间:
2017-07-22 12:03:25
阅读次数:
258
数据挖掘是一种技术,它将传统的数据分析方法与处理大量数据的复杂算法相结合。下面先列举需要新的数据分析技术的一些应用场景。 (1) 商务。 数据挖掘技术可以用来支持广泛的商务智能应用(BI),如顾客分析,定向营销,商店分布,欺诈检测等。 能帮助零售商回答一些重要的商务问题,如: 谁是最有价值的客户? ...
分类:
其他好文 时间:
2017-07-18 18:44:28
阅读次数:
138
高可靠性。能够尽可能地放置服务器故障、站点故障和人为错误的发生。 高安全信息。可以利用行级安全性、细粒度审计、透明的数据加密和数据的全面会议确保数据安全和遵守法规。 更好的数据管理。轻松管理最大型数据库信息的整个生命周期。 领先一部的商务智能。高性能数据仓库、在线分析处理和数据挖掘。 ...
分类:
数据库 时间:
2017-07-12 12:17:50
阅读次数:
339
ETL分别是“Extract”、“ Transform” 、“Load”三个单词的首字母缩写也就是“抽取”、“转换”、“装载”,但我们日常往往简称其为数据抽取。 ETL是BI/DW(商务智能/数据仓库)的核心和灵魂,按照统一的规则集成并提高数据的价值,是负责完成数据从数据源向目标数据仓库转化的过程, ...
分类:
数据库 时间:
2017-06-29 00:57:59
阅读次数:
320
1简介Pentaho是世界上最流行的开源商务智能软件,以工作流为核心的,强调面向解决方案而非工具组件的,基于java平台的商业智能(BusinessIntelligence,BI)套件BI,之所以说是套件是因为它包括一个webserver平台和几个工具软件:报表,分析,图表,数据集成,数据挖掘等,可以说包..
分类:
其他好文 时间:
2017-06-08 18:05:06
阅读次数:
792