码迷,mamicode.com
首页 >  
搜索关键字:数据仓库    ( 1540个结果
InfoBright的源码安装及使用
简介:Infobright是基于专利技术的列式数据库,一个基于MySQL开发的开源数据仓库(DataWarehouse)软件,可作为MySQL的一个存储引擎来使用,SELECT查询与普通MySQL无区别。一、几大优点:1、高压缩比率,平均压缩比可达10:1。(经测试,我们的1500万条697M日志数据压缩比例为6..
分类:其他好文   时间:2015-01-16 19:25:42    阅读次数:261
12 索引
广义上区分索引分为3部分: B-树索引, 位图索引, 索引组织表位图索引适用于不经常进行更新, 插入和删除的列. 例如数据仓库中的人口统计信息的性别.一般, 选择相对来说较少的数据时, 适用索引时比较正确的. 典型的基于索引的访问路径通常包含以下3步:1) 遍历索引树并在将 SQL 语句中的谓语应用...
分类:其他好文   时间:2015-01-15 09:16:11    阅读次数:170
Hadoop2.3、 Hbase0.98、 Hive0.13架构中Hive的安装部署配置以及数据测试
简介:Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。 1, 适用场景Hive 构建在基于静态批处理的Hadoop 之上,Hadoo...
分类:其他好文   时间:2015-01-13 15:56:05    阅读次数:256
kettle中源和目标表结构不一致的情况处理
创建数据仓库的过程中,往往会遇到这样的问题,例如:源表由于业务原因新增了字段,而ETL程序中是按照之前的源表结构进行抽取的,那么如果不重新构建ETL程序,新的指标就不会流入DW,问题如下图所示创建了一个简单的输入输出如下图所示,源表中有一个column3字段没有被匹配到下面我们可以打开sql编辑器,...
分类:其他好文   时间:2015-01-13 10:19:26    阅读次数:372
于位图索引相关的执行计划
位图索引是oracle数据库里除B树索引之外的另外一种索引的类型,它主要用于数据仓库或者DSS系统。在数据仓库或DSS系统中,针对某些类型的sql,用位图索引比用B树索引要快很多,这主要是位图索引实现了快捷的按位运算的缘故。位图索引的物理存储结构和普通B树索引的物理存储结构..
分类:其他好文   时间:2015-01-12 19:27:05    阅读次数:189
数据仓库建模方法初步
银行业:IBM有BDWM(Banking Data Warehouse Model);Teradata有FS-LDM(Financial Services Logical Data Model)。   电信业:IBM有TDWM(Telecom Data Warehouse Model);Ter...
分类:其他好文   时间:2015-01-12 11:29:06    阅读次数:386
Hive[1] 初识 及 安装
本文前提是Hadoop & Java & mysql 数据库,已经安装配置好,并且 环境变量均已经配置到位一、Hive 基本介绍 Hive是Hadoop家族中一款数据仓库产品,Hive最大的特点就是提供了类SQL的语法,封装了底层的MapReduce过程,让有SQL基础的业务人员,也可以直接利用H....
分类:其他好文   时间:2015-01-09 14:03:57    阅读次数:151
数据仓库与数据挖掘的一些基本概念
下面内容摘自互联网并作了整理。名词:BI(Business Intelligence):商业智能,DW(Data Warehouse):数据仓库,详见正文Q1部分。OLTP(On-Line Transaction Processing):联机事务处理也称为面向交易的处理系统,其基本特征是顾客的原始数...
分类:其他好文   时间:2015-01-09 12:32:54    阅读次数:172
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!