码迷,mamicode.com
首页 >  
搜索关键字:数据仓库    ( 1540个结果
hive基本操作
Hive是一个基于hadoop的数据仓库工具。Hive的查询语言是hive ql。一种类似sql的语言。 Hive支持的数据类型有 1整形: Tinyint  1字节整型 Smallint  2字节整型 Bigint   8字节整型   2.布尔型 Boolean   3浮点型  Float Double   4字符串类型 String   5.符合类型 ...
分类:其他好文   时间:2014-07-22 23:03:34    阅读次数:393
Hive常用命令
创建表: hive> CREATE TABLE pokes (foo INT, bar STRING);          Creates a table called pokes with two columns, the first being an integer and the other a string 创建一个新表,结构与其他一样 hive> create table n...
分类:其他好文   时间:2014-05-15 07:07:58    阅读次数:303
hive-0.10.0-cdh4.3.0安装
1.我使用的Hadoop2.0-cdh4.3.0,对应hive配套版本hive-0.10.0-cdh4.3.0。    2.修改hive/conf下hive-site.xml文件,无则创建hive-site.xml,在底部添加如下内容:  [html] view plaincopy xml version="1.0" encoding="UTF-8"...
分类:其他好文   时间:2014-05-15 04:05:27    阅读次数:341
Hive sql 语法解读
一、 创建表      在官方的wiki里,example是这样的: Sql代码   CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name    [(col_name data_type [COMMENT col_comment], ...)]    [COMMENT table_comment]    [PARTITION...
分类:数据库   时间:2014-05-14 14:50:27    阅读次数:463
表分区及索引分区
分区概述 为了简化数据库大表的管理,例如在数据仓库中一般都是TB级的数量级.ORACLE8以后推出了分区选项.分区将表分离在若于不同的表空间上,用分而治之的方法来支撑元限膨胀的大表,组大表在物理一级的可管理性.将大表分割成较小的分区可以改善表的维护、备份、恢复、事务及查询性能。分区的优点:1、增强可...
分类:其他好文   时间:2014-05-09 19:12:24    阅读次数:297
SSIS从理论到实战,再到应用
原文:SSIS从理论到实战,再到应用 一,是什么(What?) 1.SSIS是Microsoft SQL Server Integration Services的简称,是生成高性能数据集成解决方案(包括数据仓库的提取、转换和加载 (ETL) 包)的平台. 以上的这段文字来自于百度,脱离这个概念,我一...
分类:其他好文   时间:2014-05-09 07:49:45    阅读次数:308
DataNucleus之JDO操作例子
JDO(Java Data Object )是Java对象持久化的新的规范,也是一个用于存取某种数据仓库中的对象的标准化API。注意JDO是一种规范,而不是一个产品。而DataNucleus正是实现JDO规范的产品之一,JDO实现产品还有FOStore、JPOX等。当然DataNucleus不仅实现了JDO规范,还实现了JPA(java另一持久化规范),也就是说有了DataNucleus,你既可以...
分类:其他好文   时间:2014-05-09 01:51:48    阅读次数:346
数据挖掘-1
数据仓库技术包括数据清理、数据集成和联机分析处理(OLAP)OLAP是一种分析技术,具有汇总,合并和聚集功能,以及从不同的角度观察信息的能力。但,对于深层次的分析,如数据分类,聚类和数据随时间变化的特征,仍然需要其他 分析工具。尽管市场上已有许多“数据挖掘系统”,但是并非所有的 都能进行真正的数据挖...
分类:其他好文   时间:2014-05-08 20:18:07    阅读次数:323
Hive中join, outer join, semi join区别
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 最常用的就是多表关联查询,主要讲解下join、outer join和semi join的具体使用。 join是最简单的关联操作,两边关联只取交集。 outer join分为left outer join、rig...
分类:其他好文   时间:2014-05-06 15:01:38    阅读次数:269
前三章
1、商业智能 商业智能的实现有三个层次:数据报表、多维数据分析和数据挖掘。 商业智能项目的实施步骤: 需求分析 数据仓库建模 数据抽取 建立商业智能分析报表 用户培训和数据模拟测试 系统改进和完善商业智能系统应具有的主要功能 数据仓库 数据ETL 数据统计输出(报表) 分析功能 商业智能的软件工具集...
分类:其他好文   时间:2014-05-03 22:16:23    阅读次数:284
1540条   上一页 1 ... 152 153 154
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!