一、概念介绍
Hive 没有专门的数据存储格式,也没有为数据建立索引,用户可以非常自由的组织 Hive 中的表,只需要在创建表的时候告诉 Hive 数据中的列分隔符和行分隔符,Hive 就可以解析数据
Hive 中的 Table 和数据库中的 Table 在概念上是类似的,每一个 Table 在 Hive 中都有一个相应的目录存储数据。例如,一个表 ...
分类:
其他好文 时间:
2015-08-02 21:43:34
阅读次数:
191
[Author]: kwu ---
sqoop从关系库导出数据到hive,sqoop支持条件查询关系库中的数到hive数据仓库中,并且字段无须与hive表中的字段一致。...
分类:
其他好文 时间:
2015-07-31 20:27:38
阅读次数:
115
// HiveQLa) 数据定义语言1 数据库表的一个目录或命名空间,如果用户没有指定数据库的话,那么将会使用默认的数据库default-----创建数据库CREATE DATABASE guoyongrong;// 给每个数据库创建了一个目录,数据库的文件目录名是以.db结尾的CREATE DAT...
分类:
其他好文 时间:
2015-07-31 16:09:43
阅读次数:
114
2014-12-18 03:21:03 Starting to launch local task to process map join; maximum memory = 10654842882014-12-18 03:21:08 Processing rows: 200000 Hashtabl...
分类:
其他好文 时间:
2015-07-31 12:34:08
阅读次数:
322
本文来着美团 :http://tech.meituan.com/hive-sql-to-mapreduce.htmlHive是基于Hadoop的一个数据仓库系统,在各大公司都有广泛的应用。美团数据仓库也是基于Hive搭建,每天执行近万次的Hive ETL计算流程,负责每天数百GB的数据存储和分析。H...
分类:
数据库 时间:
2015-07-30 22:59:55
阅读次数:
208
声明:本篇blog并没有配置MySQL,不过会在接下来的文章中实现
一、环境
Ubuntu14.04
hadoop2.6伪分布(安装教程请参考:点击打开链接)
hive-1.2.1(下载链接:点击打开链接)
二、安装
1、将其下载的安装包解压到相应的目录,在此小编的是/usr/local/hadoop/
tar -zxcf apache-hive-1.2.1-bin....
分类:
其他好文 时间:
2015-07-30 17:03:25
阅读次数:
307
遇到的坑:1、Hive的任务会从临时目录移动数据到数据仓库目录,默认hive使用/tmp作为临时目录,用户通常使用/user/hive/warehouse/作为数据仓库目录。在FederatedHDFS情况下,/tmp和/user视为两个不同的ViewFSmounttable,所以hive任务在这两个目录之间移动数据。FederatedHDFS..
分类:
其他好文 时间:
2015-07-30 15:11:51
阅读次数:
1079
系统:Ubuntu 64 bit系统step1:创建hive文件目录,并在hive目录下创建tmp,warehouse 和 log目录:Step2:解压hive安装包:Step3:创建配置文件:Step4:修改hive-site.xml:Step5:修改hive-log4j.properties:S...
分类:
其他好文 时间:
2015-07-30 00:24:59
阅读次数:
158
对于mysql / hive 再进行统计的时候如果需要行变成列,可以使用函数
CASE 字段a WHEN 值b THEN c [WHEN d THEN e]* [ELSE f] END
当字段a=值b时,返回c(如果是字段的话则代表该字段的值,也可以是一个固定值 加单引号就可以);当a=d时,返回e,否则返回f。
如:
数据表结构:(举例说明,id有重复的)
...
分类:
数据库 时间:
2015-07-29 21:24:49
阅读次数:
199
Spark SQL是处理结构化数据的Spark模块。它提供了DataFrames这种编程抽象,同时也可以作为分布式SQL查询引擎使用。DataFramesDataFrame是一个带有列名的分布式数据集合。等同于一张关系型数据库中的表或者R/Python中的data frame,不过在底层做了很多优化;我们可以使用结构化数据文件、Hive tables,外部数据库或者RDDS来构造DataFrames...
分类:
数据库 时间:
2015-07-29 17:22:28
阅读次数:
196