可以在$HOME中加一个.hiverc文件,并在里面配置hive启动的一些参数。Fro example:http://hadooped.blogspot.com/2013/08/hive-hiverc-file.html意外发现在$HOME目录下有一个.hivehistory文件,里面记录了在hiv...
分类:
其他好文 时间:
2015-01-31 10:39:05
阅读次数:
193
准备数据 浙江,杭州,300 浙江,宁波,150 浙江,温州,200 浙江,嘉兴,100 江苏,南京,270 江苏,苏州,299 江苏,某市,200 江苏,某某市,100 创建表 CREATE table pcp (province string,city string,people int) RO...
分类:
其他好文 时间:
2015-01-29 17:34:36
阅读次数:
333
一、Impala简介Cloudera Impala对你存储在Apache Hadoop在HDFS,HBase的数据提供直接查询互动的SQL。除了像Hive使用相同的统一存储平台,Impala也使用相同的元数据,SQL语法(Hive SQL),ODBC驱动程序和用户界面(Hue Beeswax)。Im...
分类:
其他好文 时间:
2015-01-28 22:34:05
阅读次数:
336
写hive 用in
如分时段,分类型,分平台统计点击量
select substr(createtime,12,2) hour,logtype,os_id,count(*)
from wizad_mdm_raw_hdfs raw
where ad_id in ('19829','19830','19831','26657d5ff9020d2abefe558796b99584') and...
分类:
其他好文 时间:
2015-01-28 17:58:36
阅读次数:
235
1、产品概述
Hive作为大数据时代的数据仓库工具,使我们分析处理海量结构化数据成为可能。越来越多的公司和机构都将Hive作为应对大数据分析的强有力工具。但使用中,比较明显的问题便是当存在多个应用同时使用同一Hive的时候,如何有效控制彼此的数据安全,如何更方便使用Hive UDF的扩展机制。
当然,作为大数据平台开发过程中也同样遇到这些问题。整个公司不同业务方的数据汇聚到数据平台后,对数据的...
分类:
其他好文 时间:
2015-01-27 11:15:53
阅读次数:
192
根据mapjoin的计算原理,MAPJION会把小表全部读入内存中,在map阶段直接拿另外一个表的数据和内存中表数据做匹配。这种情况下即使笛卡尔积也不会对任务运行速度造成太大的效率影响。mapjoin的应用场景如下:1.有一个极小的表= a.min_dt) f left outer join h.....
分类:
其他好文 时间:
2015-01-26 18:50:02
阅读次数:
254
Status of Hive Authorization before Hive 0.13SQL Standards Based HiveAuthorization (New in Hive 0.13)Restrictions on HiveCommands and StatementsPrivil...
分类:
数据库 时间:
2015-01-26 13:37:11
阅读次数:
362
本人对hadoop生态系统的环境搭建、配置相关再熟悉不过了,周末刚测试过oozie相关的今早使用hive,报错:Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/hive/conf/HiveCon...
分类:
其他好文 时间:
2015-01-26 13:35:25
阅读次数:
198
Union Syntaxselect_statement UNION ALL select_statement UNION ALL select_statement ...UNION is used to combine the result from multiple SELECT stateme...
分类:
其他好文 时间:
2015-01-26 13:28:53
阅读次数:
142