1、安装1.1、下载apache-hive-0.13.1-bin.tar.gz1.2、解压至安装目录tar -zxv -f apache-hive-0.13.1-bin.tar.gz -C ../soft/#此处为了方便,进行了文件路径重命名mv apache-hive-0.13.1-bin/ h....
分类:
其他好文 时间:
2014-11-09 19:18:43
阅读次数:
201
创建带分区的外部表创建外部表的优点是数据能够随时从hdfs中挂载进表中使用分区的优点是能够缩短查询范围以下的样例展示了怎样创建外部表CREATE EXTERNAL TABLE my_daily_report( last_update string, col_a string, co...
分类:
其他好文 时间:
2014-11-08 19:37:38
阅读次数:
161
生产背景:
在从mysql导入到hive中,遇到如下问题:
1) 源mysql和集群机器不在同一个网段中,导致执行导入命令,网络连接失败。
2) 某些字符导入到hive中,出现报错终止。
2.1 sqoop使用的JDBC-connector 版本太低(更换版本)。
从hive导出到mysql中,遇到如下问题:
1)某些字符插入mysql,出现报错终止。
1.1...
分类:
其他好文 时间:
2014-11-07 22:09:13
阅读次数:
234
hive一次使用命令:
$ hive -e "select * from mytable limit 1;"
OK
name1 1
name2 2
Time taken: 3.935 seconds
$ hive -e "select * from mytable limit 1;" > /tmp/myfile
$ cat /tmp/myfile
OK
name1 1
name...
分类:
其他好文 时间:
2014-11-07 20:55:48
阅读次数:
279
Hive中有种假NULL,它看起来和NULL一摸一样,但是实际却不是NULL。例如如下这个查询:hive> desc ljn004;OKa stringTime taken: 0.237 secondshive> select a from ljn004;OKNULLTime taken: 46.2...
分类:
其他好文 时间:
2014-11-07 18:59:42
阅读次数:
134
1. 为什么要使用表变量表变量是从2000开始引入的,微软认为与本地临时表相比,表变量具有如下优点: a.与其他变量的定义一样,表变量具有良好的定义范围,并会被自动清除; b.在存储过程中使用表变量会减少存储过程重新编译的发生; c.表变量需要更少的锁请求和日志资源; d.可以在表变量上使用UDF,...
分类:
数据库 时间:
2014-11-07 16:40:08
阅读次数:
230
多样性数据源在报表开发中越来越常见,润乾集算报表对多样性数据源的有效支持使得这类报表开发变得非常简单,目前集算报表支持的数据源类型除传统的关系型数据库外,还支持:TXT文本、Excel、JSON、HTTP、Hadoop、mongodb等。对于Hadoop,集算报表既可以直接访问Hive,也可以读..
分类:
其他好文 时间:
2014-11-07 15:08:50
阅读次数:
131
1.mysql利用mysqludf的一个mysql插件可以实现调用外部程序和系统命令下载lib_mysqludf_sys程序:https://github.com/mysqludf/lib_mysqludf_sys2.安装说明:2.1查询mysql插件路径:在mysql里查询mysql插件目录的路径...
分类:
数据库 时间:
2014-11-07 12:39:27
阅读次数:
229
hadoop环境描述:master节点:node1slave节点:node2,node3,node4远端服务器(python连接hive):node29需求:通过hive查询到cdn日志中指定时间段内url访问次数最多的前10个urlps:用pig查询可以查询文章:http://shineforever.blog.51cto.com/1429204/1571124说明:python操..
分类:
编程语言 时间:
2014-11-06 17:50:01
阅读次数:
424
1、非交互模式执行HQL语句
$HIVE_HOME/bin/hive -e 'select * from movie limit 10'
会现实mapreduce的进度,但不会进入hive的交互模式,最终现实查询结果...
分类:
其他好文 时间:
2014-11-06 17:40:53
阅读次数:
122