码迷,mamicode.com
首页 >  
搜索关键字:hive driver类    ( 5946个结果
hive0.13.1安装-mysql server作为hive的metastore
hive0.13.1在hadoop2.4.1伪分布式部署上安装过程环境:redhat enterprice 6.5 +hadoop2.4.1+hive0.13.1+mysql单节点伪分布式部署相关网址:hive官网安装指导:https://cwiki.apache.org/confluence/di...
分类:数据库   时间:2014-08-09 21:21:09    阅读次数:357
Impala与Hive的比較
1. Impala架构 Impala是Cloudera在受到Google的Dremel启示下开发的实时交互SQL大数据查询工具,Impala没有再使用缓慢的Hive+MapReduce批处理,而是通过使用与商用并行关系数据库中类似的分布式查询引擎(由Query Planner、Query Coord...
分类:其他好文   时间:2014-08-09 15:39:48    阅读次数:451
hive运行query语句时提示错误:org.apache.hadoop.ipc.RemoteException: java.io.IOException: java.io.IOException:
hive> select product_id, track_time from trackinfo limit 5; Total MapReduce jobs = 1Launching Job 1 out of 1Number of reduce tasks ...
分类:编程语言   时间:2014-08-08 17:52:46    阅读次数:313
hive 常用UDF
Hive UDF整理(可以直接在mysql上测试,hive中没有伪表,需要手动创建,反应慢)字符串函数字符串长度函数:length语法: length(string A)返回值: int说明:返回字符串A的长度举例:hive> select length(‘abcedfg’) from dual;7...
分类:其他好文   时间:2014-08-08 12:24:45    阅读次数:466
Hive Python Streaming的原理及写法
在Hive中,需要实现Hive中的函数无法实现的功能时,就可以用Streaming来实现。其原理可以理解成:用HQL语句之外的语言,如Python、Shell来实现这些功能,同时配合HQL语句,以实现特殊的功能。 比如,我有一张不同网站访问的日志表,其中有两个列是url和ref,分别代表当前访问的网址和来源地址,我想要查看用户的来源,即看用户都是从那些网站跳到这些网站上去的,这里有些网站可能域名...
分类:编程语言   时间:2014-08-07 23:21:44    阅读次数:448
sqoop操作之ETL小案例
Extraction-Transformation-Loading的缩写,中文名称为数据提取、转换和加载。将数据从ORACLE中抽取数据,经过hive进行分析转换,最后存放到ORACLE中去。本案例是纯demo级别,练手使用一、需求将emp和dept表的数据分析最后存放到result表。emp和de...
分类:其他好文   时间:2014-08-06 22:14:52    阅读次数:371
sqoop操作之HIVE导出到ORACLE
示例数据准备hive中创建dept表create table dept(deptno int,dname string,loc string)row format delimited fields terminated by '\t' lines terminated by '\n' stored ...
分类:数据库   时间:2014-08-06 21:58:32    阅读次数:492
sqoop操作之ORACLE导入到HIVE
导入表的所有字段sqoop import --connect jdbc:oracle:thin:@192.168.1.107:1521:ORCL \--username SCOTT --password tiger \--table EMP \--hive-import --create-hive....
分类:数据库   时间:2014-08-06 21:47:42    阅读次数:330
hive正则表达式
hive中的正则可以用,但是有所区别,区别在于原来的‘\’ 转义,这里变成了双斜杠了‘\\’...
分类:其他好文   时间:2014-08-05 19:20:30    阅读次数:277
hive 多个key需要 group by
请问下,如果有多个统计,要统计的数据都一样,每个统计只是group by 的key不一样,怎样做,才能让这些统计最快完成? 恩,比如有10个统计,每个统计都是读取的同一份数据,但是统计的维度不一样,就是groupby的key不一样你们都是怎么处理的?语句类似这个:: from( selectk1,k...
分类:其他好文   时间:2014-08-05 15:22:49    阅读次数:352
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!