码迷,mamicode.com
首页 >  
搜索关键字:hive hook    ( 7271个结果
hadoop理解
问: ????今天花一天时间给centos6.3 64bit的系统搭建了hadoop,顺便把hive和mysql也装上了,测试什么的都没问题。 但是,迷茫了,我怎么用它分析网站的日志。他的工作原理迷迷糊糊的, 而且我这个hadoop用的...
分类:其他好文   时间:2014-07-23 21:35:46    阅读次数:332
hive的udf的编写
1.配置环境 1.引入jar包:hive-exec-0.8.0.jar 和 hadoop-core-0.20.2.jar 2.编写udf函数 1.extends UDF 2.重新定义UDF的evaluate函数。 package com.qunar.hiveudf; import java.text.SimpleDateFormat; import java.util.Calen...
分类:其他好文   时间:2014-07-23 20:58:47    阅读次数:217
Hive与Hbase区别
hive是什么? 白话一点再加不严格一点,hive可以认为是map-reduce的一个包装。hive的意义就是把好写的hive的sql转换为复杂难写的map-reduce程序。 于是,hbase是什么? 同样白话一点加不严格一点,hbase可以认为是...
分类:其他好文   时间:2014-07-23 13:57:36    阅读次数:268
夏梦竹谈Hive vs. HBase的区别
对于刚接触大数据的用户来说,要想区分Hive与HBase是有一定难度的。本文将尝试从其各自的定义、特点、限制、应用场景等角度来进行分析,以作抛砖引玉之用。Hive是什么?Apache Hive是一个构建于Hadoop(分布式系统基础架构)顶层的数据仓库,注意这里不是数据库。Hive可以看作是用户编程...
分类:其他好文   时间:2014-07-22 22:45:54    阅读次数:257
hive 使用
参考资料1.QuickStarthttps://cwiki.apache.org/confluence/display/Hive/GettingStarted2.Tutorialhttps://cwiki.apache.org/confluence/display/Hive/Tutorial3.官方...
分类:其他好文   时间:2014-07-22 22:44:14    阅读次数:249
hive SQL优化之distribute by和sort by
最近在优化hiveSQL, 下面是一段排序,分组后取每组第一行记录的SQL INSERT OVERWRITE TABLE t_wa_funnel_distinct_temp PARTITION (pt='${SRCTIME}')  SELECT      bussiness_id,      cookie_id,      session_id,      funnel_...
分类:数据库   时间:2014-07-22 17:42:31    阅读次数:344
sql中的exist in在hive中的用法
Hive不支持where子句中的子查询,SQL常用的exist in子句需要改写。这一改写相对简单。考虑以下SQL查询语句:SELECT a.key, a.value FROM a WHERE a.key in (SELECT b.key FROM B);改写成:SELECT a.key, a.va...
分类:数据库   时间:2014-07-22 08:07:35    阅读次数:1966
Hive语法层面优化之七数据倾斜总结
关键字情形后果join其中一个表较小,但key集中分发到某一个或几个reduce上的数据远高于平均值大表与大表关联,但是分桶的判断字段0值或空值过多这些空值都由一个reduce处理,非常慢group byGroup by维度过小,某值的数量过多处理某值的reduce非常耗时count distinc...
分类:其他好文   时间:2014-07-22 08:07:33    阅读次数:180
Linux系统调用Hook姿势总结
系统调用属于一种软中断机制(内中断陷阱),它有操作系统提供的功能入口(sys_call)以及CPU提供的硬件支持(int 3 trap)共同完成。我们必须要明白,Hook技术是一个相对较宽的话题,因为操作系统从ring3到ring0是分层次的结构,在每一个层次上都可以进行相应的Hook,它们使用的技...
分类:系统相关   时间:2014-07-22 00:26:34    阅读次数:726
hive 自我介绍
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据...
分类:其他好文   时间:2014-07-22 00:20:35    阅读次数:252
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!