码迷,mamicode.com
首页 >  
搜索关键字:hive scratch 目录权限    ( 6865个结果
Hive命令行
Hive 命令行 Hive 命令行示例 ?从命令行执行指定的sql语句 ?$HIVE_HOME/bin/hive -e 'select a.col from tab1 a' ?以指定的hive环境变量执行指定的sql语句 ?$HIVE_HOME/bin/hive -e 'select a.col from tab1 a' -hiveconf hive.exec.scr...
分类:其他好文   时间:2014-07-24 23:11:14    阅读次数:256
hadoop理解
问: ????今天花一天时间给centos6.3 64bit的系统搭建了hadoop,顺便把hive和mysql也装上了,测试什么的都没问题。 但是,迷茫了,我怎么用它分析网站的日志。他的工作原理迷迷糊糊的, 而且我这个hadoop用的...
分类:其他好文   时间:2014-07-23 21:35:46    阅读次数:332
hive的udf的编写
1.配置环境 1.引入jar包:hive-exec-0.8.0.jar 和 hadoop-core-0.20.2.jar 2.编写udf函数 1.extends UDF 2.重新定义UDF的evaluate函数。 package com.qunar.hiveudf; import java.text.SimpleDateFormat; import java.util.Calen...
分类:其他好文   时间:2014-07-23 20:58:47    阅读次数:217
Hive与Hbase区别
hive是什么? 白话一点再加不严格一点,hive可以认为是map-reduce的一个包装。hive的意义就是把好写的hive的sql转换为复杂难写的map-reduce程序。 于是,hbase是什么? 同样白话一点加不严格一点,hbase可以认为是...
分类:其他好文   时间:2014-07-23 13:57:36    阅读次数:268
夏梦竹谈Hive vs. HBase的区别
对于刚接触大数据的用户来说,要想区分Hive与HBase是有一定难度的。本文将尝试从其各自的定义、特点、限制、应用场景等角度来进行分析,以作抛砖引玉之用。Hive是什么?Apache Hive是一个构建于Hadoop(分布式系统基础架构)顶层的数据仓库,注意这里不是数据库。Hive可以看作是用户编程...
分类:其他好文   时间:2014-07-22 22:45:54    阅读次数:257
hive 使用
参考资料1.QuickStarthttps://cwiki.apache.org/confluence/display/Hive/GettingStarted2.Tutorialhttps://cwiki.apache.org/confluence/display/Hive/Tutorial3.官方...
分类:其他好文   时间:2014-07-22 22:44:14    阅读次数:249
mysql无法启动——cannot allocate the memory for the buffer pool
今天打开开发网站突然不能使用,发现时Mysql数据库down掉了,就去重启: mysql.server restart 一直会报错:“Manager of pid-file quit without updating file”。 然后就去找原因,网上说有以下三个方面的问题: 1、硬盘不够用了,无法写入pid文件 2、进程卡死了,找到mysql进程kill掉,然后重启 3、目录权限...
分类:数据库   时间:2014-07-22 17:53:52    阅读次数:274
hive SQL优化之distribute by和sort by
最近在优化hiveSQL, 下面是一段排序,分组后取每组第一行记录的SQL INSERT OVERWRITE TABLE t_wa_funnel_distinct_temp PARTITION (pt='${SRCTIME}')  SELECT      bussiness_id,      cookie_id,      session_id,      funnel_...
分类:数据库   时间:2014-07-22 17:42:31    阅读次数:344
Hive语法层面优化之七数据倾斜总结
关键字情形后果join其中一个表较小,但key集中分发到某一个或几个reduce上的数据远高于平均值大表与大表关联,但是分桶的判断字段0值或空值过多这些空值都由一个reduce处理,非常慢group byGroup by维度过小,某值的数量过多处理某值的reduce非常耗时count distinc...
分类:其他好文   时间:2014-07-22 08:07:33    阅读次数:180
hive 自我介绍
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据...
分类:其他好文   时间:2014-07-22 00:20:35    阅读次数:252
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!