hive在生产环境中由于用户数量和身份的不同,难免会对用户按组进行划分,根据不同组的优先级划分hadoop资源,hadoop fairscheduler支持按用户组划分资源池,每个group对应一个组pool,然后根据pool优先级划分mapreduce资源,在map-site.xml中添加以下配置即可实现按组划分:
mapred.jobtracker.taskScheduler...
分类:
其他好文 时间:
2014-09-16 17:29:10
阅读次数:
286
Hadoop系列之Hive(数据仓库)安装配置1.在NameNode安装cd/root/softtarzxvfapache-hive-0.13.1-bin.tar.gzmvapache-hive-0.13.1-bin/usr/local/hadoop/hive2.配置环境变量(每个节点都需要增加)打开/etc/profile#添加以下内容:exportHIVE_HOME=/usr/local/hadoop/hiveexportPATH..
分类:
其他好文 时间:
2014-09-16 16:07:12
阅读次数:
256
[hadoop@master hive_dat]$ hive? Logging initialized using configuration in file:/app/hive/conf/hive-log4j.properties Hive history file=/tmp/hadoop/hive_job_log_hadoop_201212181216_2004188466.txt h...
分类:
其他好文 时间:
2014-09-15 17:58:19
阅读次数:
402
目前 Spark SQL 不支持自定义UDF ,底层 SQL 引擎用的 catalyst 。
在SqlContext 中 有一个 Analyzer
@transient
protected[sql]
lazy
val
analyzer:
Analyzer =
new
Analyzer(catalog, Em...
分类:
数据库 时间:
2014-09-13 22:50:26
阅读次数:
339
使用java开发一个helloworld级别UDF,打包成udf.jar,存放在/home/hadoop/lib下,代码如下:package com.luogankun.udf;import org.apache.hadoop.hive.ql.exec.UDF;public class HelloU...
分类:
数据库 时间:
2014-09-13 19:57:35
阅读次数:
401
Hadoop是云计算的事实标准软件框架,是云计算理念、机制和商业化的具体实现,是整个云计算技术学习中公认的核心和最具有价值内容。如何从企业级开发实战的角度开始,在实际企业级动手操作中深入浅出并循序渐进的掌握Hadoop是本课程的核心。云计算学习者的心声:如何从企业级开发的角度,不断动手实际操作,循序...
分类:
移动开发 时间:
2014-09-13 18:34:35
阅读次数:
300