码迷,mamicode.com
首页 >  
搜索关键字:hive    ( 5904个结果
Hive-On-Tez性能测试
Table of Contents Hive-On-Tez测试 MRR计算模型测试MPJ计算模型测试 Hive-On-Tez测试 在MRR和MPJ计算模型的处理上,TEZ能够提升的性能较为明显,具体测试如下: MRR计算模型测试 测试表格 1.users(id,name,password): 数据总量1千万条...
分类:其他好文   时间:2015-07-21 06:49:46    阅读次数:393
MySQL字符串连接
mysql> select concat('Hadoop:','Hive:','Spark#','HBase;',TBL_TYPE,'{}',SD_ID) from TBLS;| Hadoop:Hive:Spark#HBase;MANAGED_TABLE{}6 || Hadoop:Hive:Spar...
分类:数据库   时间:2015-07-21 01:26:52    阅读次数:213
Hive桶列BucketedTables
The CLUSTERED BY and SORTED BY creation commands do not affect how data is inserted into a table – only how it is read. This means that users must be ...
分类:其他好文   时间:2015-07-21 01:06:02    阅读次数:461
[转]Mahout推荐算法API详解
Mahout推荐算法API详解Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oo...
分类:编程语言   时间:2015-07-20 19:20:32    阅读次数:168
快速查询hive数据仓库表中的总条数
Author: kwu --- 快速查询hive数据仓库中的条数,在查询hive表的条数,通常使用count(*),但是数据量大的时候,mr跑count(*)往往需要几分钟的时间。...
分类:其他好文   时间:2015-07-20 13:07:16    阅读次数:440
【解决】hive动态增加partitions不能超过100的问题
Author: kwu --- 【解决】hive动态增加partitions不能超过100的问题,全量动态生成partitions超过100会出现如下异常:...
分类:其他好文   时间:2015-07-20 12:59:24    阅读次数:144
Hive高级查询(group by、 order by、 join等)
查询操作group by、 order by、 join 、 distribute by、 sort by、 clusrer by、 union all底层的实现 mapreduce常见的聚合操作count计数count(*) 所有值不全为NULL时,加1操作 count(1) 不管有没有值,只要有这条记录,值就加1 count(col) col列里面的值为null,值不会加1,这个...
分类:其他好文   时间:2015-07-19 11:51:52    阅读次数:193
Hive的表属性操作
修改表名alter table table_name rename to new_table_name增加列alter table tablename add columns(c1 string comment 'xxxx', c2 long comment 'yyyy')修改列名alter table tablename change column c_Old c_New int comment...
分类:其他好文   时间:2015-07-18 18:36:19    阅读次数:257
Hive官方手册翻译(Getting Started)(转)
原文:http://slaytanic.blog.51cto.com/2057708/939950翻译Hive官方文档系列,文中括号中包含 注: 字样的,为我自行标注的,水平有限,翻译不是完美无缺的。如有疑问,请参照Hive官方文档对照查看。内容列表 Cloudera制作的Hive介绍视频 安装与配...
分类:其他好文   时间:2015-07-18 15:22:55    阅读次数:241
Hive动态分区
动态分区指不需要为不同的分区添加不同的插入语句,分区不确定,需要从数据中获取。相关参数设置set hive.exec.dynamic.partition=true; //使用动态分区 (可通过这个语句查看:set hive.exec.dynamic.partition;) set hive.exec.dynamic.partition.mode=nonstrict;//无限制模式 如果模式是str...
分类:其他好文   时间:2015-07-18 12:35:05    阅读次数:145
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!