搜索关键字：hive 认证类，搜索到5967个结果！码迷,mamicode.com！

(1)、hive框架搭建和架构简介

一、简介Hive是基于hadoop的一个数据仓库工具，有助于查询和管理分布式存储系统中的数据集，非常适合数据仓库的统计分析Hive 不适合用于连机事物处理、也不提供实时查询，比较适合在大量不可变数据的批处理作业。二、下载与安装1、下载hive压缩包，并复制到centos系统的/opt/module目...

分类：其他好文时间：2015-06-29 22:04:56 阅读次数：193

Understanding Cubert Concepts 之 BLOCK(一)

Understanding Cubert Concepts：Cubert Concepts对于Cubert，我们要理解其核心的一些概念，比如BLOCK。这些概念也是区别于传统的关系型范式（Pig，Hive）等数据处理流程并使得Cubert在大规模数据下JOIN和Aggregation中取胜的关键因素。（自己测下来，CUBE的计算效率比Hive高好多倍。）BLOCKCubert定义了一个BLOCK的概...

分类：其他好文时间：2015-06-29 20:24:58 阅读次数：116

hive grouping sets 和 cube 用法

grouping sets 和cube基本知识。基础知识可参考 http://blog.csdn.net/mashroomxl/article/details/22578471grouping sets 适用于多维度统计,可以代替之前lateral view explode 方式cube 相当于grouping sets 所有条件组合。平时跑临时需求看数据，也可以用cube。比如看某款游戏andro...

分类：其他好文时间：2015-06-29 20:22:19 阅读次数：966

talend hive数据导入到mysql中

thiveInput->tmap->tMysqloutput thiveInput: tmap: tmysqlOutput:注意编码问题：noDatetimeStringSync=true&useUnicode=true&characterEncoding=UTF-8

分类：数据库时间：2015-06-29 19:28:32 阅读次数：800

Hive参数

1. Map相关参数 set?mapred.max.split.size?=?256000000?;?//最大分割 set?mapred.min.split.size=1?;?//最小分割 set?hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat;?/...

分类：其他好文时间：2015-06-29 15:04:36 阅读次数：200

使用Talend Open Studio将数据从oracle导入到hive中

先使用Tos建立模型，将Oracle中的数据导入到本地： build job后，形成独立可以运行的程序：将生成的zip文件，上传到hadoop集群上，有hive环境的机器上： [hive@h1 work]$ ls file.zip jobInfo.properties join lib [hive...

分类：数据库时间：2015-06-29 14:45:40 阅读次数：260

[转]Hive：简单查询不启用Mapreduce job而启用Fetch task

转自：http://www.iteblog.com/archives/831 如果你想查询某个表的某一列，Hive默认是会启用MapReduce Job来完成这个任务，如下： hive> SELECT id, money FROM m limit 10; Total MapReduce jobs =...

分类：其他好文时间：2015-06-28 14:05:28 阅读次数：168

Sqoop处理Clob与Blob字段

[Author]: kwu --- Sqoop处理Clob与Blob字段，在Oracle中Clob为大文本，Blob存储二进制文件。遇到这类字段导入hive或者hdfs需要特殊处理。...

分类：其他好文时间：2015-06-28 09:57:54 阅读次数：145

Hive中将查询结果导出到指定分隔符的文件中

在Hive0.11.0版本中新引进了一个新的特性，当用户将Hive查询结果输出到文件中时，用户可以指定列的分割符，而在之前的版本是不能指定列之间的分隔符。在Hive0.11.0之前版本如下使用，无法指定分隔符，默认为\x01： hive (hive)> insertoverwrite local directory '/home/hadoop/export_hive' select * fr...

分类：其他好文时间：2015-06-27 19:53:56 阅读次数：105

Hive索引

1、 Hive索引概述 Hive的索引目的是提高Hive表指定列的查询速度。没有索引时，类似'WHERE tab1.col1 = 10' 的查询，Hive会加载整张表或分区，然后处理所有的rows，但是如果在字段col1上面存在索引时，那么只会加载和处理文件的一部分。与其他传统数据库一样，增加索引在提升查询速度时，会消耗额外资源去创建索引和需要更多的磁盘空间存储索引。 H...

分类：其他好文时间：2015-06-27 18:20:34 阅读次数：158

共5967条上一页 1 ... 499 500 501 502 503 ... 597 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)