Hive 运行架构
由Facebook开源,最初用于解决海量结构化的日志数据统计问题:ETL工具;
构建于Hadoop的HDFS和MapReduce智商,用于管理和查询结构化/非结构化数据的数据仓库;
设计目的是让SQL技能良好,但Java技能较弱的分析师可以查询海量数据:
使用HQL作为查询接口;
使用HDFS作为存储底层;...
分类:
其他好文 时间:
2014-08-12 19:05:44
阅读次数:
314
Phoenix(sql on hbase)简介
介绍:
Phoenix is a SQL skin over HBase delivered as a client-embedded JDBC driver targeting low latency queries over HBase data. Phoenix takes your SQL query, compile...
分类:
数据库 时间:
2014-08-11 21:28:33
阅读次数:
589
配置环境.hadoop2.4hbase0.98.3hive0.13.1(源用的mysql)配置。分2种情况(1.hbase与hive在一台机器上,2.hbase与hive不在同一台机器上)(1)hbase与hive在一台机器上比较简单,只需要在环境变量里把hbase,hive的home配置好即可。当然也可以按照不在一台进行配置。#confighad..
分类:
其他好文 时间:
2014-08-11 18:14:03
阅读次数:
177
以ANALYZE为例描述ANALYZE在Hive中的使用方法详见:https://cwiki.apache.org/confluence/display/Hive/StatsDev#StatsDev-ExistingTablesANALYZE在Hive中使用简单介绍一张表有4个分区:Partitio...
分类:
数据库 时间:
2014-08-11 14:23:32
阅读次数:
428
gzip: stdin: unexpected end of filetar: Unexpected EOF in architar: Unexpected EOF in archivevetar: Error is not recoverable: exiting now从网上下载了一个tar的文...
分类:
其他好文 时间:
2014-08-11 11:35:22
阅读次数:
320
本文介绍了Facebook公司数据分析系统中的RCFile存储结构,该结构集行存储和列存储的优点于一身,在 MapReduce环境下的大规模数据分析中扮演重要角色。Facebook曾在2010 ICDE(IEEE International Conference on Data Engineerin...
分类:
其他好文 时间:
2014-08-10 10:18:00
阅读次数:
315
通过Apache+mod_JK+Tomcat集群实现负载均衡1、概念通过Apache+mod_JK+Tomcat集群搭建起来的环境主要用来实现负载均衡和高可用性。使用apache作为反向代理服务器实现负载均衡,使用mod_jk可以实现节点的故障恢复功能,达到高可用性。使用tomcat集群功能实现sessionID共享复制。..
分类:
其他好文 时间:
2014-08-10 04:00:50
阅读次数:
366
Hive是一种强大的数据仓库查询语言,类似SQL,本文将介绍如何搭建Hive的开发测试环境。...
分类:
数据库 时间:
2014-08-10 01:50:39
阅读次数:
449
Hive架构1)用户接口: CLI(hive shell):命令行工具;启动方式:hive 或者 hive --service cli ThriftServer:通过Thrift对外提供服务,默认端口是10000;启动方式:hive --service hiveserver WEBUI(浏览器...
分类:
其他好文 时间:
2014-08-10 01:27:29
阅读次数:
467
Hive是什么1)Hive 是建立在Hadoop (HDFS/MR)上的用于管理和查询结果化/非结构化的数据仓库;2)一种可以存储、查询和分析存储在Hadoop 中的大规模数据的机制;3)Hive 定义了简单的类SQL 查询语言,称为HQL,它允许熟悉SQL 的用户查询数据;4)允许用Java开发自...
分类:
其他好文 时间:
2014-08-09 23:10:49
阅读次数:
288