码迷,mamicode.com
首页 >  
搜索关键字:hive 认证类    ( 5967个结果
第53课:Hive 第一课:Hive的价值、Hive的架构设计简介
一、Hive的历史价值1,大数据因Hadoop而知名,而Hadoop又因Hive而实用。Hive是Hadoop上的KillerApplication,Hive是Hadoop上的数据仓库,同时Hive兼具有数据仓库中的存储和查询引擎。而SparkSQL是一个更加出色和高级的查询引擎,并不提供存储功能。所以SparkSQL无法取代Hive,..
分类:其他好文   时间:2016-03-14 16:48:05    阅读次数:296
【解决】hive动态添加partitions不能超过100的问题
Author: kwu  【解决】hive动态添加partitions不能超过100的问题,全量动态生成partitions超过100会出现例如以下异常:
分类:其他好文   时间:2016-03-14 08:22:03    阅读次数:116
关键字
1. hadoop、hbase、hive、spark、strom、mapreduce、mahout、zookeeper. 2.redis、dubbo、mongodb、memcache、kafka、sqoop. 3. autofac、unity、xunit. 4.serfj restlet httpc
分类:其他好文   时间:2016-03-09 23:48:33    阅读次数:171
在apache hadoop2.6 上部署hive 并将hive数据源存储于Mysql
集成hive 的前提是apache hadoop 集群能够正常启动。 hadoop 版本 apach2.6.0 hive 版本:1.2.1 1、安装mysql 并赋予权限: 1.1:创建hive 用户和密码: Create user ‘hive’ identified by ‘123456’ 1.2
分类:数据库   时间:2016-03-07 16:39:52    阅读次数:261
我为什么学习hive窗口分析函数
1. 窗口函数 LEAD(column_name, n, default_value),用于统计窗口内往下第n行的值, LAG(column_name, n, default_value),用于统计窗口内往上第n行的值。 FIRST_VALUE(column_name),分组窗口排序后,截止到当前行
分类:其他好文   时间:2016-03-01 18:42:18    阅读次数:180
大数据之三:几个名词
Hadoop=HDFS+Hive+Pig+... HDFS: 存储系统MapReduce:计算系统Hive:提供给SQL开发人员(通过HiveQL)的MapReduce,基于Hadoop的数据仓库框架Pig:基于Hadoop的语言开发的HBase:NoSQL数据库Flume:一个收集处理Hadoop
分类:其他好文   时间:2016-02-29 19:52:51    阅读次数:132
Spark 大数据 视频教程 安装 SQL Streaming Scala Hive Hadoop
Hadoop、Redis、Memcached、MongoDB、Spark、Storm、云计算、R语言、机器学习、Nginx、Linux、MySQL、Java EE、.NET、PHP Spark 大数据 视频教程 安装 SQL Streaming Scala Hive Hadoop
分类:数据库   时间:2016-02-28 18:34:07    阅读次数:203
Hive安装
Hadoop安装 Hadoop安装 Hive元数据三种存储方式 Derby:hive默认的存储模式,不可以并发调用hive 本地MySQL 远程MySQL 采用第二种方式,安装MySQL,启动并创建Hive用户,创建Hive元数据库 insert into mysql.user(Host,User,...
分类:其他好文   时间:2016-02-28 12:26:09    阅读次数:173
Sqoop处理Clob与Blob字段
[Author]: kwu Sqoop处理Clob与Blob字段,在Oracle中Clob为大文本。Blob存储二进制文件。遇到这类字段导入hive或者hdfs须要特殊处理。 1、oracle中的測试表 CREATE TABLE T_LOB ( A INTEGER, B CLOB, C BLOB )
分类:其他好文   时间:2016-02-28 09:53:02    阅读次数:439
Hive 12、Hive优化
要点:优化时,把hive sql当做map reduce程序来读,会有意想不到的惊喜。 理解hadoop的核心能力,是hive优化的根本。 长期观察hadoop处理数据的过程,有几个显著的特征: 1.不怕数据多,就怕数据倾斜。 2.对jobs数比较多的作业运行效率相对比较低,比如即使有几百行的表,如
分类:其他好文   时间:2016-02-26 21:59:40    阅读次数:274
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!