搜索关键字：hive 认证类，搜索到5967个结果！码迷,mamicode.com！

第53课：Hive 第一课：Hive的价值、Hive的架构设计简介

一、Hive的历史价值1，大数据因Hadoop而知名，而Hadoop又因Hive而实用。Hive是Hadoop上的KillerApplication，Hive是Hadoop上的数据仓库，同时Hive兼具有数据仓库中的存储和查询引擎。而SparkSQL是一个更加出色和高级的查询引擎，并不提供存储功能。所以SparkSQL无法取代Hive，..

分类：其他好文时间：2016-03-14 16:48:05 阅读次数：296

【解决】hive动态添加partitions不能超过100的问题

Author： kwu 【解决】hive动态添加partitions不能超过100的问题，全量动态生成partitions超过100会出现例如以下异常：

分类：其他好文时间：2016-03-14 08:22:03 阅读次数：116

关键字

1. hadoop、hbase、hive、spark、strom、mapreduce、mahout、zookeeper. 2.redis、dubbo、mongodb、memcache、kafka、sqoop. 3. autofac、unity、xunit. 4.serfj restlet httpc

分类：其他好文时间：2016-03-09 23:48:33 阅读次数：171

在apache hadoop2.6 上部署hive 并将hive数据源存储于Mysql

集成hive 的前提是apache hadoop 集群能够正常启动。 hadoop 版本 apach2.6.0 hive 版本：1.2.1 1、安装mysql 并赋予权限： 1.1：创建hive 用户和密码： Create user ‘hive’ identified by ‘123456’ 1.2

分类：数据库时间：2016-03-07 16:39:52 阅读次数：261

我为什么学习hive窗口分析函数

1. 窗口函数 LEAD(column_name, n, default_value)，用于统计窗口内往下第n行的值， LAG(column_name, n, default_value)，用于统计窗口内往上第n行的值。 FIRST_VALUE(column_name)，分组窗口排序后，截止到当前行

分类：其他好文时间：2016-03-01 18:42:18 阅读次数：180

大数据之三：几个名词

Hadoop=HDFS+Hive+Pig+... HDFS: 存储系统MapReduce：计算系统Hive：提供给SQL开发人员（通过HiveQL）的MapReduce，基于Hadoop的数据仓库框架Pig：基于Hadoop的语言开发的HBase:NoSQL数据库Flume：一个收集处理Hadoop

分类：其他好文时间：2016-02-29 19:52:51 阅读次数：132

Spark 大数据视频教程安装 SQL Streaming Scala Hive Hadoop

Hadoop、Redis、Memcached、MongoDB、Spark、Storm、云计算、R语言、机器学习、Nginx、Linux、MySQL、Java EE、.NET、PHP Spark 大数据视频教程安装 SQL Streaming Scala Hive Hadoop

分类：数据库时间：2016-02-28 18:34:07 阅读次数：203

Hive安装

Hadoop安装 Hadoop安装 Hive元数据三种存储方式 Derby：hive默认的存储模式，不可以并发调用hive 本地MySQL 远程MySQL 采用第二种方式，安装MySQL，启动并创建Hive用户，创建Hive元数据库 insert into mysql.user(Host,User,...

分类：其他好文时间：2016-02-28 12:26:09 阅读次数：173

Sqoop处理Clob与Blob字段

[Author]: kwu Sqoop处理Clob与Blob字段，在Oracle中Clob为大文本。Blob存储二进制文件。遇到这类字段导入hive或者hdfs须要特殊处理。 1、oracle中的測试表 CREATE TABLE T_LOB ( A INTEGER, B CLOB, C BLOB )

分类：其他好文时间：2016-02-28 09:53:02 阅读次数：439

Hive 12、Hive优化

要点：优化时，把hive sql当做map reduce程序来读，会有意想不到的惊喜。理解hadoop的核心能力，是hive优化的根本。长期观察hadoop处理数据的过程，有几个显著的特征: 1.不怕数据多，就怕数据倾斜。 2．对jobs数比较多的作业运行效率相对比较低，比如即使有几百行的表，如

分类：其他好文时间：2016-02-26 21:59:40 阅读次数：274

共5967条上一页 1 ... 457 458 459 460 461 ... 597 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)