简介 YARN 提供请求和使用hadoop集群资源的API 向上隐藏细节 提供更高层的API 4.1 YARN应用运行机制 资源请求 应用生命周期 构建yarn应用 4.2 YARN与MapReduce 1相比 (MapReduce特指hadoop1 的版本, 2/3依次对应) 4.3 YARN中的 ...
分类:
其他好文 时间:
2020-01-02 20:42:12
阅读次数:
81
Hbase数据管理 Hbase就是Hadoop database Hbase是列式数据库 因此Hbase特别适合寻找按照时间排序寻找Top n的场景 Hive数据管理 基于 Hadoop 文件系统的数据仓库 Hive是建立在Hadoop上的数据仓库基础架构。它提供了一系列的工具,用来进行数据提取、转 ...
分类:
其他好文 时间:
2020-01-02 15:24:13
阅读次数:
66
HBase是大数据中的数据库,是一种列级存储的数据库,支持秒级查询,下面安装记录一下,基于centos6,后面查看用。 安装hadoop hbase存储的数据在hadoop中,因此需要先安装hadoop,可以安装伪分布式就可以,用作学习用,参考 https://www.cnblogs.com/you ...
分类:
其他好文 时间:
2020-01-02 00:04:07
阅读次数:
121
package com.zy; import java.io.IOException; import org.apache.commons.lang.time.StopWatch; import org.apache.hadoop.conf.Configuration; import org.apa ...
分类:
编程语言 时间:
2020-01-01 11:46:04
阅读次数:
94
大数据概述 大数据的特点 存储单位概述 大数据在现实生活中的具体应用 大数据公司组织结构 全部作品 Hadoop ...
分类:
其他好文 时间:
2020-01-01 09:28:11
阅读次数:
115
ElasticSearch之介绍 一 Elasticsearch产生背景 1.1 大规模数据如何检索 如:当系统数据量上了10亿、100亿条的时候,我们在做系统架构的时候通常会从以下角度去考虑问题:1)用什么数据库好?(mysql、oracle、mongodb、hbase…)2)如何解决单点故障;( ...
分类:
其他好文 时间:
2019-12-31 21:31:10
阅读次数:
88
https://blog.csdn.net/fengliaoai/article/details/89890303 http://www.xuexiluxian.net/hadoop-xuexi.html https://edu.51cto.com/mic-position/243.html?jzl ...
分类:
其他好文 时间:
2019-12-31 18:18:44
阅读次数:
198
转:https://blog.csdn.net/qx12306/article/details/67014096 Sqoop是一款开源的工具,主要用于在Hadoop相关存储(HDFS、Hive、HBase)与传统关系数据库(MySql、Oracle等)间进行数据传递工作。Sqoop最早是作为Hado ...
分类:
数据库 时间:
2019-12-31 17:07:17
阅读次数:
126
转:https://www.aboutyun.com/thread-21544-1-1.html 问题导读:1.Hive 是什么? 2.Hive 架构分哪几部分? 3.Hive 文件格式是怎样的? 一、Hive是什么? Hive 是基于 Hadoop 构建的一套数据仓库分析系统,它提供了丰富的 SQ ...
分类:
其他好文 时间:
2019-12-31 14:28:25
阅读次数:
108