码迷,mamicode.com
首页 >  
搜索关键字:hadoop mapreduce java编程    ( 18089个结果
大数据学习5(基于yarn的高可用集群搭建)
NN-1 NN-2 DN ZK ZKFC JNN RS NM(和DN在一起) node0001 * * * node0002 * * * * * * node0003 * * * * * node0004 * * * * 1,修改配置文件 cd /opt/sxt/hadoop-2.6.5/etc/h ...
分类:其他好文   时间:2020-07-29 00:45:28    阅读次数:156
《hadoop 集群搭建、spark安装、Hbase安装、Hive安装、Kafka安装》
1 hadoop集群安装 https://blog.csdn.net/shshheyi/article/details/84893371 1.1 修改主机名 [root@localhost ~]# vim /etc/hosts # 三台机器都需要操作 192.168.28.131 master 19 ...
分类:其他好文   时间:2020-07-29 00:41:18    阅读次数:111
Azkaban基础(一):概述
1.1 什么是 Azkaban Azkaban 是由 Linkedin 公司推出的一个批量工作流任务调度器,主要用于在一个工作流内以一个特定的顺序运行一组工作和流程,它的配置是通过简单的 key:value 对的方式,通 过配置中的 Dependencies 来设置依赖关系。Azkaban 使用 j ...
分类:其他好文   时间:2020-07-29 00:41:05    阅读次数:74
Hadoop HA高可用搭建流程
一、HDFS-HA集群配置 1.环境准备 1. 修改IP 2. 修改主机名及主机名和IP地址的映射 3. 关闭防火墙 4. ssh免密登录 5. 安装JDK,配置环境变量等 2.规划集群 hadoop102 hadoop103 hadoop104 NameNode NameNode JournalN ...
分类:其他好文   时间:2020-07-28 22:19:09    阅读次数:77
Hive函数大全-完整版
Hive函数大全–完整版 现在虽然有很多SQL ON Hadoop的解决方案,像Spark SQL、Impala、Presto等等,但就目前来看,在基于Hadoop的大数据分析平台、数据仓库中,Hive仍然是不可替代的角色。尽管它的相应延迟大,尽管它启动MapReduce的时间相当长,但是它太方便、 ...
分类:其他好文   时间:2020-07-28 14:21:17    阅读次数:191
Hbase学习
尚硅谷大数据技术之HBase (作者:尚硅谷大数据研发部) 版本:V1.2 第1章 HBase简介 1.1 什么是HBase HBase的原型是Google的BigTable论文,受到了该论文思想的启发,目前作为Hadoop的子项目来开发维护,用于支持结构化的数据存储。 官方网站:http://hb ...
分类:其他好文   时间:2020-07-27 16:06:52    阅读次数:97
Hadoop小练习
Hadoop和HDFS内容:1.什么是HDFS文件系统? HDFS是大数据开源框架hadoop的组件之一,全称(Hadoop Distributed File System),它是一个分布式文件系统,由多台服务器联合起来实现文件存储功能,通过目录树来定位文件,集群中的服务器都有有各自的角色. 2.h ...
分类:其他好文   时间:2020-07-26 23:17:20    阅读次数:88
MapReduce
1.1 MapReduce定义 1.2 MapReduce优缺点 1.2.1 优点 1.2.2 缺点 1.3 MapReduce核心思想 1)分布式的运算程序往往需要分成至少2个阶段。 2)第一个阶段的MapTask并发实例,完全并行运行,互不相干。 3)第二个阶段的ReduceTask并发实例互不 ...
分类:其他好文   时间:2020-07-26 23:12:54    阅读次数:73
YARN
Yarn资源调度器 Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台,而MapReduce等运算程序则相当于运行于操作系统之上的应用程序。 Yarn基本架构 YARN主要由ResourceManager、NodeManager、ApplicationMas ...
分类:其他好文   时间:2020-07-26 23:11:08    阅读次数:88
大数据第一阶段
1 Hadoop是什么1.hadoop是一个由Apache基金会所开发的分布式系统基础架构。2.主要解决,海量数据的储存和海量数据的分析计算问题。3.广义来说,hadoop通常是指一个更广泛的概念 Hadoop生态圈。 Hadoop三大发行版本Hadoop三大发行版本:Apache、Cloudera ...
分类:其他好文   时间:2020-07-26 23:10:55    阅读次数:101
18089条   上一页 1 ... 28 29 30 31 32 ... 1809 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!