1.准备两台虚拟机,配置hosts文件 vim /etc/hosts 加入两台虚拟机的ip 和主机名(两台分别都要配置) 2.配置ssh免密通信 ssh-keygen ssh-copy-id 主机名 ssh 主机名(测试是否免密成功 3.配置hdfs-site.xfs文件 <configuratio ...
分类:
其他好文 时间:
2020-02-25 19:52:10
阅读次数:
51
hadoopd的sbin目录的脚本 一、服务相关的一些脚本 开启一个软件: 1、hadoop-daemon.sh start namenode 2、hadoop-daemon.sh start datanode 3、hadoop-daemon.sh start secondarynamenode ( ...
分类:
其他好文 时间:
2020-02-25 18:14:39
阅读次数:
74
一:MapReduce框架 (结合YARN框架) 补充:MapReduce框架知道我们写的map-reduce程序的运行逻辑。我们写的map-reduce中并没有管理层的任务运行分配逻辑,该逻辑被封装在MapReduce框架里面,被封装为MRAppMaster类,该类用于管理整个map-reduce ...
分类:
其他好文 时间:
2020-02-24 18:50:55
阅读次数:
71
下载路径 Hadoop所有版本:http://archive.apache.org/dist/hadoop/common/ ...
分类:
其他好文 时间:
2020-02-24 16:55:48
阅读次数:
51
官方文档上这么解释zookeeper,它是一个分布式服务框架,是Apache Hadoop 的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。上面的解释有点抽象,简单来说zookeeper=文件系统+监听通知机制 ...
分类:
其他好文 时间:
2020-02-24 11:19:04
阅读次数:
71
承接上文:Hadoop基础 流量求和MapReduce程序及自定义数据类型 一:实验数据 对上一篇文章中的数据进行排序处理: 13480253104 180 200 380 13502468823 102 7335 7437 13560439658 5892 400 6292 13600217502 ...
分类:
编程语言 时间:
2020-02-23 20:01:26
阅读次数:
85
Hadoop HA架构搭建 共七台服务器,节点角色分配如下: 192.168.133.21 (BFLN-01):namenode zookeeper journalnadeDFSZKFailoverController192.168.133.23 (BFLN-02):namenoderesource... ...
分类:
其他好文 时间:
2020-02-23 18:36:02
阅读次数:
91
hadoop+spark集群搭建 本次实验环境:两台hadoop+两台spark组成集群 环境准备: 1. 两个主机实现ssh无密钥认证,包括本机与本机的免密钥认证: ssh-keygren :生成一对密钥 ssh-copy-id : 把公钥发给对方服务器 2. 集群间需实现时间同步:... ...
分类:
其他好文 时间:
2020-02-23 18:34:33
阅读次数:
90
近来无事恰逢找实习,了解一下Nginx,实践一下,于是又操起了老本行,之前本科毕设装的双系统也用不上了,故删掉,把空间都匀给G盘(学习资料,用驱动精灵),打开虚拟机,新建了一个CentOS7虚拟机,下了个Xshell,打算依样画葫芦。 想起本科的时候就搞过这事,当时想进实验室跟着老师做hadoop,... ...
分类:
系统相关 时间:
2020-02-23 18:31:02
阅读次数:
107
序言 MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",是它们的主要思想。 MapReduce产生背景 如果让你统计日志里面的出现的某个URL的总次数,让你自己去写个单机版的程序,写个逻辑:无非就是读这个文件一行,然后把那个 ...
分类:
其他好文 时间:
2020-02-23 11:52:43
阅读次数:
68