1、Hdfs的HA高可用:保证Hdfs高可用,其实就是保证namenode的高可用,保证namenode的高可用的机制有两个,editlog共享机制+ZKFC。ZKFC就是ZookeeperFailOverController,即zookeeper故障转移控制器。 2、nameNode的高可用机制: ...
分类:
其他好文 时间:
2019-12-06 09:15:11
阅读次数:
93
Centos6下安装伪分布式hadoop集群,选取的hadoop版本是apache下的hadoop2.7.1,在一台linux服务器上安装hadoop后,同时拥有namenode,datanode和secondarynamenode等节点的功能,下面简单安装下。 前置准备 主要涉及防火墙关闭、jdk ...
分类:
其他好文 时间:
2019-12-06 00:03:53
阅读次数:
99
先stop-all.sh 删除hdfs-site.xml中的这两个目录 然后删除core-site.xml 中的这个目录 然后格式化hdfs hdfs namenode -format 即可启动成功 注意:顺序不要错,很多人namnode起不来都是顺序错了 ...
分类:
其他好文 时间:
2019-12-04 19:59:58
阅读次数:
108
1、hdfs是通过分布式集群来存储文件,为客户端提供了一个便捷的访问方式,就是一个虚拟的目录结构2、文件存储到hdfs集群中去的时候是被切分成block的3、文件的block存放在若干台datanode节点上4、hdfs文件系统中的文件与真实的block之间有映射关系,由namenode管理5、每一 ...
分类:
其他好文 时间:
2019-11-25 20:52:22
阅读次数:
77
Hadoop [翻译大象] 广义: 以apache hadoop软件为主的生态圈(hive sqoop spark flink....)狭义: apache hadoop软件 以后这些网站经常用到hadoop.apache.orghive.apache.orgspark.apache.org had ...
分类:
其他好文 时间:
2019-11-25 15:21:18
阅读次数:
134
Hadoop在多次运行下列指令: hadoop namenode format sbin/start dfs.sh 经常会出现没有启动datanode的情况。 运行命令: jps 发现没有datanode线程。 现给出原因和解决方案 原因 当我们使用hadoop namenode format格式化 ...
分类:
系统相关 时间:
2019-11-24 10:20:06
阅读次数:
274
zk是干什么的?????分布式服务架构,解决统一命名,状态同步,集群管理,分布式应用配置项管理为了减轻分布式应用程序所承担的协调任务,比如hadoop中多个NameNode节点,怎么管理与节点间信息同步,Hbase中master与slaver之间状态同步。怎么干的???既然是为了减轻协调任务,产生了角色,有老大leader,跟随的follower,观察的observerleader,负责投票的发起
分类:
其他好文 时间:
2019-11-22 15:29:36
阅读次数:
79
HA工作机制 (配置HA高可用传送门:https://www.cnblogs.com/zhqin/p/11904317.html) HA:高可用(7 24小时不中断服务) 主要的HA是针对集群的master节点的,即namenode和resourcemanager,毕竟DataNode挂掉之后影响 ...
分类:
其他好文 时间:
2019-11-21 16:59:14
阅读次数:
122
hadoop及NameNode和SecondaryNameNode工作机制 1.hadoop组成 Common MapReduce Yarn HDFS (1)HDFS namenode:存放目录,最重要的(主机) datanode:存放数据。(从机) 2namenode:“助手” (2)YARN R ...
分类:
其他好文 时间:
2019-11-21 12:21:17
阅读次数:
83
HA工作机制 HA:高可用(7 24小时不中断服务) 主要的HA是针对集群的master节点的,即namenode和resourcemanager,毕竟DataNode挂掉之后影响 不是特别大,重启就好了。 HDFS的HA HDFS HA功能通过配置Active/Standby两个NameNodes ...
分类:
其他好文 时间:
2019-11-21 11:42:34
阅读次数:
151