码迷,mamicode.com
首页 > 其他好文 > 详细

HDFS数据复本存放

时间:2018-07-30 22:39:49      阅读:197      评论:0      收藏:0      [点我收藏+]

标签:存储   idt   方法   数据   避免   分享   节点   选择   nbsp   

复本怎么放
Hadoop的默认布局策略是在运行客户端的节点上放第一个复本(如果客户端运行在容器之外,就随机选择一个节点,不过系统会避免挑选那些存储太满或太忙的节点)。第二个复本放在与第一个不通且随机另外选择的机架中节点上(离架)。第三个复本与第二个复本放在同一个机架上,且随机选择另一个节点,其他复本放在集群中随机选择的节点上,不过系统会尽量避免在同一个机架上放太多复本。
一旦选定复本的放置位置,就根据网络拓扑创建一个管线。
总的来说,这一方法不仅提供很好的稳定性(数据块存储在两个机架中)并实现很好的负载均衡,包括写入带宽(写入操作只需要遍历一个交换机)、读取性能(可以从两个机架中选择读取)和集群中块的均匀分布(客户端只在本地机架上写入一个块)

 技术分享图片

 

HDFS数据复本存放

标签:存储   idt   方法   数据   避免   分享   节点   选择   nbsp   

原文地址:https://www.cnblogs.com/EnzoDin/p/9393114.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!