首页 > 其他好文 > 详细

HDFS写流程

时间：2018-04-17 11:47:14 阅读：185 评论：0 收藏：0 [点我收藏+]

标签：流式获取状态 pip 分配列表 png hdfs 汇报

HDFS client首先会与NameNode交互元数据信息，然后NameNode制定策略，分配NameNode节点，客户端先会与离自己最近的DataNode进行socket连接，已经与DataNode建立连接的节点再与剩余节点之间进行连接构成pipeline，请注意，由于客户端只有一块网卡， HDFS客户端只与某一个DataNode连接，而非与所有的DataNode建立连接，当pipeline建立后，对于客户端来说，副本信息是透明的，并且不会因为副本数的数量多而影响传输速度，因为客户端只与其中一个DataNode传输。

Client会切分文件的Block块，按Block线性和NameNode获取DataNode列表(副本数)，验证DataNode列表后以更小的单位流式传输数据，各个节点之间两两通信确定可用。

当前Block传输结束后，DataNode向NameNode汇报Block信息，DataNode向Client汇报完成，Client向NameNode汇报完成。然后获取下一个Block存放的DataNode列表，重复上述步骤，直到Client汇报完成。

最终，NameNode会在写流程更新文件状态。

技术分享图片

标签：流式获取状态 pip 分配列表 png hdfs 汇报

原文地址：https://www.cnblogs.com/7758521gorden/p/8862050.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！