码迷,mamicode.com
首页 > 其他好文 > 详细

HDFS的Checkpoint机制

时间:2020-07-22 01:46:07      阅读:87      评论:0      收藏:0      [点我收藏+]

标签:image   保留   元数据   内存   序列化   时间间隔   次数   文件合并   hdfs   

Checkpoint机制

技术图片

  • NameNode负责管理元数据,元数据存在内存中,但在磁盘上有元数据镜像文件FSimage和操作日志文件edits

    内存中的元数据和磁盘镜像文件有状态差,状态差体现在操作日志文件中

    SecondaryNameNode会定期将NameNode上的操作日志文件下载到本地,跟上一个状态的镜像文件合并,得到新的镜像文件并上传给NameNode,让NameNode的镜像文件和内存元数据状态差保持在一个比较小的范围

  • 触发条件:时间间隔、操作事件次数、操作日志文件数目

    1分钟检查一次是否触发触发条件,两次checkpoint间的最大周期是1小时,最大操作记录是100万,最大操作日志保留数目是100万

  1. 达到触发条件后,Secondary NameNode通知NameNode滚动操作日志
  2. Secondary NameNode下载元数据镜像文件和操作日志
  3. Secondary NameNode加载镜像文件,回放操作日志更新元数据对象,再序列化为新的镜像文件上传到NaemNode

HDFS的Checkpoint机制

标签:image   保留   元数据   内存   序列化   时间间隔   次数   文件合并   hdfs   

原文地址:https://www.cnblogs.com/lijiong/p/13358232.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!