码迷,mamicode.com
首页 > 其他好文 > 详细

分布式系统----时钟同步

时间:2016-11-27 06:21:46      阅读:247      评论:0      收藏:0      [点我收藏+]

标签:灾难   箭头   没有   操作   bsp   物理   amp   使用   集群   

一、问题产生

技术分享

时间是一个绝对量,而实体计算机的时间是相对量

1、  物理天地本身导致的时间不一致,地球自传、闰年、闰秒

2、  现实的不能绝对一致性,A机器时间同步至B机器,网络传输时间是不确定性的,AB存在绝对不一致性

如上图,computer A在2144  Tick点执行分布式任务 create output.o,注意2144是A的绝对计算量、而此时的集群computer B也许出于2143Tick点,即使B也运气恰到好处的出于2144tick,A任务同步至B消耗的tick是不确定的。获取是2144也有可能是2143,倘若如上图,ouput.c created在B小于created 2144时间点,时间戳make问题就出现了。

二、逻辑时钟

1、Berkeley算法:分布式服务器定时轮询所有服务器,各台服务器依据同步结果,决定本台服务器的Tick快慢同步是时间

技术分享

三台服务器明显不一致,3:00仲机器在轮询其他机器时候,分别有2:50,3:25,那么他们是分别加10分钟和减20分钟来同步时间吗?显然不行,各台机器本身是存在事务日志的,如果本身时间进行人为修改,事务时间戳就会出现混乱。此时应该是各台服务器调慢或调快各自时间Tick已达到三台时间Tick一致。

2、  Lamport算法时钟同步

技术分享

 

 

在红箭头时间点,从理想主义角度而言,始终应该是一致的,但现实是明显不一致的,两条偏移线要向Perfect看齐

技术分享

T2的时间传播到T1,T1时间tick慢,T4在应答时间戳上要进行同步了,解决上述问题

技术分享

保证逻辑的一致性就需要计算出偏移量,偏移量用途

技术分享

P1发起分布式任务到P2大于任务时间戳6,继续传播到P3小于时间戳40,应答回传56,时间戳小了,如果继续回传P1 54,更小了,于是需要计算偏移量机型时间一致性

如:

技术分享

偏移量调整时间过程示意

技术分享

Perfact解决方案

技术分享

不使用同步算法,导致的结果是灾难性的,update1和update2的任务在1和2上的执行顺序显然不能混乱,并且需要连续性。就好比银行是先转账还是先计息,也许,或者可能这是业务需要考虑的问题,ok,那么1和2能够一致性执行update1和update2就是分布式需要解决的技术问题。

解决

1在执行update1时候进行广播,”你们都给听好了,我要执行update1操作”

2收到广播“好的,你执行,我也开始执行了”

于是update1的执行保障了一致性。当2故障或者2没有收到update1或update2,广播应答结果就是“NO,你别执行哈,执行要出乱子的”,ok,connection refused or time out。

 

3、因果一致性

 技术分享

P0执行任务,写入时间戳100,广播P1、P2,P2执行相同的分布式任务,P2这是发起了分布式任务写入时间戳110,100和110广播到P2时候,P2执行100时候,发现时间戳有问题,告诉P2不能执行110,000,和100尚未执行,按顺序执行。

 

锁的因果一致性

   技术分享          技术分享 

1执行3并取得3locker,2需要执行3,不好意思,3已经被lockerl,进入队列,当3被释放才有2的执行权。

 

分布式系统----时钟同步

标签:灾难   箭头   没有   操作   bsp   物理   amp   使用   集群   

原文地址:http://www.cnblogs.com/aspnetdream/p/Java.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!