huacuilaifa 2020-04-17
事务:包含一系列操作的、一个有边界的工作序列,有明确的开始和结束标志,且要么被完全执行,要么完全失败,all or nothing
ACID
分布式事务基本能够满足ACID,其中的C是强一致性,也就是所有操作均执行成功,才提交最终结果,以保证数据一致性或完整性。但随着分布式系统规模不断扩大,复杂度急剧上升,达成强一致性所需时间周期较长,限定了复杂业务的处理。为了适应复杂业务,出现了BASE理论,该理论的一个关键点就是采用最终一致性代替强一致性。
实现分布式事务:解决在分布式环境下,组合事务的一致性问题
基本方法:基于XA协议的二阶段提交协议方法(强一致性);三阶段提交协议方法(强一致性);基于消息的最终一致性方法(最终一致性,BASE理论)
基于XA协议的二阶段提交方法
XA是一个分布式事务协议,规定了事务管理器和资源管理器接口。因此,XA协议可以分为两部分,即事务管理器和本地资源管理器
事务管理器作为协调者,负责各个本地资源的提交和回滚,而资源管理器就是分布式事务的参与者,通常由数据库实现
基于XA协议的二阶段提交方法中,二阶段提交协议,用于保证分布式系统中事务提交时的数据一致性,是XA在全局事务中用于协调多个资源的机制
两阶段提交协议如何保证分布在不同节点上的分布式事务的一致性呢?引入一个协调者来管理所有的节点,并确保这些节点正确提交操作结果,若提交失败则放弃事务。
两阶段提交协议的执行过程:分为投票和提交两个阶段
投票为第一阶段,协调者(Coordinator,事务管理器)会向事务的参与者(Cohort,本地资源管理器)发起执行操作的CanCommit请求,并等待参与者的响应。参与者接收到请求后,会执行请求中的事务操作,记录日志信息但不提交,待参与者执行成功,则向协调者发送“Yes”消息,表示同意操作;若不成功,则发送“No”消息,表示终止操作。
当所有的参与者都返回了操作结果(Yes 或 No 消息)后,系统进入了提交阶段。在提交阶段,协调者会根据所有参与者返回的信息向参与者发送 DoCommit 或 DoAbort 指令:
若协调者收到的都是“Yes”消息,则向参与者发送“DoCommit”消息,参与者会完成剩余的操作并释放资源,然后向协调者返回“HaveCommitted”消息;
如果协调者收到的消息中包含“No”消息,则向所有参与者发送“DoAbort”消息,此时发送“Yes”的参与者则会根据之前执行操作时的回滚日志对操作进行回滚,然后所有参与者会向协调者发送“HaveCommitted”消息;
协调者接收到“HaveCommitted”消息,就意味着整个事务结束了。
二阶段提交的算法思路:
协调者下发请求事务操作,参与者将操作结果通知协调者,协调者根据所有参与者的反馈结果决定各参与者是要提交操作还是撤销操作
缺点:
同步阻塞问题:二阶段提交算法在执行过程中,所有参与节点都是事务阻塞型的。也就是说,当本地资源管理器占有临界资源时,其他资源管理器如果要访问同一临界资源,会处于阻塞状态
单点故障问题:基于 XA 的二阶段提交算法类似于集中式算法,一旦事务管理器发生故障,整个系统都处于停滞状态。尤其是在提交阶段,一旦事务管理器发生故障,资源管理器会由于等待管理器的消息,而一直锁定事务资源,导致整个系统被阻塞。
数据不一致问题:提交阶段,当协调者向参与者发送 DoCommit 请求之后,如果发生了局部网络异常,或者在发送提交请求的过程中协调者发生了故障,就会导致只有一部分参与者接收到了提交请求并执行提交操作,但其他未接到提交请求的那部分参与者则无法执行事务提交。于是整个分布式系统便出现了数据不一致的问题。
三阶段提交方法
三阶段提交协议,是对二阶段提交的改进。为了解决两阶段提交的同步阻塞和数据不一致问题,三阶段提交引入了超时机制和准备阶段
同时在协调者和参与者中引入超时机制。如果协调者或参与者在规定的时间内没有接收到来自其他节点的响应,就会根据当前的状态选择提交或者终止整个事务。
在第一阶段和第二阶段中间引入了一个准备阶段,也就是在提交阶段之前,加入了一个预提交阶段。在预提交阶段排除一些不一致的情况,保证在最后提交之前各参与节点的状态是一致的。
第一,CanCommit 阶段。
CanCommit 阶段与 2PC 的投票阶段类似:协调者向参与者发送请求操作(CanCommit 请求),询问参与者是否可以执行事务提交操作,然后等待参与者的响应;参与者收到 CanCommit 请求之后,回复 Yes,表示可以顺利执行事务;否则回复 No。
第二,PreCommit 阶段。
协调者根据参与者的回复情况,来决定是否可以进行 PreCommit 操作。如果所有参与者回复的都是“Yes”,那么协调者就会执行事务的预执行:发送预提交请求。协调者向参与者发送 PreCommit 请求,进入预提交阶段。事务预提交。参与者接收到 PreCommit 请求后执行事务操作,并将 Undo 和 Redo 信息记录到事务日志中。响应反馈。如果参与者成功执行了事务操作,则返回 ACK 响应,同时开始等待最终指令。假如任何一个参与者向协调者发送了“No”消息,或者等待超时之后,协调者都没有收到参与者的响应,就执行中断事务的操作:发送中断请求。协调者向所有参与者发送“Abort”消息。中断事务。参与者收到“Abort”消息之后,或超时后仍未收到协调者的消息,执行事务的中断操作。
第三,DoCommit 阶段。
DoCmmit 阶段进行真正的事务提交,根据 PreCommit 阶段协调者发送的消息,进入执行提交阶段或事务中断阶段。执行提交阶段:发送提交请求。协调者接收到所有参与者发送的 Ack 响应,从预提交状态进入到提交状态,并向所有参与者发送 DoCommit 消息。事务提交。参与者接收到 DoCommit 消息之后,正式提交事务。完成事务提交之后,释放所有锁住的资源。响应反馈。参与者提交完事务之后,向协调者发送 Ack 响应。完成事务。协调者接收到所有参与者的 Ack 响应之后,完成事务。事务中断阶段:发送中断请求。协调者向所有参与者发送 Abort 请求。事务回滚。参与者接收到 Abort 消息之后,利用其在 PreCommit 阶段记录的 Undo 信息执行事务的回滚操作,并释放所有锁住的资源。反馈结果。参与者完成事务回滚之后,向协调者发送 Ack 消息。中断事务。协调者接收到参与者反馈的 Ack 消息之后,执行事务的中断,并结束事务。
在 DoCommit 阶段,当参与者向协调者发送 Ack 消息后,如果长时间没有得到协调者的响应,在默认情况下,参与者会自动将超时的事务进行提交,不会像两阶段提交那样被阻塞住。
基于分布式消息的最终一致性方案
2PC 和 3PC 这两种方法,有两个共同的缺点,一是都需要锁定资源,降低系统性能;二是,没有解决数据不一致的问题。因此,便有了通过分布式消息来确保事务最终一致性的方案。
将需要分布式处理的事务通过消息或者日志的方式异步执行,消息或日志可以存到本地文件、数据库或消息队列中,再通过业务规则进行失败重试。这个案例,就是使用基于分布式消息的最终一致性方案解决了分布式事务的问题。
基于分布式消息的最终一致性方案的事务处理,引入了一个消息中间件(Message Queue,MQ),用于在多个应用之间进行消息传递。