分布式事务
分布式系统会把一个应用系统拆分为可独立部署的多个服务,因此需要服务于服务之间远程协作才能完成事务操作,这种分布式系统环境下由不同的服务之间通过网络远程协作完成事务称之为分布式事务。

本地事务

在计算机系统中,更多的是通过关系型数据库来控制事务,这是利用数据库本身的事务特性来实现的,因此叫数据库事务,由于应用主要靠关系数据库来控制事务,而数据库通常和应用在同一服务器,所以基于关系型数据库的事务又被称为本地事务。

数据库的四大事务ACID:

  • A(Atomic):原子性,构成事务的所有操作,要么都执行完,要么全部不执行,不可能出现部分成功部分失败的情况。
  • C(Consistecy):一致性,在事务执行前后,数据库的一致性约束没有被破坏。比如:张三向李四转100元,转账前和转账后的数据是正确状态这叫一执性,如果出现张三转出100元,李四账户没有增加100元这就出现数据错误,就没有达到一致性。
  • I(Isolation):隔离性,数据库中的事务一般都是并发的,隔离性是指并发的两个事务的执行互不干扰,一个事务不能看到其他事务运行过程的中间状态。通过配置事务隔离级别可以避免脏读、重复读等问题。
  • D(Durability):持久性,事务完成之后,该事务对数据的更改会被持久化到数据库,且不能被回滚。

数据库事务在实现时会将一次事务涉及的所有操作全部归纳到一个不可分割的执行单元,该执行单元的所有操作要么成功,要么失败,只要其中任一操作执行失败,都将导致整个事务回滚。

分布式事务

随着互联网的快速发展,软件系统由原来的单体应用转变为分布式应用,下图描述了单位应用向微服务的演变:

分布式系统会把一个应用系统拆分为可独立部署的多个服务,因此需要服务于服务之间远程协作才能完成事务操作,这种分布式系统环境下由不同的服务之间通过网络远程协作完成事务称之为分布式事务,例如用户注册送积分事务、创建订单减库存事务,银行转账事务都是分布式事务。

我们知道本地事务依赖数据库本身提供的事务特性来完成,因此以下逻辑可以控制本地事务:

begin transaction:
-- 1.本地数据库操作:张三减少金额
-- 2.本地数据库操作:李四增加金额
commit transaction;

但是分布式环境下,会变成下边这样:

begin transaction:
-- 1.本地数据库操作:张三减少金额
-- 2.远程调用:李四增加金额
commit transaction;

可以设想,当远程调用让李四增加金额成功了,由于网络问题远程调用并没有返回,此时本地事务提交失败就回滚了张三减少金额的操作,此时张三和李四的数据就不一致了。

因此在分布式架构的基础上,传统数据库事务就无法使用了,张三和李四的账户不在同一数据库中甚至不在用一应用系统里,实现转账事务需要通过远程调用,由于网络问题机会导致分布式事务问题

分布式事务产生的场景

1、典型的场景就是微服务架构

微服务之间通过远程调用完成事务操作
比如:订单微服务和库存微服务,下单同时订单微服务请求库存微服务减库存
简言之:跨JVM进程产生分布式事务

2、单体访问多个数据库实例

当单体系统需要访问多个数据库(实例)时就会产生分布式事务。
比如:用户信息和订单信息分别在两MySQL实例存储,用户管理系统删除用户信息,需要分别删除用户信息及用户的订单信息,由于数据分布在不同数据实例,需要通过不同的数据库链接去操作数据库,此时产生分布式事务。
简言之:跨数据库实例产生分布式事务

3、多服务访问同一个数据库实例

比如:订单微服务和库存微服务即使访问同一个数据库也会产生分布式事务,原因就是跨JVM进程,两个微服务持有了不同的数据库链接尽心数据库操作,此时产生了分布式事务。