共计 2838 个字符,预计需要花费 8 分钟才能阅读完成。
事务是逻辑上的一组操作,要么都执行,要么都不执行。
事务最经典的、经常被拿出来说的例子就是转账了。假如小花要给小白转账 1000 元,这个转账会涉及到两个关键操作就是:将小花的余额 -1000,将小白的余额 +1000。但是万一在这两个操作之间突然出现了错误,比如银行系统突然断电,或突然宕机崩溃,都可能会导致小花的余额 -1000 之后,小白的余额却没有 +1000,这样小花和小白就都不开心了。事务就是为了保证这两个关键操作要么都成功,要么都要失败的一个机制,都成功也就完成了转账,都失败也不会造成小花的损失。
事务的特性
事务是有四个特性(ACID)的,分别是原子性、一致性、隔离性和持久性。
原子性(Atomity):事务是最小的执行单位,不允许分割。事务的原子性确保动作要么全部完成,要么完全不起作用。
一致性(Consistency):执行事务的前后,数据保持一致。
隔离性(Isolation):并发访问数据库时,一个用户的事务不能被其他事务所干扰,各个并发事务对于数据库来说都是独立的。
持久性(Durable):一个事务被提交之后。它对数据库中数据的改变是持久的,即使数据库发生故障也不应该对其有任何影响。
并发事务带来的问题
在典型的应用程序中,如果是多个事务并发运行,经常会出现多个事务操作相同的数据来完成各自的任务(多个用户对统一数据进行操作)的场景。
虽然并发是必须的,但却可能会导致以下的问题。
1. 脏读(Dirty Read)
当一个事务正在访问数据并且对数据进行了修改,而这种修改还没有提交到数据库中,这时另外一个事务也访问了这个数据,然后使用了这个数据。因为这个数据是还没有提交的数据,而这个数据可能最后并不会被提交到数据库中,那么另外一个事务读到的这个数据是【脏数据】,依据【脏数据】所做的操作就可能是不正确的。
2. 丢失修改(Lost to Modify)
在一个事务读取一个数据时,另外一个事务也访问了该数据,那么在第一个事务中修改了这个数据后,第二个事务也修改了这个数据。这样就可能会导致第一个事务内的修改结果被丢失,因为实际上最终生效的修改是第二个事务做的修改,这就是丢失修改。例如,事务 1 读取了某表中的数据 A =21,事务 2 也读取的是 A =21,当事务 1 修改了 A =A-1,事务 2 也修改了 A =A-1,可是最终的结果是 A =20,事务 1 的修改被丢失。
3. 不可重复读(Unrepeatableread)
不可重复读指的是在一个事务内多次读取同一数据,这前后两次读取的数据却不一致的情况。因为在这个事务还没有结束时,可能会有另一个事务也访问该数据,可能会造成在第一个事务中的两次读数据之间,由于第二个事务的修改导致第一个事务两次读取的数据不一样的问题。在同一个事务内两次读到的数据不一样的情况,被称为不可重复读。
4. 幻读(Phantom Read)
幻读与不可重复读类似。它发生在一个事务(T1)读取了几行数据,接着另一个并发事务(T2)插入了一些数据时。在随后的查询中,第一个事务(T1)就会发现多了一些原本不存在的记录,就好像发生了幻觉一样,所以称为幻读。
不可重复度和幻读的区别
不可重复读的重点是修改,强调的是记录的状态,比如记录中的一些属性;幻读的重点在于新增或者删除,强调的是记录的数量,比如多了几条记录或少了几条记录。
不可重复读的例子(同样的条件,你读取过的数据,再次读取出来发现值不一样了):事务 1 中的 A 先生读取自己的余额为 1000 的操作还没完成,事务 2 中的 B 先生就修改了 A 先生的余额为 2000,导致 A 先生再次读自己的余额时余额变为了 2000,这就是不可重复读。
幻读的例子(同样的条件,第 1 次和第 2 次读出来的记录数不一样):假如工资单表中工资大于 1W 的有 24 人,事务 1 读取了所有工资大于 1W 的人,共查到 24 条记录,而这时事务 2 又插入了一条工资大于 1W 的记录,事务 1 再次读取时查到的记录就变为了 25 条,这样就导致了幻读。
事务隔离级别
在的 SQL 标准中定义了四个隔离级别,分别是读取未提交、读取已提交、可重读和可串行化。
读取未提交(READ-UNCOMMITTED):最低的隔离级别,允许读取尚未提交的数据变更,可能会导致脏读、幻读或不可重复读。
读取已提交(READ-COMMITTED):允许读取并发事务已经提交的数据,可以阻止脏读,但是幻读或不可重复读仍有可能发生。
可重读(REPEATABLE-READ):对同一字段的多次读取结果都是一致的,除非数据是被本身事务自己所修改,可以阻止脏读和不可重复读,但幻读仍有可能发生。
可串行化(SERIALIZABLE):最高的隔离级别,完全服从 ACID 四个特性。在这个隔离级别下,所有的事务是依次逐个执行,严格保证事务之间完全不可能产生干扰。这就意味着,这个级别可以有效防止脏读、不可重复读以及幻读。
MySQL 中的 InnoDB 存储引擎的默认使用的隔离级别是 REPEATABLE-READ(可重读)。
SELECT @@tx_isolation;
通过上面的命令可以查询出当前 MySQL 使用的隔离级别。
这里需要注意,MySQL 对隔离级别的实现与 SQL 标准不同的地方在于 InnoDB 存储引擎在 REPEATABLE-READ(可重读)事务隔离级别下使用的是 Next-Key Lock 锁算法,因此可以避免幻读的产生,这与其他数据库系统(如 SQL Server)是不同的。这也意味着 InnoDB 存储引擎的默认隔离级别 REPEATABLE-READ(可重读)已经可以完全保证事务的隔离性要求,即达到了 SQL 标准的 SERIALIZABLE(可串行化)隔离级别。
我们知道,数据库的隔离级别通常是使用锁来实现的。隔离级别越低,事务请求的锁也就越少,造成的性能损失也就越低,数据库响应也就越快,所以大部分数据库系统的隔离级别都是 READ-COMMITTED(读取已提交内容)。但是你要知道的是,MySQL 的 InnoDB 存储引擎默认使用的 REPEATABLE-READ(可重读)并不会有任何性能损失(真的吗),因为 MySQL 做了一些相应的优化。另外,InnoDB 存储引擎在分布式事务的情况下一般会用到 SERIALIZABLE(可串行化)隔离级别,这是场景的特殊性决定的。
事务相关命令
在 MySQL 命令行的默认配置中,事务都是自动提交的,即执行 SQL 语句后就会马上执行 COMMIT 操作。
我们可以通过下面的命令来设置隔离级别。
SET [SESSION|GLOBAL] TRANSACTION ISOLATION LEVEL [READ UNCOMMITTED|READ COMMITTED|REPEATABLE READ|SERIALIZABLE]
另外还有一些并发控制语句,也是开发中经常会使用到的。
START TARNSACTION | BEGIN — 显式地开启一个事务
COMMIT — 提交事务,使得对数据库做的所有修改成为永久性
ROLLBACK — 回滚会结束用户的事务,并撤销正在进行的所有未提交的修改。