说说MySQL中MVCC机制的原理
作者:lovoo
一、概述:
了解了MySql的底层架构后,我们今天要深入了解下什么是MVCC。
MVCC,全称Multi-Version Concurrency Control,即多版本并发控制。MVCC是一种多并发控制的方法,一般在数据库管理系统中,实现对数据库的并发访问,在编程语言中实现事务内存。
我们知道,MySql在5.5后由MyISAM存储引擎改成了InnoDB存储引擎,主要是因为InnoDB是支持事务的,那么当多线程同时执行的时候,可能会出现并发问题。这个时候可能会出现一个能够控制并发的方法,MVCC就起到了这个作用。
MVCC主要靠undo log版本链与ReadView来实现。
二、什么是Undo log
- Undo log主要用于事务回滚时恢复原来的数据。
- mysql在执行sql时,会将一天逻辑相反的日志保存到undo log中。因此,undo log中记录的也是逻辑日志。
- 但mysql执行Insert语句时,会在undo log日志中记录本次插入的主键id。等事务回滚时,delete删除此id。
- 当MySQL执行update语句时,会在undo log中保存修改前的数据。等事务回滚时,再执行一次update,得到原来的数据。
- 当MySQL执行delete语句时,会在undo log中保存删除前的数据。等事务回滚时,再执行insert,插入原来的数据。
- 数据库中的四大特性–原子性,即事务是不可分割的,要么全部成功,要不全部失败,其底层就靠undo log来实现。在执行某一条语句失败时,就会对之前事务的语句进行回滚。
三、行的隐藏列
- 在数据库的每行上,除了存放真实的数据以外,还存在3个隐藏的列:row_id、trx_id和roll_pointer
- row_id,行号:
如果当前表有整数类型的主键,那么row_id的值就是主键的值
如果没有整数类型的主键,则MySQL会按照字段的顺序选择一个非空的整数类型的唯一索引为row_id
如果都没有找到,则会创建一个自动增长的整数作为row_id
- trx_id,事务号:
当一个事务开始执行前,MySQL就会为这个事务分配一个全局自增的事务id。
之后该事务对当前进行的增、改、删除等操作时,都会将自己的事务ID记录到trx_id中。
- roll_pointer,回滚指针:
事务对当前数据改动时,会将旧的数据记录到undo log中,在将数据写入当前行,且当前的roll_pointer指向刚才那个undo log,因此可通过roll_pointer来找到改行前一个版本。
当一直有事务对该行改动时,就会一直生成undo log,最终将会形成undo log版本链。
四、Undo log版本链
一开始,我们使用以下语句创建一个stduent表
CREATE TABLE `student` ( `id` INT ( 11 ) NOT NULL AUTO_INCREMENT, `name` VARCHAR ( 255 ) NOT NULL, `age` INT ( 11 ) NOT NULL, PRIMARY KEY ( `id` ) USING BTREE ) ENGINE = INNODB;
现在开启第一个事务,事务id为1,执行以下插入语句。
INSERT INTO student VALUES ( 1, "a", 24 );
那么当前的示意图如下:
因为该数据是新插入的,因此它的roll_pointer指向的undo log为空。
接着开启第2个事务,分配的事务id是2,执行以下修改命令。
UPDATE student SET NAME = 'b' WHERE id = 1;
现在的示意图变为:
当开启第3个事务,分配到事务id是3,执行以下修改命令。
UPDATE student SET age = 25 WHERE id = 1;
示意图变为:
每个事务对该行进行改动时,都会生成一个undo log,用于保存之前的版本,之后再将新版本的roll_pointer指向刚才生成的undo log。
因此,roll_pointer可以将这些不同版本的undo log串联起来,形成undo log的版本链。
五、关于ReadView
首先需要理解一下快照读与当前读
快照读:简单的select查询,即不包括 select … lock in share mode, select … for update,可能会读到数据的历史版本。
当前读:以下语句都是当前读,总是读取最新版本,会对读取的最新版本加锁。
select ... lock in share mode select ... for update insert update delete
在事务执行每一个快照读或事务初次执行快照读时,会生成一致性视图,即ReadView。
ReadView的作用是,判断undo log版本链中的哪些数据对当前事务可见。
ReadView包含以下几个重要的参数:
- m_ids
- 在创建ReadView的那一刻,mysql中所有未提交的事务id集合。
- min_trx_id
- m_ids中的最小值
- max_trx_id
- mysql即将为下一个事务分配的事务id,并不是m_ids中的最大值。
- creator_trx_id
- 即创建此ReadView的事务id
简要的示意图如下:
那么事务在执行快照读时,可以通过以下的规则来确定undo log版本链上的哪个版本数据可见。
- 如果当前undo log的版本的trx_id<min_trx_id,说明该版本对应的事务在生成ReadView之前就已经提交了,因此是可见的。
- 如果当前undo log的版本的trx_id≥max_trx_id,说明该版本对应的事务在生成ReadView之后才开始的,因此是不可见的。
- 如果当前undo log的版本的trx_id∈[min_trx_id,max_trx_id),如果在这个范围里,还要判断trx_id是否在m_ids中:
在m_ids中,说明版本对应的事务未提交,因此是不可见的。 不在m_ids中,说明版本对应的事务已经提交,因此是可见的。
- 如果当前undo log的版本的trx_id=creator_trxt_id,说明事务正在访问自己修改的数据,因此是可见的。
- 当undo log版本链表的头结点数据被判定为不可见时,则利用roll_pointer找到上一个版本,再进行判断。如果整个链表中都没有找到可见的数据,则代表当前的查询找不到数据。
到此这篇关于说说MySQL中MVCC机制的原理的文章就介绍到这了,更多相关MySQLMVCC机制内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!