mysql在repeatable read隔离级别下,是可以很大程度避免幻读问题的发生的,mysql是怎么做到的?
版本链我们知道,对于使用innodb存储引擎的表来说,它的聚簇索引记录中都包含两个必要的隐藏列(row_id并不是必要的,我们创建的表中有主键或者非null的unique键时都不会包含row_id列):
trx_id:每次一个事务对某条聚簇索引记录进行改动时,都会把该事务的事务id赋值给trx_id隐藏列。
roll_pointer:每次对某条聚簇索引记录进行改动时,都会把旧的版本写入到undo日志中,然后这个隐藏列就相当于一个指针,可以通过它来找到该记录修改前的信息。
为了说明这个问题,我们创建一个演示表:
create table `teacher` ( `number` int(11) not null, `name` varchar(100) default null, `domain` varchar(100) default null, primary key (`number`)) engine=innodb default charset=utf8
然后向这个表里插入一条数据:
mysql> insert into teacher values(1, 'j', 'java');query ok, 1 row affected (0.01 sec)
现在里的数据就是这样的:
mysql> select * from teacher;+--------+------+--------+| number | name | domain |+--------+------+--------+| 1 | j | java |+--------+------+--------+1 row in set (0.00 sec)
假设插入该记录的事务id为60,那么此刻该条记录的示意图如下所示:
假设之后两个事务id分别为80、120的事务对这条记录进行update操作,操作流程如下:
trx80trx120
begin
begin
update teacher set name=‘s’ where number=1;
update teacher set name=‘t’ where number=1;
commit
update teacher set name=‘k’ where number=1;
update teacher set name=‘f’ where number=1;
commit
每次对记录进行改动,都会记录一条undo日志,每条undo日志也都有一个roll_pointer属性(insert操作对应的undo日志没有该属性,因为该记录并没有更早的版本),可以将这些undo日志都连起来,串成一个链表,所以现在的情况就像下图一样:
对该记录每次更新后,都会将旧值放到一条undo日志中,就算是该记录的一个旧版本,随着更新次数的增多,所有的版本都会被roll_pointer属性连接成一个链表,我们把这个链表称之为版本链,版本链的头节点就是当前记录最新的值。另外,每个版本中还包含生成该版本时对应的事务id。于是可以利用这个记录的版本链来控制并发事务访问相同记录的行为,那么这种机制就被称之为多版本并发控制(mulit-version concurrency control mvcc)。
readview对于使用read uncommitted隔离级别的事务来说,由于可以读到未提交事务修改过的记录,所以直接读取记录的最新版本就好了。
对于使用serializable隔离级别的事务来说,innodb使用加锁的方式来访问记录。
对于使用read committed和repeatable read隔离级别的事务来说,都必须保证读到已经提交了的事务修改过的记录,也就是说假如另一个事务已经修改了记录但是尚未提交,是不能直接读取最新版本的记录的,核心问题就是:read committed和repeatable read隔离级别在不可重复读和幻读上的区别,这两种隔离级别关键是需要判断一下版本链中的哪个版本是当前事务可见的。
为此,innodb提出了一个readview的概念,这个readview中主要包含4个比较重要的内容:
m_ids:表示在生成readview时当前系统中活跃的读写事务的事务id列表。
min_trx_id:表示在生成readview时当前系统中活跃的读写事务中最小的事务id,也就是m_ids中的最小值。
max_trx_id: 表示系统应该分配给下一个事务的id值,以便在生成readview时使用。请注意,max_trx_id不一定是m_ids中的最大值,因为事务id是递增分配的。例如,假设有三个事务分别为id 1、2、3,在id 3的事务提交后。那么一个新的读事务在生成readview时,m_ids就包括1和2,min_trx_id的值就是1,max_trx_id的值就是4。
creator_trx_id:表示生成该readview的事务的事务id。
有了这个readview,这样在访问某条记录时,只需要按照下边的步骤判断记录的某个版本是否可见:
如果被访问版本的trx_id属性值与readview中的creator_trx_id值相同,意味着当前事务在访问它自己修改过的记录,所以该版本可以被当前事务访问。
如果被访问版本的trx_id属性值小于readview中的min_trx_id值,表明生成该版本的事务在当前事务生成readview前已经提交,所以该版本可以被当前事务访问。
如果被访问版本的trx_id属性值大于或等于readview中的max_trx_id值,表明生成该版本的事务在当前事务生成readview后才开启,所以该版本不可以被当前事务访问。
如果被访问版本的trx_id属性值在readview的min_trx_id和max_trx_id之间(min_trx_id <= trx_id < max_trx_id),那就需要判断一下trx_id属性值是不是在m_ids列表中,如果在,说明创建readview时生成该版本的事务还是活跃的,事务还没提交,该版本不可以被访问;如果不在,说明创建readview时生成该版本的事务已经被提交,该版本可以被访问。
如果某个版本的数据对当前事务不可见的话,那就顺着版本链找到下一个版本的数据,继续按照上边的步骤判断可见性,依此类推,直到版本链中的最后一个版本。如果最新的版本也无法查看,则该记录对该事务是完全不可见的,查询结果将不包含该记录。
在mysql中,read committed和repeatable read隔离级别的的一个非常大的区别就是它们生成readview的时机不同。
我们还是以表teacher为例,假设现在表teacher中只有一条由事务id为60的事务插入的一条记录,接下来看一下read committed和repeatable read所谓的生成readview的时机不同到底不同在哪里。
read committed每次读取数据前都生成一个readview假设现在系统里有两个事务id分别为80、120的事务在执行:
# transaction 80set session transaction isolation level read committed;beginupdate teacher set name='s' where number=1;update teacher set name='t' where number=1;
此刻,表teacher中number为1的记录得到的版本链表如下所示:
假设现在有一个使用read committed隔离级别的事务开始执行:
set session transaction isolation level read committed;# 使用read committed隔离级别的事务begin;# selece1:transaction 80、120未提交select * from teacher where number = 1; # 得到的列name的值为'j'
这个selece1的执行过程如下:
在执行select语句时会先生成一个readview,readview的m_ids列表的内容就是[80, 120],min_trx_id为80,max_trx_id为121,creator_trx_id为0。
然后从版本链中挑选可见的记录,最新版本的列name的内容是’t’,该版本的trx_id值为80,在m_ids列表内,根据步骤4不符合可见性要求,根据roll_pointer跳到下一个版本。
下一个版本的列name的内容是’s’,该版本的trx_id值也为80,也在m_ids列表内,根据步骤4也不符合要求,继续跳到下一个版本。
下一个版本的列name的内容是’j’,该版本的trx_id值为60,小于readview 中的min_trx_id值,根据步骤2判断这个版本是符合要求的。
之后,我们把事务id为80的事务提交一下,然后再到事务id为120的事务中更新一下表teacher 中number为1的记录:
set session transaction isolation level read committed;# transaction 120beginupdate teacher set name='k' where number=1;update teacher set name='f' where number=1;
此刻,表teacher 中number为1的记录的版本链就长这样:
然后再到刚才使用read committed隔离级别的事务中继续查找这个number 为1的记录,如下:
# 使用read committed隔离级别的事务begin;# selece1:transaction 80、120未提交select * from teacher where number = 1; # 得到的列name的值为'j'# selece2:transaction 80提交、120未提交select * from teacher where number = 1; # 得到的列name的值为't'
这个selece2 的执行过程如下:
在执行select语句时会又会单独生成一个readview,该readview的m_ids列表的内容就是[120](事务id为80的那个事务已经提交了,所以再次生成快照时就没有它了),min_trx_id为120,max_trx_id为121,creator_trx_id为0。
然后从版本链中挑选可见的记录,从图中可以看出,最新版本的列name的内容是’f’,该版本的trx_id值为120,在m_ids列表内,根据步骤4不符合可见性要求,根据roll_pointer跳到下一个版本。
下一个版本的列name 的内容是’k’,该版本的trx_id值为120,也在m_ids列表内,根据步骤4不符合可见性要求,根据roll_pointer跳到下一个版本。
下一个版本的列name的内容是’t’,该版本的trx_id值为80,小于readview中的min_trx_id值120,表明生成该版本的事务在当前事务生成readview前已经提交,所以这个版本是符合要求的,最后返回给用户的版本就是这条列name为’‘t’'的记录。
以此类推,如果之后事务id为120的记录也提交了,再次在使用readcommitted隔离级别的事务中查询表teacher中number值为1的记录时,得到的结果就是’f’了,具体流程我们就不分析了。
总结一下就是:使用readcommitted隔离级别的事务在每次查询开始时都会生成一个独立的readview。
repeatable read —— 在第一次读取数据时生成一个readview对于使用repeatable read隔离级别的事务来说,只会在第一次执行查询语句时生成一个readview,之后的查询就不会重复生成了。我们还是用例子看一下是什么效果。
假设现在系统里有两个事务id分别为80、120的事务在执行:
# transaction 80beginupdate teacher set name='s' where number=1;update teacher set name='t' where number=1;
此刻,表teacher中number为1的记录得到的版本链表如下所示:
假设现在有一个使用repeatable read隔离级别的事务开始执行:
# 使用repeatable read隔离级别的事务begin;# selece1:transaction 80、120未提交select * from teacher where number = 1; # 得到的列name的值为'j'
这个selece1的执行过程如下(与read committed的过程一致):
在执行select语句时会先生成一个readview,readview的m_ids列表的内容就是[80, 120],min_trx_id为80,max_trx_id为121,creator_trx_id为0。
然后从版本链中挑选可见的记录,最新版本的列name的内容是’t’,该版本的trx_id值为80,在m_ids列表内,根据步骤4不符合可见性要求,根据roll_pointer跳到下一个版本。
下一个版本的列name的内容是’s’,该版本的trx_id值也为80,也在m_ids列表内,根据步骤4也不符合要求,继续跳到下一个版本。
下一个版本的列name的内容是’j’,该版本的trx_id值为60,小于readview 中的min_trx_id值,根据步骤2判断这个版本是符合要求的。
之后,我们把事务id为80的事务提交一下,然后再到事务id为120的事务中更新一下表teacher 中number为1的记录:
# transaction 80beginupdate teacher set name='k' where number=1;update teacher set name='f' where number=1;
此刻,表teacher 中number为1的记录的版本链就长这样:
然后再到刚才使用repeatable read隔离级别的事务中继续查找这个number为1的记录,如下:
# 使用repeatable read隔离级别的事务begin;# selece1:transaction 80、120未提交select * from teacher where number = 1; # 得到的列name的值为'j'# selece2:transaction 80提交、120未提交select * from teacher where number = 1; # 得到的列name的值为'j'
这个selece2的执行过程如下:
因为当前事务的隔离级别为repeatable read,而之前在执行selece1时已经生成过readview了,所以此时直接复用之前的readview,之前的readview的m_ids列表的内容就是[80, 120],min_trx_id为80,max_trx_id为121,creator_trx_id为0。
然后从版本链中挑选可见的记录,从图中可以看出,最新版本的列name的内容是’f’,该版本的trx_id值为120,在m_ids列表内,根据步骤4不符合可见性要求,根据roll_pointer跳到下一个版本。
下一个版本的列name的内容是’k’,该版本的trx_id值为120,也在m_ids列表内,根据步骤4不符合可见性要求,根据roll_pointer跳到下一个版本。
下一个版本的列name的内容是’t’,该版本的trx_id值为80,也在m_ids列表内,根据步骤4不符合可见性要求,根据roll_pointer跳到下一个版本。
下一个版本的列name的内容是’s’,该版本的trx_id值为80,也在m_ids列表内,根据步骤4不符合可见性要求,根据roll_pointer跳到下一个版本。
下一个版本的列name的内容是’j’,该版本的trx_id值为60,小于readview中的min_trx_id值80,表明生成该版本的事务在当前事务生成readview前已经提交,所以这个版本是符合要求的,最后返回给用户的版本就是这条列name为’‘j’'的记录。
可重复读的意思是两次select查询的结果相同,记录的列值均为'j'。
如果我们之后再把事务id为120的记录提交了,然后再到刚才使用repeatable read隔离级别的事务中继续查找这个number为1的记录,得到的结果还是’j’,具体执行过程大家可以自己分析一下。
mvcc下的幻读现象和幻读解决前面我们已经知道了,repeatable read隔离级别下mvcc可以解决不可重复读问题,那么幻读呢?mvcc是怎么解决的?幻读是一个事务按照某个相同条件多次读取记录时,后读取时读到了之前没有读到的记录,而这个记录来自另一个事务添加的新记录。
我们可以想想,在repeatable read隔离级别下的事务t1先根据某个搜索条件读取到多条记录,然后事务t2插入一条符合相应搜索条件的记录并提交,然后事务t1再根据相同搜索条件执行查询。结果会是什么?按照readview中的比较规则:
无论事务t2是否先于事务t1开启,事务t1都无法观察到t2的提交。请根据以上所述的版本历史、阅读视图与可视性判断规则,自行进行分析。
但是,在repeatable read隔离级别下innodb中的mvcc可以很大程度地避免幻读现象,而不是完全禁止幻读。怎么回事呢?我们来看下面的情况:
t1t2
begin;
select * from teacher where number=30; 无数据 begin;
insert into teacher values(30, ‘x’, ‘java’);
commit;
update teacher set domain=‘mq’ where number=30;
select * from teacher where number = 30; 有数据
嗯,怎么回事?事务t1很明显出现了幻读现象。在repeatable read隔离级别下,t1第一次执行普通的select语句时生成了一个readview,之后t2向teacher表中新插入一条记录并提交。readview并不能阻止t1执行update或者delete语句来改动这个新插入的记录(由于t2已经提交,因此改动该记录并不会造成阻塞),但是这样一来,这条新记录的trx_id隐藏列的值就变成了t1的事务id。之后t1再使用普通的select语句去查询这条记录时就可以看到这条记录了,也就可以把这条记录返回给客户端。mvcc不能完全消除幻读,因为存在这种特殊现象。
mvcc小结从上边的描述中我们可以看出来,所谓的mvcc(multi-version concurrencycontrol ,多版本并发控制)指的就是在使用read committd、repeatable read这两种隔离级别的事务在执行普通的select操作时访问记录的版本链的过程,这样子可以使不同事务的读-写、写-读操作并发执行,从而提升系统性能。
read committd、repeatable read这两个隔离级别的一个很大不同就是:生成readview的时机不同,read committd在每一次进行普通select操作前都会生成一个readview,而repeatable read只在第一次进行普通select操作前生成一个readview,之后的查询操作都重复使用这个readview就好了,从而基本上可以避免幻读现象。
我们之前说执行delete语句或者更新主键的update语句并不会立即把对应的记录完全从页面中删除,而是执行一个所谓的delete mark操作,相当于只是对记录打上了一个删除标志位,这主要就是为mvcc服务的。另外,所谓的mvcc只是在我们进行普通的seelct查询时才生效,截止到目前我们所见的所有select语句都算是普通的查询,至于什么是个不普通的查询,后面就会讲到。
以上就是mysql innodb之mvcc原理是什么的详细内容。
