spurity 2020-11-10
概念介绍:
我们知道,MySQL中的redo日志记录了事务的行为,在服务器宕机的时候,可以通过重做事务来达到恢复数据的目的,然而,有的时候,事务还有回滚的需求,也就是说,我们需要知道某条在变成当前情况之前的样子,这种情况下,undo日志就派上用场了。也就是说,undo日志是为了将数据恢复到修改之前的样子,因此在对数据库进行修改的时候,我们需要知道,这个过程中会产生redo日志和undo日志。
存储位置:
我们还知道,redo日志一般情况下放在redo日志文件中,也就是常说的ib_log中,而undo日志存放在数据库内部的一个"段"中,这个概念,我们在8月21号的文章中有讲过,忘记的同学可以回去看看,undo日志的段位于共享表空间内。
回滚操作:
现在,我们已经知道了undo的概念,其实就是共享表空间中的一块区域,它的主要作用是将事务恢复到执行修改之前的样子,但是,恢复的情况一般分为两种,一种是逻辑恢复,一种是物理恢复,这里需要非常强调的是,undo的恢复是逻辑恢复,也就是说,如果你插入了100w条数据,导致innodb分配了一个新的数据页来存储这些数据,那么在事务进行回滚的时候,undo的功能并不是回收这个数据页,而是将这些insert的操作,改变成delete的操作从而执行回滚。在这个过程中,共享表空间的大小并不会发生改变。除此之外,undo日志会将delete操作转化为insert操作,update操作转化为反向的update操作。
删除方式:
还有一点需要注意,事务共享表空间中写入undo日志的过程同样需要写入redo日志,事务一旦提交,也就意味着事务的持久性生效,那么undo日志则不被需要,但是innodb并不会把这个undo日志直接删除,而是放在一个undo日志的链表中,到底什么时候删除取决于mysql的purge线程,这样做是为了避免其他的事务需要通过undo日志来得到这条记录之前的版本。
空间分配:
在实际操作中,一个数据库实例上可能会进行很多事务,如果我们为每一个事务都分配单独的日志数据页来保存undo将会非常的浪费存储空间,我们简单算一算,假设一个应用的TPS为1000,为每个事务分配一个undo页,我们之后到一个数据页的大小是16kb,1分钟将会产生60*1000个数据页,那么一分钟大约需要的空间就是960M的磁盘空间,这样显然是不合理的,因此,在innodb中,对于undo页可以进行重用,具体的方法是,事务提交的时候,现将undo页放入链表中,然后判断这个undo页的使用空间是否小于75%,如果是的话,那么这个undo页就可以被重用,之后的undo日志就可以追加在当前undo日志的后面。当然,我们可以通过show engine innodb status来查看链表中undo log 的数量,这里不做演示了。