gululululu 2020-05-21
前段时间还在忙,终于又出点空更新了,虽然不是所有的付出都有收获,很多时候需要我们先付出才可以看到希望。
Mysql 类的文章看的人比较少,我想一方面可能是大家更热衷于比较前言的技术,像 Mysql 类的已经发展很久的基础数据库,关注的人反而少,当时我在学习 Mysql 的过程中发现,Mysql 的很多优秀的技术在大数据很多开源框架中都能看到影子,所以还是按照笔记的方式把这个系列写完吧,当然也会穿插些其他内容。
其实,如果业务上就要求我们数据库的值必须是唯一的,那没什么好讨论的,就选择唯一索引;那么如果业务上要求不严格,或者说不需要我们数据库后台来保障唯一性要求,这时候我们选择唯一索引还是普通索引就看谁在性能上更好,谁好选谁。
对于数据库查询来说,以前介绍过,InnoDB 引擎的索引以 B+树这种数据结构保存的,我们在利用索引查询的时候,先从 B+树的叶子节点进行按层搜索,定位到我们数据在的数据页,数据页内基本按照二分法查找我们具体要查找的数据。
我们想一下,Mysql 的数据包含两个部分,一部分在内存中,一部分在磁盘上,在内存中的不光是 Mysql 的数据还有索引。 那么我们在更新的时候,如果数据在内存里面好说,直接更新,定期刷新到磁盘,但是更多的时候可能是数据不在内存中,如果每次都从磁盘读取数据所在的数据页,然后去操作,就需要至少涉及到一次磁盘的随机读操作,比较昂贵的操作。
那么我们是否可以在内存里面中把这个更新操作纪录下来,在合适的时候再将数据合并到磁盘上。这块内存在 Mysql 中就叫 change buffer,(看到 buffer,可能就会认为只存在内存中,实际上 change buffer 不光在内存中也存在磁盘上,同步到数据库的系统表空间 ibdata1),更新操作的时候,数据如果不在内存中,且不影响数据(比如不影响数据的唯一性的情况下),我们把更新操作纪录到 change buffer 上,并不需要从磁盘上读取数据页。这时候,如果来了一个查询动作,刚好要查这条数据的情况下,Mysql 会从磁盘上读取这个数据页,然后发现 change buffer 有修改了这个数据页,会将这个数据页修改的内容 merge 到这个数据页上。 查询配置如下:
mysql> show variables like ‘%innodb_change_buffer%‘; +-------------------------------+-------+ | Variable_name | Value | +-------------------------------+-------+ | innodb_change_buffer_max_size | 25 | | innodb_change_buffering | all | +-------------------------------+-------+ 2 rows in set, 1 warning (0.03 sec) mysql> show variables like ‘%innodb_buffer_pool_size%‘; +-------------------------+---------+ | Variable_name | Value | +-------------------------+---------+ | innodb_buffer_pool_size | 8388608 | +-------------------------+---------+ 1 row in set, 1 warning (0.01 sec)
说明下:
- innodb_change_buffer 为 change_buffer 占 innodb_buffer_pool_size 中的百分比,这里面 25%最大为 50%,我这个本机配置实在是太低了。
- innodb_change_buffering 表示哪些场景用 change_buffer 取值:all/none/inserts/deletes
那在更新数据的时候,数据库是如何操作的,总体来说分两种清空,要操作的数据所在的数据页在内存中和不在内存中。 数据页在内存中:
数据页不在内存中:
所以从更新角度看,普通索引可以利用 change buffer 更新操作的性能比唯一索引要更好。 这里面要说明的是有些人可能会认为像插入操作,我们需要一个主键,主键是唯一索引,所以插入操作是用不到 change buffer,这样是不对的,因为一个表一般除了主键还有二级索引,主键用不到,二级索引可以用到 change buffer。
不是所有的场合都适合使用 change buffer 的,change buffer 的本质是通过减少磁盘的随机 IO 读的访问来提升系统的性能。
江城子·墨云拖雨过西楼 [宋] 苏轼 墨云拖雨过西楼。水东流。晚烟收。 柳外残阳,回照动帘钩。 今夜巫山真个好,花未落,酒新篘。 美人微笑转星眸。月花羞。捧金瓯。 歌扇萦风,吹散一春愁。 试问江南诸伴侣,谁似我,醉扬州。
死锁的本质是资源竞争,批量插入如果顺序不一致很容易导致死锁,我们来分析一下这个情况。为了方便演示,把批量插入改写为了多条 insert。t1 t2 begin; begin; insert ignor