mysql 页存储分布-编程知识

mysql 页存储分布

news/2025/2/22 13:37:25/文章来源:https://www.cnblogs.com/aoximin/p/18721720

前言

前文我们已经明白了行数据，如何在页存储中分布的行是怎么存储的。

正文

那么页结构又是怎么样的呢？

这里我们唯一知道的就是user records 就是实际存储的行记录内容。

这里让我觉得有意思的是infimum 和 suprenum，分别是最小记录和最大记录，这两个是用来做什么呢？

我估计是用来查询的。

还有一个就是free space，这个猜想应该是用来扩缩page direcotry和 user records。

终点，page directory 某些记录的相对位置，估计也是用来查询的。

在页的7个组成部分中，我们自己存储的记录会按照我们指定的行格式存储到 User Records 部分。但是在一开
始生成页的时候，其实并没有 User Records 这个部分，每当我们插入一条记录，都会从 Free Space 部分，也就
是尚未使用的存储空间中申请一个记录大小的空间划分到 User Records 部分，当 Free Space 部分的空间全部
被 User Records 部分替代掉之后，也就意味着这个页使用完了，如果还有新的记录插入的话，就需要去申请新
的页了，这个过程的图示如下：

里面的数据大致是这样：

一个链式结构。

这里可以看到两条特殊的记录，infimum 和 supremum 这两条记录是天生就有的，还记得我们说占用26个字节嘛。

怎么来的呢？

比如最小字节：5个固定字节是记录信息，8个字节存储的是infimum。最大记录也是这个，所以加起来是26个字节。

然后我们来看一下查询操作，如果2被删除了呢？那是怎么样的呢？

这条记录只是标记而已。

然后最大记录的n_owned 变成了4.

如果再把这条数据插入回去呢，那么是怎么样的呢？

又回来了。

当数据页中存在多条被删除掉的记录时，这些记录的next_record属性将会把这些被删除掉的记录组成
一个垃圾链表，以备之后重用这部分存储空间。

然后还有一个值得注意的是，nextrecord指向的是中间位置，也就是记录头和列数据之间，这是为了方便读取两边的数据。

这也是为啥变长字段长度列表null值列表是逆着写的。

因为读取出来是byte[] 数组，那么读取的是只需要--，那么就是顺序的了。

还有一个值得注意的就是heap_no 就是编号。

接下来page directory，这个对于查询是非常重要的。

对于一条有序的链表而言呢，我们怎么去查询呢？

链表天生有一个限制，那就是得从一头到另外一头。

那么怎么能快一点呢？那就是记录链表的一些位置，这些位置也是顺序的，也就是将这条链表切成一小段一小段。

将所有正常的记录（包括最大和最小记录，不包括标记为已删除的记录）划分为几个组。
每个组的最后一条记录（也就是组内最大的那条记录）的头信息中的 n_owned 属性表示该记录拥有多少条记
录，也就是该组内共有几条记录。
将每个组的最后一条记录的地址偏移量单独提取出来按顺序存储到靠近页的尾部的地方，这个地方就是所
谓的 Page Directory ，也就是页目录（此时应该返回头看看页面各个部分的图）。页面目录中的这些地址
偏移量被称为槽（英文名： Slot ），所以这个页面目录就是由槽组成的。

也就是下面这样的。

是的，设计 InnoDB 的大叔们对每个分组中的记录条数是有规定的：对于最小记录所在的分组只能有 1 条记录，
最大记录所在的分组拥有的记录条数只能在 1~8 条之间，剩下的分组中记录的条数范围只能在是 4~8 条之间。

初始情况下一个数据页里只有最小记录和最大记录两条记录，它们分属于两个分组。
之后每插入一条记录，都会从页目录中找到主键值比本记录的主键值大并且差值最小的槽，然后把该槽对
应的记录的 n_owned 值加1，表示本组内又添加了一条记录，直到该组中的记录数等于8个。
在一个组中的记录数等于8个后再插入一条记录时，会将组中的记录拆分成两个组，一个组中4条记录，另一
个5条记录。这个过程会在页目录中新增一个槽来记录这个新增分组中最大的那条记录的偏移量。

分组大概是这样的：