mysql 索引页存储关系

news/2025/2/22 20:39:17/文章来源:https://www.cnblogs.com/aoximin/p/18729008

前言

简单介绍一下页存储的关系。

正文

在前文中,我们已经知道了页存储的内怎么去查询的数据的,也就两点。

  1. 记录根据主键(索引)按照顺序链式存储

  2. 有一个page directory,里面有槽,可以快速定位到槽,然后就可以从链式存储的某个点进行分组查询

理论上这样在一页内查询还是非常ok的。

那么有一个问题,就是一页我们知道了只有16k,不可能全部的数据放在16k上。

然后我们有知道了,这些页呢,在物理层上是双链表。

嗯,这里我们知道了,如果需要查任何一个数据,我们其实是可以查到的,因为不存在孤岛的问题。

现在就是另外一个问题,如何快速定位到数据属于哪一个页呢?

这似乎是一个值得思考的问题。

再简单点说,我们有两个页:

咦?怎么分配的页号是 28 呀,不应该是 11 么?再次强调一遍,新分配的数据页编号可能并不是连续的,也
就是说我们使用的这些页在存储空间里可能并不挨着。它们只是通过维护着上一个页和下一个页的编号而建
立了链表关系。另外, 页10 中用户记录最大的主键值是 5 ,而 页28 中有一条记录的主键值是 4 ,因为 5

4 ,所以这就不符合下一个数据页中用户记录的主键值必须大于上一个页中用户记录的主键值的要求,所
以在插入主键值为 4 的记录的时候需要伴随着一次记录移动,也就是把主键值为 5 的记录移动到 页28 中,
然后再把主键值为 4 的记录插入到 页10 中,这个过程的示意图如下:

这似乎就对了,所以这也是为什么我们说的页分裂问题。

如果不按照顺序插入,那么总得这里移动哪里移动啥的,极端的情况会发生连锁反应。

这不是我们要解决的问题,想必开发者应该有这个想法了。

然后我们就有了很多页。

因为这些 16KB 的页在物理存储上可能并不挨着,所以如果想从这么多页中根据主键值快速定位某些记录所
在的页,我们需要给它们做个目录,每个页对应一个目录项,每个目录项包括下边两个部分:
页的用户记录中最小的主键值,我们用 key 来表示。
页号,我们用 page_no 表示。

然后我们做了一个目录。

神奇的现象发生了:

如果我们抽象一下会怎么样呢?

有没有可能(key:1, page_no) 就是一条记录呢? 且1,5,12,209 是顺序的,那不就完全符合我们的页的结构了。

有趣。

那么这样的记录叫做目录记录。
record_type 属性,它的各个取值代表的意思如下:

0 :普通的用户记录
1 :目录项记录
2 :最小记录
3 :最大记录

整体来说就行下面这样:

那么现在查询数据,那么就是页30通过二分法查到是哪一条记录。

比例比如说查8吧。

因为8在30页的,5-12之间,因为目录页里面记录的是最小值,那么是左闭右开,所以定位到是(5,28)这条记录。

那么找到28页,然后就去二分法找到记录啥的。

虽然说 目录项记录 中只存储主键值和对应的页号,比用户记录需要的存储空间小多了,但是不论怎么说一个页
只有 16KB 大小,能存放的 目录项记录 也是有限的,那如果表中的数据太多,以至于一个数据页不足以存放所有
的 目录项记录 ,该咋办呢?

来,给目录页加上:

那么现在查询的就需要下面几个步骤了:

  1. 确定 目录项记录 页
  2. 通过 目录项记录 页确定用户记录真实所在的页。
  3. 在真实存储用户记录的页中定位到具体的记录。

那么问题来了,在这个查询步骤的第1步中我们需要定位存储 目录项记录 的页,但是这些页在存储空间中也可能
不挨着,如果我们表中的数据非常多则会产生很多存储 目录项记录 的页,那我们怎么根据主键值快速定位一个
存储 目录项记录 的页呢?其实也简单,为这些存储 目录项记录 的页再生成一个更高级的目录,就像是一个多级
目录一样,大目录里嵌套小目录,小目录里才是实际的数据

这玩意儿像不像一个倒过来的 树 呀,上头是树根,下头是树叶!其实这是一种组织数据的形式,或者说是一种
数据结构,它的名称是 B+ 树。

从图中可以看出来,我们的实际用户记录其实都存放在B+树的最底层的节点
上,这些节点也被称为 叶子节点 或 叶节点 ,其余用来存放 目录项 的节点称为 非叶子节点 或者 内节点 ,其
中 B+ 树最上边的那个节点也称为根节点。

我们每次查询的时候就是从这个根节点开始查。

那么问题来了,mysql 怎么知道根节点在哪呢?

那么肯定有记录的,至于在哪后面再说。

  1. 每当为某个表创建一个 B+ 树索引(聚簇索引不是人为创建的,默认就有)的时候,都会为这个索引创建一
    个 根节点 页面。最开始表中没有数据的时候,每个 B+ 树索引对应的 根节点 中既没有用户记录,也没有目
    录项记录。
  2. 随后向表中插入用户记录时,先把用户记录存储到这个 根节点 中。
  3. 当 根节点 中的可用空间用完时继续插入记录,此时会将 根节点 中的所有记录复制到一个新分配的页,比
    如 页a 中,然后对这个新页进行 页分裂 的操作,得到另一个新页,比如 页b 。这时新插入的记录根据键值
    (也就是聚簇索引中的主键值,二级索引中对应的索引列的值)的大小就会被分配到 页a 或者 页b 中,而
    根节点 便升级为存储目录项记录的页。

然后还有一个问题,那就是二级索引的问题。

我们知道二级索引的记录里面存在是 索引列+主键对吧。

然后二级索引的目录是怎么样的呢?

是存这索引列加页号吗?

当然不是,因为其实二级索引记录里面主键是啥? 是索引列+主键,而不单单是主键。

所以应该是这样的:

先这么着吧,后面再补充。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/887599.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

为什么你的客户留不住?可能是CRM没用对!

最近同事跟我抱怨: ——“营销活动越做越多,可是活跃的客户突然就不见了。” ——”跟客户明明聊的好好的,怎么一转头就不合作了?“ ——“客户一走,业绩没保障,我可太焦虑了😭!!!” 客户流失率越来越高,不仅影响个人业绩,从长远来看,还会影响到公司品牌的信誉和…

如何在JMeter中配置断言,将非200状态码视为测试成功

如何在JMeter中配置断言,将非200状态码视为测试成功 引言 在接口测试中,HTTP响应状态码是判断请求是否成功的重要依据。通常情况下,状态码200表示请求成功,而其他状态码则可能表示各种类型的错误。然而,在某些特定场景下,我们可能期望接收到非200的状态码,并将其视为测试…

CDN大致原理

没有CDN加速情况下对于资源的请求路径: 增加了CDN(content delivery network)服务后的请求路径:

自然语言转SQL避坑指南:FocusSearch如何用两步法碾压传统大模型方案?

在数据驱动的时代,企业每天需要处理海量结构化数据,但非技术人员与数据库之间的“最后一公里”鸿沟始终存在。传统Text2SQL技术试图用自然语言直接生成SQL查询,然而大模型的黑箱特性、高昂成本及不可控的幻觉问题,使得这一目标长期陷入“理想丰满,现实骨感”的困境。本文将…

P1044 [NOIP 2003 普及组] 栈——卡特兰数

题目背景 栈是计算机中经典的数据结构,简单的说,栈就是限制在一端进行插入删除操作的线性表。 栈有两种最重要的操作,即 pop(从栈顶弹出一个元素)和 push(将一个元素进栈)。 栈的重要性不言自明,任何一门数据结构的课程都会介绍栈。宁宁同学在复习栈的基本概念时,想到…

[开源自荐] Catime 不一样的计时器(番茄时钟),非常欢迎反馈

Catime一款简洁的 Windows 倒计时工具,具有透明界面和丰富的自定义选项。Github:https://github.com/vladelaina/Catime🌟特点极简设计: 透明界面、点击穿透、可调大小和位置、多语言支持 丰富字体: 14种 Nerd Fonts 字体,支持实时预览 灵活计时: 快速预设、自定义时间输入…

PCIe图像采集卡功能与优势解析

PCIe图像采集卡是一种通过PCI Express接口与计算机连接的硬件设备,主要用于高速采集摄像头、工业相机、医学成像设备等输出的图像或视频信号。以下是关键信息整理: 一、核心功能与优势 高速传输 利用PCIe接口的高带宽(如PCIe 3.0 x4可达4GB/s),支持高分辨率(4K/8K)或高帧…

VShell v4.9.3 高级版:红队国产化C2工具

免责声明 请勿利用文章内的相关技术从事非法测试。由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失,均由使用者本人负责,作者不为此承担任何责任,请务必遵守网络安全法律法规。本文仅用于测试,请完成测试后24小时删除,请勿用于商业用途。如文中内容涉…

什么地方的。。。。。。

这几个ip下载了一上午了,每次关电脑打开还是他们 有好几个ip的位置一样,客户端也出奇的一致

JVM-新

JVM学习 jvm 前提 课程章节内存与垃圾回收(本课程只讲这个) ​​字节码与类的加载性能监控与调优篇jdk 版本6,7,8,11-LTS,(现在都是 8,否则就是 11)‍ JVM 与 java 体系结构 前言之前遇到的问题运行着的线上系统突然卡死,系统无法访问,甚至直接 O0M! 解决 JVM GC 问题,但却无从…

【日记】今天超级开心!(2140 字)

正文见到了灵,不过这次只挑印象最深的地方说。而印象最深的地方,很大程度上却与去玩的经过本身无关。一是出发前兄长的问题。他问我这次特意大老远回家干什么,我说见人。他说:“也就只有这个理由能把你这尊大神请得动了。”我当时还愣了一下:“什么意思?”“我感觉你每次…