【MySQL】数据库索引详解 | 聚簇索引 | 最左匹配原则

创作不易，本篇文章如果帮助到了你，还请点赞关注支持一下♡>𖥦<)!!
主页专栏有更多知识，如有疑问欢迎大家指正讨论，共同进步！
🔥c++系列专栏：C/C++零基础到精通 🔥

给大家跳段街舞感谢支持！ጿ ኈ ቼ ዽ ጿ ኈ ቼ ዽ ጿ ኈ ቼ ዽ ጿ ኈ ቼ ዽ ጿ ኈ ቼ

在这里插入图片描述

索引概述

什么是索引？可以用于优化查询

是一种已经排好序的数据结构（映射结构），根据 key 找到 value

如果不使用索引，mysql 查询就会从第一个开始逐个去查询（全表查询）
每次查询都会产生磁盘的 I/O 交互

为什么要使用索引?
就是为了缩短查询的时间。就像书本的目录一样。
数据量和数据结构有很大的关系。

mysql索引使用什么？
有使用B+树的索引，有使用hash表的引擎决定了索引的类型

MySQL 常见引擎与索引类型：

MyISAM、InnoDB：B+ 树
Memory/heap：Hash 表

存储引擎形容数据库表！

索引的使用

创建索引

create index 索引名 on 表名(列名);

删除索引

drop index 索引名 on 表名;

使用 explian关键字查看是否使用索引进行检索：type = RES时代表使用索引检索，还可关注 key、row、extra等字段，查看影响查询性能的主要指标。

为什么不使用 AVL、红黑树作为索引？

红黑树的本质仍是二叉树，当数据量比较大时，红黑树的层数比较高，每次读取节点都是在做磁盘 IO

并且每个节点只能存储一个数据，但是在索引的数据结构中，一个节点需要存两个值，一个是key 用来存节点的值，一个是value 存索引所在行的磁盘地址，查到后就能获取到其value内的值即地址。

为什么不使用哈希作为索引？

哈希表不支持排序操作，哈希表不能进行范围查询，如果发生哈希冲突效率变低

B 树

B 树相比于二叉树，每个节点横向上能够存储更多的索引元素，在树的高度相同的情况下，B 树能够存储更多的数据。

B 树的每个节点都存储索引 key 和数据地址 value，导致层数变高。

B+树

B+树将所有的索引都存放在叶子节点上
B+树的节点上索引顺序从左到右依次递增
B+树只有叶子节点存储索引 key 和数据地址 value，非叶子节点存储冗余索引（冗余索引的值为主键）注意所有在冗余索引中出现的主键值都会在叶子节点中再现。设置冗余索引目的：为了使树高尽可能小，所以一层要尽可能多的放索引，按照B树这种结构，一个节点16KB，data元素会占用空间。如果不存储data只存储索引就可以存储更多索引，树可以分更多叉

对比红黑树： B+树的一个节点可以存放多个元素，比红黑树更低，磁盘 IO 次数更少。

对比 B 树： B 树不利于范围查询，B+树可以通过双向指针进行范围查找，只需要遍历叶子节点即可完成数据遍历

B+树查找索引的过程：

① 把根节点所有的索引从磁盘加载到内存中（如图的15、56、77），磁盘加载到内存就是一次磁盘 IO
② 在内存中比对（比对过程可用二分查找），发现在15-56之间，注意他俩之间白色框存储的是其指向节点在磁盘中的文件地址
③ 把指向节点所有索引再次加载到内存
④ 重复直到当定位到目标索引元素30后，直接用其data中的物理地址去访问索引所在行的磁盘地址
高版本 Mysql 在启动时就将所有的非叶子节点即冗余节点加载到内存中