【MySQL精炼宝库】深度解析索引 | 事务

目录

一、索引

1.1 索引(index)概念:

1.2 索引的作用:

1.3 索引的缺点:

1.4 索引的使用场景:

1.5 索引的使用:

1.6 面试题:索引底层的数据结构(核心内容):

1.7 索引列查询(主键 | 非主键)过程:

二、事务

2.1 事务的概念:

2.2 事务操作:

2.3 面试题:事务的基本特性:

2.4 MySQL事务的隔离性:


一、索引

1.1 索引(index)概念:

索引是一种特殊的文件,包含着对数据表里所有记录的引用指针。可以对表中的一列或多列创建索引, 并指定索引的类型,各类索引有各自的数据结构实现。

注意:数组下标,目录,索引这三个是不同的术语,虽然它们的英文都是 index 但是表示的含义各不相同,希望友友们不要混淆。

本文章主要讲解MySQL中的索引及事务。

1.2 索引的作用:

• 数据库中的表、数据、索引之间的关系,类似于书架上的图书、书籍内容和书籍目录的关系。

• 索引所起的作用类似书籍目录,可用于快速定位、检索数据。

• 索引对于提高数据库的性能有很大的帮助。

1.3 索引的缺点:

主要体现在下面两点:

• 索引本身要占据存储空间。

• 索引能提高查询速度,但是可能会拖慢增删改的速度(对数据进行增删改都是要同步更新索引的)。

1.4 索引的使用场景:

要考虑对数据库表的某列或某几列创建索引,需要考虑以下几点:

• 数据量较大,且经常对这些列进行条件查询(索引是用在条件查询的时候)。

• 该数据库表的插入操作,及对这些列的修改操作频率较低。

• 索引会占用额外的磁盘空间。

满足以上条件时,考虑对表中的这些字段创建索引,以提高查询效率。

相反,如果非条件查询列,或经常做插入、修改操作,或磁盘空间不足时,不考虑创建索引。

1.5 索引的使用:

创建主键约束(PRIMARY KEY)、唯一约束(UNIQUE)、外键约束(FOREIGN KEY)时,会自动创建对应列的索引。

例如下图:只需关注画红框的这几个即可,至于如何查看表中的索引,后续马上讲到。

通过sql我们能够创建索引,查看索引,删除索引。 

 • 查看索引

sql脚本语法:

show index from 表名;

案例:查看学生表已有的索引

show index from student;

问题:为什么建立外键约束时,子表中的对应列(外键)为什么也要建立索引? 

解答:在父表中进行删除修改的时候要去子表查询(如果子表有对应外键那么要先修改子表).为了让子表查询的速度加快,所以这里加上了索引。

 • 创建索引

sql脚本语法:

create index 索引名 on 表名(字段名);

案例:创建班级表中,name字段的索引。

create index idx_classes_name on classes(name);

注意1:创建索引都是根据具体的列来创建的,所以后续查询的时候,也必须针对这一列进行条件查询才能够通过索引来提速。

注意2:索引的创建是一个危险操作。如果表中的数据不多,创建索引啥的哪都无所谓。如果表本身很大,这个时候进行创建索引操作,就会引起大量的 CPU / 硬盘 IO 的消耗,也是可能会把数据库给搞挂了的(年终奖也挂了😭)。

那么如果我们因为业务需要就是要加上索引该怎么加呢?

解决办法如下:

(1)另外弄一个机器,也是搭建好一样的数据库服务器。

(2)创建表,建立索引(空表无所谓)。

(3)把旧的数据库的数据,导入到新的数据库中(非常耗时)我们可以慢慢导~控制一下数据传输的速度。

(4)数据导好了,把应用程序的请求切换到新的服务器上。

这样就可以在数据库不会挂的前提把索引加上。

 • 删除索引

sql脚本语法:

drop index 索引名 on 表名;

案例:删除班级表中name字段的索引

drop index idx_classes_name on classes;

注意:删除索引也是一个比较危险的操作,因为会涉及到大量的 IO ,那么就可能会把 mysql 主机弄挂了。

1.6 面试题:索引底层的数据结构(核心内容):

在面试中,mysql 相关的面试题很少出现,如果考 SQL 的话就是考察多表查询,更加常见更加高频的问题是(1)索引:谈谈索引内部的结构是怎么样的。(2)谈谈事务的基本特性。

数据库索引数据结构的最终形态是 B+ 树,B树的升级版。例如下图就是一颗B+树。

这里解释一下为什么不使用二叉搜索树和哈希表。

• 不使用哈希表的原因

哈希表只能查询 key 相等的情况无法进行大于小于的范围查询。

• 不使用二叉搜索树原因

二叉搜索树虽然可以进行范围查询但是要找到中序遍历的下一个后继元素的操作很可能需要向父亲节点进行回溯,才能找到后续。如果通过“线索化”的方式来解决,需要付出更多的存储空间。当元素非常多的时候由于是二叉,树的高度就会比较高,查询的效率就会低,数据库的数据/索引都是存储在硬盘上的,上述的每次比较都需要一次硬盘 IO 操作,是非常耗时的因此,红黑树(二叉搜索树)不太适合于大规模在硬盘上管理数据的场景。

• 使用B树的优点

为了方便叙述下面就是一颗B树。注意:每个方框是一个节点(每个数字代表一个key,一个方框里面可以存储多个数字)。

优点:

1. 每个节点上的 key 也是有序排序的,比较的时候可以直接进行二分查找。

2. B 树会控制(可以自己调整),某个节点上存储的 key 不会太多,如果插入更多的元素,那么节点会分裂出更多的子树出来。

3. 多个数据放在一块连续的存储空间上,在进行比较的时候,一次硬盘 IO 就能读取出整个节点(进行多次比较,实际上只有一次硬盘的 IO)。

• B+树相对于B树的优点

要想理解B+ 树的优点那么至少要知道B+ 树的特点(图在上面给过了)

• B+ 树的特点:

1. N叉搜索树.

2. 每个父节点中的元素都会在子节点中以最大值的方式存在。

3. 叶子节点这一层通过链表连接。

4. 所有节点都会在叶子节点出现。

• B+ 树的优势:

1. 方便查询范围(数据都是在叶子节点,可以直接通过链表找到下一个数据不用回溯)。

2. 查询操作稳定(每次都要查询到叶子节点,稳定本身就是最大的优势)。

3. 数据存储在叶子节点,非叶子节点能够存储在内存。(由于叶子节点是数据的全集,非叶子节点都是重复出现的数据,那么就可以把表中的每一行数据,最终都关联到叶子节点这一层。非叶子节点中只保存一个单纯的 key 值即可,例如(id))。

因为B+ 树的稳定,查询的速度又快,所以我们选择B + 树作为底层的数据结构。 

B+ 树这个结构是一直存在的如果定义了主键,那么就是按照主键来建立,如果没有定义主键,数据库会用自带的隐藏的列建立。

查询一次B+树的时间复杂度为O(以M为底的logN)M为树的度。

1.7 索引列查询(主键 | 非主键)过程:

• 针对索引列进行查询

非叶子节点存储索引对应列的信息。

1. 主键索引:叶子节点存储数据行(全部信息)。

2. 非主键索引:叶子节点存储的是主键的id,找到id后再进行主键的索引(称为“回表”),也就是要查询两次。

• 针对非索引列查询

直接去最底下的叶子节点,遍历链表(直接遍历是最慢的)。

二、事务

在日常开发中,有很多操作不是通过一个 SQL 就能完成的,往往需要多个SQL配合完成,当执行多个SQL操作的时候,如果中间出现了特殊的情况(程序奔溃,系统奔溃,网络断开等)可能会出现前面的 SQL 执行成功,后面的 SQL 执行失败了。例如:转账,钱扣了但是账没有转出去,那么钱就丢了,这是非常严重的问题。因此事务的出现就是为了解决这个问题。

2.1 事务的概念:

事务指逻辑上的一组操作,组成这组操作的各个单元,要么全部成功,要么全部失败。

在不同的环境中,都可以有事务。对应在数据库中,就是数据库事务。

简单来说事务就是把多个操作打包成一个整体,那么就能够包装这个整体要么都执行成功,要么就

一个都不执行,这样就能有效避免,部分执行产生的一些“中间状态引起的问题”。

其实出现问题并非是没有执行,而是事务能够保证当执行到某一条出现问题,数据库能够自动的把前面 sql 造成的影响恢复回去,看起来就好像没有执行过一样。把这里的“翻新”操作称为“回滚”(rollback)。为了实现回滚机制,数据库会在执行事务的时候记录日志。

2.2 事务操作:

为了方便叙述我们先引入测试表:

drop table if exists accout;
create table accout(id int primary key auto_increment,name varchar(20) comment '账户名称',money decimal(11,2) comment '金额'
);
insert into accout(name, money) values
('阿里巴巴', 3000),
('四十大盗', 3000);

操作流程如下:

• 开启事务:start transaction;

• 执行多条SQL语句  

• 回滚或提交:rollback/commit;

说明:rollback即是全部失败,commit即是全部成功。 

具体案例如下:

start transaction;
-- 阿里巴巴账户减少2000
update accout set money=money-2000 where name = '阿里巴巴';
-- 四十大盗账户增加2000
update accout set money=money+2000 where name = '四十大盗';
commit;

 案例演示效果如下:

上面这些都是基本操作,

2.3 面试题:事务的基本特性:

基本特性主要有四个:原子性,一致性,持久性,隔离性。

• 原子性

把多个操作打包成一个整体。

• 一致性

执行事务之前,和执行事务完毕之后,数据是一致的(不会出现 “对不上” 的情况)。

• 持久性

把数据存储在硬盘上(程序重启/主机重启,数据依然能存在)。

• 隔离性

描述的是,数据库并发(多个客户端同时给服务器发起事务)执行事务时,产生的情况。

这个是最难理解的,面试官考你事务的四个核心特征其实就是在考隔离性。

将事务同时处理会出现三个问题:

1. 脏读问题:

描述:事务B读到了事务A中未提交的临时数据(脏数据)。

解决方法:写操作加锁。

2. 不可重复读问题:

描述:事务B读的过程中,又有一个事务C对刚才事务A提交的数据进行了修改,使事务B内部不同的读操作读到的结果不同。

解决方法:读操作加锁。

3. 幻读问题:

描述:和不可重复读类似,事务B读的过程中,事务C没有修改数据内容,而是修改了“结果集”,导致B内部不同的读操作读到的结果集合不同。

解决方法:串行化。

解决上述问题的过程中,要想让数据更准确,就需要牺牲一部分的并发/效率。

2.4 MySQL事务的隔离性:

那么在MySQL 中事务的隔离性具体是如何体现的呢?

MySQL给程序员提供了四个隔离级别。可以在MySQL配置文件中进行设置。具体如下:

到这我们今天要讲解的内容就已经全部讲解完毕了🎉🎉🎉 ,还是希望大家一定要把面试题多看看,这是最重要的部分。

结语:

其实写博客不仅仅是为了教大家,同时这也有利于我巩固知识点,和做一个学习的总结,由于作者水平有限,对文章有任何问题还请指出,非常感谢。如果大家有所收获的话还请不要吝啬你们的点赞收藏和关注,这可以激励我写出更加优秀的文章。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/661003.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Stability AI 推出稳定音频 2.0:为创作者提供先进的 AI 生成音频

概述 Stability AI 的发布再次突破了创新的界限。这一尖端模型以其前身的成功为基础,引入了一系列突破性的功能,有望彻底改变艺术家和音乐家创建和操作音频内容的方式。 Stable Audio 2.0 代表了人工智能生成音频发展的一个重要里程碑,为质量…

【docker】Docker开启远程访问

将构建的镜像自动上传到服务器。 需要开放 Docker 的端口,让我们在本地能连接上服务器的 Docker,这样,才能上传构建的镜像给 Docker。 开启远程访问 首先在服务器打开 Docker 的服务文件 vim /usr/lib/systemd/system/docker.service修改…

Java项目:基于SSM框架实现的实践项目管理系统(ssm+B/S架构+源码+数据库+毕业论文+开题报告)

一、项目简介 本项目是一套基于SSM框架实现的实践项目管理系统,主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的Java学习者。 包含:项目源码、数据库脚本等,该项目附带全部源码可作为毕设使用。 项目都经过严格调试&#xff…

使用Ollama和OpenWebUI在CPU上玩转Meta Llama3-8B

2024年4月18日,meta开源了Llama 3大模型[1],虽然只有8B[2]和70B[3]两个版本,但Llama 3表现出来的强大能力还是让AI大模型界为之震撼了一番,本人亲测Llama3-70B版本的推理能力十分接近于OpenAI的GPT-4[4],何况还有一个4…

罗德与施瓦茨RS SMR40 10MHZ-40GHZ信号分析仪

罗德与施瓦茨R&S SMR40 10MHZ-40GHZ信号分析仪 SMR40 被设计为具有脉冲调制功能的 CW 发生器。SMR40 具有 < 10 ms 2 ms /GHz 的极快频率切换时间和 0.1 Hz 的分辨率。SMR40 包含一个电子振荡器&#xff0c;该电路能够创建重复波形。 附加功能&#xff1a; 频率范围&a…

网页使用之如何返回json/xml

后端返回json数据给前端进行渲染的方式比较熟悉&#xff0c;至于返回html页面&#xff0c;返回xml的方式接触逐渐减少&#xff0c;来在项目中熟悉这一点。 返回文本数据 json姿势的返回实属最简单的方式&#xff0c;在SpringBoot应用中&#xff0c;有两种简单的方式 1.直接在…

【stomp 实战】spring websocket用户消息发送源码分析

这一节&#xff0c;我们学习用户消息是如何发送的。 消息的分类 spring websocket将消息分为两种&#xff0c;一种是给指定的用户发送&#xff08;用户消息&#xff09;&#xff0c;一种是广播消息&#xff0c;即给所有用户发送消息。那怎么区分这两种消息呢?那就是用前缀了…

Linux服务器安全基础 - 查看入侵痕迹

1. 常见系统日志 /var/log/cron 记录了系统定时任务相关的日志 /var/log/dmesg 记录了系统在开机时内核自检的信息&#xff0c;也可以使用dmesg命令直接查看内核自检信息 /var/log/secure:记录登录系统存取数据的文件;例如:pop3,ssh,telnet,ftp等都会记录在此. /var/log/btmp:记…

特斯拉与百度合作;字节正全力追赶AI业务;小红书内测自研大模型

特斯拉中国版 FSD 或与百度合作 根据彭博社的报道&#xff0c;特斯拉将通过于百度公司达成地图和导航协议&#xff0c;扫清在中国推出 FSD 功能的关键障碍。 此前&#xff0c;中国汽车工业协会、国家计算机网络应急技术处理协调中心发布《关于汽车数据处理 4 项安全要求检测情…

Jupyter Notebook 中使用虚拟环境的Python解释器

问题&#xff1a;创建虚拟环境&#xff0c;在pycharm中配置虚拟环境的Python解释器&#xff0c;然后在pycharm中打开ipynb&#xff0c;执行发现缺少包&#xff0c;但是虚拟环境中已经安装了 解决方式&#xff1a; 配置Jupyter Notebook 使用虚拟环境的Python解释器 1&#x…

Python 与 TensorFlow2 生成式 AI(二)

原文&#xff1a;zh.annas-archive.org/md5/d06d282ea0d9c23c57f0ce31225acf76 译者&#xff1a;飞龙 协议&#xff1a;CC BY-NC-SA 4.0 第四章&#xff1a;教授网络生成数字 在前一章中&#xff0c;我们涵盖了神经网络模型的构建基块。在这一章中&#xff0c;我们的第一个项目…

使用FPGA实现串-并型乘法器

介绍 其实我们知道&#xff0c;用FPGA实现乘法器并不是一件很简单的事&#xff0c;而且在FPGA中也有乘法器的IP核可以直接调用&#xff0c;我这里完全就是为了熟悉一些FPGA的语法然后写了这样一个电路。 串-并型乘法器模块 从字面上看&#xff0c;串-并乘法器就是其中一个乘数…