mysql索引与优化问题

作为一个java程序员,mysql数据库面试应该是比较多的了;而关于数据库的面试,最多的就是性能问题,而以性能为起点,延伸出很多具体的问题。

我们使用第一性原理的方法来分析,为什么面试中一定会问数据库的索引问题。

数据的管理主要涉及到几个问题,数据的存储,使用以及安全等问题;那么为什么要使用数据库呢,文本文件通用可以实现数据等管理功能。

原因就是使用数据库管理数据,更加高效,简单,方便。

而随着现在互联网时代的发展,每天都会产生大量的数据,各大企业内部都存储了大量的用户,产品等相关的数据;

而怎么处理这些数据,怎么快速处理这些数据就成为了一个问题;所以,数据库技术就是其中比较重要的一个方面,而数据库的优化等问题,也理所当然的成为一个重要的问题。

数据库等性能优化主要涉及到以下几个方面:

1. sql语句的优化,主要是sql语句能命中索引,也就是索引的优化

2. 数据表结构的设计

3. 读写分离

3. 分库分表

从成本与效率来说,sql语句的优化 > 数据表结构的优化 > 读写分离 > 分库分表

从市场的实际情况来说,市面上大部分公司都是小型企业,并没有大型企业那种几十亿,甚至几百亿,千亿级别的数据量;所以对这些公司来说,主要使用的还是前两种方式,也就是数据表的设计,以及sql语句方面的优化;

1. sql语句优化

        sql语句的问题,本质上是索引的问题。

那索引到底是什么,为什么会有索引,索引解决了什么问题?

首先,索引的本质是一种数据结构,以常用的mysql为例,现在的mysql索引使用的是b+树,其本质是一种平衡二叉树,关于b+树的问题可以找一些数据结构的文章看一下。

至于为什么会有索引,以及索引解决了什么问题;

mysql数据库是一种关系型数据库,其数据库是由一张张数据表构成的;而数据表中会有一个一个的字段,也就是数据列;而每一行数据就是一条数据记录。

我们设想一下,如果没有索引会出现什么情况?

如下表所示,这就是一个典型的关系型数据库结构,里面存储了用户信息,包括编号,姓名和年龄。

编号姓名年龄
001张三30

而我们使用数据最常用的一个操作就是查询,比如查询张三的信息;而我们常规的查询方式是遍历,也就是查询这张表中所有的数据,然后进行匹配,匹配姓名叫张三的人。

而如果这个数据表中的数据很多怎么办,假如有几百万,几千万,甚至上亿的数据量;那么匹配起来要多长时间,而这在实际应用中是不被允许的;

所以,就有了索引的出现;所谓的索引就类似于字典和书籍的目录,我们可以根据目录更加快速的找到我们需要的内容。

而为什么说索引是一种数据结构呢?

就类似于书籍的目录,目录中有书本章节的标题,然后每个章节中还有小的节点,然后还有这些节点所在的页码。

同样,索引同样需要有数据的信息,以及数据所在的位置;比如,主键索引就会保存数据记录的主键id,以及当前数据所在的数据页。而保存这些索引的结构,就是b+树。

就像书本一样,内容是写在一页一页的纸上面;而数据库的数据保存在计算机的磁盘上面,而且也是通过页的方式进行保存的,这就是数据页。

而磁盘上的数据,需要加载到内存中才能使用;所以,如果没有索引的情况下,数据库查询数据时,就要每次加载一页数据到内存中进行匹配,如果没匹配到就继续从磁盘加载一页数据到内存,往复循环。

而我们知道,磁盘的io性能是很慢的, 而数据库性能瓶颈主要也在io上;所以,我们就要尽量减少数据库查询时io的次数。

而索引就解决了这个问题;就像我们看书一样,我们翻看书籍的目录,这样就可以直接找到内容所在的页数,直接翻到那一页,这样就不用频繁的io,提升了数据的查询效率。

为什么选择b+树作为索引的结构,那是因为b+树比较矮,比较胖,也就是说其节点层级比较少,这样最多三到四次的io就可以查到结果。具体的内容可以看一下为什么使用b+树作为索引的存储结构的文章。

而根据不同的索引类型,查询效率又不尽相同;比如,根据主键索引就可以快速定位的数据所在的位置;而普通索引,也叫二级索引可能会导致出现 回表 查询;

什么是 回表 查询?

回表查询就是,比如你使用姓名作为二级索引,这时b+树的非叶子结点上就保存的是用户的id和姓名;并不能直接查询到用户的信息。其具体流程是,根据姓名张三查找索引,在索引中查找到了一个或多个名字叫张三的人的信息,然后从这个信息中获取到了张三这个人的id,然后需要根据这个id 再次查询才能获取到用户的全部信息,比如性别,年龄,家庭住址等;

这个需要根据id再次查询用户信息的方式,就叫做回表,也就是要查询两次,第一次查询索引,第二次查询表数据。

也就是说二级索引并不能直接查询全部信息,需要通过id这个中间人,才能获取到用户的真实信息。而如果根据姓名查询到名叫张三的人有多个,这个可能需要多次回表查询才能得到真实的结果。

正常情况下,数据库会把我们写入的数据安装主键id进行排序,如果没有主键,那么就会把具有唯一索引的字段作为排序字段,如果这个字段也没有,那么mysql会自动给增加一个主键。

所以,如果使用主键排序的情况下,数据库会默认把我们写入的数据安装顺序排列在磁盘上,而且是连续的;这样根据局部数据原理,就能更快到找到所需要的数据;而如果我们使用uuid等随机数据作为主键,那么数据的存储就会东一个,西一个,导致数据读取的时候,出现随机读取,而在磁盘上,磁头就需要不断的“摇头”,也就是不断的去找磁盘上数据所在的位置。导致效率低下。

在mysql的索引实现中,数据库会把数据进行组队,比如1到5是一队,6到10是一队,这样在索引中就可以把每队最大值和最小值保存下来,这样查询的时候就可以使用二分法,判断当前数据是在那一队,这样更加快速的查询数据。而这些每队的节点就叫做——槽。

根据不同的实现方式,索引又分为主键索引,普通索引,联合索引,聚集索引,非聚集索引等。

而怎么分析sql语句是否命中索引,explain计划关键字,就可以查看当前sql语句的执行过程,以及是否命中索引,命中了那个索引。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/614879.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

70 个常用的GIS Python 库

由于其多功能性、广泛的库生态系统和用户友好的语法,Python 已成为地理信息系统 (GIS) 和遥感领域的主导语言。这个 70 个地理空间 Python 库的汇编展示了可用于 GIS 和遥感数据处理和分析的丰富工具包。 Python 在 GIS 中的重要性源于它处理复杂地理空间数据的能力…

【学习】软件测试人员使用Loadrunner进行性能测试的优势

在软件测试领域,性能测试是一项至关重要的环节,它关乎到软件系统的稳定性和用户体验。而在这其中,Loadrunner作为一款久经考验的性能测试工具,凭借其独特的优势,成为了众多企业和开发者眼中的“得力助手”。 首先&…

打造你的私有云盘:安全优先、支持分享 | 开源日报 No.222

nextcloud/server Stars: 25.2k License: AGPL-3.0 nextcloud/server 是一个安全的数据存储空间,可以存储文件、联系人、日历等,并在各设备之间同步。用户可以分享数据并通过应用商店扩展功能。该项目提供加密机制、HackerOne 悬赏计划和双因素认证以确…

2024阿里云学生服务器申请图文全流程,学生机免费续费攻略

2024年阿里云学生服务器免费申请,完成学生认证可以领取1个月免费学生机,完成任务可以再免费学费6个月时长,还可以领取高校计划学生300元无门槛优惠代金券,阿里云服务器网aliyunfuwuqi.com整理2024年最新阿里云大学生服务器申请入口…

2024年重庆市三支一扶考试报名详细流程

2024年重庆市三支一扶考试报名详细流程

【vue】defineEmits 传值 子传父

先行知识 【vue】导入组件【vue】defineProps 传数据 父传子 传值流程 App.vue <template><Header getWeb"emitsGetWeb" userAdd"emitsUserAdd"/><hr /><p>web.name: {{ web.name }}</p><p>web.url: {{ web.url }}&…

STL函数对象

1&#xff0c;函数对象 1.1 函数对象概念 概念&#xff1a; 重载函数调用操作符的类&#xff0c;其对象常称为函数对象函数对象使用重载的&#xff08;&#xff09;时&#xff0c;行为类似函数调用&#xff0c;也称为仿函数 本质&#xff1a; 函数对象&#xff08;仿函数&…

【网站项目】数学辅导微信小程序

&#x1f64a;作者简介&#xff1a;拥有多年开发工作经验&#xff0c;分享技术代码帮助学生学习&#xff0c;独立完成自己的项目或者毕业设计。 代码可以私聊博主获取。&#x1f339;赠送计算机毕业设计600个选题excel文件&#xff0c;帮助大学选题。赠送开题报告模板&#xff…

数据结构速成--数据结构和算法

由于是速成专题&#xff0c;因此内容不会十分全面&#xff0c;只会涵盖考试重点&#xff0c;各学校课程要求不同 &#xff0c;大家可以按照考纲复习&#xff0c;不全面的内容&#xff0c;可以看一下小编主页数据结构初阶的内容&#xff0c;找到对应专题详细学习一下。 目录 一…

Linux 使用 ifconfig 报错:Failed to start LSB: Bring up/down networking

一、报错信息 在运行项目时报错数据库连接失败&#xff0c;我就想着检查一下虚拟机是不是 Mysql 服务忘了开&#xff0c;结果远程连接都连接不上虚拟机上的 Linux 了&#xff0c;想着查一下 IP 地址看看&#xff0c;一查就报错了&#xff0c;报错信息&#xff1a; Restarting…

前端Vue中基于uQRCode的二维码生成插件:从入门到精通的应用与实践(适配Vue3)

前端Vue中基于uQRCode的二维码生成插件&#xff1a;从入门到精通的应用与实践(适配Vue3) 在数字化时代&#xff0c;二维码作为一种信息传递的便捷方式&#xff0c;已经渗透到我们生活的方方面面。无论是微信扫码支付、网页链接跳转&#xff0c;还是广告宣传、身份验证等场景&am…

基于Whisper语音识别的实时视频字幕生成 (一): 流式显示视频帧和音频帧

Whishow Whistream&#xff08;微流&#xff09;是基于Whisper语音识别的的在线字幕生成工具&#xff0c;支持rtsp/rtmp/mp4等视频流在线语音识别 1. whishow介绍 whishow&#xff08;微秀&#xff09;是python实现的在线音视频流播放器&#xff0c;支持rtsp/rtmp/mp4等流式输…