MySQL 外连接和内连接的查询优化怎么做?

目录

1. 表连接方式的分类和需要注意的细节

2. 表连接时底层做了什么事?

3. 左外连接优化方案

4. 内连接优化方案


1. 表连接方式的分类和需要注意的细节

多表连接查询,大体上可以分为内连接与外连接

内连接的意思就是把两个表有关联的部分都取出来,不分主表和次表,在连接时从我们的角度来说是不分谁是驱动表谁是被驱动表,但 MySQL 的查询优化器底层会做一个初步计算,计算出谁作为驱动表效率更高;

外连接则又分为左外连接,右外连接,满外连接(全外连接)。左外连接和右外连接中是分主表和此表的,所以本篇文章中点来说左外连接与右外连接的优化策略。

左外连接中左表是主表,也就是驱动表,右表作为从表,也就是被驱动表;语法为"表A LEFT JOIN 表B ON 查询条件";

右外连接中右表是主表,作为驱动表,右表是从表,作为被驱动表;语法为"表A RIGHT JOIN 表B ON 查询条件";

2. 表连接时底层做了什么事?

在没有任何索引的情况下,当两张表在进行连接查询操作的时候,实际上底层做的第一件事就是拿出驱动表一条记录与被驱动表的所有记录去做匹配,看是否满足条件,匹配完毕之后,再拿出驱动表的第二条记录与被驱动表的所有记录去做匹配,看是否有满足条件的记录,以此类推,直到驱动表所有记录均与被驱动表的所有记录进行过匹配并得出了满足条件的结果,两张表的连接查询的第一步连接操作就完成了。大致过程如下图所示

3. 左外连接优化方案

(1)小表驱动大表

通过上面表连接时进行匹配可以看出,两个表在进行连接查询时,驱动次数与驱动表的数据量有关,A表的数据量越少,与B表进行驱动的次数越少,所以第一种优化左外连接的方法就是将数据量小的表作为驱动表,让数据量小的表去与数据量大的表进行匹配,就可以减少驱动次数;

(2)给被驱动表的匹配字段添加索引

如下是 employee 员工表和 department 部门表,部门表的主键 部门id 

SELECT e.employee_id,d.department_id
FROM employees e LEFT JOIN departments d
ON e.department_id = d.department_id;

驱动表与被驱动表进行匹配时,连接条件是 查询条件字段 = 某个值。本例子中就是 员工表中的部门 id = 部门表中的部门 id。

没有给被驱动表的匹配字段添加索引:取出驱动表的一条数据,确定查询字段为 id = 12,那么与被驱动表匹配查询时,就是挨个将被驱动表中的每条数据取出做判断,看被驱动表的 id 是否为12,这其实就是一个全表扫描的过程。假设 employee 表中有20条数据,deparement 部门表中有30条数据,最坏的情况需要匹配 20 * 30 = 600 次,最好的情况是每次取出被驱动表第一条数据恰好能匹配到,只需要匹配20次。

用时间复杂度来表示就是驱动表时间复杂度O(n) * 被驱动表时间复杂度O(n) = O(n^2);索引没有索引时两表连接查询的时间复杂度为O(n^2),三表连接查询就是O(n^3),随着表数量增多,时间复杂度指数级增长。

给被驱动表的匹配字段添加了索引:接着刚才的说,如果被驱动表中给 id 字段添加了索引,那么被驱动表就可以精准查找 id = 12 的这条记录是否存在,查询不到则说明没有返回空,这样就不需要对被驱动表做全表扫描,省去了大量的时间。这里被驱动表的查询字段如果是主键索引,那么B+树的叶子节点就存有完整的数据,如果被驱动表的查询字段是非主键索引,那么就需要进行一次徽标查询操作,每次驱动只需要在 department 部门被驱动表中进行一次查询,效率得到了很大的提升。

用时间复杂度来表示驱动表扫描数据时间复杂度O(n),被驱动表主键索引时时间复杂度为O(logn),非主键索引回表操作时间复杂度为2O(logn),因此有索引时时间复杂度为O(nlogn),比没有索引的O(n^2)降低了很多;

(3) 若有WHERE查询条件,给WHERE查询字段添加索引

假如说在两个表进行了多表连接查询之后,我们还需要进一步的做过滤,一般都会在WHERE中添加过滤条件,此时想要进一步提高SQL的执行效率,就可以给WHERE查询条件的字段上添加索引。如果不加索引就会向上面一样进行一个全表扫描,取出每一条表连接之后的数据与WHERE的查询条件做匹配,加了索引就可以精确判断,迅速过滤掉无用的数据,提高性能。

(4)表连接查询查询条件字段类型一定要保持一致

如果不保持一致,就算我们为被驱动表添加了索引,索引也是失效的,因为数据类型不一致,所以数据库底层就需要全表扫描将每条数据都拿出来,然后先进行数据类型的转换,再去做条件的匹配,因此一定要注意,多表连接查询查询条件的字段类型一定要保持一致,否则会因为隐式类型转换导致索引失效。

4. 内连接优化方案

首先需要明确的一点是,内连接查询表面上是不分主表和此表的,默认来说左边的表就是驱动表,右边的表就是被驱动表。但在执行查询之前,SQL优化器会从和判断查询字段是否存在索引和两张表那个表数据量较少,会选出一个数据量小的作为驱动表,选出查询字段有索引的作为被驱动表。

如下图,是我数据库中的 employee员工表和 department 部门表,

department 部门表中有27条数据,

department_id 是主键,有数据库默认生成的主键索引

employee 员工表中有107条数据;

 在 employee 员工表中,我们给 department_id 外键添加普通索引

现在两个表中都有 department_id 的索引, 

如下SQL语句,使用 explain 关键字显示查询计划,我们将 employee 写在坐标作为驱动表,将department 部门表作为被驱动表,看看 employee 会作为驱动表吗

EXPLAIN SELECT e.employee_id,d.department_id
FROM employees e INNER JOIN departments d
ON e.department_id = d.department_id;

可以观察到,虽然SQL语句中将 employee 写在左边作为驱动表,但 explain 执行计划中显示实际执行SQL语句的时候会将 department 作为驱动表,为什么呢?

因为 department 表中只有27条数据,比employee 表的107条数据少得多,能大大减少驱动次数,提高效率,所以内连接查询中,基本上都是哪个数据量少哪个表作为驱动表。

因此在实际开发设计表的时候,如果需要涉及到多表查询,应该尽量在数据量多的表(被驱动表)中经常需要查询的字段上添加索引,可以大大降低表连接查询匹配消耗的时间。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/160719.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

cmake find_package、引用GDAL 初步学习

上次的源码的CMakeLists.txt文件里有 find_package(GDAL REQUIRED) 这句; 从字面意思看此源码需要GDAL库; 查了一下,find_package 指令的基本功能是查找第三方库,并返回其细节; 我当前GDAL安装在D:\GDAL; 先把它的CMakeLists.txt重命名为别的,不使用; 新建一个C…

C++:set和map的使用

set和map的使用 1.关联式容器2.key模型和key_value模型3.set3.1一些注意点3.2set的使用3.3习题 4.multiset5.map5.1一些注意点5.2map的使用5.3习题 6.multimap 1.关联式容器 序列式容器:比如我们之前讲的vector、string、list等均为序列式容器,特点是按…

ubuntu中如何设置中文输入

文章目录 1.找到设置(settings)2.找到keyboard3.点击Chinese,选择intelligent pinyin,并点击add4.打开浏览器测试一下 1.找到设置(settings) 2.找到keyboard 3.点击Chinese,选择intelligent pin…

项目实战:通过axios加载水果库存系统的首页数据

1、创建静态页面 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>Title</title><link rel"stylesheet" href"style/index.css"><script src"script/axios.mi…

Go语言与Python语言的性能比较

目录 一、背景与意义 二、执行速度 三、内存消耗 四、并发性能 五、编译速度与开发效率 六、综合考虑 七、应用场景 八、未来发展趋势 总结 一、背景与意义 在编程世界中&#xff0c;Go语言和Python语言都占有一席之地。Go语言是由Google开发的&#xff0c;其设计初衷…

升级 MacOS 系统后,playCover 内游戏打不开了如何解决

我们有些小伙伴在升级了 macOS 系统后大概率会遇到之前能够正常使用的 playCover 突然游戏打不开了&#xff0c;最近 mac 刚刚正式推出了 MacOS 14.1 ,导致很多用户打开游戏会闪退&#xff0c;我们其实只需要更新一下 playCover 就可以解决 playCover 正式版更新会比较慢所以我…

LInux之在同一Tomcat下使用不同的端口号访问不同的项目

&#x1f389;&#x1f389;欢迎来到我的CSDN主页&#xff01;&#x1f389;&#x1f389; &#x1f3c5;我是君易--鑨&#xff0c;一个在CSDN分享笔记的博主。&#x1f4da;&#x1f4da; &#x1f31f;推荐给大家我的博客专栏《LInux实战开发》。&#x1f3af;&#x1f3af; …

ruby语言怎么写个通用爬虫程序?

Ruby语言爬虫是指使用Ruby编写的网络爬虫程序&#xff0c;用于自动化地从互联网上获取数据。其中&#xff0c;CRawler是一个基于文本的小型地牢爬虫&#xff0c;它被设计为可扩展&#xff0c;所有游戏数据均通过JSON文件提供&#xff0c;程序仅处理游戏引擎。除此之外&#xff…

spring入门程序

2023.11.4 今天学习了一下spring的简单使用。 首先需要配置一下spring context和junit的依赖&#xff0c;在pom.xml文件中添加&#xff1a; <dependency><groupId>org.springframework</groupId><artifactId>spring-context</artifactId><ver…

Cube MX 开发高精度电流源跳坑过程/SPI连接ADS1255/1256系列问题总结/STM32 硬件SPI开发过程

文章目录 概要整体架构流程技术名词解释技术细节小结 概要 1.使用STM32F系列开发一款高精度恒流电源&#xff0c;用到了24位高精度采样芯片ADS1255/ADS1256系列。 2.使用时发现很多的坑&#xff0c;详细介绍了每个坑的具体情况和实际的解决办法。 坑1&#xff1a;波特率设置…

Node.js 中解析 HTML 的方法介绍

在 Web 开发中&#xff0c;解析 HTML 是一个常见的任务&#xff0c;特别是当我们需要从网页中提取数据或操作 DOM 时。掌握 Node.js 中解析 HTML 的各种方式&#xff0c;可以大大提高我们提取和处理网页数据的效率。本文将介绍如何在 Node.js 中解析 HTML。 基本概念 HTML 解析…

详解IPD需求分析工具$APPEALS

够让企业生存下去的是客户&#xff0c;所以&#xff0c;众多企业提出要“以客户为中心”&#xff0c;那如何做到以客户为中心&#xff1f;IPD中给出的答案是需求管理。 需求管理流程&#xff0c;是IPD&#xff08;集成管理开发&#xff09;体系中的四大支撑流程之一&#xff0…