16 “count(*)“ 和 “count(1)“ 和 “count(field1)“ 的差异

前言

经常会有面试题看到这样的问题 “ select count(*) ”, “ select count(field1) ”, “ select count(1) ” 的效率差异啥的

然后 我们这里 就来探索一下 这个问题

我们这里从比较复杂的 select count(field1) 开始看, 因为 较为复杂的处理过程 会留一下一些关键的调试的地点, 然后根据这些地点去参照看一下 其他的查询 在这些地点分别都是怎么做的?

 

 

“ select count(field1) ” 的实现

首先是语法解析这边, 将 field1 解析为一个 PTI_in_sum_expr 里面包含了 field1 的 token 和 location 等等 

0303b8a80115467189848a8849e37f77.png

 

然后就是后面将 PTI_in_sum_expr resolve 成为 Item_field, 当然 这里也仅仅是维护了 field1 的 token 的相关信息, 后面才会填充 table 等等信息 

bc893b0e88f24cb69fc8ed04cac85542.png

 

然后是根据上下文填充目标字段的 table 的信息, field 的信息 

537342954bc6422cabcd41d6fc4e73af.png

 

然后就是迭代符合条件的记录, 然后根据给定的字段是否为空的信息, 来判断是否统计计数 

80e999c8cf56423f9d3c742c440532e3.png

 

然后判断 是否为空的标准为, 字段值是否是 NULL 

对应的处理方式如下 

5c450f93492e47c5b893b96b16c1a0ff.png

 

 

“ select count(*) ” 的实现

首先是语法解析这边, 将 * 解析为 NULL, 这里上下文包含了 location 的相关信息

2370993fab754f268dcbab01d77baf17.png

 

sql 解析完成之后, args[0] 之前为 NULL, 被更新为了 “Item_int(0)”

b6c5d5dcd6b84e16b8f8639de8022f4f.png

 

然后 setup_fields 这边, 没有做 太多的事情, Item_int 这边的 fix_fields 这边是走的默认处理 Item::fix_fields

d3c0cbc85f554bcbbaaa03675de45d3f.png

 

Item::fix_fields 的处理如下, 仅仅是一个标记的更新 

ad2aa5e465274d5c9b8b850b19497f31.png

 

然后就是迭代符合条件的记录, 然后根据给定的字段是否为空的信息, 来判断是否统计计数 

60bf166d50a84834b63592278dcdacf5.png

 

判断是否为空的判断标注哪位, 恒不为空 

类似于一个基本数据类型的 int 值为 0, 恒不为 NULL

eae65e9f9b6a4f8593acb27cf25e1f44.png

 

 

“ select count(1) ” 的实现

首先是语法解析这边, 将 1 解析为 PTI_in_sum_expr 里面 PTI_num_literal_num 包含了长了常量 ”1”, 这里上下文包含了 location 的相关信息

68dc01aca8c84d92b0cb60b4e1942a5c.png

 

然后 setup_fields 这边, 没有做 太多的事情, Item_int 这边的 fix_fields 这边是走的默认处理 Item::fix_fields

3b8300ff1c6a4980b16e95495da32e51.png

 

然后就是迭代符合条件的记录, 然后根据给定的字段是否为空的信息, 来判断是否统计计数 

PTI_num_literal_num 这边判断为不为空的方式也是基于 Item::is_null, 也是恒不为空 

dc45b9884d904875b3bc01d1c69162ca.png

 

 

“ select count(“1“) ” 的实现

其他的我们就不去看了, 仅仅看一下 Item_sum_count::add 这边的上下文 

解析出来的 对象有所调整, 但是结果不变, PTI_text_literal_text_string 这边判断为不为空的方式也是基于 Item::is_null, 也是恒不为空 

0fb832d4f4fb49279f8d456f9d0017cc.png

 

 

“ select count(NULL) ” 的实现

其他的我们就不去看了, 仅仅看一下 Item_sum_count::add 这边的上下文 

解析出来的 对象有所调整, 但是结果不变, Item_null 这边判断为不为空的方式是基于 Item_null::is_null, 是恒为空 

因此 最终的查询结果为 0

85309490573347fba623e504312e7c87.png

 

然后 Item_null::is_null 的处理方式如下, 恒为空 

5e034727ea1a4f71bb04afd9d3d0e3dc.png

 

 

总结

大致可以分成两类, “ select count(field1) ” 和 ”其他select count” 

影响效率的差异主要在于 是否是全表扫描, 扫描的是聚簇索引还是非聚簇索引

假设是索引扫描, 则几者的差异并不大, 主要的差异在于 比较的时候前者复杂一点, 后者快一点, 但是扫描的记录数量有限, 效率影响不大 

假设是全表扫描, 主要的影响就是 “ select count(field1) ” 是走聚簇索引, 还是非聚簇索引了, 然后 “其他select count” 会优先选择较小的非聚簇索引, 造成的影响主要是 io 的开销, 走非聚簇索引所需要的 io 较小

 

 

完 

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/103900.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2022年03月 C/C++(六级)真题解析#中国电子学会#全国青少年软件编程等级考试

C/C++编程(1~8级)全部真题・点这里 第1题:多项式相加 我们经常遇到两多项式相加的情况, 在这里, 我们就需要用程序来模拟实现把两个多项式相加到一起。 首先, 我们会有两个多项式,每个多项式是独立的一行, 每个多项式由系数、 幂数这样的多个整数对来表示。 如多项式 2…

【RabbitMQ】介绍及消息收发流程

介绍 RabbitMQ 是实现 AMQP(高级消息队列协议)的消息中间件的一种,最初起源于金融系统,用于在分布式系统中存储转发消息,在易用性、扩展性、高可用性等方面表现不俗。 RabbitMQ 主要是为了实现系统之间的双向解耦而实…

FasterNet(PConv)paper笔记(CVPR2023)

论文:Run, Don’t Walk: Chasing Higher FLOPS for Faster Neural Networks 先熟悉两个概念:FLOPS和FLOPs(s一个大写一个小写) FLOPS: FLoating point Operations Per Second的缩写,即每秒浮点运算次数,或…

Linux之Shell概述

目录 Linux之Shell概述 学习shell的原因 shell是什么 shell起源 查看当前系统支持的shell 查看当前系统默认shell Shell 概念 Shell 程序设计语言 Shell 也是一种脚本语言 用途 Shell脚本的基本元素 基本元素构成: Shell脚本中的注释和风格 Shell脚本编…

【网络编程】IO多路复用

IO多路复用是一种高效的I/O处理方式,它允许单个进程能够同时监视多个文件描述符(sockets、文件等),并在其中任何一个文件描述符准备好进行I/O操作时进行处理。它的核心在于使用少量的线程或进程来管理多个I/O操作,以提…

消息队列基本原理和选型对比

消息队列使用场景 消息队列中间件是分布式系统中重要的组件,主要解决应用耦合,异步消息,削峰填谷等问题。实现高性能、高可用、可伸缩和最终一致性架构。 解耦:多个服务监听、处理同一条消息,避免多次 rpc 调用。 异步…

c语言开篇---跟着视频学C语言

标识符 标识符必须声明定义,可以是变量、函数或其他实体。 Int是标识符吗? 不是,int是c语言关键词,不是随意命名的 C语言关键词如下: 常量 不需要被声明,不能赋值更改。 printf函数 printf是由print打印…

202328读书笔记|《杨绛传:岁月流转,我心依然》——我和谁都不争,和谁争我都不屑。我爱大自然,其次就是艺术。

202328读书笔记|《杨绛传:岁月流转,我心依然》——我和谁都不争,和谁争我都不屑。我爱大自然,其次就是艺术 《杨绛传:岁月流转,我心依然》作者王臣。关于杨绛女士自传的书很多,她和钱钟书的爱情…

CSS_文字渐变

/* 定义渐变背景样式 */ .gradient-text {background-image: linear-gradient(to right, #ff0000, #00ff00); /* 渐变色范围 */background-clip: text; /* 应用渐变背景到文本 */-webkit-background-clip: text; /* Safari 和 Chrome 的前缀 */color: transparent; /* 将文本颜…

SpringBoot通过自定义注解实现日志打印

目录 前言: 正文 一.Spring AOP 1.JDK动态代理 2.Cglib动态代理 使用AOP主要的应用场景: SpringBoot通过自定义注解实现日志打印 一.Maven依赖 二.ControllerMethodLog.class自定义注解 三.Spring AOP切面方法的执行顺序 四.ControllerMethodL…

进阶C语言-指针的进阶(上)

指针的进阶 📖1.字符指针📖2.指针数组📖3.数组指针🎈3.1 数组指针的定义🎈3.2 &数组名VS数组名🎈3.3 数组指针的使用 📖4.数组参数、指针参数🎈4.1一维数组传参🎈4.2…

怎么扫码听音频?音频在线生码的方法

现在很多小伙伴喜欢听书而不是自己看,那么当我们想分享一段听书音频时,有什么的方法能够更快更好地来让其他人获取内容呢?想要提高传播的效率,那么制作音频二维码(音视频二维码制作-一键免费生成音视频二维码在线工具-…