窗口函数-分组排序:row_number()、rank() 、dense_rank()、ntile()

窗口函数语法结构:

分析函数() over(partition by 分组列名 order by 排序列名 rows between 开始位置 and 结束位置)

开窗函数和聚合函数区别:
聚合函数会对一组值进行计算并返回一个值,常见的比如sum(),count(),max(),min(), avg(),会与group by一起使用。

注意其中只有count不忽略null值,COUNT(a):返回非空值的数量。COUNT(*):返回所有行的数量(不区分空值)。
count(0)=1

ROW_NUMBER()

有些场景比如求各个班或各个学科的前几名,这时候需要每一组返回多个值,就需要开窗函数解决。
比如现在有一部分学生成绩,来自不同的班级:
求所有人中的前几名学生:
首先想到SELECT * FROM temp ORDER BY sroce DESC 这是对分数倒序排序,如果想只要前几名名,需要生成一个序号,所以使用ROW_NUMBER()。不分组

SELECT name,class,score, ROW_NUMBER() OVER(ORDER BY score DESC) mm FROM temp

如果对于班级分组加上PARTITION BY class

SELECT name,class,score 
FROM ( SELECT name,class,score, RANK() OVER(PARTITION BY class ORDER BY score) mm FROM temp ) a WHERE mm = 1;

这里引用博客:[窗口函数over](https://blog.csdn.net/qq_55342245/article/details/122300899)的例子
在这里插入图片描述

RANK() DENSE_RANK()

进一步,如果只要第一名,或者最后一名就不能用row_number(),因为如果同班有两个并列第一,mm=1就只返回一个结果。使用RANK()
查询每个班的第一名的成绩:

SELECT name,class,score 
FROM (SELECT name,class,score, RANK() OVER(PARTITION BY class ORDER BY score DESC) mm FROM TEMP ) a WHERE mm = 1;

RANK()在处理相同值时序号一样,但是会占位,排名可能是:12225
DENSE_RANK()在处理相同值时序号一样,但是不会占位,数字连续出现:12223

NTILE()

NTILE函数是用来将数据切割成指定数量的桶(buckets),并将每个数据行分配到对应的桶中。它可用于将数据划分为相等的小切片,为每一行分配该小切片的数字序号。

NTILE不支持ROWS BETWEEN,比如NTILE(2) OVER(PARTITION BY dept_no ORDER BY salary ROWS BETWEEN 3 PRECEDING - AND CURRENT ROW)。

搬运一些例子便于理解:

SELECT name, dept_no, salary,ntile(2) over(order by salary) n1,-- 全局按照salary升序排列,数据切成2份ntile(2) over(partition by dept_no order by salary) n2, -- 按照dept_no分组,在分组内按照salary升序排列,数据切成2份ntile(3) over(partition by dept_no order by salary) n3 -- 按照dept_no分组,在分组内按照salary升序排列,数据切成3份
FROM data;

对于第三个例子:
NTILE(3) OVER(PARTITION BY dept_no ORDER BY salary)是根据dept_no列进行分组,意味着每个部门的数据会独立进行切割成3份。数据在每个分组内根据salary排序,然后再将排序后的数据切割成3份,并且每份数据的大小相对均匀。

在这里插入图片描述

————————————————
参考自:窗口函数之ntile()函数讲解https://blog.csdn.net/godlovedaniel/article/details/116571187

总结&区别

select ROW_NUMBER()over(order by name) as 排序,* from temp
— 排序,即使值一样,也不会重复排序。例如1,2,3,4,5
select RANK()over(order by name) as 排序,* from temp
— 排序,值一样,就重复排序,有间隙。例如1,1,3,4
select DENSE_RANK()over(order by name) as 排序,* from temp
— 排序,值一样,就重复排序,没有间隙。例如1,1,2,2,3,4,5
select NTILE(2)over(order by name) as 排序,* from temp
— 排序,分成2组。此函数一般用于取表中前百分之几的数据。例如,取数据的前25%就将数据分4组,然后字段的条件是等于1。

在这里插入图片描述
这里引用博客:[窗口函数over](https://blog.csdn.net/qq_55342245/article/details/122300899)的例子

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/107114.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Autojs 小游戏实践-潮玩宇宙开扭蛋

概述 最近在玩潮流宇宙,里面有扭蛋兔的一个玩法,开始有很多蛋,需要我们一个个点开,然后根据装备品质替换分解,潮流提供了自动开扭蛋功能,但是开到品质比自己装备好的时候回暂停,由于个人懒得看…

Java密码学之数字签名

密码系统是加密技术及其附带基础工具的实现,以提供信息安全服务。基本密码系统的各种组件是明文,加密算法,密文,解密算法,加密密钥和解密密钥。其中加密密钥和解密密钥是: 加密密钥是发件人已知的值。发送…

《向量数据库指南》——向量数据库内核面临的技术挑战及应对措施

最近一年,以 ChatGPT、LLaMA 为代表的大语言模型的兴起,将向量数据库的发展推向了新的高度。 向量数据库是一种在机器学习和人工智能领域日益流行的新型数据库,它能够帮助支持基于神经网络而不是关键字的新型搜索引擎。向量数据库不同于传统的…

CMake+CLion+Qt配置

在这里我下载MSVC的工具包,并没有下载Visual Studio。 配置编译环境 下载Visual Studio,其中有MSVC编译工具,下载MSVC工具包, 工具包下载链接:https://visualstudio.microsoft.com/zh-hans/visual-cpp-build-tools/ …

第5篇 vue的通信框架axios和ui框架-element-ui以及node.js

一 axios的使用 1.1 介绍以及作用 axios是独立于vue的一个项目,基于promise用于浏览器和node.js的http客户端。 在浏览器中可以帮助我们完成 ajax请求的发送在node.js中可以向远程接口发送请求 1.2 案例使用axios实现前后端数据交互 1.后端代码 2.前端代码 &…

Linux 下 C语言版本的线程池

目录 1. 线程池引入 2. 线程池介绍 3. 线程池的组成 4. 任务队列 5. 线程池定义 6. 头文件声明 7. 函数实现 8. 测试代码 1. 线程池引入 我们使用线程的时候就去创建一个线程,这样实现起来非常简便,但是就会有一个问题:如果并发的线程数…

循环购模式:一种新型的电商模式,让你的生意更轻松

你是否想过,你的商品能够以一种更高效、更环保、更有趣的方式销售给顾客?你是否想过,你的顾客能够以一种更低成本、更高回报、更多互动的方式享受你的商品?如果你的答案是肯定的,那么你一定要了解一下循环购模式。 循环…

IDEA的快捷键大全

快捷键 说明 IntelliJ IDEA 的便捷操作性,快捷键的功劳占了一大半,对于各个快捷键组合请认真对待。IntelliJ IDEA 本身的设计思维是提倡键盘优先于鼠标的,所以各种快捷键组合层出不穷,对于快捷键设置也有各种支持,对…

floodfill算法(洪水灌溉算法)

一)floodfill算法简介: 二)图像渲染 733. 图像渲染 - 力扣(LeetCode) class Solution {int[] dx {1, 0, 0, -1};int[] dy {0, 1, -1, 0};//上下搜索的时候要使用向量数组int row0;int col0;int target0;public void dfs(int[][] image,int i,int j,int…

STC15/8单片机特有的PWM寄存器和普通定时器实现PWM输出

STC15/8单片机特有的PWM寄存器和普通定时器实现PWM输出 🌿主要针对STC15W4型号特有的6通道15位专门的高精度PWM。 🌿STC8系列 ✨STC15W4K32S4系列单片机具有6通道15位专门的高精度PWM(带死区控制)和2通道CCP(利用它的高速脉冲输出功能可实现11~16位PWM);(STC15F/L2K60S2系…

Mysql同步数据到Doris的踩坑过程

问题背景 由于项目需要,需要把多个Mysql数据库的数据同步到Doris数据库,然后利用Doris强调的计算和查询能力,来满足业务需求。有关Doris可以查看它的官方文档来了解它。 seatunnel的使用到放弃 缘起 从《第十届GIAC全球互联网架构大会》了…

口袋参谋:淘宝不限类目,透视竞品实时销量!快试试这个插件

​在运营一家店铺之前,可以先了解各类目宝贝的市场行情,及时掌握不同类目宝贝的价格、销售情况,根据需求制定出属于自己的营销策略。 【可跨类目竞店透视】功能: 支持一键获取任意店铺宝贝概况信息 【跨类目竞店透视】功能使用 …