数据结构-堆排序及其复杂度计算

目录

1.堆排序

1.1 向上调整建堆

1.2 向下调整建堆

2. 两种建堆方式的时间复杂度比较

2.1 向下调整建堆的时间复杂度

2.2 向上调整建堆的时间复杂度

Topk问题


上节内容,我们讲了堆的实现,同时还包含了向上调整法向下调整法,最后我们用堆实现了对数据的排序:

int main()
{HP hp;HeapInit(&hp);int arr[] = { 65,100,70,32,50,60 };int i = 0;for (i = 0; i < sizeof(arr) / sizeof(int); i++){HeapPush(&hp, arr[i]);}while (!HeapEmpty(&hp)){HeapDatatype top = HeapTop(&hp);printf("%d ", top);HeapPop(&hp);}return 0;
}

那以上代码能实现对数据的排序吗?

答案是可以的,但是以上方式有两个弊端

1. 要先写一个堆,太麻烦

2. 空间复杂度+拷贝数据。

1.堆排序

上节内容中,用堆对数据进行排序,是将数据一个一个插入堆,然后再调整排序的,那我们能不能直接把数据就建成一个堆?

当然可以,建堆有两种方式:向上调整建堆、向下调整建堆

1.1 向上调整建堆

我们先来讲向上调整建堆

向上调整建堆其实还是插入堆的逻辑,要求前面的数据必须是一个堆,下标从1开始是因为一个数据本身就可以被看做一个堆,然后向上调整。 

下图就是我们对一个数组数据进行向上调整建堆后的结果,可以看出来,此时我们建的是一个小堆: 

现在问题来了,我们要把数据排为升序,建大堆还是建小堆好?

先说结论:升序 -- 建大堆    降序 -- 建小堆。 

假设我们要得到升序,此时又建的是小堆,那我们就把选出的最小的数据放在下标为0的位置,要想继续选出次小的数据放在下标为1的位置,就要把剩下的数据看做堆,这样堆的关系就全乱了,只能重新建堆,代价太大。

而如果我们建大堆,向下调整选出最大的数据,首尾交换,把最大的数据放在最后一个下标的位置,然后隔离最后一个数据,把其他数据看做一个堆,再向下调整选出次大的,首尾交换......直到所有的数据被排好序,此时得到的就是数据升序。

代码如下:

#define  _CRT_SECURE_NO_WARNINGS 1
#include<stdio.h>typedef int HeapDatatype;swap(HeapDatatype* p1, HeapDatatype* p2)
{HeapDatatype tmp = *p1;*p1 = *p2;*p2 = tmp;
}
//向上调整法
void AdjustUp(HeapDatatype* a, int child)
{int parent = (child - 1) / 2;while (child > 0){if (a[parent] < a[child]){HeapDatatype p = a[parent];a[parent] = a[child];a[child] = p;child = parent;parent = (child - 1) / 2;}else{break;}}
}
//向下调整法
void AdjustDown(HeapDatatype* a, int n, int parent)
{int child = parent * 2 + 1;while (child < n){if (child + 1 < n && a[child] < a[child + 1]){child++;}if (a[parent] < a[child]){swap(&a[parent], &a[child]);parent = child;child = parent * 2 + 1;}else{break;}}
}
//堆排序
void HeapSort(int* a, int n)
{//建堆 - 向上调整建堆for (int i = 1; i < n; i++){AdjustUp(a, i);}//向下调整得到次大数据int end = n - 1;while (end > 0){swap(&a[0], &a[end]);AdjustDown(a, end, 0);end--;}
}int main()
{int a[] = { 7,8,3,5,1,9,5,4 };HeapSort(a, sizeof(a) / sizeof(int));return 0;
}

我们建的是大堆,最后得到的就是升序: 

要得到数据降序,就要建小堆,向下调整选出最小的数据,首尾交换,把最小数据放在最后一个下标的位置,隔离最后一个数据,把其他数据看做一个堆,再向下调整选出次小的数据,首尾交换......直到所有数据都被拍好序,这就得到数据降序。

代码如下:(只需将向下调整和向上调整中的'<'改为'>'即可

#define  _CRT_SECURE_NO_WARNINGS 1
#include<stdio.h>typedef int HeapDatatype;swap(HeapDatatype* p1, HeapDatatype* p2)
{HeapDatatype tmp = *p1;*p1 = *p2;*p2 = tmp;
}
//向上调整法
void AdjustUp(HeapDatatype* a, int child)
{int parent = (child - 1) / 2;while (child > 0){if (a[parent] > a[child]){HeapDatatype p = a[parent];a[parent] = a[child];a[child] = p;child = parent;parent = (child - 1) / 2;}else{break;}}
}
//向下调整法
void AdjustDown(HeapDatatype* a, int n, int parent)
{int child = parent * 2 + 1;while (child < n){if (child + 1 < n && a[child] > a[child + 1]){child++;}if (a[parent] > a[child]){swap(&a[parent], &a[child]);parent = child;child = parent * 2 + 1;}else{break;}}
}
//堆排序
void HeapSort(int* a, int n)
{//建堆 - 向上调整建堆for (int i = 1; i < n; i++){AdjustUp(a, i);}//向下调整得到次小数据int end = n - 1;while (end > 0){swap(&a[0], &a[end]);AdjustDown(a, end, 0);end--;}
}int main()
{int a[] = { 7,8,3,5,1,9,5,4 };HeapSort(a, sizeof(a) / sizeof(int));return 0;
}

由于我们建的是小堆,所以得到的就是数据降序: 

注意:不论是升序还是降序,数据都是从后往前放的,这样就不会使堆的关系混乱。 

1.2 向下调整建堆

我们可以看到,堆排序使用向上调整建堆,还要写两个函数:向下调整函数、向上调整函数

那我们想用一个向下调整函数就解决问题呢?

这就需要向下调整建堆

向下调整建堆要求根节点的左右子树都是大堆(小堆),如果左右子树不满足大堆,我们只需要确保左右子树的左右子树是大堆(小堆)即可,如果又不是,我们再往下找,所以只要使所有父节点的左右子树都是大堆(小堆)就行,那我们就倒着调整,因为叶子节点本身就是一个堆,所以不需要调整,那就从最后一个节点的父节点开始调整

代码如下:

#define  _CRT_SECURE_NO_WARNINGS 1
#include<stdio.h>typedef int HeapDatatype;swap(HeapDatatype* p1, HeapDatatype* p2)
{HeapDatatype tmp = *p1;*p1 = *p2;*p2 = tmp;
}//向下调整法
void AdjustDown(HeapDatatype* a, int n, int parent)
{int child = parent * 2 + 1;while (child < n){if (child + 1 < n && a[child] > a[child + 1]){child++;}if (a[parent] > a[child]){swap(&a[parent], &a[child]);parent = child;child = parent * 2 + 1;}else{break;}}
}
//堆排序
void HeapSort(int* a, int n)
{//建堆 - 向下调整建堆for (int i = (n - 1 - 1) / 2; i >= 0; i--){AdjustDown(a, n, i);}int end = n - 1;while (end > 0){swap(&a[0], &a[end]);AdjustDown(a, end, 0);end--;}
}int main()
{int a[] = { 7,8,3,5,1,9,5,4 };HeapSort(a, sizeof(a) / sizeof(int));return 0;
}

代码中int i=(n-1-1)/2是通过孩子找父亲的下标,n是数组大小,先减一得到最后一个下标,再减一除以二得到最后一个孩子的父节点。 

这就是向下调整建堆,以后我们用的都是向下调整建堆,不再使用向上调整建堆,这两种方式不仅代码量上有差距,时间复杂度上也有差距,向下调整建堆的时间复杂度更小。

2. 两种建堆方式的时间复杂度比较

2.1 向下调整建堆的时间复杂度

前文中我们知道了,向下调整建堆要保证每个父节点的左右子树都是大堆(小堆),所以我们在调整的时候是从下往上进行的,而最后一层的每个叶节点本身就可以看做一个堆,不用调整,从它们的父节点开始调整(即倒数第二层开始调整),所以时间复杂度如下:

总步数 = ∑(每一层的节点数*该节点需要调整的层数)

2.2 向上调整建堆的时间复杂度

向上调整和向下调整刚好相反,向下调整时,第h-1行的2^(h-2)个节点需向下调整1层,而向上调整时,第h-1行的2^(h-1)个节点需要向上调整h-2,向下调整是大乘小、小乘大,而向上调整时大乘大、小乘小,时间复杂度如下:

以上就是向上调整建堆和向下调整建堆的时间复杂度,那我们整个堆排序的过程的时间复杂度是多少呢?

堆排序过程中,除了建堆还有向下调整选数,当选数时,要首尾交换,交换一次,从头向下调整一次, 所以第h行的2^(h-1)个节点,每次首尾交换时都要调整(h-1)次,一共2^(h-1)*(h-1),由此可见,选数据过程中的时间复杂度和向上调整建堆的时间复杂度保持一致,即为O(N*logN)

所以堆排序整体的时间复杂度是:建堆+选数 = O(N+N*logN),即O(N*logN)。

Topk问题

TOP-K问题:即求数据结合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。
比如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。
对于Top-K问题,能想到的最简单直接的方式就是排序,但是:如果数据量非常大,排序就不太可取了(可能数据都不能一下子全部加载到内存中)。最佳的方式就是用堆来解决,基本思路如下:

1. 用数据集合中前K个元素来建堆
前k个最大的元素,则建小堆
前k个最小的元素,则建大堆
2. 用剩余的N-K个元素依次与堆顶元素来比较,不满足则替换堆顶元素
将剩余N-K个元素依次与堆顶元素比完之后,堆中剩余的K个元素就是所求的前K个最小或者最大的元素。

比如:我们要找10000个数中的前K个最小的数,就把先把前K个数建小堆,然后把用剩余的N-K个元素依次与堆顶元素来比较,不满足则替换堆顶元素 

代码如下:

#define  _CRT_SECURE_NO_WARNINGS 1
#include<stdio.h>
#include<time.h>
#include<stdlib.h>//Top-K问题
typedef int HeapDatatype;swap(HeapDatatype* p1, HeapDatatype* p2)
{HeapDatatype tmp = *p1;*p1 = *p2;*p2 = tmp;
}
//向下调整法
void AdjustDown(HeapDatatype* a, int n, int parent)
{int child = parent * 2 + 1;while (child < n){if (child + 1 < n && a[child] > a[child + 1]){child++;}if (a[parent] > a[child]){swap(&a[parent], &a[child]);parent = child;child = parent * 2 + 1;}else{break;}}
}
void CreateNDate()
{// 造数据int n = 10000;srand(time(0));const char* file = "data.txt";FILE* fin = fopen(file, "w");if (fin == NULL){perror("fopen error");return;}for (size_t i = 0; i < n; ++i){int x = rand() % 1000000;fprintf(fin, "%d\n", x);}fclose(fin);
}void PrintTopK(int k)
{const char* file = "data.txt";FILE* fout = fopen(file, "r");if (fout == NULL){perror("fopen error");return;}int* kminheap = (int*)malloc(sizeof(int) * k);if (kminheap == NULL){perror("malloc error");return;}for (int i = 0; i < k; i++){fscanf(fout, "%d", &kminheap[i]);}// 建小堆for (int i = (k - 1 - 1) / 2; i >= 0; i--){AdjustDown(kminheap, k, i);}int val = 0;while (!feof(fout)){fscanf(fout, "%d", &val);if (val > kminheap[0]){kminheap[0] = val;AdjustDown(kminheap, k, 0);}}for (int i = 0; i < k; i++){printf("%d ", kminheap[i]);}printf("\n");
}int main()
{CreateNDate();PrintTopK(5);return 0;
}

关于堆排序的所有内容已经学完了,下节我们继续讲二叉树的前序、中序、后序和层序。

未完待续。。。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/171311.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++字典树算法:找出强数对的最大异或值 II

涉及知识点 数学 字典树 题目 给你一个下标从 0 开始的整数数组 nums 。如果一对整数 x 和 y 满足以下条件&#xff0c;则称其为 强数对 &#xff1a; |x - y| < min(x, y) 你需要从 nums 中选出两个整数&#xff0c;且满足&#xff1a;这两个整数可以形成一个强数对&…

二十四、W5100S/W5500+RP2040树莓派Pico<PHY的状态模式控制>

文章目录 1. 前言2. 相关简介2.1 简述2.2 原理2.3 优点&应用 3. WIZnet以太网芯片4. PHY模式配置测试4.1 程序流程图4.2 测试准备4.3 连接方式4.4 相关代码4.5 测试现象 5. 注意事项6. 相关链接 1. 前言 W5100S/W5500不仅支持自动PHY自动协商&#xff0c;而且支持用户自定义…

vue3 ref 与shallowRef reactive与shallowReactive

ref 给数据添加响应式&#xff0c;基本类型采用object.defineProperty进行数据劫持&#xff0c;对象类型是借助reactive 实现响应式&#xff0c;采用proxy 实现数据劫持&#xff0c;利用reflect进行源数据的操作 let country ref({count:20,names:[河南,山东,陕西],objs:{key…

C/C++交换输出 2021年9月电子学会青少年软件编程(C/C++)等级考试一级真题答案解析

目录 C/C交换输出 一、题目要求 1、编程实现 2、输入输出 二、算法分析 三、程序编写 四、程序说明 五、运行结果 六、考点分析 C/C交换输出 2021年9月 C/C编程等级考试一级编程题 一、题目要求 1、编程实现 输入两个整数a,b&#xff0c;将它们交换输出 2、输入输…

概率论和数理统计(三)数理统计基本概念

前言 “概率论”是给定一个随机变量X的分布F(x),然后求某事件A概率 P ( x ∈ A ) P(x \in A) P(x∈A)或者随机变量X的数字特征.“统计”是已知一组样本数据 { x 1 , x 2 , . . . x n } \{x_1,x_2,...x_n\} {x1​,x2​,...xn​},去求分布F(x) 统计的基本概念 在统计中&#x…

Android framework添加自定义的Product项目,lunch目标项目

文章目录 Android framework添加自定义的Product项目1.什么是Product&#xff1f;2.定义自己的Product玩一玩 Android framework添加自定义的Product项目 1.什么是Product&#xff1f; 源码目录下输入lunch命令之后&#xff0c;简单理解下面这些列表就是product。用于把系统编…

飞天使-template模版相关知识

遇到报错django.template.exceptions.TemplateSyntaxError: ‘staticfiles’ is not a registered tag library. Must ROOT_URLCONF TEMPLATES [{BACKEND: django.template.backends.django.DjangoTemplates,DIRS: [os.path.join(BASE_DIR, templates)],APP_DIRS: True,OPTI…

c++四种类型转换

首先我们要先引入上行转换和下行转换的概念 所谓上行转换&#xff0c;即将原来的子类指针转换成父类指针&#xff1b; 下行转换即将原来的父类指针转换成子类指针 由于子类对象的空间较大&#xff0c;所以把子类强制转换父类给父类指针赋值时&#xff0c;父类指针对象能读取…

ISP图像处理Pipeline

参考&#xff1a;1. 键盘摄影(七)——深入理解图像信号处理器 ISP2. Understanding ISP Pipeline3. ISP图像处理流程介绍4. ISP系统综述5. ISP(图像信号处理)之——图像处理概述6. ISP 框架7. ISP(图像信号处理)算法概述、工作原理、架构、处理流程8. ISP全流程简介9. ISP流程介…

1.jvm基本知识

目录 概述jvm虚拟机三问jvm是什么&#xff1f;java 和 jvm 的关系 为什么学jvm怎么学习为什么jvm调优?什么时候jvm调优调优调什么 结束 概述 相关文章在此总结如下&#xff1a; 文章地址jvm类加载系统地址双亲委派模型与打破双亲委派地址运行时数据区地址 jvm虚拟机三问 j…

Python 日志记录器logging 百科全书 之 日志回滚

Python 日志记录器logging 百科全书 之 日志回滚 前言 在之前的文章中&#xff0c;我们学习了关于Python日志记录的基础配置。 本文将深入探讨Python中的日志回滚机制&#xff0c;这是一种高效管理日志文件的方法&#xff0c;特别适用于长时间运行或高流量的应用。 知识点&…

NFTScan | 11.06~11.12 NFT 市场热点汇总

欢迎来到由 NFT 基础设施 NFTScan 出品的 NFT 生态热点事件每周汇总。 周期&#xff1a;2023.11.06~ 2023.11.12 NFT Hot News 01/ 《辛普森一家》提及 NFT 及区块链&#xff0c;相关 NFT 地板价涨至 0.35 ETH 11 月 6 日&#xff0c;据 Coindesk 报道&#xff0c;美国时间周…