DS:二叉树的顺序结构及堆的实现

                                       创作不易,兄弟们给个三连!!

一、二叉树的顺序存储

      顺序结构指的是利用数组来存储,一般只适用于表示完全二叉树,原因如上图,存储不完全二叉树会造成空间上的浪费,有的人又会问,为什么图中空的位置不能存储呢??原因是我们需要根据数组的下标关系才能访问到对应的节点!!有以下两个下标关系公式:

1、父亲找孩子:leftchild=parent*2+1,rightchild=parent*2+2

2、孩子找父亲:parent=(child-1)/2   要注意,这边无论用左孩子算还是右孩子算都是可以的,因为一般俩说,(child-1)/2 由于int类型向下取整的特点,所以得到的结果都是一样的!!

      所以我们想要上面这种方式去访问节点,并且还不希望有大量的空间浪费,现实中只有堆才会使用数组存储,二叉树的顺序存储中在物理上是一个数组,再逻辑上是一颗二叉树!!

二、堆的概念及结构

    现实中我们把堆(类似完全二叉树)使用顺序结构来存储,要注意这里的堆和操作系统虚拟进程地址空间中的堆是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分区。

   如果有一个关键码的集合k,我们将他的全部元素按照完全二叉树的存储逻辑放在一个一维数组中,则成为堆,根节点最大的堆叫做大堆,根节点最小的堆叫做小堆。 

堆的性质:

1、堆中某个节点的值总是不大于或不小于其父节点的值

2、堆总是一颗完全二叉树

注意:并不一定有序 

三、堆的实现

假设我们实现小堆

3.1 相关结构体的创建

跟顺序表的形式是一样的,但是换了个名字

typedef int HPDataType;
typedef struct Heap
{HPDataType * a;int size;int capacity;
}Heap;

3.2 堆的初始化

void HeapInit(Heap* php)
{assert(php);php->a = NULL;php->capacity = php->size = 0;
}

3.3 堆的插入

堆的插入很简单,但是我们要保证堆插入后还能维持堆的形状

所以我们在插入后,还要进行向上调整,也就是孩子要根据下标关系找到自己的父亲去比较,小就交换

void HeapPush(Heap* php, HPDataType x)
{assert(php);//首先要判断是否需要扩容if (php->size == php->capacity){int newcapacity = php->capacity == 0 ? 4 : 2 * php->capacity;HPDataType* temp = (HPDataType*)realloc(php->a,sizeof(HPDataType) * newcapacity);if (temp == NULL){perror("malloc fail");exit(1);}//扩容成功php->a = temp;php->capacity = newcapacity;}//扩容后,我们插入这个元素并size++php->a[php->size++] = x;//但是插入之后可能会破坏堆的结构,所以我们需要这个元素和他的父辈进行逐个比较, AdjustUp(php->a,php->size-1);//封装一个向上调整函数,传入数组和新加元素的下标
}

3.4 向上调整算法

void AdjustUp(HPDataType* a, int child)
{assert(a);//通过孩子找父亲  parent=(child-1)/2int parent = (child - 1) / 2;//孩子和父亲开始比较,如果孩子小,就交换,如果孩子大,退出循环while (child>0)//如果孩子变成了根节点,就没有必要再找了,因为已经没有父母了//如果用parent>=0来判断,那么由于(0-1)/2是-1/2,取整后还是0,就会一直死循环,所以必须用孩子来当循环条件{if (a[child] < a[parent])//孩子小,交换{Swap(&a[child], &a[parent]);//但是交换过后,可能还需要继续往上比,所以我们要让原来的父亲变成孩子,然后再找新的父亲进行比较child = parent;parent = (child - 1) / 2;}else//孩子大,退出break;}
}

注:这里的向上调整算法和后面向下调整算法我们都不用跟堆有关的接口,原因就是这个算法的运用范围很广,可以用在堆排序以及top-k问题中!!

3.5 交换函数

void Swap(HPDataType* p1, HPDataType* p2)
{HPDataType temp = *p1;*p1 = *p2;*p2 = temp;
}

3.6 堆的删除

         一般来说,如果直接删除堆的最后一个元素,其实是没什么意义的,一行代码就可以搞定,没必要封装什么函数,所以这里的堆的删除指的是删除根部的元素!!

        

void HeapPop(Heap* php)//一般来说,堆中的删除指的是删除根位置的数据
//如果直接删除根然后往前挪动一位,那么亲缘关系就会十分混乱,为了能够尽量在调整中减少对关系的改变
//我们将根部元素与最后一个元素进行交换之后再删除,此时的根是原先的最后一个元素
//然后将该元素进行向下调整(封装一个函数,传入数组、元素个数、)
{assert(php);assert(!HeapEmpty(php));//为空的话没有删除的必要Swap(&php->a[0], &php->a[php->size - 1]);php->size--;//开始向下调整AdjustDown(php->a, php->size,0);
}

3.7 向下调整算法

void AdjustDown(HPDataType* a, int n,int parent)
{assert(a);//此时根部为原来的最后一个元素,往下比较//即通过父亲去找到自己的孩子,如果孩子比自己小,就得交换位置,如果孩子比自己大,就退出//但是因为父亲有一个左孩子parent*2+1,右孩子parent*2+2,我们选择孩子中较小的和自己交换int child = parent * 2 + 1;//假设左孩子比右孩子小while (child<n)//当child超出个数的时候结束{if (child+1<n && a[child + 1]<a[child])//如果右孩子比左孩子小,假设错误,修正错误//注意,一定不能写反,要注意只有左孩子没有右孩子的情况child++;if (a[child] < a[parent])//如果孩子小于父亲,交换{Swap(&a[child], &a[parent]);//交换完后,让原来的孩子变成父亲,然后再找新的孩子parent = child;child = parent * 2 + 1;}elsebreak;//如果孩子大于等于父亲,直接退出}
}

       在上述算法中,我们应用了先假设再推翻的方法,一开始我们先假设左孩子比较小,然后我们再给个条件判断,如果左孩子大于右孩子,假设不成立,再推翻,这样可以保证我们的child变量一定是较小的孩子!! 

       虽然这里的parent很明显是从a[0]开始,好像不需要专门去传一个parent的参数,但是这也是为了之后的堆排序做准备!

3.8 取堆顶的数据

HPDataType HeapTop(Heap* php)
{assert(php);assert(!HeapEmpty(php));//为空的话没有取的必要return php->a[0];
}

3.9 堆的数据个数

int HeapSize(Heap* php)
{assert(php);return php->size;
}

3.10 堆的判空

bool HeapEmpty(Heap* php)
{assert(php);return php->size == 0;
}

3.11 堆的销毁

void HeapDestory(Heap* php)
{assert(php);free(php->a);php->a = NULL;php->size = php->capacity = 0;
}

3.12 堆的打印(测试)

我们要实现堆的打印,利用我们之前封装的函数,每获取一次堆顶元素就删除一次,直到堆删完就可以获取全部的元素了!!

#include"Heap.h"
int main()//该方法实现堆的顺序打印
{Heap hp;HeapInit(&hp);int a[] = { 55,100,70,32,50,60 };for (int i = 0; i < sizeof(a) / sizeof(int); i++)HeapPush(&hp, a[i]);//不断进堆while (!HeapEmpty(&hp)){int top = HeapTop(&hp);printf("%d\n", top);HeapPop(&hp);}HeapDestory(&hp);return 0;
}

前面只是先创建一个堆,从while循环开始才是实现对堆的打印!!

运行结果 :32 50 55 60 70 100

          我们发现了一个情况:按道理来说堆只有父子节点之间有大小关系,兄弟之间没有的,但是我们最后打印出来的结果却完成了排序!!!下面我们来进行分析

     总之任何一个堆,我们都可以通过不断地pop去实现它的顺序打印!!堆排序后面会介绍!

四、堆实现的全部代码

4.1 Heap.h

#pragma once
#include<stdio.h>
#include<stdlib.h>
#include<assert.h>
#include<stdbool.h>typedef int HPDataType;
typedef struct Heap
{HPDataType * a;int size;int capacity;
}Heap;void Swap(HPDataType* p1, HPDataType* p2);//实现父亲和孩子的交换
void AdjustUp(HPDataType* a, int child);//向上调整算法// 堆的初始化
void HeapInit(Heap* php);
// 堆的插入
void HeapPush(Heap* php, HPDataType x);
// 堆的删除
void HeapPop(Heap* php);
// 取堆顶的数据
HPDataType HeapTop(Heap* php);
// 堆的数据个数
int HeapSize(Heap* php);
// 堆的判空
bool HeapEmpty(Heap* php);
// 堆的销毁
void HeapDestory(Heap* php);

4.2 Heap.c

#include"Heap.h"
//当前实现小堆
void HeapInit(Heap* php)
{assert(php);php->a = NULL;php->capacity = php->size = 0;
}void Swap(HPDataType* p1, HPDataType* p2)
{HPDataType temp = *p1;*p1 = *p2;*p2 = temp;
}void AdjustUp(HPDataType* a, int child)
{assert(a);//通过孩子找父亲  parent=(child-1)/2int parent = (child - 1) / 2;//孩子和父亲开始比较,如果孩子小,就交换,如果孩子大,退出循环while (child>0)//如果孩子变成了根节点,就没有必要再找了,因为已经没有父母了//如果用parent>=0来判断,那么由于(0-1)/2是-1/2,取整后还是0,就会一直死循环,所以必须用孩子来当循环条件{if (a[child] < a[parent])//孩子小,交换{Swap(&a[child], &a[parent]);//但是交换过后,可能还需要继续往上比,所以我们要让原来的父亲变成孩子,然后再找新的父亲进行比较child = parent;parent = (child - 1) / 2;}else//孩子大,退出break;}
}void AdjustDown(HPDataType* a, int n,int parent)
{assert(a);//此时根部为原来的最后一个元素,往下比较//即通过父亲去找到自己的孩子,如果孩子比自己小,就得交换位置,如果孩子比自己大,就退出//但是因为父亲有一个左孩子parent*2+1,右孩子parent*2+2,我们选择孩子中较小的和自己交换int child = parent * 2 + 1;//假设左孩子比右孩子小while (child<n)//当child超出个数的时候结束{if (child+1<n && a[child + 1]<a[child])//如果右孩子比左孩子小,假设错误,修正错误//注意,一定不能写反,要注意只有左孩子没有右孩子的情况child++;if (a[child] < a[parent])//如果孩子小于父亲,交换{Swap(&a[child], &a[parent]);//交换完后,让原来的孩子变成父亲,然后再找新的孩子parent = child;child = parent * 2 + 1;}elsebreak;//如果孩子大于等于父亲,直接退出}
}void HeapPush(Heap* php, HPDataType x)
{assert(php);//首先要判断是否需要扩容if (php->size == php->capacity){int newcapacity = php->capacity == 0 ? 4 : 2 * php->capacity;HPDataType* temp = (HPDataType*)realloc(php->a,sizeof(HPDataType) * newcapacity);if (temp == NULL){perror("malloc fail");exit(1);}//扩容成功php->a = temp;php->capacity = newcapacity;}//扩容后,我们插入这个元素并size++php->a[php->size++] = x;//但是插入之后可能会破坏堆的结构,所以我们需要这个元素和他的父辈进行逐个比较, AdjustUp(php->a,php->size-1);//封装一个向上调整函数,传入数组和新加元素的下标
}void HeapPop(Heap* php)//一般来说,堆中的删除指的是删除根位置的数据
//如果直接删除根然后往前挪动一位,那么亲缘关系就会十分混乱,为了能够尽量在调整中减少对关系的改变
//我们将根部元素与最后一个元素进行交换之后再删除,此时的根是原先的最后一个元素
//然后将该元素进行向下调整(封装一个函数,传入数组、元素个数、)
{assert(php);assert(!HeapEmpty(php));//为空的话没有删除的必要Swap(&php->a[0], &php->a[php->size - 1]);php->size--;//开始向下调整AdjustDown(php->a, php->size,0);
}HPDataType HeapTop(Heap* php)
{assert(php);assert(!HeapEmpty(php));//为空的话没有取的必要return php->a[0];
}int HeapSize(Heap* php)
{assert(php);return php->size;
}bool HeapEmpty(Heap* php)
{assert(php);return php->size == 0;
}void HeapDestory(Heap* php)
{assert(php);free(php->a);php->a = NULL;php->size = php->capacity = 0;
}

4.3 test.c(测试)

#include"Heap.h"
int main()//该方法实现堆的顺序打印
{Heap hp;HeapInit(&hp);int a[] = { 55,100,70,32,50,60 };for (int i = 0; i < sizeof(a) / sizeof(int); i++)HeapPush(&hp, a[i]);//不断进堆while (!HeapEmpty(&hp)){int top = HeapTop(&hp);printf("%d\n", top);HeapPop(&hp);}HeapDestory(&hp);return 0;
}

五、堆的应用

5.1 堆排序

要对数组排序前,我们要用堆排序,首先要建堆!

大家看看之前堆的打印时的测试代码逻辑的方法

就是我们得到一个数组,就先建堆,然后先把数组push进去,再pop出来,是可以实现有序的

但是现在我们的需求不是打印出来,而是将他排好序后放进数组里,所以们可以这么写:

void HeapSort(int* a, int n)
{HP hp;HeapInit(&hp);// N*logNfor (int i = 0; i < n; ++i){HeapPush(&hp, a[i]);}// N*logNint i = 0;while (!HeapEmpty(&hp)){int top = HeapTop(&hp);a[i++] = top;HeapPop(&hp);}HeapDestroy(&hp);
}

 这个方法固然是可以的,但是很麻烦,原因如下:

1、每次都要建立一个新的堆,然后再销毁,比较麻烦,而且空间复杂度比较高 

2、我通过把数组放进变成堆,还要再把堆拷贝到数组中,数据的拷贝是很繁琐的!!

所以我们要思考一种方式避免数据的拷贝,所以就有了向上调整建堆和向下调整建堆的方法了!!

也就是我们在原数组的基础上直接建堆,然后向下调整排序即可,下面会详细介绍

5.1.1 向上调整建堆

 假设数组有n个元素

for (int i = 1; i < n; i++)
{AdjustUp(a, i);
}

5.1.2 向下调整建堆

for (int i = (n-1-1)/2; i >= 0; i--)
{AdjustDown(a, n, i);
}

5.1.3 堆排序的实现

那我们究竟选择向下建堆好还是向下建堆好呢??我们来分析一下

所以我们发现向上调整建堆的时间复杂度大概是N*logN,而向下调整建堆的时间复杂度是N

其实们在推导的时候也能发现,向上调整建堆是节点多的情况调整得多,节点少的情况调整的少,次数是多*多+少*少 ,而向下调整建堆是节点多的情况调整得少,节点少的情况调整的多,次数是多*少+少*多,显然是向下调整建堆是更有优势的!!

     接下去我们建好堆,就要想着怎么去排序了,我们思考一下,之前我们对堆的打印时,不断pop打印出来有序结果的原因是什么??原因就是pop函数里的向下调整算法!!每一次交换根节点和尾节点,将每个节点进行向下调整,最后就可以得到有序的

 

 因为我们之前实现的向下调整算法是小堆的,所以我们这边来实现一个降序的堆排序算法

void HeapSort(int* a, int n)
{//降序  建小堆//升序  建大堆for (int i = (n-1-1)/2; i >=0;i--)AdjustDown(a, n, i);//开始排序   先交换向下调整int end = n - 1;while (end >= 0){Swap(&a[0], &a[end]);AdjustDown(a, end, 0);--end;}
}

 

 如果我们想实现升序,将向下调整算法按照大堆的规则改一下就行 

向下调整算法和向上调整算法的空间复杂度都是(logN) 

堆排序中,建堆的时间复杂度是o(N),排序的时间复杂度是(N*logN)所以堆排序的总时间复杂度是N*logN

5.2 TOP-K问题

Top-k问题:即求数据中前k个最大的元素或者是最小的元素,一般情况下的数据量都比较大!

比如:专业前10名、世界五百强、富豪榜前十

堆排序能够帮助我们在大量数据中筛选出最好的几个。

5.2.1 思路

        比如说我们要从1000个学生的成绩中找到前10个分数最高的,方法就是将所有的数据放在一个数组里,直接建大堆,然后pop9次就可以找到了(pop中的向下调整算法可以使得每次pop出去的都是最大值,然后pop9次的原因是因为第10次就可以直接去获取堆顶元素即可)

但是有些情况,上述思路解决不了,分析:

5.2.2 通过数组验证TOP-K

void PrintTopK(int* a, int n, int k)
{//建前k个建小堆for (int i = (k - 1 - 1) / 2; i >= 0; i--)AdjustDown(a, k, i);//将剩余n个数据不断与堆顶元素比较,大就交换,然后向下调整for (int i = k; i < n; i++){if (a[i] > a[0]){a[0] = a[i];//直接覆盖就行,不用交换AdjustDown(a, k, 0);}}//打印for(int i=0;i<k;i++)printf("%d ", a[i]);
}void TestTopk()
{int n = 10000;int* a = (int*)malloc(sizeof(int) * n);srand((unsigned int)time(NULL));for (size_t i = 0; i < n; ++i){a[i] = rand() % 1000000;//随机数范围0-999999}
// 为了能够方便找到这些数a[5] = 1000000 + 1;a[1231] = 1000000 + 2;a[531] = 1000000 + 3;a[5121] = 1000000 + 4;a[115] = 1000000 + 5;a[2335] = 1000000 + 6;a[9999] = 1000000 + 7;a[76] = 1000000 + 8;a[423] = 1000000 + 9;a[3144] = 1000000 + 10;PrintTopK(a, n, 10);
}int main()
{TestTopk();return 0;
}

5.2.3 通过文件验证TOP-K

其实用数组的方法,并不能有效地模拟,我们可以尝试用文件的方式来验证

void CreateNDate()
{// 造数据int n = 10000;srand((unsigned int)time(NULL));const char* file = "data.txt";FILE* fin = fopen(file, "w");if (fin == NULL){perror("fopen error");return;}for (size_t i = 0; i < n; ++i){int x = rand() % 1000000;fprintf(fin, "%d\n", x);//将随机数写进文件}fclose(fin);
}void PrintTopK(int k)
{const char* file = "data.txt";FILE* fout = fopen(file, "r");if (fout == NULL){perror("fopen fail");return;}int* kminheap = (int*)malloc(sizeof(int) * k);if (kminheap == NULL){perror("malloc fail");return;}for (int i = 0; i < k; i++){fscanf(fout, "%d", &kminheap[i]);//从文件读取数据}// 建小堆for (int i = (k - 1 - 1) / 2; i >= 0; i--){AdjustDown(kminheap, k, i);}int val = 0;while (!feof(fout))//feof是文件结束的标识,如果返回1,则说明文件结束{fscanf(fout, "%d", &val);//fscaf的光标闪动到原先的位置,所以会从k的位置开始读if (val > kminheap[0]){kminheap[0] = val;AdjustDown(kminheap, k, 0);}}for (int i = 0; i < k; i++){printf("%d ", kminheap[i]);}printf("\n");
}
int main()//该方法实现堆的顺序打印
{CreateNDate();PrintTopK(5);return 0;
}

友友们上述代码有不理解的,看看博主关于文件操作里的函数介绍:

C语言:文件操作详解-CSDN博客

 不太好找,所以我们可以先注释创造数据的文件,然后再文件中修该出5个最大数,然后再执行一次函数

以上就是通过数组验证top和利用文件验证tok的方法!!

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/469523.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

红色系可视化界面,偶尔用用可以,长时间太刺眼。

继昨日发了白色的可视化界面&#xff0c;表明了不适合做大屏展示用&#xff0c;友友们从很多角度阐述了&#xff0c;为什么不能用白色&#xff0c;大家的结论基本一致。 今天发一些红色&#xff0c;这些在某个节日用个一小会还行&#xff0c;长时间用肯定不适合。

SpringBoot Starter造了个自动锁轮子

可能有人会有疑问&#xff0c;为什么外面已经有更好的组件&#xff0c;为什么还要重复的造轮子&#xff0c;只能说&#xff0c;别人的永远是别人的&#xff0c;自己不去造一下&#xff0c;就只能知其然&#xff0c;而不知其所以然。&#xff08;其实就为了卷&#xff09; 在日常…

攻防演练后的一点随记

攻防演练 攻防演练算是告一段落了&#xff0c;各位红队和蓝队的兄弟们都辛苦了&#xff0c;写一点随记&#xff0c;供大家参考。 记得第一次参加攻防演练是在2018年&#xff0c;当时被派到北京&#xff0c;在某个政企单位做攻防演练支撑工作&#xff0c;然后2020年又被紧急派到…

探索微信小程序的奇妙世界:从入门到进阶

文章目录 一、什么是微信小程序1.1 简要介绍微信小程序的定义和特点1.2 解释小程序与传统应用程序的区别 二、小程序的基础知识2.1 微信小程序的架构2.2 微信小程序生命周期的理解2.3 探索小程序的目录结构和文件类型 三、小程序框架和组件3.1 深入了解小程序框架的核心概念和原…

Hive3.1.2——企业级调优

前言 本篇文章主要整理hive-3.1.2版本的企业调优经验&#xff0c;有误请指出~ 一、性能评估和优化 1.1 Explain查询计划 使用explain命令可以分析查询计划&#xff0c;查看计划中的资源消耗情况&#xff0c;定位潜在的性能问题&#xff0c;并进行相应的优化。 explain执行计划…

修改npm 的运行命令详解

在Node.js和npm中&#xff0c;你可以通过修改package.json文件中的scripts部分来定义和运行自定义的npm脚本。这些脚本可以是任何你希望在项目中运行的命令&#xff0c;包括启动服务器、运行测试、构建项目等。下面是一些修改npm运行命令的详解和代码示例。 修改npm运行命令的…

相机图像质量研究(17)常见问题总结:CMOS期间对成像的影响--靶面尺寸

系列文章目录 相机图像质量研究(1)Camera成像流程介绍 相机图像质量研究(2)ISP专用平台调优介绍 相机图像质量研究(3)图像质量测试介绍 相机图像质量研究(4)常见问题总结&#xff1a;光学结构对成像的影响--焦距 相机图像质量研究(5)常见问题总结&#xff1a;光学结构对成…

OpenCV Mat实例详解 一

OpenCV中的Mat是一个类&#xff0c;它用存储图像信息。由两部分数据组成&#xff1a;矩阵头和像素值矩阵。矩阵头包含矩阵尺寸、存储方法、存储地址等信息&#xff0c;而像素值矩阵则存储实际的像素值数据。 Mat类在OpenCV中有十分重要的作用&#xff0c;图像信息的载入、保存、…

Hive的相关概念——架构、数据存储、读写文件机制

目录 一、架构及组件介绍 1.1 Hive整体架构 1.2 Hive组件 1.3 Hive数据模型&#xff08;Data Model&#xff09; 1.3.1 Databases 1.3.2 Tables 1.3.3 Partitions 1.3.4 Buckets 二、Hive读写文件机制 2.1 SerDe 作用 2.2 Hive读写文件流程 2.2.1 读取文件的过程 …

Python算法探索:从经典到现代(三)

一、引言 随着信息技术的飞速发展&#xff0c;数据已经成为现代社会不可或缺的资源。Python&#xff0c;作为数据处理和分析的利器&#xff0c;为我们提供了大量强大的库和工具&#xff0c;用于从经典到现代的各种算法探索。本文将带你领略Python在算法领域的魅力&#xff0c;从…

儿童护眼台灯哪个值得推荐?推荐专业的儿童护眼台灯

现在的孩子很多都存在视力问题&#xff0c;而且年龄也越来越早&#xff0c;不少还为上学的孩子都早已戴上小眼镜。虽说这可能存在家族近视遗传的可能性&#xff0c;不过更多的还是后天导致的。长时间玩耍电子产品、缺乏运动、不良用眼习惯、不合适的光线等等都是导致孩子近视的…

数仓建模—数据网格

数据网格 随着数字化时代的到来,近几年数据领域的新技术概念不断涌现,无论是数据湖、湖仓一体、流批一体、存算一体、数据编织抑或数据网格,很多还爬上了Gartner曲线,其中数据网格备受关注,数据网格从字面意思来看挺抽象的,会劝退很多人,但当你深入去理解这个概念时,才…