算法学习(7)-树

目录

开启“树”之旅

二叉树

堆--优先队列

并查集


开启“树”之旅

        是不是很像一棵倒挂的树?也就是说它是根朝上, 而叶子朝下的。不像?哈哈,来看看下面的图你就会觉得像啦。

        你可能会间: 树和图有什么区别?这个称之为树的东西和无向图差不多嘛。不要着急,继续往下看。树其实就是不包含回路的连通无向阳。你可能还是无法理解这其中的差异, 下面举个例子。 


二叉树

        二义树是一种特殊的树。二叉树的特点是每个结点最多有两个儿子, 左边的叫做左儿子,右边的叫做右儿子, 或者说每个结点最多有两棵于树。更加严格的递归定义是: 二叉树要么为空, 要么由根结点、左子树和右子树组成, 而左子树和石子树分别是一棵二叉树。下面这棵树就是一棵二叉树。

        二叉树的使用范阶最广,一棵多叉树也可以转化为二叉树, 因此我们将着重讲解二叉树。
        二叉树中还有两种特殊的二叉树, 叫做满二义树和完全二叉树。如果二叉树中每个内部结点都有两个儿子, 这样的二叉树叫做满二叉树。或者说满二义树所有的叶结点都有同样的深度。比如下面这棵二叉树, 是不是感觉很“ 丰满"。满二叉树的严格的定义是一棵深度为h且有2^h-1个结点的二叉树。

         其实完全二叉树类似下面这个形状。

        说到这里我们马上就要领略到完全二叉树的魅力了。先想一想: 一棵完全二叉树如何存储呢?其实完全二叉树中父亲和儿子之间有着神奇的规律,我们只需用一个一维数组就可以存储完全二叉树。首先将完全二叉树进行从上到下, 从左到右编号。


堆--优先队列

        假如有14 个数, 分别是99、5 、36、7、22、17 、46、12 、2 、19 、25 、28 、1 和92, 请找出这14个数中最小的数, 请间怎么办呢?最简单的方法就是将这14个数从头到尾依次扫一遍, 用一个循环就可以解决。这种方法的时间复杂度是0(14), 也就是O(N) 。

for (i = 1; i <= 14; i++) {if (a [i] <min) {min=a [i];}
}

        现在我们需要删除其中最小的数, 并增加一个新数23, 再次求这14 个数中最小的一个数。请间该怎么办呢?只能重新扫描所有的数, 才能找到新的最小的数, 这个时间复杂度也是O(N)。假如现在有14 次这样的操作(删除最小的数后再添加一个新数), 那么整个时间复杂度就是0(14^2)即O(N2)。那有没有更好的方法呢?堆这个特殊的结构恰好能够很好地解决这个问题。
        首先我们把这14 个数按照最小堆的要求(就是所有父结点都比子结点要小)放入一棵完全二叉树, 就像下面这棵树一样。

        很显然最小的数就在堆顶, 假设存储这个堆的数组叫做h的话, 最小数就是h[1] 。接下来, 我们将堆顶部的数删除。将新增加的数23放到堆顶。显然加了新数后已经不符合最小堆的特性, 我们需要将新增加的数调整到合适的位置。那如何调整呢? 

void siftdown(int i) //传入一个需要向下调整的节点编号i,这里传入1,即从堆的顶点开始向下调整
{int t, flag = 0;//flag用来交际是否需要继续向下调整//当i节点有儿子(其实是至少有左儿子的情况下)并且有需要继续调整的时候,循环就执行while(i * 2 <= n && flag == 0) {//首先判断他和左儿子的关系,并用t记录值较小的节点编号if (h[i] > h[i*2]) {t = i * 2;} else {t = i;}//如果他有右儿子,再对有儿子进行讨论if (i * 2 + 1 <= n) {//如果右儿子的值更小,更新较小的节点编号if (h[t] > h[i*2+1]) {t = i * 2 + 1;}}//如果发现最小的节点编号不是自己,说明子节点中有比父节点更小的if (t != i) {swap(t, i);i = t;//更新i为刚才与他交换的儿子节点的编号,便于继续向下调整} else {flag = 1;//否则说明当前父节点小于子节点,不用调整了}}
}

void siftup(int i)//传入一个需要向上调整的节点编号i
{int flag = 0;if (i == 1) {return;//如果是堆顶,返回}//不在堆顶,并且当前节点i的值比父节点小的时候就继续向上调整while(i != 1 && falg == 0) {//判断是否比父节点的小if (h[i] < h[i/2]) {swap(i, i/2);} else {flag = 1;//整理表示已经不用调整,当前节点的值比父节点大}i = i/2;//这句话很重要,更新编号i为他父节点的编号,从而便于下一次继续向上调整}
}

        说了半天, 我们忽略了一个很重要的问题!就是如何建立这个堆。可以从空的堆开始,然后依次往堆中插入每一个元素, 直到所有数都被插入(转移到堆中)为止。因为插入第i个元索所用的时间是O(log i) ,所以插入所有元索的整体时间复杂度是O(MogN), 代码如下。

n = 0;
for (i = 1; i <= m; i++) {n++;h[n] = a[i];//或写成scanf("%d", &h[n]);siftup();
}

        小结一下这个创建堆的算法。把n个元素建立一个堆, 首先我可以将这n个结点以自顶向下、从左到右的方式从1到n编码。这样就可以把这n个结点转换成为一棵完全二叉树。紧接着从最后一个非叶结点(结点编号为n/2)开始到根结点(结点编号为1), 逐个扫描所有的结点, 根据需要将当前结点向下调整, 直到以当前结点为根结点的子树符合堆的特件。虽然讲起来很复杂, 但是实现起来却很简单, 只有两行代码如下: 

for (i = n/2; i >= 1; i--) {siftdown(i);
}

         用这种方法来建立一个堆的时间复杂度是O(N), 堆还有一个作用就是堆排序,与快速排序一样,堆排序的时间复杂度也是O(NlogN).堆排序的实现很简单, 比如我们现在要进行从小到大排序,可以先建立最小堆, 然后每次删除顶部元素并将顶部元素输出或者放入一个新的数组中,直到堆为空为止。最终输出的或者存放在新数组中的数就已经是排序好的了。

//删除最大的元素
int deletemax() {int t;t = h[1];//用一个临时变量记录堆顶点的值h[1] = h[n];//将堆的最后一个点赋值到堆顶n--;//堆的元素减少1siftdown(1);//向下调整return t;//返回之前记录的堆的顶点的最大值
}

        建堆以及堆排序的完整代码如下:

#include <stdio.h>int h[101]; // 用来存放堆的数组
int n;      // 用来存储堆中元素的个数,也就是堆的大小// 交换函数,用来交换堆中的两个元素的值
void swap(int x, int y) {int t;t = h[x];h[x] = h[y];h[y] = t;
}// 向下调整函数
void siftdown(int i) { // 传入一个需要向下调整的结点编号i,这里传入1,即从堆的顶点开始向下调整int t, flag = 0; // flag用来标记是否需要继续向下调整// 当i结点有儿子(其实是至少有左儿子)并且有要继续调整的时候循环就执行while (i * 2 <= n && flag == 0) {// 首先判断它和左儿子的关系,并用t记录值较小的结点编号if (h[i] > h[i * 2])t = i * 2;elset = i;// 如果它有右儿子,再对右儿子进行讨论if (i * 2 + 1 <= n) {// 如果右儿子的值更小,更新较小的结点编号if (h[t] > h[i * 2 + 1])t = i * 2 + 1;}// 如果发现最小的结点编号不是自己,说明子结点中有比父结点更小的if (t != i)swap(t, i); // 交换它们,注意swap函数要自己来写elseflag = 1; // 否则说明当前的父结点已经比两个子结点都要小了,不需要再进行调整了}
}// 建立堆的函数
void create() {int i;// 从最后一个非叶结点到第1个结点依次进行向上调整for (i = n / 2; i >= 1; i--) {siftdown(i);}
}// 删除最大的元素
int deleteMax() {int t;t = h[1];      // 用一个临时变量记录堆顶点的值h[1] = h[n];   // 将堆的最后一个点赋值到堆顶n--;           // 堆的元素减少1siftdown(1);   // 向下调整return t;      // 返回之前记录的堆的顶点的最大值
}int main() {int i, num;// 读入要排序的数字的个数scanf("%d", &num);for (i = 1; i <= num; i++)scanf("%d", &h[i]);n = num;// 建堆create();// 删除顶部元素,连续删除n次,其实也就是从大到小把数输出来for (i = 1; i <= num; i++)printf("%d ", deleteMax());getchar();getchar();return 0;
}

        当然堆排序还有一种更好的方法。从小到大排序的时候不建立最小堆而建立最大堆, 最大堆建立好后, 最大的元素在h[1],因为我们的需求是从小到大排序, 希望最大的放在最后。因此我们将h[1]和h[n]交换, 此时h[n]就是数组中的最大的元素。请注意, 交换后还需将h[1]向下调整以保持堆的特性。OK, 现在最大的元素已经归位, 需要将堆的大小减1即n--,然后再将h[1]和h[n]交换, 并将h[l]向下调整。如此反复, 直到堆的大小变成1为止。此时数组h中的数就已经是排序好的了。代码如下:

//堆排序
void heapsort() {while(n > 1) {swap(1, n);n--;siftdown(1);}
}

        完整的堆排序的代码如下,注意使用这种方法来进行从小到大排序需要建立最大堆。

#include <stdio.h>#define lOl 1000 // 用来存放堆的数组大小int h[lOl]; // 用来存放堆的数组
int n; // 用来存储堆中元素的个数,也就是堆的大小// 交换函数,用来交换堆中的两个元素的值
void swap(int x, int y) {int t = h[x];h[x] = h[y];h[y] = t;
}// 向下调整函数
void siftdown(int i) { // 传入一个需要向下调整的结点编号i,这里传入1,即从堆的顶点开始向下调整int t, flag = 0; // flag用来标记是否需要继续向下调整// 当i结点有儿子(其实是至少有左儿子)并且有需要继续调整的时候循环就执行while (i * 2 <= n && flag == 0) {// 首先判断它和左儿子的关系,并用t记录较大的结点编号if (h[i] < h[i * 2])t = i * 2;elset = i;// 如果它有右儿子,再对右儿子进行讨论if (i * 2 + 1 <= n) {// 如果右儿子的值更大,更新较小的结点编号if (h[t] < h[i * 2 + 1])t = i * 2 + 1;}// 如果发现最大的结点编号不是自己,说明子结点中有比父结点更大的if (t != i) {swap(t, i); // 交换它们,注意swap函数需要自己来写i = t; // 更新i为刚才与它交换的儿子结点的编号,便于接下来继续向下调整} else {flag = 1; // 否则说明当前的父结点已经比两个子结点都要大了,不需要再进行调整了}}
}// 建立堆的函数
void create() {int i;// 从最后一个非叶结点到第1个结点依次进行向上调整for (i = n / 2; i >= 1; i--) {siftdown(i);}
}// 堆排序
void heapsort() {while (n > 1) {swap(1, n);n--;siftdown(1);}
}int main() {int i, num;// 读入n个数scanf("%d", &num);for (i = 1; i <= num; i++) {scanf("%d", &h[i]);}n = num;// 建堆create();// 堆排序heapsort();// 输出for (i = 1; i <= num; i++) {printf("%d ", h[i]);}getchar();getchar();return 0;
}

        最后还是要总结一下。像这样支持插入元素和寻找最大(小)值元素的数据结构称为优先队列.如果使用普通队列来实现这两个功能,那么寻找最大元素需要枚举整个队列,这样的时间复杂度比较高。如果是已排序好的数组, 那么插入一个元素则需要移动很多元素,时间复杂度依旧很高。而堆就是一种优先队列的实现, 可以很好地解决这两种操作。
        另外Dijkstra 算法中每次找离源点最近的一个顶点也可以用堆来优化, 使算法的时间复杂度降到O((M+N)logN)。堆还经常被用来求一个数列中第K 大的数, 只需要建立一个大小为K的最小堆, 堆顶就是第K大的数。(我举个例子, 假设有10个数, 要求第3大的数。第一步选取任意3个数, 比如说是前3个, 将这3个数建成最小堆, 然后从第4个数开始, 与堆顶的数比较, 如果比堆顶的数要小, 那么这个数就不要, 如果比堆顶的数要大, 则舍弃当前堆顶而将这个数做为新的堆顶, 并再去维护堆, 用同样的方法去处理第5~10个数)


并查集

        上一节用了很长的篇幅讲解了树在优先队列中的应用一堆的实现。那么树还有哪些神奇的用法呢?咱们从一个故事说起一解密犯罪团伙。

        要想解决这个问题, 首先我们假设这10个强盗相互是不认识的, 他们各自为政, 每个人都是首领, 他们只听从自己的。之后我们将通过警方提供的线索,一步步地来“ 合并同伙"。

#include <stdio.h>int f[1000] = {0}, n, m, k, sum = 0;// 这里是初始化,非常地重要,数组里面存的是自己数组下标的编号就好了。
void init() {int i;for (i = 1; i <= n; i++) {f[i] = i;}
}// 这是找爹的递归函数,不停地去找爹,直到找到祖宗为止,其实就是去找犯罪团伙的最高领导人,“擒贼先擒王”原则。
int getf(int v) {if (f[v] == v) {return v;} else {// 这里是路径压缩,每次在函数返回的时候,顺带把路上遇到的v的“BOSS”改为最后找到的祖宗编号,// 也就是犯罪团伙的最高领导人编号。这样可以提高今后找到犯罪团伙的最高领导人(其实就是树的祖先)的速度。f[v] = getf(f[v]);return f[v];}
}// 这里是合并两子集合的函数
void merge(int v, int u) {int t1, t2;t1 = getf(v);t2 = getf(u);if (t1 != t2) { // 判断两个结点是否在同一个集合中,即是否为问一个祖先。f[t2] = t1;// “靠左”原则,左边变成右边的BOSS。即把右边的集合,作为左边集合的子集合。// 经过路径压缩以后,将f[u]的根的值也赋值为v的祖先f[t1]。}
}// 请从此处开始阅读程序,从主函数开始阅读程序是一个好习惯。
int main() {int i, x, y;scanf("%d %d", &n, &m);// 初始化是必须的init();for (i = 1; i <= m; i++) {// 开始合并犯罪团伙scanf("%d %d", &x, &y);merge(x, y);}// 最后扫描有多少个独立的犯罪团伙for (i = 1; i <= n; i++) {if (f[i] == i) {sum++;}}getchar(); // 清除输入缓冲区getchar(); // 清除输入缓冲区printf("%d\n", sum); // 输出独立团伙数量return 0;
}

        并查集也称为不相交集数据结构。此算法的发展经历了十多年, 研究它的人也很多, 其中Robert E. Tarjan做出了很大的贡献。在此之前John E. Hopcroft和Jeffrey D. Ullman也进行了大量的分析。你是不是又感觉Robert E. Tarjan和John E. Hopcroft很熟悉?没错, 就是发明了深度优先搜索的两个人一1986年的图灵奖得主。你看牛人们从来都不闲着的。他们到处交流, 寻找合作伙伴,一起改变世界。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/705499.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

什么是Zoho CRM客户关系系统管理?

以客户为中心的商业时代&#xff0c;卓越的客户体验已成为企业持续增长与成功的关键,为了在这场激烈的市场竞争中脱颖而出&#xff0c;企业需要一套强大、灵活且智能的客户关系管理系统——Zoho CRM应运而生&#xff0c;它不仅是管理客户信息的工具箱&#xff0c;更是驱动业务增…

Geotrust哪种通配符证书800

Geotrust是成立了几十年的CA认证机构&#xff0c;每年都会通过WebTrust审计&#xff0c;旗下拥有各种类型的SSL数字证书产品&#xff0c;例如单域名SSL证书、多域名SSL证书和通配符SSL证书等。而为了更好地区分SSL证书产品&#xff0c;Geotrust旗下还分了几个子品牌&#xff0c…

【管理咨询宝藏103】麦肯锡咨询顾问逻辑结构内部培训

本报告首发于公号“管理咨询宝藏”&#xff0c;如需阅读完整版报告内容&#xff0c;请查阅公号“管理咨询宝藏”。 【管理咨询宝藏103】麦肯锡咨询顾问逻辑结构内部培训 【格式】PDF版本 【关键词】麦肯锡、咨询顾问、逻辑培训 【核心观点】 - 所谓逻辑性&#xff0c;指的是“…

DC-DC转换效率的影响因素和优化方向

一. 定义 DC-DC转换效率的定义是输入与输出功率之比&#xff1a; η P O U T P I N P O U T P O U T P L O S S η\frac{P_{OUT}}{P_{IN}}\frac{P_{OUT}}{P_{OUT}P_{LOSS}} ηPIN​POUT​​POUT​PLOSS​POUT​​ 其中POUT代表输出功率&#xff0c;PIN代表输入功率&#x…

RAG向量模型bce-embedding-base_v1、bce-reranker-base_v1

参考: https://huggingface.co/maidalun1020/bce-reranker-base_v1 一个向量模型,一个重排模型 下载模型: 这模型需要授权,所以需要–token https://huggingface.co/settings/tokens export HF_ENDPOINT=https://hf-mirror.comhuggingface-cli download --resume-downlo…

监控 Apache Web 服务器性能指标

Apache Web 服务器以其可靠性、灵活性和强大的功能而闻名&#xff0c;几十年来一直是互联网的支柱&#xff0c;从小型个人博客到大型电子商务平台&#xff0c;Apache 的多功能性使其能够轻松处理各种 Web 应用程序。 Apache 的 Web 服务器是如何工作的 尽管 Web 服务器涉及复…

Go微服务: Prometheus性能监控与Grafana平台的搭建

Prometheus 概述 promethues 是一套开源的监控&报警&时间序列数据库的组合基本原理是通过http协议周期性抓取被监控组件的状态适合Docker、Kubernetes环境的监控系统 Promethues 整体架构 一、抓取数据的两种方式 1 &#xff09;Short-lived jobs 短暂的任务 不会提…

“图生视频”技术创新:剪贴画秒变动画生成的实验验证与分析

在最近的研究进展中&#xff0c;AniClipart系统的问世标志着文本到视频生成技术的一个重要里程碑。这一系统由香港城市大学和莫纳什大学的研究者们共同开发&#xff0c;旨在解决将静态剪贴画图像根据文本提示自动转换成动画序列的挑战。传统的动画制作流程繁琐且耗时&#xff0…

【opencv】答题卡判分实验

实验环境&#xff1a; anaconda、jupyter notebook 实验用的包&#xff1a;numpy、matplotlib、opencv 实验的目的还是以熟悉图像的透视变换、轮廓特征提取为主要目的 关于如何判断答题卡被选项&#xff1a;通过几个覆盖备选项的掩膜与原二值图像想与&#xff0c;最终整个图像…

基于BF算法和KMP算法的病毒感染检测

案例引入&#xff1a; 实验任务&#xff1a; 代码实现&#xff1a; 注意&#xff1a;我以项目的形式编写此代码&#xff0c;编译环境为VS2022&#xff0c;代码移植可能会导致错误 mystring.h&#xff1a;存放结构体以及函数声明 #define _CRT_SECURE_NO_WARNINGS #pragma on…

2024中国应急(消防)品牌巡展西安站成功召开!惊喜不断

消防品牌巡展西安站 5月10日&#xff0c;由中国安全产业协会指导&#xff0c;中国安全产业协会应急创新分会、应急救援产业网联合主办&#xff0c;陕西消防协会协办的“一切为了安全”2024年中国应急(消防)品牌巡展-西安站成功举办。该巡展旨在展示中国应急&#xff08;消防&am…

Linux服务器lvm磁盘管理fdisk和df磁盘大小不同修改

服务器端由于硬盘是通过VCenter原来100G磁盘复制的虚拟机,复制完成后,原来100G的磁盘通过选择 磁盘重新复制出150G的磁盘,开机后发现还是原来的100G的磁盘,通过fdisk -l 查看有个sdb是150G, 但是已经划转的lvm盘只有100G, 通过df查看也是原来的100G: pvs查看pv里也是10…