数据结构和算法:分治

分治算法

分治(divide and conquer),全称分而治之,是一种非常重要且常见的算法策略。分治通常基于递归实现,包括“分”和“治”两个步骤。
1.分(划分阶段):递归地将原问题分解为两个或多个子问题,直至到达最小子问题时终止。
2.治(合并阶段):从已知解的最小子问题开始,从底至顶地将子问题的解进行合并,从而构建出原问题的解。

“归并排序”是分治策略的典型应用之一:
在这里插入图片描述
1.分:递归地将原数组(原问题)划分为两个子数组(子问题),直到子数组只剩一个元素(最小子问题);
2.治:从底至顶地将有序的子数组(子问题的解)进行合并,从而得到有序的原数组(原问题的解)。

如何判断分治问题

一个问题是否适合使用分治解决,通常可以参考以下几个判断依据:
1.问题可以分解:原问题可以分解成规模更小、类似的子问题,以及能够以相同方式递归地进行划分。
2.子问题是独立的:子问题之间没有重叠,互不依赖,可以独立解决。
3.子问题的解可以合并:原问题的解通过合并子问题的解得来。

显然,归并排序满足以上三个判断依据。
1.问题可以分解:递归地将数组(原问题)划分为两个子数组(子问题)。
2.子问题是独立的:每个子数组都可以独立地进行排序(子问题可以独立进行求解)。
3.子问题的解可以合并:两个有序子数组(子问题的解)可以合并为一个有序数组(原问题的解)。

通过分治提升效率

分治不仅可以有效地解决算法问题,往往还可以提升算法效率。
在排序算法中,快速排序、归并排序、堆排序相较于选择、冒泡、插入排序更快,就是因为它们应用了分治策略。

1. 操作数量优化

以“冒泡排序”为例,其处理一个长度为 𝑛 的数组需要 𝑂(𝑛^2) 时间。
假设按照下图所示的方式,将数组从中点处分为两个子数组,则划分需要 𝑂(𝑛) 时间,排序每个子数组需要 𝑂((𝑛/2)^2) 时间,合并两个子数组需要 𝑂(𝑛) 时间,总体时间复杂度为:
在这里插入图片描述
在这里插入图片描述
接下来,计算以下不等式,其左边和右边分别为划分前和划分后的操作总数:
在这里插入图片描述
这意味着当 𝑛 > 4 时,划分后的操作数量更少,排序效率应该更高。请注意,划分后的时间复杂度仍然是平方阶 𝑂(𝑛^2) ,只是复杂度中的常数项变小了。

进一步想,如果把子数组不断地再从中点处划分为两个子数组,直至子数组只剩一个元素时停止划分呢?这种思路实际上就是“归并排序”,时间复杂度为 𝑂(𝑛 log 𝑛) 。

再思考,如果多设置几个划分点,将原数组平均划分为 𝑘 个子数组呢?这种情况与“桶排序”非常类似,它非常适合排序海量数据,理论上时间复杂度可以达到 𝑂(𝑛 + 𝑘) 。

2. 并行计算优化

分治生成的子问题是相互独立的,因此通常可以并行解决。也就是说,分治不仅可以降低算法的时间复杂度,还有利于操作系统的并行优化。

并行优化在多核或多处理器的环境中尤其有效,因为系统可以同时处理多个子问题,更加充分地利用计算资源,从而显著减少总体的运行时间。

比如在下图所示的“桶排序”中,将海量的数据平均分配到各个桶中,则可所有桶的排序任务分散到各个计算单元,完成后再合并结果:
在这里插入图片描述

分治常见应用

一方面,分治可以用来解决许多经典算法问题:
寻找最近点对:该算法首先将点集分成两部分,然后分别找出两部分中的最近点对,最后找出跨越两部分的最近点对。
大整数乘法:例如 Karatsuba 算法,它将大整数乘法分解为几个较小的整数的乘法和加法。
矩阵乘法:例如 Strassen 算法,它将大矩阵乘法分解为多个小矩阵的乘法和加法。
汉诺塔问题:汉诺塔问题可以通过递归解决,这是典型的分治策略应用。
求解逆序对:在一个序列中,如果前面的数字大于后面的数字,那么这两个数字构成一个逆序对。求解逆序对问题可以利用分治的思想,借助归并排序进行求解。

另一方面,分治在算法和数据结构的设计中应用得非常广泛:
二分查找:二分查找是将有序数组从中点索引处分为两部分,然后根据目标值与中间元素值比较结果,决定排除哪一半区间,并在剩余区间执行相同的二分操作。
归并排序:。。。。。
快速排序:快速排序是选取一个基准值,然后把数组分为两个子数组,一个子数组的元素比基准值小,另一子数组的元素比基准值大,再对这两部分进行相同的划分操作,直至子数组只剩下一个元素。
桶排序:桶排序的基本思想是将数据分散到多个桶,然后对每个桶内的元素进行排序,最后将各个桶的元素依次取出,从而得到一个有序数组。
:例如二叉搜索树、AVL 树、红黑树、B 树、B+ 树等,它们的查找、插入和删除等操作都可以视为分治策略的应用。
:堆是一种特殊的完全二叉树,其各种操作,如插入、删除和堆化,实际上都隐含了分治的思想。
哈希表:虽然哈希表并不直接应用分治,但某些哈希冲突解决方案间接应用了分治策略,例如,链式地址中的长链表会被转化为红黑树,以提升查询效率。

分治搜索策略

搜索算法分为两大类。
暴力搜索:它通过遍历数据结构实现,时间复杂度为 𝑂(𝑛) 。
自适应搜索:它利用特有的数据组织形式或先验信息,时间复杂度可达到 𝑂(log 𝑛) 甚至 𝑂(1) 。

实际上,时间复杂度为 𝑂(log 𝑛) 的搜索算法通常是基于分治策略实现的,例如二分查找和树。
二分查找的每一步都将问题(在数组中搜索目标元素)分解为一个小问题(在数组的一半中搜索目标元素),这个过程一直持续到数组为空或找到目标元素为止。
树是分治思想的代表,在二叉搜索树、AVL 树、堆等数据结构中,各种操作的时间复杂度皆为 𝑂(log 𝑛)。

二分查找的分治策略如下所示:
问题可以分解:二分查找递归地将原问题(在数组中进行查找)分解为子问题(在数组的一半中进行查找),这是通过比较中间元素和目标元素来实现的。
子问题是独立的:在二分查找中,每轮只处理一个子问题,它不受其他子问题的影响。
子问题的解无须合并:二分查找旨在查找一个特定元素,因此不需要将子问题的解进行合并。当子问题得到解决时,原问题也会同时得到解决。

分治能够提升搜索效率,本质上是因为暴力搜索每轮只能排除一个选项,而分治搜索每轮可以排除一半选项。

1.基于分治实现二分查找

给定一个长度为 𝑛 的有序数组 nums ,其中所有元素都是唯一的,请查找元素 target 。

从分治角度,将搜索区间 [𝑖, 𝑗] 对应的子问题记为 𝑓(𝑖, 𝑗) :
以原问题 𝑓(0, 𝑛 − 1) 为起始点,通过以下步骤进行二分查找。
1.计算搜索区间 [𝑖, 𝑗] 的中点 𝑚 ,根据它排除一半搜索区间。
2.递归求解规模减小一半的子问题,可能为 𝑓(𝑖, 𝑚 − 1) 或 𝑓(𝑚 + 1, 𝑗) ;
3.循环第 1. 步和第 2. 步,直至找到 target 或区间为空时返回。

下图展示了在数组中二分查找元素 6 的分治过程:
在这里插入图片描述

/*** File: binary_search_recur.cpp* Created Time: 2023-07-17* Author: krahets (krahets@163.com)*/#include "../utils/common.hpp"/* 二分查找:问题 f(i, j) */
int dfs(vector<int> &nums, int target, int i, int j) {// 若区间为空,代表无目标元素,则返回 -1if (i > j) {return -1;}// 计算中点索引 mint m = (i + j) / 2;if (nums[m] < target) {// 递归子问题 f(m+1, j)return dfs(nums, target, m + 1, j);} else if (nums[m] > target) {// 递归子问题 f(i, m-1)return dfs(nums, target, i, m - 1);} else {// 找到目标元素,返回其索引return m;}
}/* 二分查找 */
int binarySearch(vector<int> &nums, int target) {int n = nums.size();// 求解问题 f(0, n-1)return dfs(nums, target, 0, n - 1);
}/* Driver Code */
int main() {int target = 6;vector<int> nums = {1, 3, 6, 8, 12, 15, 23, 26, 31, 35};// 二分查找(双闭区间)int index = binarySearch(nums, target);cout << "目标元素 6 的索引 = " << index << endl;return 0;
}

构建二叉树问题

给定一棵二叉树的前序遍历 preorder 和中序遍历 inorder ,请从中构建二叉树,返回二叉树的根节点。假设二叉树中没有值重复的节点(如图所示)。
在这里插入图片描述

1.判断是否为分治问题

原问题定义为从 preorder 和 inorder 构建二叉树,是一个典型的分治问题:
问题可以分解:从分治的角度切入,可以将原问题划分为两个子问题:构建左子树、构建右子树,加上一步操作:初始化根节点。而对于每棵子树(子问题),仍然可以复用以上划分方法,将其划分为更小的子树(子问题),直至达到最小子问题(空子树)时终止;
子问题是独立的:左子树和右子树是相互独立的,它们之间没有交集。在构建左子树时,只需关注中序遍历和前序遍历中与左子树对应的部分。右子树同理。
子问题的解可以合并:一旦得到了左子树和右子树(子问题的解),我们就可以将它们链接到根节点上,得到原问题的解。

2.如何划分子树

根据以上分析,这道题可以使用分治来求解,但如何通过前序遍历 preorder 和中序遍历 inorder 来划分左子树和右子树呢?
根据定义,preorder 和 inorder 都可以划分为三个部分。
前序遍历:[ 根节点 | 左子树 | 右子树 ] ,例如图 12‑5 的树对应 [ 3 | 9 | 2 1 7 ] 。
中序遍历:[ 左子树 | 根节点 | 右子树 ] ,例如图 12‑5 的树对应 [ 9 | 3 | 1 2 7 ] 。

以上图数据为例,可以通过下图所示的步骤得到划分结果:
1.前序遍历的首元素 3 是根节点的值。
2.查找根节点 3 在 inorder 中的索引,利用该索引可将 inorder 划分为 [ 9 | 3 | 1 2 7 ] 。
3.根据 inorder 的划分结果,易得左子树和右子树的节点数量分别为 1 和 3 ,从而可将 preorder 划分为[ 3 | 9 | 2 1 7 ] 。

在这里插入图片描述

3.基于变量描述子树区间

根据以上划分方法,已经得到根节点、左子树、右子树在 preorder 和 inorder 中的索引区间。而为了描述这些索引区间,需要借助几个指针变量。
将当前树的根节点在 preorder 中的索引记为 𝑖 ;
将当前树的根节点在 inorder 中的索引记为 𝑚 ;
将当前树在 inorder 中的索引区间记为 [𝑙, 𝑟] 。

在这里插入图片描述
通过以上变量即可表示根节点在 preorder 中的索引,以及子树在 inorder 中的索引区间。
右子树根节点索引中的 (𝑚 − 𝑙) 的含义是“左子树的节点数量”:
在这里插入图片描述

代码实现

为了提升查询 𝑚 的效率,借助一个哈希表 hmap 来存储数组 inorder 中元素到索引的映射:

/*** File: build_tree.cpp* Created Time: 2023-07-17* Author: Krahets (krahets@163.com)*/#include "../utils/common.hpp"/* 构建二叉树:分治 */
TreeNode *dfs(vector<int> &preorder, unordered_map<int, int> &inorderMap, int i, int l, int r) {// 子树区间为空时终止if (r - l < 0)return NULL;// 初始化根节点TreeNode *root = new TreeNode(preorder[i]);// 查询 m ,从而划分左右子树int m = inorderMap[preorder[i]];// 子问题:构建左子树root->left = dfs(preorder, inorderMap, i + 1, l, m - 1);// 子问题:构建右子树root->right = dfs(preorder, inorderMap, i + 1 + m - l, m + 1, r);// 返回根节点return root;}/* 构建二叉树 */
TreeNode *buildTree(vector<int> &preorder, vector<int> &inorder) {// 初始化哈希表,存储 inorder 元素到索引的映射  unordered_map<int, int> inorderMap;for (int i = 0; i < inorder.size(); i++) {inorderMap[inorder[i]] = i;}TreeNode *root = dfs(preorder, inorderMap, 0, 0, inorder.size() - 1);return root;
}/* Driver Code */
int main() {vector<int> preorder = {3, 9, 2, 1, 7};vector<int> inorder = {9, 3, 1, 2, 7};cout << "前序遍历 = ";printVector(preorder);cout << "中序遍历 = ";printVector(inorder);TreeNode *root = buildTree(preorder, inorder);cout << "构建的二叉树为:\n";printTree(root);return 0;
}

下图展示了构建二叉树的递归过程,各个节点是在向下“递”的过程中建立的,而各条边(引用)是在向上“归”的过程中建立的:
在这里插入图片描述
在这里插入图片描述

每个递归函数内的前序遍历 preorder 和中序遍历 inorder 的划分结果如图所示:
在这里插入图片描述
设树的节点数量为 𝑛 ,初始化每一个节点(执行一个递归函数 dfs() )使用 𝑂(1) 时间。因此总体时间复杂度为 𝑂(𝑛) 。
哈希表存储 inorder 元素到索引的映射,空间复杂度为 𝑂(𝑛) 。在最差情况下,即二叉树退化为链表时,递归深度达到 𝑛 ,使用 𝑂(𝑛) 的栈帧空间。因此总体空间复杂度为 𝑂(𝑛) 。

汉诺塔问题

给定三根柱子,记为 A、B 和 C 。起始状态下,柱子 A 上套着 𝑛 个圆盘,它们从上到下按照从小到大的顺序排列。
在这里插入图片描述

任务是要把这 𝑛 个圆盘移到柱子 C 上,并保持它们的原有顺序不变(如图所示)。在移动圆盘的过程中,需要遵守以下规则:
1.圆盘只能从一根柱子顶部拿出,从另一根柱子顶部放入。
2.每次只能移动一个圆盘。
3.小圆盘必须时刻位于大圆盘之上。

将规模为 𝑖 的汉诺塔问题记作 𝑓(𝑖) 。例如 𝑓(3) 代表将 3 个圆盘从 A 移动至 C 的汉诺塔问题。

1.考虑基本情况

对于问题 𝑓(1) ,即当只有一个圆盘时,将它直接从 A 移动至 C 即可。
在这里插入图片描述

对于问题 𝑓(2) ,即当有两个圆盘时,由于要时刻满足小圆盘在大圆盘之上,因此需要借助 B 来完成移动:
1.先将上面的小圆盘从 A 移至 B ;
2.再将大圆盘从 A 移至 C ;
3.最后将小圆盘从 B 移至 C 。
在这里插入图片描述

解决问题 𝑓(2) 的过程可总结为:将两个圆盘借助 B 从 A 移至 C 。其中,C 称为目标柱、B 称为缓冲柱。

2.子问题分解

对于问题 𝑓(3) ,即当有三个圆盘时,情况变得稍微复杂了一些。
因为已知 𝑓(1) 和 𝑓(2) 的解,所以我们可从分治角度思考,将 A 顶部的两个圆盘看作一个整体。
执行下图所示的步骤。这样三个圆盘就被顺利地从 A 移至 C 了。

1.令 B 为目标柱、C 为缓冲柱,将两个圆盘从 A 移至 B ;
2.将 A 中剩余的一个圆盘从 A 直接移动至 C ;
3.令 C 为目标柱、A 为缓冲柱,将两个圆盘从 B 移至 C 。

在这里插入图片描述
从本质上看,将问题 𝑓(3) 划分为两个子问题 𝑓(2) 和一个子问题 𝑓(1) 。按顺序解决这三个子问题之后,原问题随之得到解决。这说明子问题是独立的,而且解可以合并。

至此,可总结出解决汉诺塔问题的分治策略:将原问题 𝑓(𝑛) 划分为两个子问题 𝑓(𝑛−1) 和一个子问题 𝑓(1) ,并按照以下顺序解决这三个子问题:
1.将 𝑛 − 1 个圆盘借助 C 从 A 移至 B 。
2.将剩余 1 个圆盘从 A 直接移至 C 。
3.将 𝑛 − 1 个圆盘借助 A 从 B 移至 C 。

在这里插入图片描述

对于这两个子问题 𝑓(𝑛 − 1) ,可以通过相同的方式进行递归划分,直至达到最小子问题 𝑓(1) 。而 𝑓(1) 的解是已知的,只需一次移动操作即可。

3.代码实现

在代码中,声明一个递归函数 dfs(i, src, buf, tar) ,它的作用是将柱 src 顶部的 𝑖 个圆盘借助缓冲柱 buf 移动至目标柱 tar :

// === File: hanota.cpp ===
/* 移动一个圆盘 */
void move(vector<int> &src, vector<int> &tar) {// 从 src 顶部拿出一个圆盘int pan = src.back();src.pop_back();// 将圆盘放入 tar 顶部tar.push_back(pan);
}/* 求解汉诺塔问题 f(i) */
void dfs(int i, vector<int> &src, vector<int> &buf, vector<int> &tar) {// 若 src 只剩下一个圆盘,则直接将其移到 tarif (i == 1) {move(src, tar);return;}// 子问题 f(i-1) :将 src 顶部 i-1 个圆盘借助 tar 移到 bufdfs(i - 1, src, tar, buf);// 子问题 f(1) :将 src 剩余一个圆盘移到 tarmove(src, tar);// 子问题 f(i-1) :将 buf 顶部 i-1 个圆盘借助 src 移到 tardfs(i - 1, buf, src, tar);
}
/* 求解汉诺塔问题 */
void solveHanota(vector<int> &A, vector<int> &B, vector<int> &C) {int n = A.size();// 将 A 顶部 n 个圆盘借助 B 移到 Cdfs(n, A, B, C);
}

汉诺塔问题形成一棵高度为 𝑛 的递归树,每个节点代表一个子问题,对应一个开启的 dfs()函数,因此时间复杂度为 𝑂(2^𝑛) ,空间复杂度为 𝑂(𝑛) 。
在这里插入图片描述

学习地址

学习地址:https://github.com/krahets/hello-algo
重新复习数据结构,所有的内容都来自这里。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/596311.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring源码解析-容器基本实现

spring源码解析 整体架构 defaultListableBeanFactory xmlBeanDefinitionReader 创建XmlBeanFactory 对资源文件进行加载–Resource 利用LoadBeandefinitions(resource)方法加载配置中的bean loadBeandefinitions加载步骤 doLoadBeanDefinition xml配置模式 validationMode 获…

Open CASCADE学习|放样建模

在CAD软件中&#xff0c;Loft&#xff08;放样&#xff09;功能则是用于创建三维实体或曲面的重要工具。通过选取两个或多个横截面&#xff0c;并沿这些横截面进行放样&#xff0c;可以生成复杂的三维模型。在CAD放样功能的操作中&#xff0c;用户可以选择不同的选项来定制放样…

二分答案 蓝桥杯 2022 省A 青蛙过河

有些地方需要解释&#xff1a; 1.从学校到家和从家到学校&#xff0c;跳跃都是一样的&#xff0c;直接看作2*x次过河就可以。 2.对于一个跳跃能力 y&#xff0c;青蛙能跳过河 2x 次&#xff0c;当且仅当对于每个长度为 y 的区间&#xff0c;这个区间内 h 的和都大于等于…

并发编程01-深入理解Java并发/线程等待/通知机制

为什么我们要学习并发编程&#xff1f; 最直白的原因&#xff0c;因为面试需要&#xff0c;我们来看看美团和阿里对 Java 岗位的 JD&#xff1a; 从上面两大互联网公司的招聘需求可以看到&#xff0c; 大厂的 Java 岗的并发编程能力属于标配。 而在非大厂的公司&#xff0c; 并…

安卓主板MT8390(Genio 700)_MTK联发科Linux开发板方案

MediaTek Genio 700 &#xff08;MT8390&#xff09;是一款高性能的边缘 AI 物联网平台&#xff0c;专为智能家居、互动零售、工业与商业应用而设计。提供快速响应的边缘计算能力、先进的多媒体功能、广泛的传感器和连接方式&#xff0c;且支持多任务操作系统。 MT8390安卓核心…

C# 委托的基础应用

一、Action 和 Func 的使用。 二、自定义委托&#xff1a; 完整的使用代码示例&#xff1a; 三、委托的一般使用 模板方法&#xff1a; 回调方法&#xff0c;在模板方法的基础上进行添加。

基于Vision Transformer的迁移学习在乳腺X光图像分类中的应用

乳房X线摄影(MG)在乳腺癌的早期发现中起着重要作用。MG可以在早期阶段发现乳腺癌&#xff0c;即使是感觉不到肿块的小肿瘤。基于卷积神经网络(CNN)的DL最近吸引了MG的大量关注&#xff0c;因为它有助于克服CAD系统的限制(假阳性、不必要的辐射暴露、无意义的活组织检查、高回调…

C++面向对象程序设计 - 对象指针和this指针

在C学习中&#xff0c;指针是一个用于指向另一个变量的地址的变量。理解指针有一定难度&#xff0c;但是理解它的工作原理后&#xff0c;会发现它们是非常强大和有用的工具。指针可以用来指向一般的变量&#xff0c;也可以指向对象。 一、指向对象的指针 在建立对象时&#xf…

ARM v8 Cortex R52内核 02 程序模型 Programmers Model

ARM v8 Cortex R52内核 02 程序模型 Programmers Model 2.1 关于程序模型 Cortex-R52处理器实现了Armv8-R架构。这包括&#xff1a; 所有的异常级别&#xff0c;EL0-EL2。 每个异常级别下的AArch32执行状态。 T32和A32指令集&#xff0c;其中包括&#xff1a; 浮点运算。 …

文件的随机读写--fseek,ftell,拷贝文件

想要查看fseek&#xff0c;ftell&#xff0c;函数&#xff0c;请登录这个网站&#xff1a; cplusplus.com - The C Resources Networkhttps://legacy.cplusplus.com/ 还有一个函数没有写出来&#xff0c;是rewind&#xff0c;它是&#xff1a;让⽂件指针的位置回到⽂件的起始位…

java.lang.NoClassDefFoundError: javax/validation/constraints/Min

1、报错截图 2、解决办法 添加依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-validation</artifactId> </dependency>

论文润色康康我

想象一下&#xff0c;当您埋头苦干&#xff0c;终于完成了一篇研究论文或商业报告&#xff0c;那份成就感无疑是巨大的。然而&#xff0c;文章的完成只是第一步&#xff0c;如何让文章在众多作品中脱颖而出&#xff0c;才是摆在每一位作者面前的挑战。这时&#xff0c;意得辑的…