排序算法之【归并排序】

📙作者简介: 清水加冰,目前大二在读,正在学习C/C++、Python、操作系统、数据库等。

📘相关专栏:C语言初阶、C语言进阶、C语言刷题训练营、数据结构刷题训练营、有感兴趣的可以看一看。

欢迎点赞 👍 收藏 ⭐留言 📝 如有错误还望各路大佬指正!

✨每一次努力都是一种收获,每一次坚持都是一种成长✨       

在这里插入图片描述

目录

 前言

1. 归并排序

   1.1 原理

2. 排序实现

 2.1 递归

2.2 非递归

3. 复杂度

 空间复杂度

时间复杂度

总结


 前言

        归并排序也是常用排序算法中较为重要的,对于新手来说较为复杂的排序算法,也是一个十分高效的排序算法。本篇文章我将带领大家深入理解归并排序。


1. 归并排序

         归并排序是一种分治算法,它将一个大问题分解成多个小问题,然后将这些小问题的解合并起来得到最终的解。

   1.1 原理

  1. 将待排序的数组分成多个子数组,分别对这些子数组进行归并排序。
  2. 对有序的两个子数组进行合并,合并后的数组是有序的。

归并排序核心步骤如下: 

       

2. 排序实现

        两两合并的前提是两个数组都必须有序,在归并排序中也存在使用递归和非递归的方法实现。

 2.1 递归

         我们先使用递归来实现归并,归并的过程中我们并不是在原数组中进行排序,我们需要额外创建一个等大的数组,将分解后排序过的数组放到新数组中,然后将新数组中排好的数据拷贝到原数组中。(每合并一次就拷贝一次)

         首先我们肯定需要先开辟一个新的数组,然后是对数组进行分讲合并。

void MergrSort(int* a, int n)
{int* tmp = (int*)malloc(sizeof(int) * n);if (tmp == NULL){perror("malloc fail");return;}//调整排序接口free(tmp);
}

         调整排序接口的实现,归并排序是对数组进行二等分,当分解到只有一个数据时开始合并。所以这里使用递归是非常合适的,先分解,当分解到最小,然后开始逐层返回合并(向下递归的过程为分解,递归返回的过程为合并)。

void _MergrSort(int* a, int* tmp, int begin, int end)
{if (end <= begin)return;int mid = (begin + end) / 2;_MergrSort(a, tmp, begin, mid);_MergrSort(a, tmp, mid + 1, end);//归并//  ……}

 接下来就是合并过程的实现。我们已知数组大小,对数组进行不断二分,每次归并时都是两两归并,这里我们需要记录一些两个数组的起始下标。然后遍历两数组,谁小就把数据尾插到新数组。

 注意一个数组遍历结束,另一个数组没有结束的情况。

代码如下: 

void _MergrSort(int* a, int* tmp, int begin, int end)
{if (end <= begin)return;int mid = (begin + end) / 2;_MergrSort(a, tmp, begin, mid);_MergrSort(a, tmp, mid + 1, end);//合并int begin1 = begin, end1 = mid;//记录两数组的起始下标int begin2 = mid + 1, end2 = end;int index = begin;    //记录新数组数据的下标while (begin1 <= end1 && begin2 <= end2)//遍历数组,当一个数组遍历结束就结束{if (a[begin1] < a[begin2]){tmp[index++] = a[begin1++];}else{tmp[index++] = a[begin2++];}}//一共数组结束另一个数组没结束的情况while (begin1 <= end1){tmp[index++] = a[begin1++];}while (begin2 <= end2){tmp[index++] = a[begin2++];}//归并一次,把数据拷贝回原数组一次memcpy(a + begin, tmp + begin, (end - begin + 1) * sizeof(int));}

         注意:记录新数组的下标index不要初始等于0,因为它将合并的数据放到到新数组时,开始的位置不一定是0,index是在函数内创建的变量出函数作用域无法保存,但是它开始的位置恰好就是当前合并范围中数组1的起始位置下标(begin1),所以index=begin;

2.2 非递归

         使用递归需要消耗计算机的栈区,而栈区在计算机内存中空间很小,在多次调用函数的过程速度也没有同等条件下循环快(随着计算机的不断完善和优化它们之间差距其实也没那么大),考虑到空间和速度问题,我们很有必要学习一下非递归的实现方法。

         非递归相对于递归来说有很多的坑,也更复杂一点。那我们实现非递归要怎么去设计?归并不和快排一样,它使用栈并不能模拟出归并的过程。

 为什么?

例如上述的数组,我们在分的时候可以分为以下区间:

 用栈来模拟实现逻辑如下:

         在0~1和2~3区间数据各自归并后拷贝回原数组,下一步就需要将0~1和2~3这两个区间数据归并成一个数组,归并区间是0~3,但此时就再从栈里取,取出的是4~7这个区间。所以使用栈来模拟归并行不通。

 那我们要怎么设计?我们来看一下它的归并划分:

         那它的区间变化规律就可以这样写:

int begin1 = i, end1 = i + gap - 1;
int begin2 = i + gap, end2 = i + 2 * gap - 1;

        这里我们可以使用循环来跳区间,i的初始值为0,11归,跳到下一个归并区间开始位置需要跳2步;22归,跳到下一个归并区间开始位置需要跳4步;由此我们找到i的变化规律,i每次增加2倍gap。

void MergrSortNoneR(int* a, int n)
{int* tmp = (int*)malloc(sizeof(int) * n);if (tmp == NULL){perror("malloc fail");return;}int gap = 1;for (int i = 0; i < n; i += gap * 2){int begin1 = i, end1 = i + gap - 1;int begin2 = i + gap, end2 = i + 2 * gap - 1;int index = i;while (begin1 <= end1 && begin2 <= end2){if (a[begin1] < a[begin2]){tmp[index++] = a[begin1++];}else{tmp[index++] = a[begin2++];}}while (begin1 <= end1){tmp[index++] = a[begin1++];}while (begin2 <= end2){tmp[index++] = a[begin2++];}memcpy(a + i, tmp + i, (end2 - i + 1) * sizeof(int));}free(tmp);
}

        这里的gap默认的是1,前边要求的gap是变化的,11归每次跳到下一个区间开始gap=1,22归每次跳到下一个区间开始gap=2,44归每次跳到下一个区间开始gap=4。gap每次扩大两倍。所以我们还需要再套一个循环:

void MergrSortNoneR(int* a, int n)
{int* tmp = (int*)malloc(sizeof(int) * n);if (tmp == NULL){perror("malloc fail");return;}int gap = 1;while (gap < n){for (int i = 0; i < n; i += gap * 2){int begin1 = i, end1 = i + gap - 1;int begin2 = i + gap, end2 = i + 2 * gap - 1;int index = i;//归并//……}gap *= 2;}free(tmp);
}

 到这里还并没有结束,这个代码还有一个大坑,我们使用的示例是8个数据,那如果是9个数据要怎么办?到第9个数据归并时发现没有和它相对于的归并区间,i如果在一次跳2倍gap就越界了。

注意: 我们在使用递归实现时使用的是除来二分区间,除到最后最小也是0,但使用i跳区间就不一样,它是乘,那就一定存在跳越界的情况。

 所以在进行合并之前,我们需要判断一下是否越界,如果越界要及时修正。

for (int i = 0; i < n; i += gap * 2)
{int begin1 = i, end1 = i + gap - 1;int begin2 = i + gap, end2 = i + 2 * gap - 1;int index = i;if (begin2 >= n)//只有一个完整数组{break;}if (end2 >= n)//有一个完整的区间,第二个归并区间超了就修正{end2 = n - 1;//n-1是数组最后元素下标}//归并//……}

 非递归完整代码如下:

void MergrSortNoneR(int* a, int n)
{int* tmp = (int*)malloc(sizeof(int) * n);if (tmp == NULL){perror("malloc fail");return;}int gap = 1;while (gap < n){for (int i = 0; i < n; i += gap * 2){int begin1 = i, end1 = i + gap - 1;int begin2 = i + gap, end2 = i + 2 * gap - 1;int index = i;if (begin2 >= n){break;}if (end2 >= n){end2 = n - 1;}while (begin1 <= end1 && begin2 <= end2){if (a[begin1] < a[begin2]){tmp[index++] = a[begin1++];}else{tmp[index++] = a[begin2++];}}while (begin1 <= end1){tmp[index++] = a[begin1++];}while (begin2 <= end2){tmp[index++] = a[begin2++];}memcpy(a + i, tmp + i, (end2 - i + 1) * sizeof(int));}gap *= 2;}free(tmp);
}

3. 复杂度

说到排序那就一定要聊一聊它的复杂度。

 空间复杂度

在进行排序时我们额外开辟了一个新的等大数组,由此看来它的空间复杂度是O(N)。

时间复杂度

         在归并的过程中需要遍历每个子数组,然后重新排序,遍历子数组的时间复杂度是O(N),原数组二分成子数组,一共可以分logN个数组,所以它的时间复杂度就是O(N*logN)。


总结

        以上便是本期全部内容,归并排序是一种高效的排序算法,在实际应用中也有很大的价值,是一种值得掌握的算法,希望本文对你有所帮助。最后,感谢阅读!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/129124.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

TS类中属性的封装

我们在如下的代码中&#xff0c;我们在类中设置属性&#xff0c;创建的对象可以随意修改自身的属性&#xff0c;对象中的属性可以任意被修改导致对象中的数据非常不安全。 // 创建一个Person类 class Person {name: string;age: number;constructor(name: string, age: number…

安卓玩机----解锁system分区 可读写系统分区 magisk面具模块

玩机教程----安卓机型解锁system分区 任意修改删除系统文件 system分区可读写 参考上个博文可以了解到解锁system分区的有关常识。但目前很多机型都在安卓12 13 基础上。其实最简单的方法就在于刷写一个解锁system分区的第三方补丁包。在面具更新不能解锁系统分区的前提下。…

ElasticSearch搜索引擎:数据的写入流程

一、ElasticSearch 写数据的总体流程&#xff1a; &#xff08;1&#xff09;ES 客户端选择一个节点 node 发送请求过去&#xff0c;这个节点就是协调节点 coordinating node &#xff08;2&#xff09;协调节点对 document 进行路由&#xff0c;通过 hash 算法计算出数据应该…

3D孪生场景搭建:3D漫游

上一篇 文章介绍了如何使用 NSDT 编辑器 制作模拟仿真应用场景&#xff0c;今天这篇文章将介绍如何使用NSDT 编辑器 设置3D漫游。 1、什么是3D漫游 3D漫游是指基于3D技术&#xff0c;将用户带入一个虚拟的三维环境中&#xff0c;通过交互式的手段&#xff0c;让用户可以自由地…

【计算机视觉|人脸建模】学习从4D扫描中获取的面部形状和表情的模型

本系列博文为深度学习/计算机视觉论文笔记&#xff0c;转载请注明出处 标题&#xff1a;Learning a model of facial shape and expression from 4D scans 链接&#xff1a;Learning a model of facial shape and expression from 4D scans | ACM Transactions on Graphics Pe…

面试经典 150 题 1 —(数组 / 字符串)— 88. 合并两个有序数组

88. 合并两个有序数组 方法一&#xff1a; class Solution { public:void merge(vector<int>& nums1, int m, vector<int>& nums2, int n) {for(int i 0; i<n;i){nums1[mi] nums2[i];}sort(nums1.begin(),nums1.end());} };方法二&#xff1a; clas…

asp.net电影院选座系统VS开发sqlserver数据库web结构c#编程Microsoft Visual Studio

一、源码特点 asp.net电影院选座系统 是一套完善的web设计管理系统&#xff0c;系统具有完整的源代码和数据库&#xff0c;系统主要采用B/S模式开发。开发环境为vs2010&#xff0c;数据库为sqlserver2008&#xff0c;使用c#语言开发 asp.net电影院选座系统1 二、功能介…

CI/CD工具中的CI和CD的含义

CI/CD工具中的CI和CD的含义&#xff1f; CI/CD 是现代软件开发方法中广泛使用的一种方法。其中&#xff0c;CI 代表持续集成&#xff08;Continuous Integration&#xff09;&#xff0c;CD 则有两层含义&#xff0c;一是持续交付&#xff08;Continuous Delivery&#xff09;…

9 家用热水器用户行为分析与事件识别

第9章 家用热水器用户行为分析与事件识别 9.1 了解家用热水器用户行为分析的背景与步骤9.1.1 热水器采集数据基本情况9.1.2 熟悉家用热水器用户行为分析的步骤与流程 9.2 预处理热水器用户用水数据9.2.1 删除冗余特征9.2.2 划分用水事件9.2.3 确定单次用水事件时长阈值9.2.4 代…

Flask与PyQt结合使用时候,阻塞,界面卡死

一.问题起因 做了个服务端, 使用到了python的PYQT6和Flask, PYQT做的是个简单的设置界面: 但是在点击开始运行, 写入flask run的代码的时候, PYQT界面卡死了 代码如下: # 生产环境模式server make_server(0.0.0.0, ser_port, app)server.serve_forever()app.run() 二.问题产…

python pytorch- TextCNN TextRNN FastText Transfermer (中英文)文本情感分类实战(附数据集,代码皆可运行)

python pytorch- TextCNN TextRNN FastText Transfermer 文本情感分类实战&#xff08;附数据集&#xff0c;代码皆可运行&#xff09; 注&#xff1a;本次实验&#xff0c;主要注重代码实现这些模型&#xff0c;博主的数据集质量较差&#xff0c;模型评估效果并不是十分理想&…

Flutter环境搭建及新建项目

一、下载安装压缩包 https://storage.flutter-io.cn/flutter_infra_release/releases/stable/windows/flutter_windows_3.10.6-stable.zip 二、解压缩 解压之后&#xff0c;将里面的flutter整体拿出来 三、配置环境变量 将flutter/bin全路径配置到系统环境变量里面 四、运行…