数据结构与算法C语言版学习笔记(6)-树、二叉树、赫夫曼树

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • 前言
  • 一、树的定义
    • 1.结点的度、树的度
    • 2.结点的逻辑关系
    • 3.树的深度
    • 4.有序树和无序树
    • 5.森林
  • 二、树的存储结构
    • (1)双亲表示法
    • (2)孩子表示法
      • ①每个结点的指针域数量等于整个树的度
      • ②每个结点的指针域数量等于自己的度
      • ③升级改进后的孩子表示法
    • (3)孩子兄弟表示法
  • 三、二叉树
    • 1.背景引出
    • 2.二叉树的特殊形态
      • (1)斜树
      • (2)满二叉树
      • (3)完全二叉树
    • 3.二叉树的性质
    • 4.二叉树的存储结构
    • 5.二叉树的遍历算法(前序、中序、后序)
      • ①前序遍历
      • ②中序遍历:
      • ③后序遍历:
    • 6.已知前序/中序/后序三者中的其二,求另外一个
    • 7.建立一颗二叉树
  • 六、线索二叉树
  • 七、赫夫曼树


前言

前面说,数据的逻辑结构包括线性结构和非线性结构,线性结构学了线性表(顺序表与链表)、栈与队列、串等,而现在要接触的树是非线性结构,它是一对多的关系,更加复杂。

一、树的定义

在这里插入图片描述
在这里插入图片描述

1.结点的度、树的度

(1)结点拥有的子树数称为结点的度(Degree)。度为0的结点称为叶结点(Leaf)或终端结点;度不为0的结点称为非终端结点或分支结点。除根结点之外,分支结点也称为内部结点。比如D有三个子树,度为3;C有两个子树,度为2。

(2)树的度是树内各结点的度的最大值。如图6-2-4所示,因为这棵树结点的度的最大值是结点D的度,为3,所以树的度也为3。
在这里插入图片描述

2.结点的逻辑关系

在这里插入图片描述
结点的子树的根称为该结点的孩子(Child),相应地,该结点称为孩子的双亲(Parent)。嗯,为什么不是父或母,叫双亲呢?对于结点来说其父母同体,唯一的一个,所以只能把它称为双亲了。同一个双亲的孩子之间互称兄弟(Sibling)。结点的祖先是从根到该结点所经分支上的所有结点。所以对于H来说,D、B、A 都是它的祖先。反之,以某结点为根的子树中的任一结点都称为该结点的子孙。

3.树的深度

结点的层次(Level)从根开始定义起,根为第一层,根的孩子为第二层。若某结点在第1层,则其子树的根就在第l+1层。其双亲在同一层的结点互为堂兄弟。显然图6-2-6中的D、E、F是堂兄弟,而G、H、1、J也是。树中结点的最大层次称为树的深度(Depth)或高度,当前树的深度为4。
在这里插入图片描述

4.有序树和无序树

如果将树中结点的各子树看成从左至右是有次序的,不能互换的,则称该树为有序树,否则称为无序树

5.森林

在这里插入图片描述在这里插入图片描述

二、树的存储结构

树的存储结构不同于线性表,由于结构的差异,很难用顺序结构来表示,这里产生了针对树的三种存储结构:
(1)双亲表示法:每个节点除了数据域外,还包含一个指向父节点的指针。根节点的指针为空。这种存储结构方便查找父节点,但是查找子节点需要遍历整个树。

(2)孩子表示法:每个节点包含一个指向第一个子节点的指针,以及一个指向兄弟节点的指针。这种存储结构方便查找子节点和兄弟节点,但是查找父节点需要遍历整个树。

(2)孩子兄弟表示法:每个节点包含一个指向第一个子节点的指针,以及一个指向下一个兄弟节点的指针。这种存储结构比较灵活,可以表示任意树形结构,但是查找父节点需要遍历整个树。

(1)双亲表示法

我们人可能因为种种原因,没有孩子,但无论是谁都不可能是从石头里出来的,所以是人一定会有父母。树这种结构也不例外,除了根结点外,其余每个结点,它不一定有孩子,但是一定有且仅有一个双亲。
我们假设以一组连续空间存储树的结点,同时在每个结点中,附设一个指示器指示其双亲结点到链表中的位置。也就是说,每个结点除了知道自己是谁以外,还知道它的双亲在哪里。它的结点结构为表6-4-1所示。
在这里插入图片描述

其中 data是数据域,存储结点的数据信息。而 parent是指针域,存储该结点的双亲在数组中的下标。所以它与链表还是有区别的,链表指针域存储的是后驱结点的地址。
在这里插入图片描述
所以我们可以通过一个结点很容易找到其双亲结点,但是很难找到其孩子节点。

如果需要解决找到孩子结点的问题,当然可以再拓展一个指针域,用来存储一个长子的位置。
在这里插入图片描述

(2)孩子表示法

顾名思义,每一个结点除了自己的数据域外,指针域存储了自己的孩子结点的位置。

①每个结点的指针域数量等于整个树的度

在这里插入图片描述
很明显,最大的缺点就是每个结点的子节点个数不一致,所以会空出许多空间没有被利用,浪费存储空间。

②每个结点的指针域数量等于自己的度

在这里插入图片描述
这也有缺点,每个结点的存储结构不同,看着很费劲。

③升级改进后的孩子表示法

为了既可以节省存储空间,又可以将存储结构看起来整齐划一,设计了升级版的孩子表示法:
在这里插入图片描述
如图,对于一棵树,变成了顺序表+链表的形式,每个结点的数据和长子指针构成了一个顺序结构的一维数组,然后每个节点的长子结点又引出链式结构,指向第二个孩子,第二个孩子结点又有一个next指针指向后驱结点即第三个孩子,如此往复。
孩子表示法结构体:
在这里插入图片描述
在这里插入图片描述

(3)孩子兄弟表示法

刚才我们分别从双亲的角度和从孩子的角度研究树的存储结构,如果我们从树结点的兄弟的角度又会如何呢?当然,对于树这样的层级结构来说,只研究结点的兄弟是不行的,我们观察后发现,任意一棵树,它的结点的第一个孩子如果存在就是唯一的,它的右兄弟如果存在也是唯一的。因此,我们设置两个指针,分别指向该结点的第一个孩子和此结点的右兄弟。
在这里插入图片描述
简而言之,一个结点的数据域是自己的数据,两个指针域,第一个指向自己的长子,第二个指向自己的右边的兄弟。
在这里插入图片描述

三、二叉树

1.背景引出

我们玩猜数字游戏, 猜0-100中的某个数,可以使用二分法。先猜50,大则猜25,小则猜75,然后再次二分。
在这里插入图片描述
这种结构就叫二叉树结构。二叉树是一种特殊的树结构,每个节点最多有两个子节点,分别称为左子节点和右子节点。

二叉树的特点有:
①每个结点最多有两棵子树,所以二叉树中不存在度大于2的结点。注意不是只有两棵子树,而是最多有。没有子树或者有一棵子树都是可以的。
②左子树和右子树是有顺序的,次序不能任意颠倒。就像人是双手、双脚,但显然左手、左脚和右手、右脚是不一样的,右手戴左手套、右脚穿左鞋都会极其别扭和难受。
③即使树中某结点只有一棵子树,也要区分它是左子树还是右子树。图6-5-3中,树1和树2是同一棵树,但它们却是不同的二叉树。就好像你一不小心,摔伤了手,伤的是左手还是右手,对你的生活影响度是完全不同的。

2.二叉树的特殊形态

(1)斜树

在这里插入图片描述
斜树是一种特殊的二叉树,所有的节点都只有左子节点或右子节点,没有同时拥有左子节点和右子节点的节点。斜树可以分为左斜树和右斜树,具体取决于所有节点只有左子节点或右子节点。

(2)满二叉树

在这里插入图片描述
满二叉树是一种特殊的二叉树,除了叶节点外,每个节点都有两个子节点。满二叉树的特点是所有的叶节点都在同一层上,并且除了叶节点外,每个节点的度数都是2。

(3)完全二叉树

在这里插入图片描述

完全二叉树是一种特殊的二叉树,除了最后一层外,其他层的节点都是满的,且最后一层的节点都靠左排列。也可以说,完全二叉树是一颗二叉树中,从上到下、从左到右依次填满节点的二叉树。

3.二叉树的性质

二叉树具有以下性质:

每个节点最多有两个子节点:每个节点最多有两个子节点,分别称为左子节点和右子节点。如果一个节点没有子节点,称为叶节点。

左子树和右子树的顺序不能颠倒:二叉树的左子树和右子树的顺序不能颠倒,即左子节点在右子节点之前。

每个节点的子树也是二叉树:二叉树的每个节点的子节点也是二叉树,即每个节点都可以看作是根节点。

二叉树的高度:二叉树的高度是指从根节点到最深叶节点的路径上的节点数。树中的节点数目为n,那么二叉树的高度最大为n-1,最小为log2(n+1)。

二叉树的遍历:二叉树的遍历有三种常用的方式,分别是前序遍历、中序遍历和后序遍历。前序遍历先访问根节点,然后递归访问左子树和右子树。中序遍历先递归访问左子树,然后访问根节点,最后递归访问右子树。后序遍历先递归访问左子树和右子树,最后访问根节点。

二叉搜索树(Binary Search Tree,简称BST):二叉搜索树是一种特殊的二叉树,其中每个节点的值都大于其左子树中的任意节点的值,且小于其右子树中的任意节点的值。这使得在二叉搜索树中进行搜索、插入和删除操作的时间复杂度为O(logn),其中n为树中节点的数量。

4.二叉树的存储结构

链式结构,一个数据域,两个指针域,分别存放指向左孩子和右孩子的指针。
在这里插入图片描述
在这里插入图片描述

5.二叉树的遍历算法(前序、中序、后序)

①前序遍历

在这里插入图片描述
关键思路就是:先根结点,再左后右。(根节点不是指A,指的是每一次遍历到的当前结点就看作根节点)
遍历每个结点的顺序是:ABDHKECFIGJ

②中序遍历:

关键思路是:先左后根节点,再右节点。
在这里插入图片描述
遍历每个结点的顺序是:HKDBEAIFCGJ

③后序遍历:

关键思路是:先左再右,根节点最后访问。
在这里插入图片描述
遍历每个结点的顺序是:KHDEBIFJGCA

6.已知前序/中序/后序三者中的其二,求另外一个

不过多解释,反正用脑子分析就行。理解原理,然后就跟推理一样,慢慢分析即可。
注意:已知前序和后序,无法求出中序。

7.建立一颗二叉树

#include <stdio.h>
#include <stdlib.h>// 定义二叉树节点结构体
typedef struct TreeNode {int val;struct TreeNode* left;struct TreeNode* right;
} TreeNode;// 创建二叉树节点
TreeNode* createNode(int val) {TreeNode* newNode = (TreeNode*)malloc(sizeof(TreeNode));if (newNode == NULL) {printf("内存分配失败\n");exit(1);}newNode->val = val;newNode->left = NULL;newNode->right = NULL;return newNode;
}// 构建二叉树
TreeNode* buildTree() {int val;printf("输入节点的值(输入-1表示空节点):");scanf("%d", &val);if (val == -1) {return NULL;}TreeNode* root = createNode(val);printf("构建左子树:\n");root->left = buildTree();printf("构建右子树:\n");root->right = buildTree();return root;
}

思路:buildTree 函数可以递归地创建左右子节点是因为在构建二叉树的过程中,每次调用 buildTree 函数都是在当前节点的基础上构建其左右子树。

具体来说,函数首先提示用户输入节点的值,如果输入值为 -1,则表示该节点为空,返回 NULL。否则,创建一个新的节点,并递归地调用 buildTree 函数来构建当前节点的左子树和右子树。

在递归调用中,每次调用都会创建一个新的节点,并将其赋值给当前节点的左子树或右子树指针。然后,在新的节点上,再次调用 buildTree 函数来构建其左子树和右子树。这样,通过递归的方式,就可以逐层构建整个二叉树的节点。

当用户输入 -1 表示节点为空时,会逐层返回 NULL,即构建空节点。这样,递归调用结束后,就完成了整个二叉树的构建过程。

六、线索二叉树

线索二叉树是对二叉树的一种改进,它通过添加线索(thread)来加快对二叉树的遍历操作。线索二叉树中,除了存储节点的值和左右子树指针外,还添加了线索指针,用于指向前驱节点或后继节点。

具体来说,线索二叉树中的线索指针可以分为两种类型:

前驱线索:对于每个节点,线索指针可以指向其在中序遍历中的前驱节点。
后继线索:对于每个节点,线索指针可以指向其在中序遍历中的后继节点。
线索化二叉树的过程主要包括两个步骤:

线索化左子树:在线索化当前节点的左子树时,需要将当前节点的前驱线索指针指向其在中序遍历中的前驱节点,并将前驱线索指针的后继线索指针指向当前节点。
线索化右子树:在线索化当前节点的右子树时,需要将当前节点的后继线索指针指向其在中序遍历中的后继节点,并将后继线索指针的前驱线索指针指向当前节点。
线索化完成后,可以通过线索指针直接找到任意节点的前驱节点和后继节点,从而加速对二叉树的遍历操作。
在这里插入图片描述

七、赫夫曼树

赫夫曼树(Huffman Tree),也称为最优二叉树(Optimal Binary Tree),是一种特殊的二叉树结构,常用于数据压缩算法中的赫夫曼编码

赫夫曼树的构建过程基于赫夫曼算法,其核心思想是将出现频率较高的字符或数据项放在离根节点较近的位置,而出现频率较低的字符或数据项放在离根节点较远的位置,以实现高效的压缩

具体构建赫夫曼树的步骤如下:

给定一组字符或数据项及其出现频率,根据频率从小到大排序,作为初始的叶子节点集合。

从初始的叶子节点集合中选择出现频率最小的两个节点作为左右子节点,并创建一个新的节点作为它们的父节点,父节点的频率为左右子节点频率之和。

将父节点加入到叶子节点集合中,并从集合中删除被合并的两个子节点。

重复步骤2和步骤3,直到只剩下一个节点,该节点即为赫夫曼树的根节点。

赫夫曼树的构建过程可以通过使用优先队列(Priority Queue)来实现,每次从队列中选择频率最小的两个节点进行合并。

赫夫曼树的特点是,出现频率较高的字符或数据项在树中的路径较短,而出现频率较低的字符或数据项在树中的路径较长。这样,在进行赫夫曼编码时,可以用较短的编码表示较高频率的字符或数据项,从而实现数据的压缩

赫夫曼树在数据压缩中具有重要的应用,能够有效地压缩数据并保证数据的可恢复性。

具体的赫夫曼树的图解、代码实现、性质作用等内容以后有机会再补充,这里仅了解一下。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/168512.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

leetcode(力扣) 207. 课程表1+2(图的构造与遍历,清晰思路,完整模拟)

文章目录 题目描述思路分析完整代码 题目描述 你这个学期必须选修 numCourses 门课程&#xff0c;记为 0 到 numCourses - 1 。 在选修某些课程之前需要一些先修课程。 先修课程按数组 prerequisites 给出&#xff0c;其中 prerequisites[i] [ai, bi] &#xff0c;表示如果要学…

矢量绘图软件Sketch 99 for mac

Sketch是一款为用户提供设计和创建数字界面的矢量编辑工具。它主要用于UI/UX设计师、产品经理和开发人员&#xff0c;帮助他们快速设计和原型各种应用程序和网站。 Sketch具有简洁直观的界面&#xff0c;以及丰富的功能集&#xff0c;使得用户可以轻松地创建、编辑和共享精美的…

openai自定义API操作 API 返回值说明

custom-自定义API操作 openai.custom 公共参数 名称类型必须描述keyString是调用key&#xff08;获取测试key&#xff09;secretString是调用密钥api_nameString是API接口名称&#xff08;包括在请求地址中&#xff09;[item_search,item_get,item_search_shop等]cacheStrin…

轻量日志管理方案-[EFK]

使用FileBeat进行日志文件的数据收集&#xff0c;并发送到ES进行存储&#xff0c;最后Kibana进行查看展示&#xff1b; 这个应该是最简单&#xff0c;轻量的日志收集方案了。 最总方案为&#xff1a;FileBeatESKibana ; 【Kibana过于强大&#xff0c;感觉可以无限扩展】 文章目…

Apinto 网关进阶教程,使用 API Mock 生成模拟数据

什么是 API Mock &#xff1f; API Mock 是一种技术&#xff0c;它允许程序员在不依赖后端数据的情况下&#xff0c;模拟 web服务器端 API 的响应。通常使用 API Mock 来测试前端应用程序&#xff0c;而无需等待后端程序构建完成。API Mock 可以模拟任何 HTTP 请求方法&#x…

linux安装nodejs

写在前面 因为工作需要&#xff0c;需要使用到nodejs&#xff0c;所以这里简单记录下学习过程。 1&#xff1a;安装 wget https://nodejs.org/dist/v14.17.4/node-v14.17.4-linux-x64.tar.xz tar xf node-v14.17.4-linux-x64.tar.xz mkdir /usr/local/lib/node // 这一步骤根…

使用电脑时提示msvcp140.dll丢失的5个解决方法

“计算机中msvcp140.dll丢失的5个解决方法”。在我们日常使用电脑的过程中&#xff0c;有时会遇到一些错误提示&#xff0c;其中之一就是“msvcp140.dll丢失”。那么&#xff0c;什么是msvcp140.dll呢&#xff1f;它的作用是什么&#xff1f;丢失它会对电脑产生什么影响呢&…

人工智能基础_机器学习022_使用正则化_曼哈顿距离_欧氏距离_提高模型鲁棒性_过拟合_欠拟合_正则化提高模型泛化能力---人工智能工作笔记0062

然后我们再来看一下,过拟合和欠拟合,现在,实际上欠拟合,出现的情况已经不多了,欠拟合是 在训练集和测试集的准确率不高,学习不到位的情况. 然后现在一般碰到的是过拟合,可以看到第二个就是,完全就把红点蓝点分开了,这种情况是不好的, 因为分开是对训练数据进行分开的,如果来…

如何将NetCore Web程序独立发布部署到Linux服务器

简介 在将 .NET Core 应用程序部署到 Linux 服务器上时,可以采用独立发布的方式,以便在目标服务器上运行应用程序而无需安装 .NET Core 运行时。本文介绍如果将NetCore Web程序独立发布部署到Linux服务器。 1、准备一台服务器 服务器配置:2核2G 系统环境:Alibaba Cloud…

可视化技术专栏100例教程导航帖—学习可视化技术的指南宝典

&#x1f389;&#x1f38a;&#x1f389; 你的技术旅程将在这里启航&#xff01; &#x1f680;&#x1f680; 本文专栏&#xff1a;可视化技术专栏100例 可视化技术专栏100例领略各种先进的可视化技术&#xff0c;包括但不限于大屏可视化、图表可视化等等。订阅专栏用户在文章…

1994-2021年分行业二氧化碳排放量数据

1994-2021年分行业二氧化碳排放量数据 1、时间&#xff1a;1994-2021年 2、来源&#xff1a;原始数据整理自能源年鉴 3、指标&#xff1a;统计年度、行业代码、行业名称、煤炭二氧化碳排放量、焦炭二氧化碳排放量、原油二氧化碳排放量、汽油二氧化碳排放量、煤油二氧化碳排放…

【Python】AppUI自动化—appium自动化元素定位、元素事件操作(17)下

文章目录 前言一.Appium 元素定位1.定位方式种类2.如何定位2.1 id定位2.2 className定位2.3 content-desc 定位2.4 Android Uiautomator定位4.1 text定位4.2 text模糊定位4.3 text正则匹配定位4.4 resourceId定位4.5 resourceId正则匹配定位4.6 className定位4.7 className正则…