树的概念及结构|树的三种表示方法-编程知识

前言

以前我们学的线性结构是一对一的线性关系，但现实中，还有一对多的情况要处理，那就是树形结构。今天我们将学习树的概念及结构、和树的三种常见表示方法。

一、树的概念及结构

1、树的概念

树是一种非线性的数据结构，它是由n（n >= 0）个有限结点组成的一个具有层次关系的集合。

（1）为什么把这种结构，叫做树呢？

答案是： 因为它的逻辑图看起来像一颗倒挂的树，根朝上，叶向下。如下图：

在这里插入图片描述

（2）空树

空树： n=0时称为空树。

（3）非空树

根节点： 有且仅有一个特定的结点，称为根(Root)节点。（根节点没有前驱结点）

树是递归实现的： 当n>1时，除根节点外，其余结点可分为m（m>0）个互不相交的有限集T1,T2,……Tm，其中每一个集合Ti（1<= i <=m）本身又是一颗树，并且称为根的子树(SubTree)。（每颗子树的根节点有且仅有一个前驱，可以有0个或多个后继）简单来说：任何一颗树都由根与子树组成。（没有子树就结束） 如下图：

在这里插入图片描述

（4）对于树的定义需要强调两点

① 对于任意一棵树根节点都是唯一，子树的根节点是子树的。

② 在树形结构中，子树之间一定是互不相交的，否则就不是树型结构。如下图：

在这里插入图片描述

（5）树的其他的表示形式（了解）

在这里插入图片描述

2、树的相关概念

在这里插入图片描述

结点的度： 结点拥有的子树的个数称为结点的度。如上图：A的度为6。
叶结点或终端结点： 度为0的结点称为叶子结点或终端结点。如上图：B、C、H、I……等结点为叶节点。
分支结点或非终端结点： 度不为0的结点称为分支结点或非终端结点。（除了根节点外，分支节点也称内部结点。）如上图：D、E、F、G……等结点为分支节点。
树的度： 树的度是树内各节点的度的最大值。如上图：树的度为6。
孩子结点与双亲结点： 结点的子树的根称为该节点的孩子结点，相应的，该节点称为孩子结点的双亲结点。如上图：A是B的双亲结点，B是A的孩子结点。
兄弟结点： 同一个双亲结点的孩子结点之间互称兄弟结点。如上图：B、C是兄弟结点。
结点的祖先： 从根到该节点所经分支上所有结点。如上图A是所有结点的祖先。
结点的子孙： 以某结点为根的子树中的任一结点都称为该结点的子孙。如上图：所有结点都是A的子孙。
结点的层次： 从根开始定义起，根为第一层，根的孩子为第二层，以此类推。（数组我们是从0开始，为什么层次不从0开始呢——因为不符合我们平时的习惯，如以0开始，我们说根为第0层，那空树就得说-1层了，所以我们一般从1开始。）
树的深度或高度： 树中节点的最大层次。如上图：树的高度为4。
堂兄弟结点： 其双亲在同一层的结点互为堂兄弟。如上图：B、C、D、E、F、G互为堂兄弟。
森林： 由m（m>=0）颗互不相交的树的集合称为森林。
有序树与无序树： 如果将树中结点的各子树看成从左至右是有次序的，不能互换的，则称该树为有序树，否则称为无序树。

二、树的存储结构

树这种一对多的结构相对线性表就比较复杂了，要存储表示起来就比较麻烦了，既要保存值域，也要保存结点和结点之间的关系， 不过充分利用顺序存储和链式存储结构的特点，完全可以实现树的存储结构的表示。我们这里了解三种不同的表示法：双亲表示法、孩子表示法、孩子兄弟表示法。

1、双亲表示法

定义： 用一组连续空间存储树的节点，同时在每个结点中，附设一个指示器指示其双亲结点在表中的位置。结点结构如下图所示：

在这里插入图片描述
其中data是数据域，存储结点的数据信息。parent是指针域，存储该结点的双亲在数组中的下标，因为根节点没有双亲，所以我们约定根节点的位置域设置为-1。

实现： 树的结构需要有三个成员：结点数组、结点数、根的位置，所以我们将其定义为一个结构体。

双亲表示法的代码实现：

//树节点的数据类型
typedef int TElemType;
//结点结构
typedef struct PTNode
{TElemType data;//结点数据域int parent;//结点指针域，指向双亲的下标位置
}PTNode;//树结构
typedef struct PTree
{PTNode* a;//指向堆区开辟的节点数组int root;//根节点的位置int size;//结点数
}PTree;

如下图中树结构和树双亲表示所示：

在这里插入图片描述
优缺点：

优点：①找双亲容易；②顺序存储。

缺点：找孩子难，需要遍历整个结构。

2、孩子表示法

定义： 由于树中每个结点可能有多棵子树，可以考虑用多重链表，即每个结点有多个指针域，其中每个指针指向一棵子树的根节点，我们把这种方法叫做多重链表表示法。

因为树的每个结点的度，也就是它的孩子个数是不同的。所以我们有两种设计方案来解决。

方案一（树的度已知）：结点同构 ——已知树的度为d，指针域的个数就等于树的度。其结构如下图：

在这里插入图片描述
其中data是数据域，child1到childd是指针域，用来指向该结点的孩子结点。

代码示例：

//已知树的度为N
#define N 5
//树的节点
typedef struct TreeNode
{struct TreeNode* child[N];//指针数组——存储孩子结点的位置int data;//存储数据
}TreeNode;

如下左图的树，树的度是3，所以指针域的个数是3，孩子表示如下右图所示：

在这里插入图片描述
如图我们可知这种方法当树中很多结点的度小于d时，结点中有很多指针域为空，空间浪费。

方案二（树的度未知）：孩子表示法——理解两个结构：①孩子结点；②表头结点。然后使用顺序存储实现孩子表示法。 如图所示：

在这里插入图片描述

①孩子结点： 就是用单链表存储某个结点的所有孩子结点的地址（注：n个结点有n个孩子链表，如果是叶子结点则该链表为空。）结构如下所示：

在这里插入图片描述
②表头结点： 有两个成员：data成员存储某个结点的数据信息；firstchild成员存储该结点孩子链表的头指针。结构如图所示：

③树结构： 由三个成员组成：指向表头数组的指针a、保存根位置的root、保存节点数的size。

代码示例：

//孩子结点
typedef struct CTNode
{int child;//数据域，存储孩子结点在表头数组中的下标struct CTNode* next;//指向下一个孩子结点
}CTNode;//表头结点
typedef struct
{int data;//存储结点的数据CTNode* firstchild;//存储孩子链表的头指针
}CTBox;//树的结构
typedef struct
{CTBox* a;//指向堆区开辟表头数组int root;//根位置int size;//节点数
}Tree;

3、孩子兄弟法

定义： 我们观察发现，任意一棵树，它的节点的第一个孩子如果存在就是唯一，它的右兄弟如果存在也是唯一的。因此，我们设置两个指针，分别指向该结点的第一个孩子和此结点的右兄弟，也可叫做左兄弟右孩子法。结构如图所示：

在这里插入图片描述
代码示例：

typedef int DataType;
typedef struct TreeNode
{struct Node* firstChild1; // 第一个孩子结点struct Node* pNextBrother; // 指向其下一个兄弟结点DataType data; // 结点中的数据域
}TreeNode;