咬文嚼图式的介绍二叉树、B树/B-树

news/2024/9/13 11:12:16/文章来源:https://www.cnblogs.com/oldme/p/18305424

前言

因为本人天资愚钝,所以总喜欢将抽象化的事务具象化表达。对于各类眼花缭乱的树,只需要认知到它们只是一种数据结构,类似数组,切片,列表,映射等这些耳熟能详的词汇。对于一个数据结构而言,无非就是增删改查而已,既然各类树也是数据结构,它们就不能逃离增删改查的桎梏。

那么,为什么我们需要树这种数据结构呢,直接用数组不行吗,用切片不行吗?当然可以,只不过现实世界是缤纷杂乱的,而又没有一种万能药式的数据结构以应对千变万化的业务需求。所以,才会有各类树,而且一些“高级”数据结构是基于树形数据结构的,例如映射。

二叉树

在中文语境中,节点结点傻傻分不清楚,故后文以 node 代表 "结点",root node 代表根节点,child node 代表 “子节点”

二叉树是诸多树状结构的始祖,至于为什么不是三叉树,四叉树,或许是因为计算机只能数到二吧,哈哈,开个玩笑。二叉树很简单,每个 node 最多存在两个 child node,第一个节点称之为 root node。

二叉树具备着一些基本的数学性质,不过很简单,定义从 i 从 0 开始:

  • i 层至多有 2i 个 node;
  • 深度为 i 层二叉树至多有 2i+1-1 个 node。

二叉树的特殊类型

这里有兴趣的可以了解一下,不影响后文的阅读。二叉树根据 child node 的不同,衍生出了几种特殊类型:在一颗二叉树中,如果每个 node 都有 0 或 2 个 child node,则二叉树是满二叉树;定义从 i 从 0 开始,一棵深度为 i,且仅有 2i+1−1 个 node 的二叉树,称为完美二叉树;若除最后一层外的其余层都是满的,并且最后一层要么是满的,要么在右边缺少连续若干 node,则此二叉树为完全二叉树

二叉搜索树

二叉搜索树(Binary Search Tree),也叫二叉查找树,有序二叉树,排序二叉树(名字还挺多)。它是一种常用且特殊的二叉树,它具备一个特有的性质,left node(左结点)始终小于 parent node (父结点),right node 始终大于 parent node。

二叉搜索树的查找

  1. 二叉搜索树从 root node 开始,如果命中则返回;
  2. 否则,目标值比 node 小进入 left node;
  3. 比 node 大进入 right node;
  4. 如果左右都为空,则未命中。

二叉搜索树的遍历

二叉搜索树有不同的遍历方式,这里介绍常用的中序遍历方式:

  1. 先遍历左子树;
  2. 然后查找当前左子树的 parent node;
  3. 遍历右子树。

二叉搜索树的插入

  1. 二叉搜索树从 root node 开始,如果命中则不进行操作;
  2. 否则,目标值比 node 小进入 left node;
  3. 比 node 大进入 right node;
  4. 最终将值插入搜索停止的地方。

二叉搜索树的删除

二叉树的删除和查询基本一致,只要在命中时删除即可。

  1. 二叉搜索树从 root node 开始,如果命中则删除;
  2. 否则,目标值比 node 小进入 left node;
  3. 比 node 大进入 right node;
  4. 删除后使用该 node 左子树最大值或者右子树最小值替代该 node。

自平衡二叉树

从上面的几张动图中我们知晓,二叉搜索树不同于线性结构,它可以大大降低查找,插入的时间复杂度。但在特殊情况下,二叉搜索树可能退化为线性结构,假如我们依次插入1,2,3,4,5:

此时,二叉搜索树退化为线性结构,效率重新变回遍历。于是,便出现了自平衡二叉树,例如 AVL 树,红黑树,替罪羊树等。但它们并不是本文重点,下面我要介绍的是另外一种很常见的自平衡二叉树:B树。

B树

B树和B-树是同一个概念。B树相对于二叉树有两点最大的不同:

  • 每个 node 可以有不止一个数值
  • 每个 node 也可以有不止两个 child node

B树有两种类型 node:

  • internal node(内部结点):不仅仅存储数据,也具备 child node;
  • leaf node(叶子结点):仅存储数据,不具备 child node。

这两种 node 不同于前文所提的 root node 和 child node。root 和 child 是相对于阶层的概念,而 internal 和 leaf 是相对于性质的概念

一个简单的图例如下:

图中的蓝色方块是 internal node,绿色则是 leaf node。

B树有一些需要满足的性质,这里的抽象的逻辑有些烧脑,我会对照前面的图片来解释。设定一颗 m 阶的B树,m = 3

设 internal node 的 child node 个数为 k

  1. 如果 internal node 是 root node,那么 k = [2, m],比如上图的 8 有两个 child node(3|6, 10/12);
  2. 如果 internal node 不是 root node,那么 k = [m/2, m],m/2 向上取整,比如上图的 3|6 有三个 child node;
  3. 如果 root node 的 k 为 0,那么 root node 是 leaf 类型的;
  4. 所有 leaf node 在同一层,上图最后一行的六个 node。

设任意 node 键值个数为 n

  1. 对于 internal node, n = k-1, 升序排序,满足 k[i] < k[i+1],比如上图的三个 internal(8,3|6,10|12) 都满足此规律;
  2. 对于 leaf node,n = [0, m-1],同样升序排序,比如上图最后一个的六个 leaf,其键值最多为两个。 

上述的概念有些抽象,但是这是理解B树关键的地方所在,后面在B树的插入讲解,会有更多具象的动图来解释这些概念。

B树的查找

B树的查找类似于二叉树:

  1. 从 root node 开始,如果目标值小于 root node,进入左子树,否则进入右子树;
  2. 遍历 child node 的多个键值;
  3. 如果匹配到键值,则返回;
  4. 如果不匹配,则根据目标值的范围选择对应的子树;
  5. 重复步骤2、3、4,直到匹配成功返回或者未找到。

假如我们要查找 11:

B树的遍历

B树的遍历方式类似二叉搜索树,不过因为B树一个 node 有多个键值和多个 child node,所以需要遍历每个左右子树和键值:

  1. 先遍历第一个左子树,也就是 parent node 第一个键值的左边;
  2. 然后查找当前 parent node 的第一个键值;
  3. 遍历第二个左子树,也就是 parent node 第二个键值的左边;
  4. 遍历完搜索的左子树,最后遍历当前 parent 的最右子树,即最后一个键值的右边。

B树的插入

插入前面的过程和查询一致,在插入后可能需要重整 node,以符合B树的性质,例如插入 16:

  1. 先查找到目标 node,也就是 13|15
  2. 因为这是一颗 3 阶B树,所以 node 最多只能有两个键值,于是向上传递中间值 15;
  3. parent node 最多也只能有两个键值,于是继续向上传递中间值 12;
  4. 此时 root node 是 8|12,需要有三个 child node,于是 10|15 需要拆分,再向下进一步调整,至此,插入 16 完成。

 

B树的删除

删除是插入的逆操作,但是往往比插入更复杂,因为删除后经常需要重整 node:

  1. 先查找到目标 node,也就是 16
  2. 删除 16,此时 15 child node 剩下一个,不符合条件,递归向上调整,一直到根节点;
  3. 直到所有的条件都满足后,删除 16 完成。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/744736.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

“码”力全开!高效开发就靠这款神器

即构致力于用领先的音视频技术帮助开发者即刻构建实时互动世界。通过大量的用户调研了解到,兼顾高效开发和个性化UI以实现产品快速上线,是许多开发者的共同需求。为此,即构推出了含标准化 UI 的音视频互动 SDK —— UIKits,帮助开发者应对互动应用开发中的各种挑战。基于广…

Linux-awk

awk 3.4.2 功能 过滤 取行 取列 统计计算 数组 函数3.4.3 格式 awk 条件 动作 (找谁 干啥) awk [options] commands filenames awk [options] -f awk-script-file filenames3.4.4 awk处理数据的方式:1、进行逐行扫描文件,从第一行到最后一行 2、寻找匹配的特定模式的…

24 年 “年薪百万” 的 Java 程序员,都要学什么?

前几天我看了一篇由国外的 Java 架构师大佬分享的文章,主题是 “Java 架构师必会的 20 个技术”。 光看这个标题,就知道在国外做 Java 开发,也很卷啊!能学习的技术真的太多了。大家好,我是程序员鱼皮。前几天我看了一篇由国外的 Java 架构师大佬分享的文章,主题是 “Java…

idea 查看项目的git路径

目录 第一种方式: 第二种方式: 第三种方式:第一种方式: 1、打开项目,在工程上右键,选择Show in Explorer; 如下图:2、此时会打开本地的代码路径窗口; 如下图:3、双击工程,会出现git目录文件夹;4、双击进去git目录, 打开config文件夹;5、文件里面的url 属性即为gi…

如何将文本转换为向量?(方法二)

​文本转换为向量有多种方式: 方法一:通过模型服务灵积DashScope将文本转换为向量(推荐) 方法二:通过ModelScope魔搭社区中的文本向量开源模型将文本转换为向量 方法三:通过Jina Embeddings v2模型将文本转换为向量 方法四:通过百川智能向量化模型将文本转换为向量本文介…

2024-07-16 代码高亮插件highlight.js安装使用以及排错日志

highlight.js —— 一个开源语法高亮库,用于在网页上对源代码进行语法高亮显示。 安装npm i highlight.js yarn add highlight.js引入// main.js import { createApp } from vue; import App from "./App.vue"; import hljs from "highlight.js"; // 代码…

安装python方法在Windows环境

一、下载安装包 ​ 下载地址: ​ https://www.python.org/downloads/ ​ 安装注意勾选:​ 注:安装位置可用默认C盘。 二、更改国内源 ​ 更改配置文件:如没有文件创建文件。 ​ 位置:"C:\Users\32974\AppData\Roaming\pip\pip.ini" ​ 添加内容:一条源。 […

520-基于ZU15EG 适配AWR2243的雷达验证底板 XCZU15EG架构高速信号处理板

基于ZU15EG 适配AWR2243的雷达验证底板 一、板卡概述 本板卡系我司自主研发,基于MPSOC系列SOC XCZU15EG-FFVB1156架构,搭载两组64-bit DDR4,每组容量32Gb,最高可稳定运行在2400MT/s。另有1路10G SFP+光纤接口、1路40G QSFP光纤接口、1路USB3.0接口、1路千兆网络接口、1路DP…

SMU Summer 2024 Contest Round 4

SMU Summer 2024 Contest Round 4 Made Up 题意 给你三个序列 \(A,B,C\) ,问你满足 \(A_i = B_{C_j}\) 的 \((i,j)\) 对有多少。 思路 由于 \(1\le A_i,B_i,C_i\le N\) ,所以可以统计 \(Cnt[A_i]\) 和 \(Cnt[B_{C_i}]\) 的个数,两者相乘累加即可。 代码 #include<bits/…

软件设计师

软考官网:http://www.ruankao.org.cn/最近公司提出如果有软件设计师或者系统架构师证(中级、高级)能加一定薪资,所以小鸟~ 最近攻关中级证中,有点空闲顺便整理下相关资料,造福下别人。报考时间2020年,上半年受疫情影响,4月考试调整到下半年11月7、8一起考试,相关报考时…

Autobots应用探索:实践中的思考与发现

背景 背景1:作为一名测试,日常工作中必不可少的几个环节是查看需求文档、编写测试用例、处理线上问题、能力提升等,基于集团的https://xxx.jd.com/工具能一次性帮我们把这些事情都做了; 背景2:作为XXX共建项目的成员之一同时也是第一批用户,我用它做了几个测试实践,和大…

从校招新星到前端技术专家的成长之路

引言 我在2018年校招进入京东,主要负责广告投放系统的前端工作。在京东,这一路走来,我经历了多种角色转换,我从学生到职场人,从校招生到校招导师,从初级前端开发到前端技术专家,也见证了京东广告业务的蓬勃发展。 回顾过去的成长历程,我心中充满了感慨。首先,我要衷心…