【数据结构】B树

1 B树介绍

B树(英语:B-tree),是一种在计算机科学自平衡的树,能够保持数据有序。这种数据结构能够让查找数据、顺序访问、插入数据及删除的动作,都在对数时间内完成。B树,概括来说是一个一般化的二叉搜索树(binary search tree)一个节点可以拥有2个以上的子节点。与自平衡二叉查找树不同,B树适用于读写相对大的数据块的存储系统,例如磁盘。B树减少定位记录时所经历的中间过程,从而加快访问速度。B树这种数据结构可以用来描述外部存储。这种数据结构常被应用在数据库和文件系统的实现上。

那为什么要使用 B-树呢(或者说为啥要有 B-树呢)?

要解释清楚这一点,我们假设我们的数据量达到了亿级别,主存当中根本存储不下,我们只能以块的形式从磁盘读取数据,与主存的访问时间相比,磁盘的 I/O 操作相当耗时,而提出 B-树的主要目的就是减少磁盘的 I/O 操作。大多数平衡树的操作(查找、插入、删除,最大值、最小值等等)需要 O(ℎ) 次磁盘访问操作,其中 ℎ 是树的高度。但是对于 B-树而言,树的高度将不再是logn(其中 n是树中的结点个数),而是一个我们可控的高度 ℎ (通过调整 B-树中结点所包含的键【你也可以叫做数据库中的索引,本质上就是在磁盘上的一个位置信息】的数目,使得 B-树的高度保持一个较小的值)。一般而言,B-树的结点所包含的键的数目和磁盘块大小一样,从数个到数千个不等。由于B-树的高度 h 可控(一般远小于logn ),所以与 AVL 树和红黑树相比,B-树的磁盘访问时间将极大地降低。

平衡二叉排序树是利用插入的成本缓解查找效率---------->红黑树来解决(最长子树不超过最短子树的2倍。数据量大的时候,树会很深,查找次数变多)----------->B树(多叉,多路查找树)

动画显示树调整的网站:Data Structure Visualization

2 B树特点

B树是一种平衡的多叉树,通常我们说m阶的B树,它必须满足如下条件:

  • 每个节点最多有m个子节点。
  • 每一个非叶子节点(除根节点)最少有[m/2]个子节点。
  • 如果根节点不是叶子节点,那么它至少有两个子节点。
  • 有k个子节点的非叶子节点拥有k-1个键,且升序排列,满足k[i] < k[i + 1]
  • 每个节点至多包含2*k-1个键。
  • 所有的叶子节点都在同一层。
  • 每个节点的结构是

其中:

n记录这个节点关键字的个数;

P0存储的是第一个孩子的地址,P1存储的是第二个孩子的地址,以此类推。。。。。。

K1是第一个关键字,K2是第二个关键字,以此类推。。。。。。

B树中一个节点的子节点数目的最大值,用m表示,假如最大值为4,则为4阶,如下图

性质:

  • 每个节点最多有m个子节点。
  • 每一个非叶子节点(除根节点)最少有[m/2]个子节点。
  • 如果根节点不是叶子节点,那么它至少有两个子节点。
  • 有k个子节点的非叶子节点拥有k-1个键,且升序排列,满足k[i] < k[i + 1]
  • 每个节点至多包含2*k-1个键。
  • 所有的叶子节点都在同一层。
  • 满足n叉排序树

3 B树的增删改查

磁盘预读

内存跟磁盘发生数据交互的时候,一般情况下有一个最小的逻辑单元,称之为页,datapage

页一般由操作系统决定是多大,一般是4k或者8k,我们在数据交互时,可以取页的整数倍来进行读取。

电脑的文件都是datapage的整数倍

每个节点放在磁盘块里,用B树做索引,这个磁盘大小是16k

三层数据。

对比B树和B+树

有一个很重要的不同是:B+树的数据都存在叶子节点上。

参考:

[1] https://zh.wikipedia.org/zh-hans/B%E6%A0%91

[2] 图解:什么是B树?(心中有 B 树,做人要虚心)一文读懂B-树 - 知乎 (zhihu.com)

[3] B 树 - OI Wiki (oi-wiki.org)

[4] 终于把B树搞明白了(四)_B树的删除操作_哔哩哔哩_bilibili

[5] notes/docs/B树和B+树详解.md at master · wardseptember/notes · GitHub

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/508328.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

黑科技工具盒源码 好用的手机工具盒iAPP源码

全新推出&#xff01;多功能工具箱&#xff1a;一款实用的手机工具集&#xff0c;提供丰富的免费小工具&#xff0c;操作简便。目前包含六项黑科技功能&#xff0c;分别为QQ云端、短信测压、Q绑查询、照妖镜、chatgpt、网页一键打包APP。工具箱体积小巧&#xff0c;不占内存&am…

u盘打不开提示需要格式化,怎么恢复数据?

U盘是不少办公族和学生党常用的文件存储工具&#xff0c;当我们的U盘提示需要格式化时&#xff0c;往往意味着U盘的文件系统可能出现了问题。这可能是由于病毒感染、不当操作、硬件故障等原因引起的。但在此之前U盘中存储的数据对我们可能非常重要。那么如何在不丢失数据的情况…

excel统计分析——拉丁方设计

参考资料&#xff1a;生物统计学 拉丁方设计也是随机区组设计&#xff0c;是对随机区组设计的一种改进。它在行的方向和列的方向都可以看成区组&#xff0c;因此能实现双向误差的控制。在一般的试验设计中&#xff0c;拉丁方常被看作双区组设计&#xff0c;用于提高发现处理效应…

技术总结: PPT绘图

目录 写在前面参考文档技巧总结PPT中元素的连接立方体调整厚度调整图形中的文本3D 图片调整渐变中的颜色 写在前面 能绘制好一个好看的示意图非常重要, 在科研和工作中好的示意图能精准表达出自己的想法, 减少沟通的成本, 可视化的呈现也可以加强自身对系统的理解, 时间很久后…

dvwa靶场xss通关

原理 XSS漏洞是攻击者将恶意代码注入到合法网页中&#xff0c;当用户浏览该页面时&#xff0c;恶意代码会被执行&#xff0c;从而获取用户敏感信息或进行其他攻击。 形成原因 网站对用户输入数据的过滤不严格或不完备&#xff0c;攻击者可以根据这个漏洞向网站提交恶意代码&am…

Java基础---lambda表达式

一、为什么要引入lambda表达式 lambda 表达式是一个可传递的代码块 &#xff0c; 可以在以后执行一次或多次 。 在介绍lambda表达式之前&#xff0c;我们看一下&#xff0c;以前&#xff0c;我们对于一个问题的通常写法。 假设你已经了解了如何按指定时间间隔完成工作&#xf…

Leetcoder Day37| 动态规划part04 背包问题

01背包理论基础 面试掌握01背包&#xff0c;完全背包和重背包就够用了。 背包问题的理论基础重中之重是01背包&#xff0c;一定要理解透&#xff01; 01 背包 有n件物品和一个最多能背重量为w 的背包。第i件物品的重量是weight[i]&#xff0c;得到的价值是value[i] 。每件物品…

力扣刷题笔记

力扣206 反转链表 题目描述: 给你单链表的头节点head &#xff0c;请你反转链表&#xff0c;并返回反转后的链表。 示例 1&#xff1a; 输入&#xff1a;head [1,2,3,4,5] 输出&#xff1a;[5,4,3,2,1] 示例 2&#xff1a; 输入&#xff1a;head [1,2] 输出&#xff1a;[…

SpringBoot整合MyBatis实现增删改查

✅作者简介:大家好,我是Leo,热爱Java后端开发者,一个想要与大家共同进步的男人😉😉 🍎个人主页:Leo的博客 💞当前专栏: 循序渐进学SpringBoot ✨特色专栏: MySQL学习 🥭本文内容: SpringBoot整合MyBatis实现增删改查 📚个人知识库: Leo知识库,欢迎大家访…

【大厂AI课学习笔记NO.61】环境部署的选择

主要是选择单机和分布式、生产和开发环境的规划等。 开发环境、测试环境、预发布环境和生产环境是软件开发和部署过程中常见的几个环境&#xff0c;它们各自的定义、区别、联系以及实现的关键技术如下&#xff1a; 1. 开发环境&#xff08;Development Environment&#xff09…

12.vue学习笔记(异步组件+依赖注入+Vue应用)

文章目录 1.异步组件2.依赖注入注意事项 3.Vue应用3.1.应用实例3.2.根组件3.3.挂载应用3.4.公共资源文件夹 1.异步组件 目的&#xff1a;优化组件性能 在大型项目中&#xff0c;我们可能需要拆分应用为更小的块&#xff0c;并仅在需要时再从服务器加载相关组件 defineAsyncCom…

Chat GPT:AI聊天机器人的革命性突破!

一、引言 近年来&#xff0c;人工智能&#xff08;AI&#xff09;技术的发展日新月异&#xff0c;其中最具代表性的成果之一便是Chat GPT。这款基于自然语言处理&#xff08;NLP&#xff09;技术的聊天机器人&#xff0c;以其高度智能、灵活多变的特点&#xff0c;迅速吸引了全…