【Linux】EXT2文件系统 | 磁盘分区块组 | inode

文章目录

  • 一、前言
  • 二、EXT2文件系统 - 逻辑存储结构
    • 💾分区(Partition)
        • 分区的概念
        • 每个分区的内容
        • Linux下查询磁盘分区
    • 💾块组(Block Group)
        • 磁盘格式化
        • 每个块组的内容
          • 1. Superblock(超级块)
          • 2. Group Descriptor Table(组描述符表)
          • 3. Block Bitmap(块位图)
          • 4. inode Bitmap(inode位图)
          • 5. inode Table(inode表)
          • 6. Data Blocks(数据块)
  • 三、操作磁盘文件的过程
    • ✨创建文件
    • ✨找到文件
    • ✨删除文件
    • ✨恢复文件

一、前言

在上篇 文件IO 文件系统调用 文件fd 重定向 文章中,我们已经学习了在内存中被打开(被加载)的文件,还有一部分是磁盘中未被打开的文件。这篇我们来谈磁盘文件。

Linux对文件的管理工作:

  1. 管理被打开的文件
  2. 管理磁盘中没有被打开的文件

以上两点构成了Linux的文件系统,文件系统这个名词狭义上指的是磁盘文件系统,例如Linux下的ext2文件系统。




二、EXT2文件系统 - 逻辑存储结构

💾分区(Partition)

分区的概念
  • 定义: 将硬盘划分为逻辑上独立的单元。

  • 作用: 实现文件系统的组织和管理,提供隔离的存储空间,体现了分治的思想。

    请添加图片描述

每个分区的内容
  • 对于每一个分区:
    请添加图片描述

Boot Block(引导块):

  • 定义: Boot block是文件系统中的第一个块,通常包含引导加载程序和文件系统的元数据,用于引导操作系统。
  • 作用: 存储引导加载程序,提供文件系统的起始点,引导操作系统的启动。

Linux下查询磁盘分区

可以通过以下命令查看当前Linux系统的分区:

  1. 使用 lsblk 命令:
lsblk /dev/vda

请添加图片描述

上述命令会列出 /dev/vda 设备的分区信息,包括每个分区的大小、挂载点等。


  1. 使用 fdisk 命令:
sudo fdisk -l /dev/vda

请添加图片描述

上述命令会显示 /dev/vda 设备的分区表信息,包括每个分区的起始扇区、大小等。可能要使用sudo提权。


  1. 使用 df -h
df -h

请添加图片描述

相当于Windows的 “此电脑”,df -h 提供了一个快速的方式来查看系统上各个文件系统的存储使用情况,以便及时了解磁盘空间的分布和使用率。




💾块组(Block Group)

ext2文件系统会根据分区的大小划分为数个块组(Block Group)。而每个块组都有着相同的结构组成。块组也被称为分组块组是由分区细分出的产物。

磁盘格式化
  1. 当磁盘完成分区后,我们还需要对磁盘进行格式化
  2. 磁盘格式化就是对磁盘中的分区进行初始化的一种操作,这种操作通常会导致现有的磁盘或分区中所有的文件被清除。
  3. 磁盘格式化就是对分区后的各个区域写入对应的管理信息

其中,写入的管理信息是什么是由文件系统决定的,不同的文件系统格式化时写入的管理信息是不同的,常见的文件系统有EXT2、EXT3、XFS、NTFS等。

每个块组的内容

块组与分区的关系如图所示:
请添加图片描述

当我们考虑一个块组中的内容时,以下是一个块组中包含的内容:

1. Superblock(超级块)
  • 定义: 超级块是文件系统中一个关键的元数据块,包含有关整个文件系统的信息
  • 作用: 提供整个块组的整体信息。存放文件系统本身的结构信息。
  • 记录的信息主要有:
    • block和 inode的总量
    • 未使用的block和inode的数量
    • 一个block和inode的大小
    • 最近一次挂载的时间
    • 最近一次写入数据的时间
    • 最近一次检验磁盘的时间等其他文件系统的相关信息。
      Super Block的信息被破坏,可以说整个文件系统结构就被破坏了
2. Group Descriptor Table(组描述符表)
  • 定义: 组描述符表存储了关于每个块组的元信息,包括块组中的inode和数据块的位置,以及空闲块和inode的数量等信息。

  • 作用: 提供了有关块组的重要信息,帮助文件系统在块组级别进行管理和分配。

  • 组描述符表中的主要信息包括:
    1. 块组的起始块号: 记录块组的起始块号,用于定位块组在整个文件系统中的位置。
    2. 块位图的起始块号: 记录块组中块位图的起始块号,用于定位块组中块的分配情况。
    3. Inode位图的起始块号: 记录块组中Inode位图的起始块号,用于定位块组中Inode的分配情况。
    4. Inode表的起始块号: 记录块组中Inode表的起始块号,用于定位块组中Inode的存储位置。
    5. 空闲块的数量: 统计块组中未分配的空闲块数量。
    6. 空闲Inode的数量: 统计块组中未分配的空闲Inode数量。

3. Block Bitmap(块位图)
  • 定义: 块位图是一个位图,记录块组中每个块的使用情况,标记哪些块已被分配,哪些是空闲的
  • 作用: 帮助文件系统管理块的分配和释放,维护块的空闲状态。
4. inode Bitmap(inode位图)
  • 定义: Inode位图是一个位图,记录块组中每个inode的使用情况,标记已分配和空闲的inode
  • 作用: 帮助文件系统管理inode的分配和释放,维护inode的空闲状态。
5. inode Table(inode表)
  • 定义: Inode表存储了块组中所有文件和目录的元数据,每个文件和目录都关联到一个唯一的inode。
  • 作用: 记录文件的属性信息,如文件大小、权限、属主等。

一个典型的inode结构包含以下信息:

  1. 文件类型(File Type): 表示Inode关联的文件类型,如普通文件、目录、符号链接等。

  2. 权限和所有者信息:

    • 文件所有者(User ID)
    • 文件所属组(Group ID)
    • 文件权限(Read、Write、Execute)
  3. 时间戳:

    • 文件的最后访问时间(atime)
    • 文件的最后修改时间(mtime)
    • Inode的最后修改时间(ctime)
  4. 文件大小: 记录文件的大小(以字节为单位)。

  5. 链接数: 记录连接到该Inode的硬链接数量。当链接数为0时,表示文件不再被引用,可以被删除。

  6. 数据块指针:

    • 直接块指针(Direct Block Pointers):用于存储文件的前一定量数据块。
    • 单间接块指针(Single Indirect Block Pointer):指向一个块,该块包含更多数据块的指针。
    • 双间接块指针(Double Indirect Block Pointer):指向一个块,该块包含单间接块的指针。
  7. 文件系统标志: 记录Inode所属的文件系统的特定标志。

6. Data Blocks(数据块)
  • 定义: 数据块是用于存储文件实际数据的块,也包括目录中文件名和对应inode的映射。
  • 作用: 存储文件和目录的实际内容,包括文件数据和目录项。



三、操作磁盘文件的过程

✨创建文件

请添加图片描述

  1. 存储属性
    内核先找到一个空闲的i节点(这里是263466)。内核把文件信息记录到其中。
  2. 存储数据
    该文件需要存储在三个数据块,内核通过块位图找到了三个空闲数据块:300,500,800。将内核缓冲区的第一块数据复制到300,下一块复制到500,以此类推。
  3. 记录分配情况
    文件内容按顺序300,500,800存放。内核在inode上的磁盘分布区记录了上述块列表。
  4. 添加文件名到目录
    假如新的文件名是“abc”。linux如何在当前的目录中记录这个文件?内核将映射关系(263466,abc)添加到目录文件。文件名和inode之间的对应关系将文件名和文件的内容及属性连接起来。

✨找到文件

在Linux操作系统的ext2文件系统中,通过一个文件的inode找到该文件的过程涉及到文件目录、内核缓冲区等关键概念。以下是找文件的步骤:

  1. 文件目录(Directory):

    • 文件目录是一个特殊的文件,用于存储文件名与其对应的inode号之间的映射关系。每个目录项都包含文件名和对应文件的inode号。
  2. 查找文件的inode:

    • 当用户提供一个文件名时,内核首先会查找文件所在的目录,即打开包含文件名的目录文件。这可以通过系统调用如 opendirreaddir 来实现。
  3. 读取目录文件:

    • 文件目录是一个包含目录项的文件。通过系统调用 readdir 等,内核将目录文件的内容读入内核缓冲区。
  4. 在内核缓冲区中查找目录项:

    • 内核缓冲区中存储了目录文件的内容,包括文件名和对应的inode号。内核根据用户提供的文件名在内核缓冲区中查找相应的目录项。

目录项

目录项是文件系统中的一个记录单元,用于将文件名与其对应的inode号关联起来。每个目录项包含一个文件或目录的名称以及与之相关联的唯一标识符(inode号),该标识符用于定位并访问文件或目录的详细元数据。目录项是构建目录结构的基本组成部分,使得文件系统能够有效地组织和检索文件。

  1. 获取文件的inode号:

    • 一旦找到了目录项,就可以从中获取文件对应的inode号。
  2. 访问文件的inode:

    • 使用文件的inode号,内核再次进行系统调用(例如 stat)来获取文件的详细元数据。这涉及到文件系统的访问操作,文件系统会将对应inode的信息读取到内核缓冲区中。
  3. 获取文件的数据块:

    • 通过读取inode中的数据块指针,内核可以找到文件的实际数据块。
  4. 读取文件内容:

    • 最终,内核可以通过读取文件的数据块来获取文件的实际内容。

总体而言,文件系统通过在文件目录中查找文件名与inode号的映射关系,然后通过inode号来获取文件的详细信息,最终访问文件的实际数据块,实现了从用户提供的文件名到文件内容的映射过程。这一系列操作都依赖于内核缓冲区。


✨删除文件

  1. 将该文件对应的inode在inode位图当中置为无效(比特位设置为0)。
  2. 将该文件申请过的数据块在块位图当中置为无效(比特位设置为0)。

✨恢复文件

因为删除操作并不会真正将文件对应的信息删除,而只是将其inode号和数据块号置为了无效,所以当我们删除文件后短时间内是可以恢复的,在删除后,有些操作系统会记录日志,日志中会保存被删的inode编号!
为什么说是短时间内可恢复呢?因为该文件对应的inode号和数据块号已经被置为了无效,因此后续创建其他文件或是对其他文件进行写入操作申请inode号和数据块号时,可能会将该置为无效了的inode号和数据块号分配出去,此时删除文件的数据就会被覆盖,也就无法恢复文件了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/454454.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ABeam德硕大中华区董事长兼总经理中野洋辅受邀参加“2024大连软件产业发展大会”并荣获奖项

聚力•笃行•谋新篇 近日,由大连市工业和信息化局指导、大连软件行业协会主办的“2024大连软件产业发展大会”圆满落幕,大会主题定为“聚力•笃行•谋新篇”,意在凝聚行业力量,共谋创新发展。 现场邀请了辽宁省、大连市等地的政…

考研中常见的算法-逆置

元素逆置 概述:其实就是将 第一个元素和最后一个元素交换,第二个元素和倒数第二个元素交换,依次到中间位置。用途:可用于数组的移动,字符串反转,链表反转操作,栈和队列反转等操作。 逆置图解 …

vulnhub靶场之Thales

一.环境搭建 1.靶场描述 Description : Open your eyes and change your perspective includes 2 flags:user.txt and root.txt. Telegram: machineboy141 (for any hint) This works better with VIrtualBox rathe than VMware 2.靶场地址 https://www.vulnhub.com/entry/t…

MySQL进阶45讲【10】MySQL为什么有时候会选错索引?

1 前言 前面我们介绍过索引,在MySQL中一张表其实是可以支持多个索引的。但是,写SQL语句的时候,并没有主动指定使用哪个索引。也就是说,使用哪个索引是由MySQL来确定的。 大家有没有碰到过这种情况,一条本来可以执行得…

【C++】【类和对象】构造函数

1.构造函数的特性: 构造函数是一个特殊的成员函数,名字与类名相同,创建类类型对象时由编译器自动调用,以保证每个数据成员都有 一个合适的初始值,任务不是开空间创建对象,而是初始化对象,并且在对象整个生…

MFC结构体写入文件和读取

先定义一个结构体; struct myTxc { char c; CString name; int value; } txc; 读和写的菜单代码; void CjgtrwView::On32771() {// TODO: 在此添加命令处理程序代码CFile file(_T("test1.txt"), CFile::modeCreate | CFile::mod…

数据结构 归并排序详解

1.基本思想 归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide andConquer)的一个非常典型的应用。 将已有序的子序列合并,得到完全有序的序列,即先使每个子序列有序…

python推荐算法在汽车用品商城营销系统 django+flask

本论文拟采用计算机技术设计并开发的汽车营销中的设计与实践 ,主要是为用户提供服务。使得会员可以在系统上查看汽车商品、汽车快讯、还可以咨询客服,管理员对信息进行统一管理,与此同时可以筛选出符合的信息,给笔者提供更符合实际…

【算法与数据结构】718、1143、1035、392、115、LeetCode最长重复子数组+最长公共子序列+不相交的线+判断子序列+不同的子序列

文章目录 一、718、最长重复子数组二、1143、最长公共子序列三、1035、不相交的线四、392、判断子序列五、115、不同的子序列六、完整代码 所有的LeetCode题解索引,可以看这篇文章——【算法和数据结构】LeetCode题解。 一、718、最长重复子数组 思路分析&#xff1…

88 docker 环境下面 前端A连到后端B + 前端B连到后端A

前言 呵呵 最近出现了这样的一个问题, 我们有多个前端服务, 分别连接了对应的后端服务, 前端A -> 后端A, 前端B -> 后端B 但是 最近的时候 却会出现一种情况就是, 有些时候 前端A 连接到了 后端B, 前端B 连接到了 后端A 我们 前端服务使用 nginx 提供前端 html, js…

K8S之Namespace的介绍和使用

Namespace的理论和实操 Namespace理论说明Namespace实操创建、查看命名空间使用ResouceQuota 对Namespace做资源限额更多ResouceQuota 的使用 Namespace理论说明 命名空间定义 K8s支持多个虚拟集群,它们底层依赖于同一个物理集群。 这些虚拟集群被称为命名空间&…

一行命令找出 Linux 中所有真实用户

哈喽大家好,我是咸鱼。 接触过 Linux 的小伙伴们都知道在 Linux (或者说类 Unix)中,有三种类型的用户: 超级用户(UID 为 0):即 root 用户,拥有最高权限。系统用户&…