Rust的eBFP框架Aya(一) - Linux内核网络基础

前言

在我的Rust入门及实战系列文章中已经说明, Rust是一门内存安全的高性能编程语言,从它的这些优秀特性来看,就是一门专为系统开发而诞生的语言。至于很多使用Rust来进行web开发的行为,不能说它们不好,只能说是杀鸡焉用牛刀耳。

本系列的文章旨在为大家介绍一个新的专用于开发eBPF程序的Rust框架:Aya。Aya 是 Rust 中的一个 eBPF(Extended Berkeley Packet Filter)库,提供了用 Rust 语言编写、加载和运行 eBPF 程序的能力。eBPF 是一种强大的技术,用于在 Linux 内核中安全地运行沙盒程序,常用于网络编程、性能监控和安全增强。我们在后面的文章中将对eBPF进行更加详细和深入的介绍。

Linux内核网络基础

如果你还不了解什么是eBPF, 那么其实从它的名称中便可见一斑,从Packet Filter可以看出,这显然是用于包的处理的一门技术。它通过在Linux的内核中的不同挂载点,加入一个隔离可控的二进制程序,来达到我们想要为内核增加功能处理网络包的目的。既然是在内核的网络处理流程中动手脚,那么在开始之前,我们有必要对Linux内核原本的网络处理流程有基本的认知, 否则,如果直接开始eBPF的编写,那么我们很可能会变成狗拿刺猬,无从下手。

网络模型概览

众所周知,网络模型的的划分有不同的方法, 最流行的莫过于经典的OSI七层网络模型, TCP/IP四层网络模型,还有综合两者而成的五层网络模型。从理解内核网络工作原理的角度出发,我们选择五层网络模型进行接下来的探究:
请添加图片描述

注: 在Linux系统中,内核源码的位置位于/usr/src/目录下的对应内核命名的目录下,例如我使用的azure虚拟机上,内核代码的目录为/usr/src/linux-headers-5.15.0-1052-azure。 后文提到的内核代码相关的目录都是以此为根的相对路径。

Linux内核在收到一个网络数据包后,首先会由网卡驱动程序(相关内核代码位于drivers/net/ethernet中)先进行处理, 然后回交由内核中处理协议栈相关的代码进行处理(相关内核代码位于kernel/net/中),处理完成后的结果,再由socket提供接口,供用户空间的应用层程序访问。

网络中断处理原理

那么从网卡收到数据包,是怎么传递给内核进行处理的呢,这里就要谈到中断处理了。 从硬件的角度来看,当一个网卡收到数据包时, 它会进行以下两件事情:

  • 将数据包以DMA(Direct Memory Access)的方式, 将收到的数据帧存放到内存的环形缓冲区中(Buffer Ring);
  • 向CPU的引脚施加一个电压变化,向CPU表明现在有一个数据来了,需要处理。

上述这种通过向CPU引脚施加电压的硬件操作,被称为硬中断。那么CPU此时就会对收到的数据包进行处理,那么如何处理呢?网络包如果一直不停的到来,而对网络包的处理往往又是复杂和耗时的,如果CPU每收到一个数据包都对它进行处理完成后再干别的工作,就会导致CPU的占用率过高,而无法对其他的硬中断进行响应了,比如鼠标键盘等设备发起的硬中断请求。

软中断注册

因此,当CPU收到一个网卡发来的硬中断时,它会告诉网卡驱动程序: “你先去内存登记一下待办事项吧”,于是网卡驱动程序会在内存中标记一个变量,表示这里有一个网络包需要人手来处理了。这个在内存中设置标志的操作,就被称为软中断。

上述过程的图示如下:
请添加图片描述

软中断处理

内核驱动程序处理

在我们的Linux启动后,内核中会运行一个进程ksoftirqd, 它的职责就是检测内存中是否有软中断需要处理, 一旦检测到这是一个网络驱动注册的软中断,就会调用网卡驱动中的poll函数,从内存的环形缓冲区中将网络数据包收下来并进行处理, 这个过程的图示如下:
请添加图片描述
其中, 网卡驱动程序中的igb_poll()函数会从内存的环形缓冲区中将完整的网络数据包取出来,然后调用igb_clean_rx_irq()函数进行处理,这些处理包括:

  • 校验收到的数据格式是否是一个合法的网络包;
  • 将收到的数据包格式化成skb,解析timestamp, VLAN id, protocol等字段信息
内核协议栈处理

在驱动程序对数据包进行处理后,处理完的数据将被发送到内核的协议栈进行处理,在进入协议栈之前,内核中存在一个GRO引擎,它的作用是把一些小的网络包合成一个大的网络包,一次性发给协议栈进行处理,目的是减少传送给协议栈的包数量,这有助于减少 CPU 的使用量。
请添加图片描述
如上图所示,在数据包进入协议栈后:

  • 首先会调用netif_receive_skb()函数,其中会辨别数据包的网络层协议,根据网络层协议调用不同的函数;
  • 例如判断得到这个数据包是个IP包,则会接下来调用ip_rcv()函数,在其中又会判断它的传输层协议,根据其是TCP还是UDP而调用不同的函数;
  • 例如判断得到这是一个TCP包,那么将继续调用tcp_rcv()函数对数据进行处理;
  • 处理完成后的数据可以供用户通过socket访问;

小结

网络模块在Linux内核中及其复杂,上面的介绍以尽可能简单明了的方式描述了一个数据包从网卡收到它开始,如何被内核进行处理的整个过程。其中包含了CPU硬中断,ksoftiqrd线程,软中断处理,网卡驱动对数据包的处理,skb的创建, 网络协议栈对数据包的处理等过程。

本文没有涉及用户空间应用程序从socket取包的过程,这涉及到recvfrom系统调用,也是一个比较复杂的话题。本系列文章旨在介绍Rust开发eBPF程序,只关注内核对网络包的处理流程,因此用户空间取包不在我们的关注范围内。在了解了网络包在内核中的处理流程之后,对于后需eBPF程序的挂载点,我们应当会有更清晰的认识。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/257765.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

操作系统 2-6 课后作业2.3:系统调用

第1关版本1内核执行的完整系统调用序列 任务描述 分析版本1内核,回答下列问题: 从系统开机直到输出第 4 个字符‘1’,系统依次执行了哪些系统调用?分别是在几号进程中执行的?(对于一组连续出现的 0 号进程…

喜讯:加速度商城系统全系列产品品牌全新升级为Shopfa

2月1日讯:经过1年多的品牌文化塑造,深圳市加速度软件开发有限公司经过研究决定,将旗下的多商户商城系列、小程序商城系列、B2B商城系列、供应商集采系列、电子元器件商城系列、跨境独立站商城系列、MRO工业品商城系列、外卖商城系列、智慧零售…

老电脑重置后能连上WIFI但是打开360网页老是提示该网址不是私密连接

看了一下可以忽略这次提示,能够上网,但是每次打开新网页都会有“该网址不是私密连接”提示,这个提示非常大,严重影响上网。 强行下载了谷歌浏览器并打开后,提示“您的时钟慢了”,然后看了一下电脑右下角日期…

【如何写论文】——写作提效的n个技巧:Word图、表自动编号 +Zotero实现参考文献自动化

目录 一、Word图、表自动编号1.1、单级编号1.2、多级编号1.3、交叉引用1.4、修改题注格式 二、Zotero实现参考文献自动化最后 一、Word图、表自动编号 在论文写作中,通常会包含数十张图片或表格。默认情况下,这些图片和表格都是没有编号的。 然而&…

快速入门FastAPI中的Field参数

快速入门FastAPI中的Field参数 在构建RESTful API时,定义资源模型是至关重要的。FastAPI是一个用于构建API的现代Python web框架,它使用Pydantic库来处理数据验证和模型。在这个过程中,Field 参数起着关键的作用。 本教程将向您介绍如何在F…

对Spring源码的学习:一

目录 BeanFactory开发流程 ApplicationContext BeanFactory与ApplicationContext对比 基于XML方式的Bean的配置 自动装配 BeanFactory开发流程 这里的第三方指的是Spring提供的BeanFactory,Spring启动时会初始化BeanFactory,然后读取配置清单&#…

【K8S】微服务不香了?单体化改造悄然兴起!!

微服务一直以来是服务治理的基本盘之一,落地到云原生上,往往是每个 K8s pods 部署一个服务,独立迭代、独立运维。 但是在快速部署的时候,有时候,我们可能需要一些宏服务的优势。有没有一种方法,能够 “既要又要” 呢?本文基于 tRPC-Go 服务,提出并最终实践了一种经验证…

常见的中间件--消息队列中间件测试点

最近刷题,看到了有问中间件的题目,于是整理了一些中间件的知识,大多是在小破站上的笔记,仅供大家参考~ 主要分为七个部分来分享: 一、常见的中间件 二、什么是队列? 三、常见消息队列MQ的比较 四、队列…

matplot绘图时图像太大报错但能保存

matplot绘图时,图像太大,可能在jupyter里面报错,但是图像可以保存。 报错:Image size of 12237479x675 pixels is too large. It must be less than 2^16 in each direction. 在这里插入图片描述

在Windows 11中,除了快捷键能让你迅速回到桌面,还有其他方法可以实现

本文介绍了在Windows11上显示桌面的所有不同方式。 使用键盘快捷键显示桌面 查看桌面的最快方法是使用键盘快捷键。有三种方法,每种方法都有自己的好处: WIN+D:按下这些键可以最小化所有打开的窗口,这样你就可以看到桌面并与之交互。重复此操作可以将所有窗口放回原位。W…

银河麒麟安装lnmp,安装chrome。

银河麒麟下载地址 兆芯 arm 架构64 点击下载 安装lnmp 下载相关文件 链接:https://pan.baidu.com/s/1YqFLfGpE5DP3Sf_2GsXqNg?pwdptsn –来自百度网盘超级会员V7的分享 上传到服务器 我所选择上传的地方是 /home/npf/nginx-server, php放在跟nginx-…

学习笔记:深度学习(3)——卷积神经网络(CNN)理论篇

学习时间:2022.04.10~2022.04.12 文章目录 3. 卷积神经网络CNN3.1 卷积神经网络的概念3.1.1 什么是CNN?3.1.2 为什么要用CNN?3.1.3 人类的视觉原理 3.2 CNN的基本原理3.2.1 主要结构3.2.2 卷积层(Convolution layer)1.…