Linux 基础IO

文章目录

  • 前言
  • 基础IO定义
  • 系统IO接口
  • 文件描述符
  • 重定向原理
  • 缓冲区刷新

前言

要知道每个函数/接口的全部参数和返回值建议去官网或者直接在Linux的man手册中查,这不是复制粘贴函数用法的文章。
C语言文件读写介绍链接

基础IO定义

IO是Input/Output的缩写,它是计算机领域中常用的术语,用来描述计算机系统与外部设备之间的数据交换过程。输入(Input)是指将外部数据或指令传输到计算机系统中,而输出(Output)则是指将计算机系统处理后的数据或结果传输到外部设备中。例如,键盘、鼠标、显示器、打印机等都属于外部设备,它们与计算机之间的数据交换过程就是通过输入和输出来实现的。

系统IO接口

在说系统IO接口之前需要区分语言库IO函数和系统IO接口的区别,库函数IO接口如C语言中的fopen函数 fseek函数 ftell函数 rewind函数 等。这些都是语言库对系统IO接口open write read close 等IO接口的再封装。 如图open write read close 等IO接口在用户操作接口层,fopen函数 fseek函数 ftell函数 rewind函数 等在用户层。
在这里插入图片描述

文件描述符

文件描述简写为fd;

在Linux中,每个进程都有一个task_struct, task_struct 里有 *files指针, *files指针指向 files_struct结构体(files_struct结构体内含有file_struct结构体的列表的指针) , fd 是 files_struct 内那个指向的数组 的下标,文件描述符本质是文件信息结构体数组下标。(注意files_structfile_struct 差一个字母 )

在这里插入图片描述

在调用系统IO接口open打开文件后会返回打开文件描述符。文件描述符是一个非负的整数。在Linux操作系统中的进程中,默认会打开三个文件描述符,分别是0 , 1 , 2 对应三个文件标准输入文件 标准输出文件 标准错误文件 。(Linux中一切皆文件,硬件如:显示器,键盘鼠标接入后都是Linux系统中的一个个文件)

文件描述符的分配原则是,当一个进程打开新的文件,该文件的信息存放在文件信息存储数组中未被使用的且素组下标最小的位置。(也就是说如果默认被标准输入文件使用的0下标在新文件被打开之前就关闭,新文件打开后就会占据0下标来记录新打开文件的文件信息)
在这里插入图片描述

重定向原理

重定向原理:关闭文件信息数组newfd下标对应的文件,并将newfd存储的文件设置为oldfd存储的文件信息。此时newfd 和 oldfd 文件描述符实际对应的都是重定向之前 newfd对应的文件信息,即可通过newfd 和 oldfd 文件描述访问同一个文件。

将oldfd实际对应的文件信息给newfd
在这里插入图片描述重定向使用

使用方法一:利用函数

int dup2(int oldfd, int newfd);

参数:
1.oldfd:一个整数值,表示要复制的旧文件描述符。
2.newfd:一个整数值,表示新的文件描述符。
返回值:
如果成功,返回值为newfd;
如果失败,返回值为-1,并设置errno来指示错误类型。
例:

#include <stdio.h>
#include <unistd.h>
#include <fcntl.h>int main() 
{// 打开一个文件用于写入int fd = open("example.txt", O_WRONLY | O_CREAT, 0644); if (fd == -1) {perror("open");return 1;}// 将标准输出重定向到文件描述符fd所指向的文件int newfd = dup2(fd, STDOUT_FILENO); if (newfd == -1) {perror("dup2");return 1;}printf("This will be written to example.txt\n"); // 这行内容将会写入到example.txt文件中close(fd); // 关闭文件描述符fdclose(newfd); // 关闭新的文件描述符newfdreturn 0;
}

使用方法二:在命令行利用重定向符号 < >

在Linux中,重定向符号>用于将命令的输出结果重定向到指定的文件中。它的作用是将命令的标准输出(stdout)输出到文件中,而不是显示在终端上。
重定向符号>的使用方法是在命令后面加上>符号,紧跟着要输出到的目标文件名。例如:

command > filename

command表示要执行的命令,filename表示要将输出结果写入的目标文件名。
当执行带有重定向符号>的命令时,如果目标文件已经存在,则会被覆盖;如果目标文件不存在,则会创建一个新文件。重定向符号>会将命令的标准输出重定向到目标文件中,不会在终端上显示输出结果。以下是几个示例,演示如何使用重定向符号>进行输出重定向:

  1. 将ls命令的输出结果写入到名为file.txt的文件中:
ls > file.txt
  1. 将command命令的错误输出(标准错误流)写入到名为error.txt的文件中
command 2> error.txt

缓冲区刷新

什么是缓冲区

缓冲区区分

前面IO分为系统IO和语言库封装的IO函数,语言库在封装IO接口的同时也对IO缓冲区刷新策略做了封装,C语言的缓冲刷新策略和Linux本身缓冲区刷新策略大致一样。但C语言的函数在系统缓冲区的基础上,在语言库层面(用户层)再设置了一个缓冲区,该缓冲区具体在FILE结构体中。

Linux 缓冲区刷新策略:

  1. 全缓冲(fully buffered):默认情况下,Linux使用全缓冲模式。在全缓冲模式下,数据会在缓冲区中累积一定量后才会被写入磁盘,这样可以减少磁盘I/O操作的次数,提高性能。但是,这也意味着数据可能会在缓冲区中停留一段时间,直到缓冲区满或者手动刷新。

  2. 行缓冲(line buffered):对于某些特殊的文件,如终端设备,Linux会使用行缓冲模式。在行缓冲模式下,数据会在遇到换行符时立即写入磁盘,这样可以保证及时显示输出结果。但是,对于普通文件,行缓冲模式并不常见。

  3. 无缓冲(unbuffered):在某些情况下,我们可能需要禁用缓冲区,直接将数据写入磁盘。这种模式下,数据会立即写入磁盘,但是由于没有缓冲区,会导致频繁的磁盘I/O操作,性能较差。

库函数刷新策略证明

#include <stdio.h>
#include <string.h>
int main()
{const char *msg0="hello printf\n";const char *msg1="hello fwrite\n";const char *msg2="hello write\n";printf("%s", msg0);fwrite(msg1, strlen(msg0), 1, stdout);write(1, msg2, strlen(msg2));fork();return 0;
}

直接运行结果:

hello printf
hello fwrite
hello write
./test > file 重定向之后结果:
hello write
hello printf
hello fwrite
hello printf
hello fwrite

现象解释:C语言库函数缓冲区在输入对象为终端时刷新策略为行缓冲,直接运行时,在遇到换行符时就将库函数缓冲区的内容刷新到系统缓冲区,再由系统缓冲区输入到终端上。重定向后,输入目标为普通文件,刷新策略变为全缓冲,write输入到系统缓冲区,fwrite 和 printf 属于C语言库函数,输入了C语言库函数缓冲区,在子进程创建后,会拷贝一份C语言库函数缓冲区 (因为拷贝了FILE结构体,C语言库函数缓冲区即为FILE结构体的成员) 到子进程。 进程结束时会将父子进程C语言库函数的缓冲区的内容输入系统缓冲区,再由系统缓冲区一起刷新到终端(屏幕)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/264802.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Linux】进程周边001之进程概念

&#x1f440;樊梓慕&#xff1a;个人主页 &#x1f3a5;个人专栏&#xff1a;《C语言》《数据结构》《蓝桥杯试题》《LeetCode刷题笔记》《实训项目》《C》《Linux》 &#x1f31d;每一个不曾起舞的日子&#xff0c;都是对生命的辜负 目录 前言 1.基本概念 2.描述进程-PCB…

linux之autoconf(1)基础介绍

Linux之autoconf(1)基础介绍 Author&#xff1a;Onceday Date&#xff1a;2023年2023年12月10日 漫漫长路&#xff0c;才刚刚开始… 本文主要内容翻译自Autoconf官方文档&#xff0c;仅供学习交流之用。 全系列文章请查看专栏: buildroot编译框架_Once_day的博客-CSDN博客。…

SpringBoot实战项目:蚂蚁爱购(从零开发)

简介 这是从零开发的SpringBoot实战项目&#xff0c;名字叫蚂蚁爱购。 从零开发项目&#xff0c;视频加文档&#xff0c;十天彻底掌握开发SpringBoot项目。 教程路线是&#xff1a;搭建环境> 安装软件> 创建项目> 添加依赖和配置> 通过表生成代码> 编写Java代…

【前端】CSS浮动(学习笔记)

一、浮动 1、传统网页布局 网页布局的本质&#xff1a;用 CSS 来摆放盒子&#xff0c;把盒子摆放到相应位置。 CSS 提供了三种传统布局方式&#xff08;盒子如何进行排列顺序&#xff09; 普通流&#xff08;标准流&#xff09;浮动定位 实际开发中&#xff0c;一个页面基…

Python实现获取b站视频的弹幕内容

前言 本文是该专栏的第39篇,后面会持续分享python的各种干货知识,值得关注。 在本专栏之前,有详细介绍使用python增加b站视频的播放量方法,感兴趣的同学可往前翻阅《Python-增加b站视频播放量》。而本文,笔者再来单独的详细介绍,通过python来获取b站视频的弹幕内容。如下…

CGAL的3D皮肤表面网格

1、介绍 Edelsbrunner 引入的皮肤表面和具有丰富而简单的组合和几何结构&#xff0c;使其适合在生物计算中模拟大分子。 对这些表面进行网格划分通常是进一步处理其几何形状所必需的&#xff0c;例如在数值模拟和可视化中。 皮肤表面由一组加权点&#xff08;输入球&#xff09…

Course3-Week1-无监督学习

Course3-Week1-无监督学习 文章目录 Course3-Week1-无监督学习1. 欢迎1.1 Course3简介1.2 数学符号约定 2. K-means算法2.1 K-means算法的步骤2.2 代价函数2.3 选择聚类数量 3. 异常检测3.1 异常检测的直观理解3.2 高斯分布3.3 异常检测算法3.4 选取判断阈值 ε \varepsilon ε…

LV.13 D2 开发板启动流程 学习笔记

一、开发板启动过程 EMMC&#xff1a;相当于电脑的外存&#xff0c;断电不丢失 开发板上电后首先运行SOC内部iROM中固化的代码(BL0)&#xff0c;这段代码先对基本的软硬件环境(时钟等...)进行初始化&#xff0c;然后再检测拨码开关位置获取启动方式&#xff0c;然后再将对应存储…

【Web】SCU新生赛个人wp及完赛感想

目录 一些碎碎念&#xff1a; Web Guideline 2048 ezupload hardupload ezphp ezweb ezsql webbuilder tarit tarit_revenge VipDinner simplespi 一些碎碎念&#xff1a; scu新生赛是我全心全力打的第二场比赛&#xff0c;历时七天&#xff0c;期间不免煎熬&…

PPP协议概述与实验示例

PPP协议概述与实验示例 概述 PPP&#xff08;Point-to-Point Protocol&#xff09;是一种用于在点对点连接上传输多协议数据包的标准方法。它已经成为最广泛使用的互联网接入数据链路层协议&#xff0c;可以与各种技术结合&#xff0c;如ADSL、LAN等&#xff0c;实现宽带接入…

GM 串口图像显示软件 V1.1

GM 串口图像显示软件 V1.1 将串口数据转换成多种格式的图像软件 针对V1.0更新了通信协议 GM 串口图像显示软件 V1.1 by 李锦上功能简介将串口收到的图像数据按图像格式显示出来支持多种格式的图像支持按行更新图像支持多行更新图像占用MCU资源小 通信成功率高通信协议&am…

Landsat7_C2_SR数据集(大气校正地表发射率数据集)

Landsat7_C2_SR数据集是经大气校正后的地表反射率数据&#xff0c;属于Collection2的二级数据产品&#xff0c;空间分辨率为30米&#xff0c;基于Landsat生态系统扰动自适应处理系统&#xff08;LEDAPS&#xff09;&#xff08;版本3.4.0&#xff09;生成。水汽、臭氧、大气高度…