【计算机网络】select/poll

多路转接 - select/poll

  • 一、I/O 多路转接之 select
    • 1. select 接口
    • 2. select 的使用
    • 3. select 的优缺点
  • 二、I/O 多路转接之 poll
    • 1. poll 接口
    • 2. poll 的使用
    • 3. poll 与 select 的对比

一、I/O 多路转接之 select

多路转接属于 IO 复用方式的一种。系统提供 select() 函数来实现多路复用输入/输出模型。select 系统调用是用来让我们的程序监视多个文件描述符的状态变化的。程序会停在 select 这里等待,直到被监视的文件描述符有一个或多个发生了状态改变。

1. select 接口

select 只负责等待,而且一次可以等待多个文件描述符。其中接口如下:

在这里插入图片描述

其中第一个参数 nfds 表示 select 等待的多个文件描述符的最大值+1,例如需要 select 等待的 fd 有 1、2、3、4、5,那么 nfds 这个参数就是 6.

返回值如果大于0,代表有 n 个 fd 就绪了;如果返回值等于 0,代表超时,表示没有错误,也没有 fd 就绪;如果小于 0,表示等待出错。

关于最后一个参数 struct timeval,我们需要另外介绍一下,在 Linux 中有对应的接口可以让我们获取时间,例如 gettimeofday() 可以获取特定时区下的特定时间,如下:

在这里插入图片描述

其中它的参数中也有 struct timeval 结构,该结构中的字段如下:

在这里插入图片描述

其中 tv_sec 表示时间戳,以秒为单位;tv_usec 以微秒为单位。

所以回到 select 接口中,最后一个参数 struct timeval 表示给 select 设置等待方式,例如设为 struct timeval timeout = {5, 0} 表示每隔 5 秒,timeout 一次,也就是在这 5 秒期间,没有任何一个文件描述符就绪,select 就会直接返回,然后再重新进入,设置 5 秒的时候,就重复刚才的工作。如果在等待 5 秒期间有文件描述符就绪了,那么就会立即返回。如果我们设为 {0, 0} 代表立马返回,非阻塞的一种。-1 表示阻塞等待。

另外,如果我们设置了,这个参数是一个输入输出型参数。例如我们设置每隔 5 秒 timeout 一次,可是刚过去 2 秒就有文件描述符就绪了,此时 timeout 输出时就变成了 3 秒。

最后,第二、三、四个参数都是同一个类型 fd_setfd_set 是内核提供的一种数据类型,它是位图。我们目前关心的 fd 上面的读写事件,要么特定的 fd 上读事件就绪,要么特定的 fd 上写事件就绪,要么特定的 fd 上有异常事件。所以对于任何一个文件描述符,如果只准它关心一种事件,那么就是这三种的其中一种。所以如果我们关心特定一个 fd 上读事件就绪,就让 select 来通知我们,我们就应该把文件描述符设置进第二个参数中。如果我们关心写事件就绪,就把文件描述符设置进第三个参数中。如果我们既关心读又关心写,我们可以同时设置进第二和第三个参数中。

下面我们单独拿第二个参数 readfds 来讲,这个集合也是输入输出型参数。当它是输入时,表示的是,用户告诉内核,我给你的一个或者多个 fd,你要帮我关心 fd 上面的读事件,如果事件就绪了,你就要告诉我!当它是输出时,也就是返回时,内核告诉用户,你让我关心的多个 fd 中,有哪些已经就绪了,你赶紧读取吧!其中这个位图传入的时候,比特位的位置,就表示文件描述符编号,比特位的内容,0 或者 1,就表示是否需要内核关心! 当有 fd 就绪时,操作系统就直接修改该位图中的内容,将已经就绪的 fd 在该位图的位置不变,也就是还是 1,将没有就绪的位置清0,也就是返回输出的时候,0 还是 1,表示哪些用户关心的 fd 上面的读事件已经就绪了!所以 fd_set 是一张位图,是为了让用户和内核传递 fd 是否就绪的信息的!

所以这就注定了使用 select 的时候,一定会有大量的位图操作,所以操作系统给我们提供了一系列的位图操作接口,如下:

在这里插入图片描述

  • FD_CLR:用来清除集合 set 中相关 fd 的位,比如 fd = 3,就是将 set 中的编号为 3 的位置由 1 改为 0 即可
  • FD_ISSET:用来测试集合 set 中相关 fd 的位是否为真,即判断是否在集合中
  • FD_SET:用来设置集合 set 中相关 fd 的位,也就是将 fd 添加到集合中
  • FD_ZERO:用来清除集合 set 的全部位,也就是全部清零

最后我们知道,fd_set 是一个位图,并且是一个具体的类型,所以 fd_set 就一定有具体的大小,只要有实际的大小,那么 fd_set 就一定有它位图中比特位的个数,也就是说 select 等待多个文件描述符一定是有上限的!下面我们验证一下 select 最多可以等待多少个文件描述符,如下代码:

				int main(){std::cout << "fd_set bits num: " << sizeof(fd_set) * 8 << std::endl;return 0;}

结果如下:

在这里插入图片描述

所以在我们当前机器的 select 能够等待的文件描述符个数是 1024 个。

2. select 的使用

下面我们写一段简单的代码使用 select 完成多个文件描述符的等待,详细解析参考代码注释,代码如下:

  • 封装的 socket 套接字 Socket.hpp:

      		#pragma once#include <iostream>#include <string>#include <cstring>#include <unistd.h>#include <sys/types.h>#include <sys/stat.h>#include <sys/socket.h>#include <arpa/inet.h>#include <netinet/in.h>#include "log.hpp"enum{SocketErr = 2,BindErr, ListenErr,};const int backlog = 10;class Sock {public:Sock(){}~Sock(){}public:void Socket(){_sockfd = socket(AF_INET, SOCK_STREAM, 0);if(_sockfd < 0){lg(Fatal, "socket error, %s: %d", strerror(errno), errno);exit(SocketErr);}int opt = 1;setsockopt(_sockfd, SOL_SOCKET, SO_REUSEADDR | SO_REUSEPORT, &opt, sizeof(opt));}void Bind(uint16_t port){sockaddr_in local;memset(&local, 0, sizeof(local));local.sin_addr.s_addr = INADDR_ANY;local.sin_family = AF_INET;local.sin_port = htons(port);if(bind(_sockfd, (const sockaddr*)&local, sizeof(local)) < 0){lg(Fatal, "bind error, %s: %d", strerror(errno), errno);exit(BindErr);}}void Listen(){if(listen(_sockfd, backlog) < 0){lg(Fatal, "listen error, %s: %d", strerror(errno), errno);exit(ListenErr);}}int Accept(std::string* client_ip, uint16_t* client_port){sockaddr_in peer;socklen_t len = sizeof(peer);int newfd = accept(_sockfd, (sockaddr*)&peer, &len);if(newfd < 0){lg(Warning, "accept error, %s: %d", strerror(errno), errno);return -1;}char buffer[64];inet_ntop(AF_INET, &peer.sin_addr, buffer, sizeof(buffer));*client_ip = buffer;*client_port = ntohs(peer.sin_port);return newfd;}void Close(){close(_sockfd);}bool Connect(std::string serverip, uint16_t serverport){sockaddr_in peer;memset(&peer, 0, sizeof(peer));inet_pton(AF_INET, serverip.c_str(), &(peer.sin_addr));peer.sin_family = AF_INET;peer.sin_port = htons(serverport);int n = connect(_sockfd, (const sockaddr*)&peer, sizeof(peer));if(n < 0){lg(Fatal, "connect error, %s: %d", strerror(errno), errno);return false;}return true;}int GetFd(){return _sockfd;}private:int _sockfd;};
    
  • 对 select 封装的 SelectServer.hpp:

      	#pragma once#include <iostream>#include <string>#include <sys/select.h>#include <sys/time.h>#include "Socket.hpp"#include "log.hpp"static const uint16_t defaultport = 8888;static const int fd_set_max = (sizeof(fd_set) * 8);int default_fd = -1;class SelectServer{public:SelectServer(uint16_t port = defaultport): _port(port){for (int i = 0; i < fd_set_max; ++i){fd_array[i] = default_fd;}}bool Init(){_listenSock.Socket();_listenSock.Bind(8888);_listenSock.Listen();return true;}void Start(){int listenSock = _listenSock.GetFd();fd_array[0] = listenSock;while (true){fd_set rfds;FD_ZERO(&rfds); // 清空集合int maxfd = fd_array[0];for (int i = 0; i < fd_set_max; ++i){if (fd_array[i] == default_fd)continue;FD_SET(fd_array[i], &rfds); // 向集合添加指定fd// 更新最大的 fdif (maxfd < fd_array[i]){maxfd = fd_array[i];lg(Info, "max fd update, max fd is: %d", maxfd);}}struct timeval timeout = {2, 0}; // 输入输出,可能要进行周期重复设置// select 告诉我们就绪了,接下来的一次读取,我们读取 fd 的时候,不会被阻塞// rfds 是输入输出型参数,所以在输入时可能是 1111,返回时可能只有一个fd就绪,那么就被覆盖成 0001// 所以 rfds 原来的位图中的值就不见了,也就是需要内核关心的fd不见了!// 所以就要求 select 每次返回处理完之后,回到循环开始,每一次都要把 rfds 的参数重新设置!int n = select(maxfd + 1, &rfds, nullptr, nullptr, &timeout);switch (n){case 0:// std::cout << "time out, timeout: " << timeout.tv_sec << "." << timeout.tv_usec << std::endl;break;case -1:std::cerr << "select error" << std::endl;break;default:// 有事件就绪了,交给事件派发器 Dispatcherstd::cout << "get a new link!" << std::endl;Dispatcher(rfds);  break;}}}~SelectServer(){_listenSock.Close();}private:Sock _listenSock;uint16_t _port;// 辅助数组,为了将合法的文件描述符添加到 rfds 中int fd_array[fd_set_max];};
    
  • 事件派发器 Dispatcher()

      	    void Dispatcher(fd_set &rfds){	for (int i = 0; i < fd_set_max; ++i){int fd = fd_array[i];if (fd == default_fd)continue;// 如果当前 fd 在 rfds 中已经就绪if (FD_ISSET(fd, &rfds)){// 处理 listen 套接字if (fd == _listenSock.GetFd()){// 连接管理器Accepter();}// 其他文件描述符就绪, 也就是读事件就绪else{Recver(fd, i);}}}}
    
  • 连接管理器 Accepter()

      	    void Accepter(){// 连接事件就绪std::string clientip;uint16_t clientport = 0;int sock = _listenSock.Accept(&clientip, &clientport); // 这里不会阻塞,因为事件已经就绪if (sock < 0) return;lg(Info, "accept success, %s: %d", clientip.c_str(), clientport);// 将已经就绪的 sock 添加到辅助数组中即可,当 select 下一次设置的时候就会将该 fd 设置到 rfds 中!int pos = 1;for (; pos < fd_set_max; ++pos){if (fd_array[pos] != default_fd)continue;elsebreak;}if (pos == fd_set_max){lg(Warning, "server is full, close %d now!", sock);close(sock);}else{fd_array[pos] = sock;}}
    
  • 读事件处理器 Recver()

      	    void Recver(int fd, int pos){char buffer[1024];ssize_t n = read(fd, buffer, sizeof(buffer) - 1);if (n > 0){buffer[n] = 0;std::cout << "get a message: " << buffer << std::endl;}else if (n == 0){lg(Info, "client quit, me too, close fd is: %d", fd);close(fd);fd_array[pos] = default_fd; // 本质从 rfds 中移除}else{lg(Warning, "recv error, fd is: %d", fd);close(fd);fd_array[pos] = default_fd; // 本质从 rfds 中移除}}
    

3. select 的优缺点

  1. 优点
  • select 已经是一种多路转接的方案了,在单进程的同时也能多用户的请求。select 一次可以等待多个文件描述符,IO 等于等待+拷贝,所以 select 可以知道多个文件描述符上的 IO 事件是否就绪,也就是把所有的等待时间重叠起来。这样如果有任何一个事件就绪,我们就可以知道这个事件就绪,然后把事件派发上来,让上层进行处理,要么是获取新连接,要么是读写数据。
  1. 缺点
  • select 能够等待的 fd 是有上限的
  • 输入输出型参数比较多,数据拷贝的频率比较高
  • 输入输出型参数比较多,每次都要对关心的 fd 进行事件重置,也就是需要大量的循环
  • 用户层使用第三方数组管理用户的 fd,用户层需要很多次遍历;内核中检测 fd 事件就绪,也要遍历

二、I/O 多路转接之 poll

poll 也是多路转接方案的一种,它主要解决的就是 select 中的等待 fd 有上限的问题,以及每次都要对关心的 fd 进行事件重置的问题。

1. poll 接口

下面我们看看 poll 的接口:

在这里插入图片描述

首先 poll 的返回值和 select 的返回值一模一样。

第三个参数 timeout 其实是一个整型,表示的是时间,单位为毫秒,含义和 select 中的 timeout 一样。

而我们发现,poll 的第一个参数,专门设计了一个结构体 struct pollfd,其实我们可以理解成这个结构体是一个数组,而第一个参数就表示第一个元素的地址。

第二个参数 nfds 代表第一个参数的数组中有多少个元素。

在这里插入图片描述

我们知道,多路转接无非包括两点,第一,用户告诉内核;第二,内核告诉用户。pollselect 一样,只不过 select 用位图,而 poll 用结构体数组。所以 poll 在用户传给内核的时候,表示告诉内核需要关心 struct pollfd 结构体中的 fd 中的 events 事件;当返回时,代表 struct pollfd 结构体中的 fd 中的 revents 事件就绪了。所以,poll 最大的特点是将输入和输出事件进行了分离!

但是当我们告诉内核需要关心 events 事件的时候,内核怎么知道是关心读事件还是写事件还是其他事件呢?当内核返回用户也一样。那么我们可以看到 eventsrevents 都是 short 类型,都是 16 个比特位,也就是在 Linux 中,使用了比特位传参!所以它把事件设置成位图的形式,如下,其实它们都是宏:

在这里插入图片描述

所以,poll 的本质是将读写事件分离,然后传入用户定的数组元素的大小,通过 eventsrevents 以位图的方式来传递就绪和关心标记位的解决方案!

2. poll 的使用

下面我们直接对 selectSever.hpp 做修改,改成一个 pollSever.hpp,代码如下:

			#pragma once#include <iostream>#include <string>#include <sys/time.h>#include <poll.h>#include "Socket.hpp"#include "log.hpp"static const uint16_t defaultport = 8888;static const int fd_num_max = 64;static const int default_fd = -1;static const int non_event = 0;class PollServer{public:PollServer(uint16_t port = defaultport): _port(port){for (int i = 0; i < fd_num_max; ++i){_event_fds[i].fd = default_fd;_event_fds[i].events = non_event;_event_fds[i].revents = non_event;   }}bool Init(){_listenSock.Socket();_listenSock.Bind(8888);_listenSock.Listen();return true;}void Accepter(){// 连接事件就绪std::string clientip;uint16_t clientport = 0;int sock = _listenSock.Accept(&clientip, &clientport); // 这里不会阻塞,因为事件已经就绪if (sock < 0) return;lg(Info, "accept success, %s: %d", clientip.c_str(), clientport);// 将已经就绪的 sock 添加到 _event_fds 中// 并将它的 events 设置为读事件 POLLINint pos = 1;for (; pos < fd_num_max; ++pos){if (_event_fds[pos].fd != default_fd)continue;elsebreak;}if (pos == fd_num_max){lg(Warning, "server is full, close %d now!", sock);close(sock);// 可以选择扩容...}else{_event_fds[pos].fd = sock;_event_fds[pos].events = POLLIN;}}void Recver(int fd, int pos){char buffer[1024];ssize_t n = read(fd, buffer, sizeof(buffer) - 1);if (n > 0){buffer[n] = 0;std::cout << "get a message: " << buffer << std::endl;}else if (n == 0){lg(Info, "client quit, me too, close fd is: %d", fd);close(fd);_event_fds[pos].fd = default_fd; // 本质从 结构体数组 中移除}else{lg(Warning, "recv error, fd is: %d", fd);close(fd);_event_fds[pos].fd = default_fd; // 本质从 结构体数组 中移除}}void Dispatcher(){for (int i = 0; i < fd_num_max; ++i){int fd = _event_fds[i].fd;if (fd == default_fd)continue;// 如果当前 fd 在 _event_fds 中已经就绪if (_event_fds[i].revents & POLLIN){// 处理 listen 套接字if (fd == _listenSock.GetFd()){// 连接管理器Accepter();}// 其他文件描述符就绪, 也就是读事件就绪else{Recver(fd, i);}}}}void Start(){_event_fds[0].fd = _listenSock.GetFd();_event_fds[0].events = POLLIN;      // listen 套接字只关心获取连接,即读事件int timeout = 2000; // 2swhile (true){int n = poll(_event_fds, fd_num_max, timeout);switch (n){case 0:std::cout << "time out..." << std::endl;break;case -1:std::cerr << "poll error" << std::endl;break;default:// 有事件就绪了,交给事件派发器 Dispatcherstd::cout << "get a new link!" << std::endl;Dispatcher( );  break;}}}~PollServer(){_listenSock.Close();}private:Sock _listenSock;uint16_t _port;struct pollfd _event_fds[fd_num_max];};

3. poll 与 select 的对比

  • 那么我们通过 poll 的使用可以看到,poll 本质上也是通过一个结构体数组来等待 fd 的,我们在开始的时候说过,它解决了 select 等待 fd 有上限的问题,那么它怎么解决了 fd 有上限的问题呢?其实我们在写的时候也发现,_event_fds 这个数组的大小是由我们自己定的,所以我们可以定的非常大,大到内存扛不住,所以此时就是操作系统的问题了,不是 poll 接口本身的问题。而 select 等待 fd 有上限的问题,本质上是接口本身的问题,所以 poll 本质上是解决了 select 等待 fd 有上限的问题。
  • pollselect 都需要遍历检测有哪些文件描述符就绪,其中 poll 在内核中需要遍历检测有哪些文件描述符就绪;在用户层需要遍历检测有哪些事件已经就绪。

所以 pollselect 都避免不开遍历的问题,也就是在效率上没有本质的提升。于是又出现了另一个接口 epoll,我们下一篇再介绍。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/585633.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

# 达梦数据库知识点

达梦数据库知识点 测试数据 -- SYSDBA.TABLE_CLASS_TEST definitionCREATE TABLE SYSDBA.TABLE_CLASS_TEST (ID VARCHAR(100) NOT NULL,NAME VARCHAR(100) NULL,CODE VARCHAR(100) NULL,TITLE VARCHAR(100) NULL,CREATETIME TIMESTAMP NULL,COLUMN1 VARCHAR(100) NULL,COLUMN…

入门教程:Windows搭建C语言和EasyX开发环境

&#x1f31f; 前言 欢迎来到我的技术小宇宙&#xff01;&#x1f30c; 这里不仅是我记录技术点滴的后花园&#xff0c;也是我分享学习心得和项目经验的乐园。&#x1f4da; 无论你是技术小白还是资深大牛&#xff0c;这里总有一些内容能触动你的好奇心。&#x1f50d; 如果对你…

C++ list

文章目录 list的介绍及使用list的介绍list的构造list iterator的使用list capacitylist element accesslist modifiers list模拟实现list节点类list迭代器类list类 list深度剖析list迭代器失效list反向迭代器 list与vector对比 list的介绍及使用 list的介绍 1.list的底层是双向…

Linux中JMeter的使用

Linux中JMeter的使用 Linux版本JMeter安装 # 1、下载、安装JMeter 如果有安装包直接上传即可 wget -c https://archive.apache.org/dist/jmeter/binaries/apache-jmeter-5.4.1.tgz # 解压 tar -zxvf apache-jmeter-5.4.1.tgz -C /usr/local/sjdwz_test cd /usr/local/sjdwz_t…

idea2023+jdk1.8+Maven3.6.3+Testng6.10+junit4.13搭建测试

idea2023jdk1.8Maven3.6.3Testng6.10junit4.13搭建测试 首先创建maven工程 导入依赖 pom.xml <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"http://www.w3.org/2001/…

electron 打不同环境的包

我用的打包工具: electron-builder 1、在package.json 文件的同级下创建2个js文件 electron-builder-test.config.js electron-builder.config.js electron-builder-test.config.js const basejson require(./electron-builder.config.js); module.exports {extraMetada…

NLP学习路线总结:从入门到精通

自然语言处理&#xff08;Natural Language Processing&#xff0c;NLP&#xff09;是人工智能领域的重要分支&#xff0c;它致力于使计算机能够理解、解释和生成人类语言。NLP技术的应用范围广泛&#xff0c;涵盖了机器翻译、情感分析、语义理解、信息抽取等诸多领域。对于想要…

2024多功能知识付费源码下载

多功能知识付费源码下载实现流量互导多渠道变现 源码介绍 资源变现类产品的许多优势&#xff0c;并剔除了那些无关紧要的元素&#xff0c;使得本产品在运营和变现能力方面实现了质的飞跃。多领域素材资源知识变现营销裂变独立版本。 支持&#xff1a;视频、音频、图文、文档…

面对复杂多变的网络攻击,企业应如何守护网络安全

企业上云&#xff0c;即越来越多的企业把业务和数据&#xff0c;迁移到云端。随着云计算、大数据、物联网、人工智能等技术的发展&#xff0c;用户、应用程序和数据无处不在&#xff0c;企业之间的业务边界逐渐被打破&#xff0c;网络攻击愈演愈烈&#xff0c;手段更为多。 当前…

vue3和vue2项目中如何根据不同的环境配置基地址?

在不同环境下取出的变量的值是不同的, 像这样的变量称为环境变量 为什么要使用环境变量呢? 开发环境生产环境下的接口地址有可能是不一样的&#xff0c;所以我们需要根据环境去配置不同的接口基地址 1、vue2环境变量配置 在根目录创建&#xff1a;.env.development和.env.p…

Shell与Bash与POSIX与Linux间的关系

shell是什么&#xff1f; Shell的英语翻译是“壳”&#xff0c;其作用也跟名字差不多&#xff0c;为操作系统套个壳&#xff0c;人与操作系统的壳交互。与壳相对应的则是操作系统内核&#xff0c;一个“壳”一个“核”。核从1970年代开始就基本定型了&#xff0c;没什么大的改…

验证码项目(java实现)

1、Kaptcha详细配置 配置项 配置说明 默认值 kaptcha.border 图⽚边框&#xff0c;合法值&#xff1a;yes , no yes kaptcha.border.color 边框颜⾊&#xff0c;合法值&#xff1a; r,g,b (and optional alpha) 或者 white,black,blue black kaptcha.image.width 图⽚宽 200…