关于redis单线程和IO多路复用的理解-编程知识

首先，Redis是一个高性能的分布式缓存中间件。其复杂性不言而喻，对于Redis整体而言肯定不是只有一个线程。

我们常说的Redis 是单线程，主要是指 Redis 在网络 IO和键值对读写是采用一个线程来完成的，这也是 Redis 对外提供键值存储服务的核心流程。但对于 Redis 的其他功能来说，比如持久化、异步删除、集群数据同步等，其实都是由额外的线程执行的。
关于redis有几个基本的说辞：

- 单线程
- 基于内存操作，速度快
- I/O 多路复用
这里简单分析一下

单线程

单线程的优势：

使用单线程可以避免频繁的上下文切换
Redis 中有各种类型的数据操作，甚至包括一些事务处理，如果采用多线程，还可能因为加锁导致软件复杂度提升，更有可能会因为加解锁，甚至出现死锁，造成的性能损耗，所以使用单线程反而性能会更好

其实是当出现多线程同时在操作一个共享的资源时，我们为了保证结果的正确性，我们需要有额外的开销来保证，如锁。当有锁出现了，我们就需要在考虑在什么时候需要获取锁，释放锁，其中就需要记录锁的状态，可想而知，性能就会下降。这就是多线程模式在面临高并发场景下共享资源的访问问题。

单线程为什么还可以这么快

实现高性能的一个方面是 Redis 是基于内存操作，它内部高效的数据结构，如跳表，quicklist,listpack,哈希表等，还有就是 Redis 采用了 I/O多路复用机制，从而保障在网络 I/O 中能够高效的处理并发请求，实现高吞吐率。包括高版本中实行的网络IO异步化。这些都是是实现高性能的重要原因。

I/O 多路复用模型

在 Linux 中，我们都知道 Linux 对文件的操作实际上就是通过文件描述符（fd），通过一个进程监听多个文件描述符，一旦某个文件描述符准备就绪，就会通知对应的程序响应并处理，这种通知的方式优势在于在单个时间内能够处理更多的链接。

Linux 中的 I/O 多路复用机制是指一个线程处理多个 IO 流，也就是我们通常说的 select/epoll。在 Redis 单线中，允许在内核中同时存在多个监听文件描述符，内核会去监听在这上面的链接请求，一但有请求就会交给 Redis 线程处理，从而实现一个Redis 线程可以处理多个 IO 流。那么什么是 select、epoll？

1、 select

select 是一个函数，它支持最大的连接数是 1024 或者 2048，因为在 select 函数需要传入fd_set 参数，这个 fd_set 的长度取决于操作系统的位数 1024 或者 2048。

其中 fd_set 是一个 bitmap，当数据没有到缓冲区那么就是 0，反之到了缓冲区就是 1。select 函数的功能是将 fd_set 遍历，判断标识位是否存在变化，若发生变化就发起中断处理。

2 、epoll

epoll 的首次提出是在 Linux 2.6 内核中，他是为了解决 select 的缺点。

它定义了 epoll_event 结构体来处理，解决 select 存在最大链接数的限制。epoll 不会遍历所有的文件描述符（fd），epoll 会将准备就绪的文件描述符维护在一块指定的空间内，每次从其中取出已经准备就绪的文件描述符进行处理，大大提高了性能。

这就是 select 和 epoll 的区别，想看具体的源码可以自行了解，这里只是简单的描述一下。

3 、Redis I/O 多路复用模型

在 Redis 中，其网络框架调用采用的是复用机制中的 epoll 机制，让内核监听文件描述符，此时 Redis 线程不会阻塞在某一个特定的监听或已连接的文件描述符，从而可以达到同时处理多个链接请求，提高并发性能。如下图，Redis I/O 多路复用模型：

为了当请求到达时会通知 Redis 线程， select/epoll 提供了基于事件的回调机制，即针对不同事件的发生，调用相应的处理函数。

说说回调机制时如何高效的工作的。当 select/epoll 监测到有文件描述符请求到达时，会发出对应的事件处理，这些事件会被放到一个事件处理队列中，然后 Redis 会对事件进行处理。通过对队列进行轮询，可以提高 CPU 利用率。同时，Redis 在处理事件时，会调用其相应的事件处理函数，实现基于事件的回调。最终使得请求能够第一时间及时响应，再一步提升 Redis 的相应性能。

举个发起读数据的例子，更好的理解上面 Redis I/O 多路复用模型。

当程序发起 Accept 和 Read 事件时， Redis 线程会注册这 Accept 和 Get 事件对应的回调函数。当 Linux 内核监听到有链接请求或者读数据的请求时，会触发 Accept 和 Read 事件，与此同时调用 Redis 的 Accept 和 Get 函数进行数据处理。

事件处理流程的更新

Redis 4.0之前的事件处理流程

我们通过IO多路复用器监听来自客户端的socket网络连接，然后由主线程进行IO请求的处理以及命令的处理，所有操作都是线性的

Redis 4.0 之后加入Lazy Free机制

Redis 4.0 之前在处理客户端命令和IO操作时都是以单线程形式运行，期间不会响应其他客户端请求，但若客户端向Redis发送一条耗时较长的命令，比如删除一个含有上百万对象的Set键，或者执行flushdb，flushall操作，Redis服务器需要回收大量的内存空间，这事就会导致Redis服务阻塞，对于负载较高的缓存系统来说将会是个灾难。为了解决这个问题，在Redis 4.0版本引入了Lazy Free，目的是将慢操作异步化，这也是在事件处理上向多线程迈进了一步

Redis 6.0 之后将网络IO异步化

从以上的发展历程中，我们也能看出Redis 的瓶颈并不在CPU上，即使是单线程Redis也能做到很快的响应，除非是遇到个别极其耗时的命令，这一块我们的Redis也在4.0版本做出了优化，但是我们是不是能更进一步优化Redis呢？从上图中我们可以看出主线程不光处理大量的命令，还需要处理大量的网络IO，Redis6.0就是基于此，将IO操作交由其他线程处理

Redis6.0的多线程默认是禁用的，只使用主线程。如需开启需要修改redis.conf配置文件：io-threads-do-reads yes

开启多线程后，还需要设置线程数，否则是不生效的。

线程数一定要小于机器核数。线程数并不是越大越好，官方认为超过了 8 个基本就没什么意义了。

设置线程数，修改redis.conf配置文件： io-threads 6