Redis专题-队列

Redis专题-队列

首先,想一想 Redis 适合做消息队列吗?

1、消息队列的消息存取需求是什么?redis中的解决方案是什么?

无非就是下面这几点:

0、数据可以顺序读取
1、支持阻塞等待拉取消息
2、支持发布/订阅模式
3、重新消费
4、消息不丢失
5、消息可堆积

那我们来看看redis怎么满足这些需求

1.1、基于 List 的消息队列解决方案

1.1.1、数据保证顺序

List 本身就是按先进先出的顺序对数据进行存取的,底层的实现就是一个「链表」,在头部和尾部操作元素,时间复杂度都是 O(1),这意味着它非常符合消息队列的模型。

生产者使用 LPUSH 发布消息:

127.0.0.1:6379> LPUSH mq 5
(integer) 1
127.0.0.1:6379> LPUSH mq 3
(integer) 2

消费者使用 RPOP 拉取消息:

127.0.0.1:6379> RPOP mq
5
127.0.0.1:6379> RPOP mq
3

img

当队列中已经没有消息了,消费者在执行 RPOP 时,会返回 NULL。

127.0.0.1:6379> RPOP mq
(nil) 

消费者读取数据时,有一个潜在的性能风险点:

生产者写入数据时,List 并不会主动通知消费者有新消息写入。
如果消费者想要及时处理消息,需要在程序中不停地调用 RPOP 命令。
如果有新消息写入,RPOP 命令就会返回结果,否则,RPOP 命令返回空值,再继续循环。

// 伪代码
while (true)
{var msg = redis.rpop("mq")if(msg == null)continue;handle(msg)
}

上述代码中如果队列为空,消费者依旧会频繁拉取消息,这会造成「CPU 空转」,不仅浪费 CPU 资源,还会对 Redis 造成压力。

我们处理一下,当队列为空时,我们可以「休眠」一会,再去尝试拉取消息。

// 伪代码
while (true)
{var msg = redis.rpop("mq")if(msg == null){Thread.Sleep(2000);continue;}handle(msg)
}

「CPU 空转」解决了,但是有新的问题发生了:当消费者在休眠等待时有新消息,那么消费者处理新消息就会存在「延迟」。

那如何做,既能及时处理新消息,还能避免 CPU 空转呢?

1.1.2、支持阻塞等待拉取消息

为了解决这个问题,Redis 提供了 BRPOP 命令。BRPOP 命令也称为阻塞式读取,客户端在没有读到队列数据时,自动阻塞,直到有新的数据写入队列,再开始读取新数据。和消费者程序自己不停地调用 RPOP 命令相比,这种方式能节省 CPU 开销。(这里的 B 指的是阻塞(Block)。)

img

使用 BRPOP 这种阻塞式方式拉取消息时,还支持传入一个「超时时间」,如果设置为 0,则表示不设置超时,直到有新消息才返回,否则会在指定的超时时间后返回 NULL

// 伪代码
while (true)
{// 没消息阻塞等待,0表示不设置超时时间var msg = redis.brpop("mq",0)if(msg == null)continue;handle(msg)
}

注意:如果设置的超时时间太长,这个连接太久没有活跃过,可能会被 Redis Server 判定为无效连接,之后 Redis Server 会强制把这个客户端踢下线。所以,采用这种方案,客户端要有重连机制。

1.1.3、发布/订阅模式

不支持。

1.1.4、重新消费

不支持。

但是在业务使用唯一ID等方式实现,消费ID后做判断是否处理过,使对于同一条消息处理结果都是一致的,保证幂等性。

1.1.5、消息不丢失

仅消费端不丢失。

List 类型提供了 BRPOPLPUSH 命令,这个命令的作用是让消费者程序从一个 List 中读取消息,同时,Redis 会把这个消息再插入到另一个 List(可以叫作备份 List)留存。

如果消费者程序读了消息但没能正常处理,等它重启后,就可以从备份 List 中重新读取消息并进行处理了。

1.1.6、消息堆积

不可堆积。

如果消费较慢,List 中的消息越积越多,redis内存压力会越来越大。
而且List本身也不支持消费组,不能使用多个消费端消费。

1.1.7、小结

需求LIST
数据保证顺序支持。使用LPUSH/RPOP
支持阻塞等待拉取消息支持。使用BRPOP
支持发布 / 订阅模式不支持
重复消费不支持。但是可以自行实现全局唯一ID
消息不丢失不完全。消费端算是不丢失,BRPOPLPUSH
消息堆积不支持。内存持续增长

简单的业务场景,可以使用list。
但如果想要有多个生产者和消费者,那么可以继续往下看。

1.2、基于 Pub/Sub 的消息队列解决方案

Redis 专门是针对「发布/订阅」( PUBLISH / SUBSCRIBE) 这种队列模型设计的。

可以解决重复消费问题,可以多组生产者、消费者场景。

img

使用 Pub/Sub 这种方案,既支持阻塞式拉取消息,还很好地满足了多组消费者,消费同一批数据的业务需求。

除此之外,Pub/Sub 还提供了「匹配订阅」模式,允许消费者根据一定规则,订阅「多个」自己希望的队列。

img

可以看到,Pub/Sub 最大的优势就是,支持多组生产者、消费者处理消息。

缺点就是:丢数据

Pub/Sub 没有基于任何数据类型,也没有做任何的数据存储(不会写入到 RDB 和 AOF 中),单纯的建立转发通道,把符合规则的数据转发到另外一端,一切都是实时转发的。

如果消费者异常,那么再次上线只能接受新的消息,在此期间生产者找不到消费者就会丢弃数据。
使用 Pub/Sub 时,注意:消费者必须先订阅队列,生产者才能发布消息,否则消息会丢失。

消息积压时消息也可能会消息丢失或者消费失败,Pub/Sub的实现上就是在server的内存上给订阅的消费者分配了一个buffer。

生产者发布消息不断写入buffer中,当消息积压时,buffer占用内存会持续增长,如果突破了buffer配置的上线,那么消费者就会被踢下线,导致消费失败,数据丢失。

缓冲区的默认配置:client-output-buffer-limit pubsub 32mb 8mb 60。
32mb:缓冲区一旦超过 32MB,Redis 直接强制把消费者踢下线.
8mb + 60:缓冲区超过 8MB,并且持续 60 秒,Redis 也会把消费者踢下线

List 拉数据,Pub/Sub推数据。

Pub/Sub 的优缺点:
1、支持发布 / 订阅,支持多组生产者、消费者处理消息
2、消费者下线,数据会丢失
3、不支持数据持久化,Redis 宕机,数据也会丢失
4、消息堆积,缓冲区溢出,消费者会被强制踢下线,数据也会丢失

哨兵集群和 Redis 实例通信时,采用了 Pub/Sub 的方案,因为哨兵正好符合即时通讯的业务场景。

很明显Pub/Sub不是我们想要的消息队列,继续往下看

1.3、基于 Streams 的消息队列解决方案

Streams 是 Redis 专门为消息队列设计的数据类型,它提供了丰富的消息队列操作命令。

XADD:插入消息,保证有序,可以自动生成全局唯一ID
XREAD:用于读取消息,可以按ID读取数据
XREADGROUP:按消费组形式读取消息
XPENDING:可以用来查询每个消费组内所有消费者已读取但尚未确认的消息
XACK:用于向消息队列确认消息处理已完成

生产者推消息:

// *表示让Redis自动生成消息ID
127.0.0.1:6379> XADD queue * name zhangsan
"1618469123380-0"
127.0.0.1:6379> XADD queue * name lisi
"1618469127777-0"

消费者拉消息:
XADD「*」表示让 Redis 自动生成唯一的消息 ID
消息 ID 的格式是「时间戳-自增序号」(自增序号从0开始编号)

// 从开头读取5条消息,0-0表示从开头读取
127.0.0.1:6379> XREAD COUNT 5 STREAMS queue 0-0
1) 1) "queue"2) 1) 1) "1618469123380-0"2) 1) "name"2) "zhangsan"2) 1) "1618469127777-0"2) 1) "name"2) "lisi"

如果想继续拉取消息,需要传入上一条消息的 ID:

127.0.0.1:6379> XREAD COUNT 5 STREAMS queue 1618469127777-0
(nil)

img

这就是Stream 最简单的生产、消费。

1.3.1、数据保证顺序

支持。
XADD插入消息,保证有序

1.3.2、支持阻塞等待拉取消息

支持。
在读取消息时,只需要增加 BLOCK 参数即可。

// BLOCK 0 表示阻塞等待,不设置超时时间
127.0.0.1:6379> XREAD COUNT 5 BLOCK 0 STREAMS queue 1618469127777-0

这时,消费者就会阻塞等待,直到生产者发布新的消息才会返回。

1.3.3、发布/订阅模式

支持。
Stream 通过以下命令完成发布订阅:
XGROUP:创建消费者组
XREADGROUP:在指定消费组下,开启消费者拉取消息

127.0.0.1:6379> XADD queue * name zhangsan
"1618470740565-0"
127.0.0.1:6379> XADD queue * name lisi
"1618470743793-0"
// 创建消费者组1,0-0表示从头拉取消息
127.0.0.1:6379> XGROUP CREATE queue group1 0-0
OK
// 创建消费者组2,0-0表示从头拉取消息
127.0.0.1:6379> XGROUP CREATE queue group2 0-0
OK

第一个消费组开始消费:

// group1的consumer开始消费,>表示拉取最新数据
127.0.0.1:6379> XREADGROUP GROUP group1 consumer COUNT 5 STREAMS queue >
1) 1) "queue"2) 1) 1) "1618470740565-0"2) 1) "name"2) "zhangsan"2) 1) "1618470743793-0"2) 1) "name"2) "lisi"

同样地,第二个消费组开始消费:

// group2的consumer开始消费,>表示拉取最新数据
127.0.0.1:6379> XREADGROUP GROUP group2 consumer COUNT 5 STREAMS queue >
1) 1) "queue"2) 1) 1) "1618470740565-0"2) 1) "name"2) "zhangsan"2) 1) "1618470743793-0"2) 1) "name"2) "lisi"

我们可以看到,这 2 组消费者,都可以获取同一批数据进行处理了。

通过创建消费组的形式达到订阅的目的。

img

1.3.4、重新消费

支持。

上面拉取消息时用到了消息 ID,这里为了保证重新消费,也要用到这个消息 ID。
当一组消费者处理完消息后,需要执行 XACK 命令告知 Redis,这时 Redis 就会把这条消息标记为「处理完成」。

// group1下的 1618472043089-0 消息已处理完成
127.0.0.1:6379> XACK queue group1 1618472043089-0

img

如果消费者异常宕机,肯定不会发送 XACK,那么 Redis 就会依旧保留这条消息。

待这组消费者重新上线后,Redis 就会把之前没有处理成功的数据,重新发给这个消费者。这样一来,即使消费者异常,也不会丢失数据了。

// 消费者重新上线,0-0表示重新拉取未ACK的消息
127.0.0.1:6379> XREADGROUP GROUP group1 consumer1 COUNT 5 STREAMS queue 0-0
// 之前没消费成功的数据,依旧可以重新消费
1) 1) "queue"2) 1) 1) "1618472043089-0"2) 1) "name"2) "zhangsan"2) 1) "1618472045158-0"2) 1) "name"2) "lisi"

1.3.5、消息不丢失

Stream 是新增加的数据类型,它与其它数据类型一样,每个写操作,也都会写入到 RDB 和 AOF 中。

我们只需要配置好持久化策略,这样的话,就算 Redis 宕机重启,Stream 中的数据也可以从 RDB 或 AOF 中恢复回来。

1.3.6、消息堆积

支持,但有长度限制。

当消息队列发生消息堆积时,一般只有 2 个解决方案:
1、生产者限流:避免消费者处理不及时,导致持续积压
2、丢弃消息:中间件丢弃旧消息,只保留固定长度的新消息

Redis 在实现 Stream 时,采用了第 2 个方案。

在发布消息时,你可以指定队列的最大长度,防止队列积压导致内存爆炸。

// 队列长度最大10000
127.0.0.1:6379> XADD queue MAXLEN 10000 * name zhangsan
"1618473015018-0"

当队列长度超过上限后,旧消息会被删除,只保留固定长度的新消息。
这么来看,Stream 在消息积压时,如果指定了最大长度,还是有可能丢失消息的。

除了以上介绍到的命令,Stream 还支持查看消息长度(XLEN)、查看消费者状态(XINFO)等命令

1.3.7、小结

需求Stream
数据保证顺序支持
支持阻塞等待拉取消息支持
支持发布 / 订阅模式支持
重复消费支持
消息不丢失支持
消息堆积支持

既然它的功能这么强大,这是不是意味着,Redis 真的可以作为专业的消息队列中间件来使用呢?

2、与专业的消息队列对比

一个专业的消息队列,必须要做到两大块:
1、消息不丢
2、消息可堆积

消息队列,其实就分为三大块:生产者、队列中间件、消费者。

img

2.1、如何保证不丢消息?

2.1.1、生产者会不会丢失数据?

生产者丢失:
1、消息没法出去,网络原因或者其他原因,中间件返回失败
2、不确定是否发送成功:网络原因等导致发布超时,数据可能已经发送成功,但读取响
应超时

第一种情况,重发即可。
第二种情况,因为不知道是否成功,为了避免丢失,就只能也重试发送到成功为止。

生产者一般设定重试次数,超过上限次数需记录日志,发送警报。

是的,为了不丢失,可以接受重复发送,在消费端就需要做一些逻辑判断了,业务可能需要保证幂等性。

所以,redis或者其他中间件队列,都可以在生产者上保证不丢失数据。

2.1.2、消费者会不会丢失数据?

消费者拿到消息后,还没处理完成,就异常宕机了,那消费者还能否重新消费失败的消息?
要解决这个问题,消费者在处理完消息后,必须「告知」队列中间件,队列中间件才会把标记已处理,否则仍旧把这些数据发给消费者。
这种方案需要消费者和中间件互相配合,才能保证消费者这一侧的消息不丢。
无论是 Redis 的 Stream,还是专业的队列中间件,例如 RabbitMQ、Kafka,其实都是这么做的。

所以,从这个角度来看,Redis 也是合格的。

2.1.3、队列中间件会不会丢失数据?

上面的问题只要客户端和服务端配合好,就能保证生产端、消费端都不丢消息。

但是,如果队列中间件本身就不可靠呢?

在这个方面,Redis 其实没有达到要求。

Redis 在以下 2 个场景下,都会导致数据丢失。

1、AOF 持久化配置为每秒写盘,但这个写盘过程是异步的,Redis 宕机时会存在数据丢失的可能

2、主从复制也是异步的,主从切换时,也存在丢失数据的可能(从库还未同步完成主库发来的数据,就被提成主库)

基于以上原因我们可以看到,Redis 本身的无法保证严格的数据完整性

RabbitMQ 或 Kafka 这类专业的队列中间件,在使用时,一般是部署一个集群,生产者在发布消息时,队列中间件通常会写「多个节点」,以此保证消息的完整性。这样一来,即便其中一个节点挂了,也能保证集群的数据不丢失。

Redis 的定位则不同,它的定位更多是当作缓存来用,它们两者在这个方面肯定是存在差异的。

2.1.4、消息积压怎么办?

Redis 的数据都存储在内存中,这就意味着一旦发生消息积压,则会导致 Redis 的内存持续增长,如果超过机器内存上限,就会面临被 OOM 的风险。
Redis 的 Stream 提供了可以指定队列最大长度的功能,就是为了避免这种情况发生。

但 Kafka、RabbitMQ 这类消息队列就不一样了,它们的数据都会存储在磁盘上,磁盘的成本要比内存小得多,当消息积压时,无非就是多占用一些磁盘空间,相比于内存,在面对积压时也会更加「坦然」。

把 Redis 当作队列来使用时,始终面临的 2 个问题:
1、Redis 本身可能会丢数据,
2、面对消息积压 Redis 内存资源紧张.

如果你的业务场景足够简单,对于数据丢失不敏感,而且消息积压概率比较小的情况下,把 Redis 当作队列是完全可以的。

而且,Redis 相比于 Kafka、RabbitMQ,部署和运维也更加轻量。

如果你的业务场景对于数据丢失非常敏感,而且写入量非常大,消息积压时会占用很多的机器资源,那么我建议你使用专业的消息队列中间件。

img

3、额外补充

3.1、延迟队列

应用场景:
1、订单超时未支付,关闭订单退还库存
2、订单完成5天后没有评论自动好评
3、用户并发量大,延后发送邮件短信
4、…

3.1.1实现方式

  1. ZSET + 定时轮询

    1. zset支持高性能的 score 排序,且去重
    2. 内存上进行操作的,速度非常快
    3. 注意多进程争抢,使用lua将zrangebyscore和zrem进行原子化
  2. 监听key(不建议)

    1. WATCH 可以鉴定单个或者多个key的变化情况
    2. 数量较大时,监听会滞后(过期事件是在Redis服务器删除密钥时产生的,而不是在理论上存活时间达到零时产生的)

参考、复制、学习、引用与:

redis官网
请勿过度依赖 Redis 的过期监听
把Redis当作队列来用,真的合适吗?
消息队列的考验:Redis有哪些解决方案?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/69242.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CSS3中的var()函数

目录 定义: 语法: 用法: 定义: var()函数是一个 CSS 函数用于插入自定义属性(有时也被称为“CSS 变量”)的值 语法: var(custom-property-name, value) 函数的第一个参数是要替换的自定义属性…

量化交易接口的开启条件--什么是a股自动交易接口?

a股自动交易接口是指可以通过程序自动进行A股买卖操作的接口。一般情况下,个人投资者可以通过证券公司提供的交易API接口实现自动交易。 通常情况下,a股自动交易接口的开发途径主要有以下几种: 1. 使用第三方交易接口:许多证券经…

gulimall-缓存-缓存使用

文章目录 前言一、本地缓存与分布式缓存1.1 使用缓存1.2 本地缓存1.3 本地模式在分布式下的问题1.4 分布式缓存 二、整合redis测试2.1 引入依赖2.2 配置信息2.3 测试 三、改造三级分类业务3.1 代码改造 四、高并发下缓存失效问题4.1 缓存穿透4.2 缓存雪崩4.3 缓存击穿 五、分布…

jenkins自动化构建保姆级教程(持续更新中)

1.安装 1.1版本说明 访问jenkins官网 https://www.jenkins.io/,进入到首页 点击【Download】按钮进入到jenkins下载界面 左侧显示的是最新的长期支持版本,右侧显示的是最新的可测试版本(可能不稳定),建议使用最新的…

虚拟机的创建与使用

一、虚拟机的下载 链接:百度网盘下载链接 提取码:a9p4 二、新建虚拟机系统 需要有版本序列号 注意: 选择 第一个是纯dos 的窗口指令 桌面没有任何东西 选择第二个就是正常的操作系统.有文件夹 我的电脑之类的 三、从主机中复制文件到虚拟机中需要安装 …

Java-Sec-Code靶场

文章目录 前言1.靶场搭建靶场地址、环境Window环境修改点 靶场通关和源码分析命令注入RCE反序列化fastjson反序列化目录穿越文件上传Spel表达式sql注入poi-ooxml组件XXE 总结 前言 一直都是一个Java盲,但是如今Java却占据了开发的半壁江山,平时遇见的多…

贴吧照片和酷狗音乐简单爬取

爬取的基本步骤 很简单,主要是两大步 向url发起请求 这里注意找准对应资源的url,如果对应资源不让程序代码访问,这里可以伪装成浏览器发起请求。 解析上一步返回的源代码,从中提取想要的资源 这里解析看具体情况,一…

每天一道leetcode:797. 所有可能的路径(图论中等深度优先遍历)

今日份题目: 给你一个有 n 个节点的 有向无环图(DAG),请你找出所有从节点 0 到节点 n-1 的路径并输出(不要求按特定顺序) graph[i] 是一个从节点 i 可以访问的所有节点的列表(即从节点 i 到节…

力扣 139. 单词拆分

题目来源:https://leetcode.cn/problems/word-break/description/ C题解:将该题视为完全背包问题,因为每个单词都可以多次用。动规五部曲分析如下: 确定dp数组以及下标的含义。dp[i] : 字符串长度为i的话,dp[i]为true…

206、仿真-51单片机锂电池蓄电池电压电流加按键控制开关状态Proteus仿真设计(程序+Proteus仿真+配套资料等)

毕设帮助、开题指导、技术解答(有偿)见文未 目录 一、硬件设计 二、设计功能 三、Proteus仿真图 四、程序源码 资料包括: 需要完整的资料可以点击下面的名片加下我,找我要资源压缩包的百度网盘下载地址及提取码。 方案选择 单片机的选择 方案一&a…

最新AI系统ChatGPT网站程序源码+搭建教程/公众号/H5端/安装配置教程/完整知识库

1、前言 SparkAi系统是基于国外很火的ChatGPT进行开发的Ai智能问答系统。本期针对源码系统整体测试下来非常完美,可以说SparkAi是目前国内一款的ChatGPT对接OpenAI软件系统。 那么如何搭建部署AI创作ChatGPT?小编这里写一个详细图文教程吧!…

【数据结构与算法】十大经典排序算法-选择排序

🌟个人博客:www.hellocode.top 🏰Java知识导航:Java-Navigate 🔥CSDN:HelloCode. 🌞知乎:HelloCode 🌴掘金:HelloCode ⚡如有问题,欢迎指正&#…