目录
引言
一、主从复制
1.1 概念
1.2 作用
1.3 流程
1.4 环境搭建
二、哨兵模式
2.1 概念
2.2 原理
2.3 作用
2.4 故障转移机制
2.5 主节点的选举
2.6 环境搭建
2.6.1 修改Redis 哨兵模式的配置文件(所有节点操作)
2.6.2 启动哨兵模式
2.6.3查看哨兵信息
2.6.3 故障模拟
总结
引言
随着Redis在互联网应用中的广泛应用,对于数据服务的可用性要求越来越高。单点故障会导致系统的不可用,因此需要引入主从复制来提高Redis的可用性。主从复制使得即使主节点发生故障,系统仍能继续提供服务,从而降低了系统的停机时间。
在大规模的Redis集群中,手动管理节点的健康状态和故障恢复是一项繁重且容易出错的任务。引入哨兵模式可以自动化地监控节点的健康状态,并在主节点发生故障时自动进行故障转移,从而减少了运维的工作量和人为错误的可能性。
一、主从复制
1.1 概念
主从复制,是指将一台Redis服务器的数据,复制到其他的Redis服务器。前者称为主节点(Master),后者称为从节点(Slave);数据的复制是单向的,只能由主节点到从节点。
默认情况下,每台Redis服务器都是主节点;且一个主节点可以有多个从节点(或没有从节点),但一个从节点只能有一个主节点。
1.2 作用
数据冗余:主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
故障恢复:当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复;实际上是一种服务的冗余。
负载均衡:在主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读服务(即写Redis数据时应用连接主节点,读Redis数据时应用连接从节点),分担服务器负载;尤其是在写少读多的场景下,通过多个从节点分担读负载,可以大大提高Redis服务器的并发量。
高可用基石:除了上述作用以外,主从复制还是哨兵和集群能够实施的基础,因此说主从复制是Redis高可用的基础。
1.3 流程
(1)若启动一个Slave机器进程,则它会向Master机器发送一个“sync command”命令,请求同步连接。
(2)无论是第一次连接还是重新连接,Master机器都会启动一个后台进程,将数据快照保存到数据文件中(执行rdb操作),同时Master还会记录修改数据的所有命令并缓存在数据文件中。
(3)后台进程完成缓存操作之后,Master机器就会向Slave机器发送数据文件,Slave端机器将数据文件保存到硬盘上,然后将其加载到内存中,接着Master机器就会将修改数据的所有操作一并发送给Slave端机器。若Slave出现故障导致宕机,则恢复正常后会自动重新连接。
(4)Master机器收到Slave端机器的连接后,将其完整的数据文件发送给Slave端机器,如果Mater同时收到多个Slave发来的同步请求,则Master会在后台启动一个进程以保存数据文件,然后将其发送给所有的Slave端机器,确保所有的Slave端机器都正常。
1.4 环境搭建
(主)打开配置文件:vim /etc/redis/6379.conf
70行 IP地址改为0.0.0.0,让所有的主机都可以使用
137行 daemonize yes打开
700行 appendonly no打开变成yes
重启配置文件:/etc/init.d/redis_6379 restart
(从)打开配置文件:vim /etc/redis/6379.conf
70行 IP地址改为0.0.0.0,让所有的主机都可以使用
137行 daemonize yes打开
288行添加一行replicaof 192.168.233.11 6379
700行 appendonly no打开变成yes
二、哨兵模式
2.1 概念
当服务器宕机后,需要手动一台从机切换为主机,这需要人工干预,不仅费时费力而且还会造成一段时间内服务不可用。为了解决主从复制的缺点,就有了哨兵机制。
2.2 原理
哨兵是特殊的redis服务,不提供读写服务,主要用来监控redis实例节点。 哨兵架构下client端第一次从哨兵找出redis的主节点,后续就直接访问redis的主节点,不会每次都通过 sentinel代理访问redis的主节点,当出现故障时通过投票机制选择新的 Master并将所有slave连接到新的 Master。所以整个运行哨兵的集群的数量不得少于3个节点,并且将新的master信息通知给client端。
这里面redis的client端一般都实现了订阅功能,订阅sentinel发布的节点变动消息。Redis服务是通过配置文件启动的,比如上面的从节点设置了只读模式,它被选举成了master之后就是可读写的了。
2.3 作用
- 监控:哨兵会不断地检查主节点和从节点是否运作正常。
- 自动故障转移:当主节点不能正常工作时,哨兵会开始自动故障转移操作,它会将失效主节点的其中一个从节点升级为新的主节点,并让其它从节点改为复制新的主节点。
- 通知(提醒):哨兵可以将故障转移的结果发送给客户端。
2.4 故障转移机制
1、由哨兵节点定期监控发现主节点是否出现了故障
每个哨兵节点每隔1秒会向主节点、从节点及其它哨兵节点发送一次ping命令做一次心跳检测。如果主节点在一定时间范围内不回复或者是回复一个错误消息,那么这个哨兵就会认为这个主节点主观下线了(单方面的)。当超过半数哨兵节点认为该主节点主观下线了,这样就客观下线了。
2、当主节点出现故障,此时哨兵节点会通过Raft算法(选举算法)实现选举机制共同选举出一个哨兵节点为leader,来负责处理主节点的故障转移和通知。所以整个运行哨兵的集群的数量不得少于3个节点。
3、由leader哨兵节点执行故障转移,过程如下:
●将某一个从节点升级为新的主节点,让其它从节点指向新的主节点;
●若原主节点恢复也变成从节点,并指向新的主节点;
●通知客户端主节点已经更换。
2.5 主节点的选举
1、过滤掉不健康的(已下线的),没有回复哨兵 ping 响应的从节点。
2、选择配置文件中从节点优先级配置最高的。(replica-priority,默认值为100)
3、选择复制偏移量最大,也就是复制最完整的从节点。
哨兵的启动依赖于主从模式,所以须把主从模式安装好的情况下再去做哨兵模式。
2.6 环境搭建
2.6.1 修改Redis 哨兵模式的配置文件(所有节点操作)
#所有节点配置一样,如下所示
vim /opt/redis-5.0.7/sentinel.conf
17 protected-mode no #关闭保护模式
21 port 26379 #Redis哨兵默认的监听端口
26 daemonize yes #指定sentinel为后台启动
36 logfile "/var/log/sentinel.log" #指定日志存放路径
65 dir "/var/lib/redis/6379" #指定数据库存放路径
84 sentinel monitor mymaster 192.168.48.11 6379 2 #指定该哨兵节点监控192.168.48.11:6379这个主节点,该主节点的名称是mymaster,最后的2的含义与主节点的故障判定有关:至少需要2个哨兵节点同意,才能判定主节点故障并进行故障转移
113 sentinel down-after-milliseconds mymaster 30000 #判定服务器down掉的时间周期,默认30000毫秒(30秒)
146 sentinel failover-timeout mymaster 180000 #146行,故障节点的最大超时时间为180000 (180秒 )
#保存配置文件
#先启动master,再启动slave
cd /opt/redis-5.0.7/
redis-sentinel sentinel.conf &
130:
131:
2.6.2 启动哨兵模式
#注意:先启master,再启slave
cd /opt/redis-5.0.7/
redis-sentinel sentinel.conf &
切记需先开启master后slave
2.6.3查看哨兵信息
redis-cli -p 26379 info sentinel
2.6.3 故障模拟
1、查看并杀死master节点的redis-server
2、再次查看哨兵信息
master主机自动跳到131节点上,成为新的leader。
总结
1、redis主从复制是为了数据冗余和读写分离
在这两种模式中,有两种角色主节点(master)和从节点(slave),主节点负责处理写的操作,并将数据更改复制到一个或多个从节点。
这样我们的主节点负载减轻,从节点可以提供数据读取服务,实现读写分离,如果主节点停止服务,从节点之一可以立即接管主节点的角色,再继续提供服务。
2、redis 哨兵模式是一个用于管理多个reids服务的系统,它提供监控、通知、自动故障转移、配置提供服务的功能,以实现redis高可用性。
哨兵模式的四个功能:
- 监控:redis哨兵会持续监控master和slave实例是否正常运行
- 通知:如某个redis实例有问题,哨兵可以通过API向管理员或者其他应用发信通知
- 自动故障转移:如果master节点不工作,哨兵会开始故障转移的过程,选择一个slave节点晋升为新的master,其他剩余slave的节点会被重新配置为新的master节点的slave
- 配置提供服务:客户端可以使用哨兵来查询被认证的master节点该master节点的目录所有的slave节点