初识 Redis 浅谈分布式

目 录

  • 一.认识 Redis
  • 二.浅谈分布式
    • 单机架构
    • 分布式是什么
    • 数据库分离和负载均衡
    • 理解负载均衡
    • 数据库读写分离
    • 引入缓存
    • 数据库分库分表
    • 引入微服务
  • 三.概念补充
  • 四.分布式小结

一.认识 Redis

在 Redis 官网我们可以看到介绍
在这里插入图片描述

翻译过来就是:数以百万计的开发人员用作缓存、矢量数据库、文档数据库、流引擎和消息代理的内存数据存储。

  1. 存储数据:在内存中存储。那我们可以想到 定义变量也是在内存中存储数据的,但是 Redis 是在分布式系统中才能发挥力量的,如果只是单机程序,直接通过变量存储数据的方式,是比使用 Redis 更优的选择。我们知道进程之间有隔离性,进程之间通过网络进行通信,Redis 就是基于网络,可以把自己内存中的变量给别的进程,甚至别的主机的进程进行使用。
  2. 数据库:一谈及数据库我们可以想到 MySQL,MySQL 最大的问题在于,访问速度比较慢,很多互联网产品中,对于性能要求是很高。Redis 也可以作为数据库使用,访问速度快!!定性的角度,可以知道 Redis 快很多,但是很难定量衡量。Redis 和 MySQL 相比,最大的劣势,存储空间是有限的。虽然有不少的互联网产品,对于性能要求比较高的,但是也有很多互联网产品对于性能要求没那么高。那如何内存又大访问速度又快呢??典型的方案,可以把 Redis 和 MySQL 结合起来使用。"二八原则”,20%的热点数据,能满足 80% 的访问需求,于是把 20% 的数据存储到 Redis 中,80% 的数据存储到MySQL 中,但是系统的复杂程度大大提升了,而且,如果数据发生修改,还涉及到 Redis 和 MySQL 之间的数据同步问题。

二.浅谈分布式

单机架构

只有一台服务器,这个服务器负责所有的工作

在这里插入图片描述

应用程序中保存了我们个人编辑的代码写的那些 HTTP 服务器,数据库服务就是我们的数据库,例如 MySQL等,MySQL 是一个客户端服务器结构的程序!!本体是 MySQL 服务器(存储和组织数据的部分)。当我们用户发送一个请求之后,经过应用服务发送HTTP 请求,HTTP 请求转成增删改查等动作转发给数据库,数据库再进行操作。

单机程序中,能不能把数据库服务器也去掉,光一个应用服务器又负责业务,又负责数据存储?(也不是不可以,但是就是会比较麻烦)

千万不要瞧不上这个东西,绝大部分的公司的产品都是这种单机架构!!现在计算机硬件,发展速度非常之快,哪怕只有一台主机,这一台主机的性能也是很高的,可以支持非常高的并发&非常大的数据存储

如果业务进一步增长,用户量和数据量都水涨船高,一台主机难以应付的时候,就需要引入更多的主机引入更多的硬件资源


分布式是什么

一台主机的硬件资源是有上限的

包括不限于以下几种

  1. CPU
  2. 内存
  3. 硬盘
  4. 网络

服务器每次收到一个请求,都是需要消耗上述的一些资源的

如果同一时刻,处理的请求多了,此时就可能会导致某个硬件资源,不够用了!!无论是哪个方面不够用了,都可能会导致服务器处理请求的时间变长甚至于处理出错

如果我们真的遇到了这样的服务器不够用的场景,怎么处理呢?

  1. 开源:简单粗暴,增加更多的硬件资源

  2. 节流:软件上优化(各凭本事了,需要通过性能测试,找到是哪个环节出现了瓶颈,再去对症下药)

一个主机上面能增加的硬件资源也是有限的,取决于主板的扩展能力。一台主机扩展到极限了,但是还不够就只能引入多台主机了。不是说新的机器买来就直接可以解决问题了,也需要软件上做出对应的调整和适配,一旦引入多台主机了,咱们的系统就可以称为是 “分布式系统”。引入分布式,这是万不得已,系统的复杂程度会大大提高,出现bug的概率也越高。


数据库分离和负载均衡

在这里插入图片描述

  1. 应用服务器,里面可能会包含很多的业务逻辑,可能会吃 CPU 和内存.

  2. 数据库服务器,需要更大的硬盘空间,更快的数据访问速度,可以配置更大硬盘的服务器,甚至还可以上 SSD(固态) 硬盘

1.机械硬盘,便宜,慢;2.固态硬盘,贵,快

通过上面的操作就达到更高的性价比了

应用服务器可能会比较吃 CPU 和内存,如果把 CPU 或者内存吃没了,此时应用服务器就顶不住了

引入更多的应用服务器,就可以有效解决上述问题

在这里插入图片描述

看起来是两个应用服务器,实际上可能是多个。

用户的请求,先到达 负载均衡器/网关服务器(单独的服务器)

假设有 1w 个用户请求,有 2 个应用服务器:此时按照负载均衡的方式,就可以让每个应用服务器承担 5k 的访问量

负载均衡:就像公司的一个组的领导一样,要负责管理,要负责把任务分配给每个组员(对于负载均衡器来说,有很多的负载均衡具体的算法)


理解负载均衡

负载均衡器,看起来不是承担了所有的请求嘛?这个东西能顶住嘛??

负载均衡器,对于请求量的承担能力,要远超过应用服务器的.

  • 负载均衡器,是领导,分配工作.
  • 应用服务器,是组员,执行任务.

是否可能会出现,请求量大到负载均衡器也扛不住了呢??也是有可能的!!

于是就可以引入更多的负载均衡器(引入多个机房)


数据库读写分离

如上面讨论,增加应用服务器,确实能够处理更高的请求量,但是随之存储服务器,要承担的请求量也就更多了!!

在这里插入图片描述

对数据库进行读写分离

在实际的应用场景中,读的频率是比写要高的

所以主服务器一般是一个,从服务器可以有多个(一主多从)

同时从数据库通过负载均衡的方式,让应用服务器进行访问


引入缓存

数据库天然有个问题,响应速度是更慢的

把数据区分"冷热",热点数据放到缓存中,缓存的访问速度往往比数据库要快很多了

在这里插入图片描述

缓存只是放一小部分热点数据.(会频繁被访问到的数据),根据二八原则:20% 的数据能够支持 80% 的访问量

此时我们右边存储服务器存储的仍然是完整的全量数据

缓存要想快就要付出代价 => 小 => Redis

此时,缓存服务器就帮助数据库服务器负重前行!!


数据库分库分表

引入分布式系统,不光要能够去应对更高的请求量(并发量),同时也要能应对更大的数据量

是否可能会出现,一台服务器已经存不下数据了呢??当然会存在

虽然一个服务器,存储的数据量可以达到几十个TB,即使如此也可能会存不下

一台主机存不下,就需要多台主机来存储

在这里插入图片描述

针对数据库进行进一步的拆分,分库分表

本来一个数据库服务器,这个数据库服务器上有多个数据库(指的是逻辑上的数据集合, create database 创建的那个东西)

现在就可以引入多个数据库服务器,每个数据库服务器存储一个或者一部分数据库

如果某个表特别大,大到一台主机存不下,也可以针对表进行拆分

具体分库分表如何实践?还是要结合实际的业务场景来展开


引入微服务

微服务架构:

在这里插入图片描述

之前应用服务器,一个服务器程序里面做了很多的业务,这就可能会导致这一个服务器的代码变的越来越复杂

为了更方便于代码的维护,就可以把这样的一个复杂的服务器,拆分成更多的,功能更单一,但是更小的服务器 —> 微服务

因此服务器的种类和数量就增加了

当应用服务器复杂了,势必就需要更多的人来维护了,当人多了,就需要配套的管理,把这些人组织好,划分组织结构,分成多个组,每个组分别配备领导进行管理

注意,微服务本质上是在解决 "人” 的问题

按照功能,拆分成多组微服务,就可以有利于上述人员的组织结构的分配了

引入微服务,解决了人的问题,付出的代价?

  1. 系统的性能下降:拆出来更多的服务,多个功能之间要更依赖网络通信,网络通信的速度很可能是比硬盘还慢的。(要想保证性能不下降太多,只能引入更多的机器,更多的硬件资源)(幸运的是,硬件技术的发展,网卡现在有万兆网卡,读写速度已经能过超过硬盘读写了)
  2. 系统复杂程度提高,可用性受到影响:服务器更多了,出现问题的概率就更大了。这就需要一系列的手段,来保证系统的可用性(更丰富的监控报警,以及配套的运维人员)

微服务的优势:

  1. 解决了人的问题.
  2. 使用微服务,可以更方便于功能的复用
  3. 可以给不同的服务进行不同的部署

三.概念补充

应用(Application)/ 系统(System)

一个应用,就是一个/组服务器程序

模块(Module)/ 组件(Component)

一个应用,里面有很多个功能,每个独立的功能,就可以称为是一个模块/组件

分布式(Distributed)

引入多个主机/服务器,协同配合完成一系列的工作.(物理上的多个主机)

集群(Cluster)

引入多个主机/服务器,协同配合完成一系列的工作.(逻辑上的多个主机)

主(Master)/ 从(Slave)

分布式系统中一种比较典型的结构,多个服务器节点,其中一个是主,另外的是从,从节点的数据要从主节点这里同步过来

中间件(Middleware)

和业务无关的服务(功能更通用的服务)

  1. 数据库
  2. 缓存
  3. 消息队列

可用性(Availability)

系统整体可用的时间 / 总的时间

响应时长(Response Time RT)

衡量服务器的性能,越小越好,和具体服务器要做的业务密切相关的

吞吐(Throughput)vs 并发(Concurrent)

衡量系统的处理请求的能力.衡量性能的一种方式


四.分布式小结

  1. 单机架构(应用程序+数据库服务器)
  2. 数据库和应用分离
    应用程序和数据库服务器分别放到不同主机上部署了.
  3. 引入负载均衡,应用服务器=>集群
    通过负载均衡器,把请求比较均匀的分发给集群中的每个应用服务器.(当集群中的某个主机挂了,其他的主机仍然可以承担服务提高了整个系统的可用性)
  4. 引入读写分离,数据库主从结构
    一个数据库节点作为主节点,其他N个数据库节点作为从节点,主节点负责写数据,从节点负责读数据,主节点需要把修改过的数据同步给从节点
  5. 引入缓存,冷热数据分离
    进一步的提升了服务器针对请求的处理能力(二八原则),Redis在一个分布式系统中,通常就扮演着缓存这样的角色,引入的问题:数据库和缓存的数据一致性问题
  6. 引入分库分表,数据库能够进一步扩展存储空间
  7. 引入微服务,从业务上进一步拆分应用服务器
    从业务功能的角度,把应用服务器,拆分成更多的功能更单一,更简单,更小的服务器

上述这样的几个演化的步骤,只是一个粗略的过程

实际上一个商业项目,真实的演化过程,都是和他的业务发展密切相关的,业务是更重要的,技术只是给业务提供支持的,所谓的分布式系统,就是想办法引入更多的硬件资源!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/564796.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

(ES6)前端八股文修炼Day2

1. let const var 的区别 var: var 是在 ES5 中引入的声明变量的关键字。 具有函数作用域,而不是块作用域,这意味着使用 var 声明的变量在函数内部是可见的。 变量可以被重复声明,而且变量的值可以在声明前使用,这可能…

29-5 webshell 流量分析 - 菜刀

环境准备:构建完善的安全渗透测试环境:推荐工具、资源和下载链接_渗透测试靶机下载-CSDN博客 一、上传木马到靶场然后使用菜刀连接抓取流量 1)上传木马到upload-labs靶场 自己创建一个php文件作为木马 <?php eval($_POST["pass"]);2)然后开启 Wireshark …

力扣-20 有效的括号详解 Java

目录 1.题目分析 2.基础知识储备 2.1 哈希表 2.2 栈的存取 3. 逻辑概要 4.源码 示例 1.题目分析 为了对比都是从内而外&#xff0c;一个个匹配&#xff0c;全部匹配成功即为有效字符 2.基础知识储备 2.1 哈希表 简单来说&#xff0c;keyvalue存储 &#xff0c;通过key…

我的世界Linux MCSM+Mohist服务端部署

前言 最近玩MC自己整合了一个新包&#xff0c;玩起来很舒服。但是有时会有朋友一起来玩&#xff0c;加上我自己玩的客服端上加了光影&#xff0c;对电脑负载有点大。所以想做个服务器&#xff0c;减小一下我电脑的负载。顺便写篇文章记录一下部署过程。 环境要求 服务器部署要…

政安晨:【深度学习实践】【使用 TensorFlow 和 Keras 为结构化数据构建和训练神经网络】(五)—— Dropout和批归一化

政安晨的个人主页&#xff1a;政安晨 欢迎 &#x1f44d;点赞✍评论⭐收藏 收录专栏: TensorFlow与Keras实战演绎 希望政安晨的博客能够对您有所裨益&#xff0c;如有不足之处&#xff0c;欢迎在评论区提出指正&#xff01; Dropout和批归一化是深度学习领域中常用的正则化技术…

【CDA二级数据分析备考思维导图】

CDA二级数据分析备考思维导图 CDA二级复习备考资料共计七个章节&#xff0c;如需资料&#xff0c;请留言&#xff0c;概览如下图&#xff1a;一、数据采集与处理1.数据采集方法2.市场调研和数据录入3、数据探索与可视化4、数据预处理方法 总结&#xff1a;以上为自己学习数据分…

pytorch中tensor类型转换的几个函数

目录 IntTensor转FloatTensor FloatTensor转IntTensor Tensor类型变为python的常规类型 IntTensor转FloatTensor .float函数&#xff1a; FloatTensor转IntTensor .int函数 Tensor类型变为python的常规类型 item函数

STM32学习笔记(5_2)- EXTI外部中断代码

无人问津也好&#xff0c;技不如人也罢&#xff0c;都应静下心来&#xff0c;去做该做的事。 最近在学STM32&#xff0c;所以也开贴记录一下主要内容&#xff0c;省的过目即忘。视频教程为江科大&#xff08;改名江协科技&#xff09;&#xff0c;网站jiangxiekeji.com 本期介…

19.严丝合缝的文明——模板方法模式详解

“项目评审的节点又快到了&#xff0c;PPT你写了没&#xff1f;” “Oops&#xff0c;忘了&#xff0c;有模板没&#xff1f;给我一份” 概述 模板&#xff0c;一个频繁出现在办公室各类角色口中的词&#xff0c;它通常意味着统一、高效、经验和优质。各项汇报因为PPT的模板变…

鸿蒙网络开发学习:【ylong_http】

简介 ylong_http 构建了完整的 HTTP 能力&#xff0c;支持用户使用 HTTP 能力完成通信场景的需求。 ylong_http 使用 Rust 编写&#xff0c;为 OpenHarmony 的 Rust 能力构筑提供支持。 ylong_http 在 OpenHarmony 中的位置 ylong_http 向 OpenHarmony 系统服务层中的网络协…

初探Flink集群【持续更新】

周末下雨&#xff0c;倒杯茶&#xff0c;在家练习Flink相关。 开发工具&#xff1a;IntelliJ Idea 第一步、创建项目 打开Idea&#xff0c;新建Maven项目&#xff0c;包和项目命名 在pom.xml 文件中添加依赖 <properties><flink.version>1.13.0</flink.vers…

通过dbeaver链接dm8数据库

一、环境说明 windows 11 vmware 17 ubuntu 22 tt:~$ lsb_release -a No LSB modules are available. Distributor ID: Ubuntu Description: Ubuntu 22.04.3 LTS Release: 22.04 Codename: jammytt:~$ docker info Client:Version: 24.0.5Context: d…