一文读懂“负载均衡”

news/2024/7/7 10:16:15/文章来源:https://www.cnblogs.com/Dongmy/p/18278460

原文链接:https://blog.csdn.net/cyl101816/article/details/135195729

负载均衡无处不在,无论是分布式,还是中间件,还是微服务,都需要涉及到负载均衡。

一、什么是负载均衡
负载均衡是一种在计算机网络和系统架构中使用的技术,用于均衡分发工作负载到多个资源,比如:服务器、计算节点或存储设备上,以提高系统的性能、可伸缩性。

如下图所示:

在传统的单个服务器架构中,当请求量增加时,单个服务器可能无法处理所有的请求,导致性能下降或系统崩溃。

负载均衡技术通过将负载(请求)分发到多个服务器上,实现资源的合理利用,从而平衡服务器的负载。

这样可以提高系统的处理能力,增加并发处理能力,并减少单点故障的风险。

二、负载均衡作用
负载均衡的作用,主要包含如下几点:

1.提高系统性能
负载均衡技术将负载(请求或任务)分发到多个资源上,使得系统能够处理更多的并发请求,从而提高整体的处理能力和性能。

2.实现高可用性
负载均衡可以将负载分发到多个资源上,当其中一个资源发生故障或不可用时,负载均衡可以自动将请求转发到其他可用的资源。

这样可以降低单点故障的风险,提高系统的可靠性和容错性。

3.提高系统可伸缩性
随着业务的增长,负载均衡技术可以动态地增加或减少资源的数量,根据实际负载情况进行扩展或收缩。

通过自动分配负载到新增的资源上,系统可以实现水平扩展,满足不断增长的需求,提高系统的可伸缩性。

4.优化资源利用
负载均衡技术可以根据资源的性能、可用性和负载情况,合理地分配请求或任务。

这样可以最大限度地利用资源,避免资源的空闲或过载,提高资源的利用率和效率。

三、负载均衡的原理
系统的扩展可分为纵向(垂直)扩展和横向(水平)扩展。

比如:纵向扩展,是从单机的角度通过增加硬件处理能力,比如CPU处理能力,内存容量,磁盘等方面,实现服务器处理能力的提升。这种情况,不能满足大型分布式系统(网站),大流量,高并发,海量数据的问题。

因此需要采用横向扩展的方式,通过添加机器来满足大型网站服务的处理能力,比如:一台机器不能满足,则增加两台或者多台机器,共同承担访问压力。

如下图所示:

负载均衡器作为一个中间层,接收来自客户端的请求,并根据特定的算法和策略将请求分发给后端的多个资源(如服务器、计算节点或存储设备)。客户端可以直接将请求发送给负载均衡器,或通过域名解析、DNS等方式间接连接到负载均衡器。

四、负载均衡算法
负载均衡算法,主要分为如下5类: 

1.Round Robin-轮询
轮询,顾名思义,把请求按顺序分配给每个服务器,然后重复执行这个顺序,进行请求分配。

假设有3台服务器,分别为A,B,C,当客户端有请求过来时,请求会按照A——>B——>C——>A——>B——>C...这种轮训的顺序分配给各个服务器。

原理:

服务器列表:维护一个服务器列表,有服务器加入/剔除时,相应的更新服务器列表;
服务器游标:记录需要处理下一个请求的服务器;
请求分发:新的请求到达,选择当前服务器来处理该请求,然后服务器游标+1;
循环:不断重复步骤三,以确保每个服务器都有机会处理请求;
2.Weighted Round Robin - 加权轮询
在轮询的基础上根据硬件配置不同,按权重分发到不同的服务器,适合场景:跟配置高、负载低的机器分配更高的权重,使其能处理更多的请求。

3.最少连接数
记录每个服务器正在处理的请求数,把新的请求分发到最少连接的服务器上,因为要维护内部状态不推荐。

原理
维护一个所有服务器和连接数的字典(Map);
当新的请求到达时,负载均衡器会检查服务器列表中当前连接数最少的服务器;
请求将被分配给具有最少连接数的服务器,处理请求后该服务器的连接数+1;
如果有多台服务器具有相同的最小连接数,算法可以使用其他标准来选择其中一台,如加权等

优缺点
优点:

动态负载均衡:它根据服务器的当前负载情况来做出决策,这使得它能够有效地分配请求给当前连接数最少的服务器,从而确保了服务器资源的最佳利用。
适应性强:这个算法适用于服务器性能不均匀的情况,因为它关注的是连接数,而不是服务器的硬件配置或性能评估。
避免过载:通过将新请求分配给连接数最少的服务器,”最小连接数”算法有助于防止某些服务器被过度加载,从而提高了系统的稳定性和性能。
自动恢复:如果某台服务器由于故障或重启而导致连接数清零,该算法会自动开始将新请求分配给该服务器,以实现自动恢复。
缺点:

连接数不一定代表负载:”最小连接数”算法假设连接数与服务器的负载成正比,但这并不总是准确。有时候,某台服务器的连接数可能很高,但仍然能够处理更多的请求,而另一台连接数较低的服务器可能已经达到了其性能极限。
不适用于长连接:如果服务器上有大量长期活跃的连接,例如WebSocket连接,该算法可能不太适用,因为长连接不同于短暂的HTTP请求,连接数的统计可能会产生误导。
无法解决服务器性能差异:虽然”最小连接数”算法可以平衡连接数,但它无法解决服务器硬件性能差异的问题。在这种情况下,可能需要其他负载均衡算法,如加权轮询,来更好地适应性能差异。

4.IP/URL Hash-IP/URL散列
IP/URL 散列算法是一种根据客户端 IP 地址或 URL 来分配请求的负载均衡算法,这样相同的IP或者URL就会负载到相同的服务器上。

原理
将客户端 IP 地址或 URL 散列到服务器列表中,
然后将请求分配给散列值对应的服务器。
优缺点
优点:

稳定性:IP/URL Hash 算法可以确保相同的客户端请求总是被分发到相同的服务器上。这可以提高应用程序的稳定性,因为客户端的会话数据在同一服务器上保持一致。
适用于会话保持:当应用程序需要在多次请求之间保持会话状态时,IP/URL Hash 算法非常有用。客户端在一次请求中选择的服务器会在后续请求中保持一致,确保会话数据不会丢失。
负载均衡:IP/URL Hash 算法可以将特定的客户端请求均匀地分配到多个服务器上,从而实现基本的负载均衡,避免了某些服务器被过度请求。
缺点:

不适用于动态环境:IP/URL Hash 算法基于客户端的 IP 地址或 URL,一旦客户端 IP 或请求的 URL 发生变化,请求可能会被分配到不同的服务器上,导致会话数据丢失或不一致。
不考虑服务器负载:IP/URL Hash 算法不考虑服务器的当前负载情况。如果某个服务器的负载过高,IP/URL Hash 无法动态地将请求分发到负载较低的服务器上。
适用场景
静态环境:在静态环境中,即客户端的 IP 地址或请求的 URL 不经常变化的情况下,IP/URL Hash 算法可以提供稳定的负载均衡。

少数服务器的负载均衡:当服务器数量相对较少且不太容易动态扩展时,IP/URL Hash 算法可以用于基本的负载均衡。

5.Least Response Time - 最短响应时间
最短响应时间就是指:处理请求的响应时间最少的服务器,获取的请求就越多。直白讲就是速度快,就干的多。

适用场景
负载均衡的所有服务器,处理能力相差比较大。比如:有3台服务器,服务器A(4C8G,4个CPU,8G内存),服务器B(2C4G,2个CPU,4G内存),服务器C(1C2G,1个CPU,2G内存), 那么就可以采用这种算法,这样可以根据服务器的处理来实现动态负载。

交通控制系统:在城市交通控制系统中,需要及时响应交通信号、路况和车辆检测等信息。最短响应时间算法可以帮助确保交通信号及时适应交通流量的变化。

优缺点
优点:可以充分发挥各个服务器的性能,提高服务器的利用率。

缺点:饥饿问题。比如,服务器A的性能最好,处理速度最快,那么所有的请求都会被分配到服务器A,这样服务器B和服务器C就会一直处于饥饿状态,无法处理请求。这样也就会产生不公平。

五、负载均衡的分类

负载均衡主要分为:二层、三层、四层、以及七层负载均衡。

1.二层负载均衡(mac)
根据OSI模型分的二层负载,一般是用虚拟mac地址方式,外部对虚拟MAC地址请求,负载均衡接收后分配后端实际的MAC地址响应)。

2.三层负载均衡(ip)
一般采用虚拟IP地址方式,外部对虚拟的ip地址请求,负载均衡接收后分配后端实际的IP地址响应。

3.四层负载均衡(tcp)
四层负载均衡就是基于IP 端口的负载均衡,在三次负载均衡的基础上,用ip port接收请求,再转发到对应机器。

实现四层负载均衡的软件有:

F5:硬件负载均衡器,功能很好,但是成本很高。
lvs:重量级的四层负载软件
nginx:轻量级的四层负载软件,带缓存功能,正则表达式较灵活
haproxy:模拟四层转发,较灵活
4.七层负载均衡(http)
七层的负载均衡,就是基于虚拟的URL或主机IP的负载均衡,根据虚拟的url或IP,主机名接收请求,再转向相应的处理服务器。

实现七层负载均衡的软件有:

haproxy:天生负载均衡技能,全面支持七层代理,会话保持,标记,路径转移;
nginx:只在http协议和mail协议上功能比较好,性能与haproxy差不多;
apache:功能较差
Mysql proxy:功能尚可。
总的来说,一般是lvs做4层负载;nginx做7层负载。

六、负载均衡应用场景
负载均衡技术可以应用于多种场景,包括但不限于以下几个方面:

1.Web应用负载均衡
在Web应用中,负载均衡可以将请求分发到多个Web服务器上,以提高并发处理能力和吞吐量,适用于高访问量的网站、电子商务平台等场景。

2.数据库负载均衡
对于数据库集群,负载均衡可以将数据库请求分发到多个数据库节点上,实现数据的分布和负载的均衡,这有助于提高数据库的处理能力、可靠性和可伸缩性。

3.应用服务负载均衡
在分布式应用中,负载均衡可以将请求分发给多个应用服务器实例,以平衡工作负载和提高系统的性能,这适用于微服务架构、分布式计算、消息队列等场景。

4.高性能计算负载均衡
在科学计算、大数据处理和高性能计算领域,负载均衡技术可以将计算任务分发到多个计算节点上,实现任务的并行处理和加速,它适用于集群计算、分布式存储、数据分析等场景。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/735868.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ros mocroros 使用双核运行microros

在硬件篇开始的第一节时,曾提到,我们所使用的开发板单片机是双核240M主频的,但是在后面的开发中我们并没有真正的使用了双核,主频也是使用的默认160MHZ。所以本节带你一起带你一起提升主频并启动双核进行MicoROS的双核。 一、双核与RTOS介绍 所谓双核指的是ESP32单片机有两…

SpringMVC的数据获取问题

在传统的javaweb中我们获取数据是通过HttpServletRequest中的getParameter或者getHeader等方法来获取相关的信息。由此我们引出了以下问题:在SpringMVC中应该如何获取请求提交的数据呢? 在SpringMVC中又应该如何获取请求头信息呢? 在SpringMVC中又应该如何获取客户端提交的C…

mysql用户

一、数据库用户管理 DCL:数据控制语言,用于设置或者更改数据库用户或角色权限 1.新建用户create user 用户名@源地址 identified by 密码;用户名 指定将创建的用户名来源地址 指定新创建的用户可在哪些主机上登录 可使用IP地址、网段、主机名的形式 本地用户可用localhost …

可视化

D3.js绘制柱形图 <!DOCTYPE html><html lang="en"><head><title>bar example</title><script src="d3.min.js"></script></head><body><div id="barchart"></div><script…

【0基础学爬虫】爬虫基础之scrapy的使用

【0基础学爬虫】爬虫基础之scrapy的使用大数据时代,各行各业对数据采集的需求日益增多,网络爬虫的运用也更为广泛,越来越多的人开始学习网络爬虫这项技术,K哥爬虫此前已经推出不少爬虫进阶、逆向相关文章,为实现从易到难全方位覆盖,特设【0基础学爬虫】专栏,帮助小白快速…

springboot使用itextpdf+jfreechart制作PDF文档

1. springboot引入的依赖组件 项目中需要引入itextpdf和jfreechart两个组件,版本根据项目所需进行引入,maven组件版本查询可根据如下地址进行查询:maven组件查询<dependency><groupId>com.itextpdf</groupId><artifactId>itextpdf</artifactId&g…

spring趣玩

自定义banner 先上图片,替换spring启动标志;或者也可以在启动类代码设置Banner也可以通过设置springApplication.setBannerMode(Banner.Mode.OFF);关闭打印横幅ApplicationRunner和@PostConstruct ApplicationRunner 是一种灵活的机制,可以用来执行数据库迁移、预加载数据、…

图论初步与可视化

本讲将简要介绍图论中的基本概念,并主要讲解图论中的最短路径问题。以及如何将图论可视化 目录一、图论的概念二、在线作图网站1.index介绍2.Node Count介绍3.Graph data三、Matlab作无向图1.无权图(每条边的权重默认为1)2.利用字符串做无权图3.有权图四、Matlab作有向图 一…

使用不同函数打印torch.nn模型——print(model),named_children(),named_modules():

创建一个具有三级嵌套的模型,结构如图:import torch import torch.nn as nn# 定义子子模块 class SubSubModule(nn.Module):def __init__(self):super(SubSubModule, self).__init__()self.conv = nn.Conv2d(3, 3, kernel_size=3, padding=1)def forward(self, x):return sel…

[LeetCode] 189. Rotate Array

无敌的切片他又来了。 class Solution:def rotate(self, nums: List[int], k: int) -> None:"""Do not return anything, modify nums in-place instead."""#0if k ==0:pass#elselenn = len(nums)k = k % lennnums[:] =nums[lenn -k:] + nums…

Centos双网卡冗余绑定

1. 前言 关于双网卡绑定,前前后后踩过不少的坑,虽然这是 RHCE 中的一道题,但是在实践中碰到问题也够喝一壶的。 在实践中,虚拟机、物理机都做过,但是不尽相同,大部分的坑也集中在这里,本文长期更新关于网卡绑定中遇到的问题及处理方法。 现在的服务器默认都配备 4 张 千…

Java 将Markdown文件转换为Word和PDF文档

Markdown 凭借其简洁易用的特性,成为创建和编辑纯文本文档的常用选择。但某些时候我们需要更加精致的展示效果,例如在专业分享文档或打印成离线使用的纸质版时,就需要将Markdown文件以其他固定的文档格式呈现。通过将 Markdown 转换为 Word 和 PDF 格式,可以得到更多的格式…

k8s-09-Deployment

Deployment微服务化:将一个大规模系统拆分成各个独立运行的组件更新 pod:直接删除所有现有的 pod, 然后创建新的 pod。 先创建新的 pod, 并等待它们成功运行之后, 再删除旧的 pod。 按顺序创建新的 pod, 然后逐渐删除旧的 pod。第 1 种会导致应用程序在一定的时间内不可用。…

IOT2050基本使用和指令集

安装系统镜像 -- debianIOT镜像地址下载及镜像版本说明Win32 disk Imager下载,用于SD卡安装镜像文件使用win32磁盘映像工具镜像操作如下:如果需要把SD卡中的镜像写入到eMMC卡:将烧录好的SD卡插入设备,修改SD卡启动顺序为默认启动设备。 如果已经存在emmc系统,则先格式化em…

K8S学习教程(一):使用PetaExpress云服务器安装Minikube 集群

什么是MinikubeMinikube是一款工具,主要用于在本地运行 Kubernetes 集群。Kubernetes 开源的平台,用于自动化容器化应用的部署、扩展和管理,而Minikube 使得开发人员能够在本地机器上轻松创建一个单节点的 Kubernetes 集群,从而方便开发、测试和学习 Kubernetes。我们看下如…

蓝牙芯片认证

前言: BLE产品工作在2.4G频段。产品具有蓝牙功能并且在产品外观上标明蓝牙标志,则必须通过认证。 各个国家的认证标准不同,但是大同小异。例如FCC/MIC/CE/BQB等。具体需要过某个认证可以查看出口国家。 认证可以分为传导和空气耦合。传导是测试芯片发射信号的波形;耦合是测…

Linux下二进制可执行文件分析 (nm,readelf,objdump 命令使用)

最近在调试一些问题,发现几个命令很实用,记录一下。 一 背景也许大家都遇到过这种场景,就是有二进制代码,比如深度分析下此文件到底是什么格式的图片等,这篇文章就记录我分析下二进制可执行文件的过程,已经自己读写二进制文件的一些坑。分析的二进制执行文件为linux下的可…

hypernetwork在SD中是怎么工作的

大家在stable diffusion webUI中可能看到过hypernetwork这个词,那么hypernetwork到底是做什么用的呢?大家在stable diffusion webUI中可能看到过hypernetwork这个词,那么hypernetwork到底是做什么用的呢? 简单点说,hypernetwork模型是用于修改样式的小型神经网络。 什么是…

使用 ROS2的多机器人探索

原文链接:https://www.youtube.com/watch?v=J0RZP_xJ3XA This video shows a demonstration of the SOS project, dedicated to forest fire detection using a fleet of robots. Several important issues are addressed. 这段视频展示了SOS项目的演示,该项目致力于使用机…