对rpc长连接与短连接的思考

对rpc长连接与短连接的思考

对于rpc项目,在接受大佬指导的时候曾问过对于长连接和短连接是如何处理的,在面试的时候也被问起socket​是长连接还是短连接,发现自己没有好好思考过这个问题,因此好好总结一下。

前置知识点:rpc基础,tcp基础

rpc项目中的长连接与短连接的思考

什么是rpc项目中的长连接和短连接

和http的长连接和短连接的概念类似,rpc项目中的短连接是指处理完一次rpc请求后就断开连接,长连接是指处理完一次rpc请求后不断开连接,复用连接。

甚至很多rpc的底层实现就是http协议,因此长连接和短连接很类似就不足为奇了。

http中长连接是指处理完一次http请求和响应之后不断开tcp连接;http短连接是指处理完一次http请求和响应之后断开tcp连接(需要注意的是:一般是服务器断开,至于为什么是服务器断开,则又是一篇小文章了hhh)。

与tcp和http的长连接短连接的异同

rpc​和http​的长短连接的异同上文已经分析过了,本质上没什么区别,都是控制tcp的断开时机。
而tcp长连接平时聊的很少,很多人甚至不清楚tcp也是有“长连接”机制的,其名字叫做 tcp的保活机制(keep-aliving),其会在长时间没有信息交流的时候向对端发送探测报文,并且在一定次数没有回复后就断开连接。

tcp的保活机制与现在常见的探测机制非常相似(服务探活、rpc探活等),但是大家基本都没有采用tcp的保活机制,而是采用自己的保活机制,原因在于tcp保活机制的探测时间太长了,在默认设置下,2个多小时才能探测出对端已经挂掉,具体见:浅谈 tcp 保活机制

这里也涉及一个平时很容易弄错的地方了,比如tcp的保活机制(keep-aliving​)与http协议的长连接(Connection: Keep-Alive​)英文很相似,但是本质上不是一个东西。

客户端与服务器有哪几种连接模式与利弊分析

rpc连接的三种方式:

常规 RPC 的连接模型主要有三种:

  • 短连接:每次请求都创建新连接,得到返回后立即关闭连接
  • 长连接池:单个连接可以处理多个请求和返回,但同时只能处理一次完整请求与返回
  • 连接多路复用:单个连接可以同时异步处理多个请求与返回

每类连接模型没有绝对好坏,取决于实际使用场景,一般来说连接多路复用性能最好。

这些应该是一些比较成熟的rpc框架实现的,中间配有负载均衡器才能实现连接池的操作。

如果是客户端与服务端直连,本质上就是两种:长连接和短连接。

长连接不是银弹

本节主要说明长连接虽然相对于短连接一般情况下性能好,但是不是十全十美,必须有所考量。

1. client 和 server 的数量

rpc​长连接模式下相比于rpc​短连接,在相同client​数量的情况下,需要维系的连接数更多(连接一般不会断开,或者是需要超时或者是其他情况才会断开),因此当client​数量相比于server数量过多的时候,使用长连接会有以下几个问题:

  • server​需要维护数量众多的连接,压力很大。
  • 端口很容易耗尽

因此在client​数量特别多的情况下就不适合用长连接了,用短连接反而合适一些。

使用长连接的时候也需要考虑超时断开等机制。

所幸rpc​服务器一般来说client​的数量相比于网页服务器等会少很多,因此使用长连接应该就可以了。

2. 负载均衡机制

现代后端服务端架构中, 为了实现高可用和可伸缩, 一般都会引入单独的模块来提供负载均衡的功能, 称为负载均衡器。根据工作所在的OSI​层级的不同, 不同的负载均衡器会提供不同的转发功能。

不同的均衡器是根据工作在OSI​的层级进行区分的,以最常见的 L4负载均衡器(工作在 TCP​层)和 L7负载均衡器(工作在应用层, 如HTTP​)两种负载均衡器来举例分析这两种负载均衡器对与rpc的影响。

当然,不一定需要一个单独的一个组件来完成负载均衡,实际上,很多项目中都是采用直接在客户端进行负载均衡的操作(胖客户端)来避免引入单独的负载均衡器。

L4 负载均衡器

L4工作在TCP层,就是对TCP的流量进行负载均衡的转发,由于TCP的特性,因此L4的负载均衡器并不能知道某次rpc请求是否处理完毕,只是在发起请求的时候进行负载均衡处理(选择要转发到哪个服务器上)。

负载均衡器将TCP包转发到其中一台服务器

这样对RPC的影响是什么

  • 如果rpc是长连接:长连接情况下client​会一直保持和某个server​的连接,这样的话在client与server建立连接之后负载均衡就失效了。但是新的client连接进来的时候还是会负载均衡的。这样容易导致在client​数量很少的时候会导致流量分发不平均:
  • 如果rpc是短连接:每次请求都会重新连接,因此每次都会负载均衡。

L7 负载均衡器

L4负载均衡在长连接情况下导致负载均衡在某种意义下失效的本质原因是负载均衡器在第一次连接的时候负载均衡后,后续不会再负载均衡了。

相比 L4 只能基于连接进行负载均衡, L7 由于在HTTP层进行负载均衡,其可以进行 HTTP协议的解析。当 client 发送请求时, client​会先和 L7 握手, L7 再和后端的一个或几个 server​ 握手,并根据不同的策略将请求分发给这些server​,从而实现基于请求的负载均衡。

L7均衡器无论是长连接还是短连接都不会有L4在长连接情况下的负载均衡的问题,原因是因为L7可以进行HTTP协议的解析,从而可以在client无感知的情况下进行切流。

这也是大家最广泛使用的负载均衡的手法!

因此使用长连接还是短连接必须要根据实际情况来确定,不能无脑的选择长连接。

关于tcp一些其他层面的优化

即对sockettcp​编程的优化,我们可以考虑如下两个方向:

  1. TCP_NODELAY​:禁用 Nagle​ 算法,使小数据包能够及时发送。
  2. TCP_QUICKACK​:启用 quickack​ 模式,减少应答延迟。

总结

从本文可知,rpc的负载均衡实现主要有3种:胖客户端、L4层负载均衡、L7层的负载均衡,在现实中,L4层的负载均衡器一般用于中央交换机这样的装置,因此后端开发的同学一般是不会接触到的。

而抛开L4负载均衡来说,现实中L7和胖客户端的负载均衡一般来说也是混合使用的,不会单独使用。

比如说一个经典的集群维度的负载均衡示例图如下:

一般来说至少有2层的负载均衡,分别保证集群维度的高可用和集群内部服务的高可用。

  • 集群维度的负载均衡用于保证集群维度的高可用:一般采用胖客户端的方式,选择一个固定的集群进行连接使用,除非当前集群出现问题,否则一般不会切换。
  • 集群内部服务的负载均衡用于保证服务内部的高可用:一般会使用L7的负载均衡器(如NGINX)进行转发。通常情况下客户端与负载均衡器的长短连接由于客户端决定,而负载均衡器与服务器之间采用长连接以避免tcp握手,提高响应速度。

无论是哪种维度的高可用保证,本质上都是为了防止“单点”问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/870307.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Windows攻防】通过代码研究空字节和无文件方式注册表隐藏技术

这篇文章收录于《取证实录》第四季中。 注册表隐藏技术通常用于恶意软件、后门程序或攻击者企图在系统中保持隐蔽,绕过安全检查和防御系统。 常见的隐藏技术有:使用非法字符隐藏注册表项(如PlugX、TDL4/Alureon(Rootkit))、利用默认键值(空字符串)隐藏(如Adwind RAT)…

DVWA靶场学习

暴力破解Brute Force low 输入密码就正常抓包放字典破解得了uploading-image-528180.png medium 同样的操作发现响应速度变慢了,但是还是能暴力破解,不多说了。 uploading-image-408161.png 部分源码解读 $user = $_GET[username]; $user = ((isset($GLOBALS["___mysqli…

推荐几个不错的 Linux 服务器管理工具

前言 选择一款好的 Linux 服务器管理工具能够极大地提高运维效率,保障业务连续性。今天大姚给大家分享3款不错的 Linux 服务器管理工具,希望可以帮助到有需要的同学。 1Panel 1Panel是新一代的 Linux 服务器运维管理面板,旨在通过现代化的 Web 界面帮助用户轻松管理 Linux 服…

学习进度笔记⑩

Tensorflow线性回归 源代码:import tensorflow as tfimport numpy as npimport matplotlib.pyplot as pltimport osos.environ["CUDA_VISIBLE_DEVICES"]="0"#设置训练参数,learning_rate=0.01,training_epochs=1000,display_step=50learning_rate=0.01…

学习进度笔记⑨

tensorflow基本操作(类似numpy) 源代码import tensorflow as tf import os os.environ["CUDA_VISIBLE_DEVICES"]="0" #构造计算图,创建两个常量节点a,b,值分别为2,3 a=tf.constant(2) b=tf.constant(3) #创建一个Session会话对象,调用run方法,运行…

利用AI大模型实现个性化视频配音

最近,作者决定拍摄短视频分享AI技术的应用,并遇到了配音问题。由于家中环境嘈杂且设备不够专业,作者尝试了机器配音,但效果不佳。作者转而想到AI大模型支持语音识别,于是开始寻找语音合成模型。最终在阿里云百炼平台上找到了通义千问-语音合成CosyVoice大模型,多个音色都…

【取证工具】Magnet AXIOM中文绿色版(更新8.4)

Magnet AXIOM取证工具介绍 Magnet AXIOM 是一款功能强大的数字取证工具,专为法律执行人员、调查员和安全专家设计,用于从各种数字设备中提取、分析和报告证据。AXIOM 提供了全面的取证支持,能够从电脑、移动设备、云端服务以及物联网设备中收集并分析数据。多平台支持 Magne…

介绍1个简单好用的英文文本翻转网站,关键还免费不用登录

输入英文,会 生成对应的翻转、反向、镜像、𝕆𝕦𝕥𝕝𝕚𝕟𝕖 𝔽𝕠𝕟𝕥、𝓒𝓾𝓻𝓼𝓲𝓿𝓮 𝓛𝓮𝓽𝓽𝓮𝓻𝓼的文本可以用于生成密码,聊天时发消息,猜字符的场景,欢迎使用和访问,简单免费,无需登录 比如你想她啦,不好意思说…

[Babel] Intro Babel - 01 Introduction

Babel介绍 Babel 是一个编译器,主要用于将最新的 JavaScript 代码转化为向后兼容的代码,以便在老版本的浏览器或环境中运行。 例如,你可能在开发时使用了 ES6、ES7 或者更高级的 JavaScript 特性,但是有些浏览器可能并不支持这些新特性,这时就可以用 Babel 来将代码转化为…

Babel Intro Babel - 01 Introduction

Babel介绍 Babel 是一个编译器,主要用于将最新的 JavaScript 代码转化为向后兼容的代码,以便在老版本的浏览器或环境中运行。 例如,你可能在开发时使用了 ES6、ES7 或者更高级的 JavaScript 特性,但是有些浏览器可能并不支持这些新特性,这时就可以用 Babel 来将代码转化为…

unordered_map-STL容器

时间复杂度和空间复杂度

2 应用层

2 应用层 2.1 网络应用原理 网络应用:能够运行在不同的端系统和通过网络彼此通信的程序。注:在端系统上运行,而不是在网络核心上运行。网络应用是计算机网络存在的理由。 2.1.1 应用体系结构(application architecture) 客户-服务器体系结构(client-server architecture)…