详细对比超融合服务器硬件平滑升级方案:新建集群 VS 滚动升级

作者:深耕行业的金融团队 刘慧敏

在企业 IT 基础架构运维中,经常会遇到以下问题,从而需要对服务器硬件进行更换或升级:

  • 服务器达到维护期限:通常在金融行业中,生产环境的服务器维护期限在 5 年左右,超过这一期限,服务器需进行下架。
  • 服务器维护成本上升:服务器使用时间较长,硬件故障或老化会导致性能和稳定性下降,从而增加了企业在人力、物力等方面的运维成本。
  • 服务器难以满足业务需求:随着业务的发展和需求的变化,早期购置的服务器配置无法满足当前的业务需求,升级服务器硬件便需提上日程。

问题是,在硬件升级的同时,运维人员应如何保障关键业务正常开展、性能和稳定性不受到升级影响?针对这一需求,SmartX 为运维人员提供了“新建集群”和“滚动升级”两种方案,帮助企业平稳实现基于超融合架构的服务器硬件替换与升级。下面我们将对两种方案进行详细对比,并通过 2 例实践案例,为用户提供方案选择和落地参考。

超融合服务器平滑升级方案

方案1:新建集群

01server-hardware-update.png

利用新服务器组建一个新集群,将原集群的虚拟机通过跨集群迁移的方式迁移至新集群,从而完成服务器的平滑升级。

方案2:滚动升级

02server-hardware-update.png

03server-hardware-update.png

通过在原有集群中依次对服务器进行替换的方式,实现服务器平滑升级。滚动升级步骤如下:

  1. 迁移虚拟机:将原服务器节点上的虚拟机迁移至集群中其他服务器节点。
  2. 迁移数据:将原服务器节点上的存储数据迁移至集群中其他服务器节点。
  3. 移除节点:将原服务器节点从集群中移除。
  4. 下架服务器:将原服务器节点关机下架。
  5. 上架新服务器:将新服务器节点加电、连线和上架。
  6. 添加节点:新服务器节点加入至原集群中。
  7. 回迁虚拟机:将虚拟机回迁至新服务器节点上。

欲深入了解服务器硬件滚动升级特性与用户实践,请阅读:如何做到 IT 基础架构软硬件升级简单又不停机?。

平滑升级方案对比

以上提到的两种方案皆可实现服务器硬件平滑升级。而两者分别适合什么样的升级环境?企业应如何选择合适的升级方案?我们可以从以下维度进行对比和评估。


业务连续性

04server-hardware-update.png

在进行服务器硬件平滑升级时,需保障升级期间集群中的虚拟机业务不受影响。

这两种升级方案都涉及了虚拟机迁移操作。在滚动升级方案中,虚拟机迁移仅涉及计算资源迁移;在新建集群的方案中,虚拟机迁移包含了计算资源迁移和存储资源迁移。虽然这两种方案都可做到不影响虚拟机业务,但因新建集群涉及了存储迁移操作,当集群中存在对业务连续性和 I/O 低延迟要求较高的业务时,滚动升级方案会优于新建集群的方式。


服务器数量

05server-hardware-update.png

滚动升级方案对新服务器数量并无限制,而新建集群方案中,需确保新服务器数量不低于 3 台。因此,当计划对集群中低于 3 台服务器进行升级时,仅能选择滚动升级方案。


虚拟机 CPU 兼容性

06server-hardware-update.png

无论是新建集群方案还是滚动升级方案,都需要确保虚拟机可以顺利完成迁移操作。SmartX 集群部署完成后默认会开启虚拟机 CPU 兼容性功能,根据当前宿主机的 CPU 类型和特性,为虚拟机选择一个最接近 的 CPU 模型,同时可以让集群中的虚拟机都继承此 CPU 特性。这一功能可以让虚拟机在不同代数(Generation)的 CPU 中进行平滑迁移。此外,虚拟机也可自定义选择 CPU 兼容性,比如物理透传或者其他 CPU 的兼容性。

因此,为了确保虚拟机可以顺利完成迁移操作,目标主机或者集群的 CPU model 中必须包含待迁移虚拟机的 CPU model 指令集,并且虚拟机迁移到新集群或者目标主机后,此虚拟机依旧继承迁移前的 CPU model。

如果目标主机或者集群不满足平滑迁移条件,则需要将虚拟机进行关机后再进行迁移。


网络资源

07server-hardware-update.png

在网络资源方面,滚动升级方案可复用原有配置,而新建集群方案需进行重新配置。这个维度主要考虑,当前集群是否具备新建集群的条件。新建集群需同时满足以下 3 个条件:

  • 机房机柜预留了可放置新服务器的空间。
  • 交换机预留了管理、存储以及业务网络的端口。
  • 新集群有足够的地址为管理、存储以及业务等 IP 地址进行规划。

如果满足,则可以选择新建集群和滚动升级这 2 种方案;如不满足,则选择滚动升级的方式。


集群调整

08server-hardware-update.png

在进行服务器硬件升级前,用户可能计划对以下方面进行调整,如:

  1. 业务网络调整:计划将集群中的业务网络和管理网络进行物理层面的隔离。
  2. 机房机柜更改:计划将服务器放置到 IDC 进行统一管理。
  3. 虚拟化平台变更:计划将基于 VMware 虚拟化的 SmartX 超融合集群,变更为基于 SmartX 原生虚拟化 ELF 的集群。
  4. CPU 供应商变更:计划将部分业务迁移至信创集群。

如本次集群调整涉及虚拟化平台和 CPU 供应商的变更,因同一个集群中不能同时存在 2 种虚拟化和 2 种 CPU 供应商,所以需要通过新建集群的方式进行服务器硬件升级。如不涉及这两个方面的变更,那么新建集群和滚动升级方式皆可供选择。


适用场景

以上提到的两种服务器平滑升级方案并不存在对立的关系,相反,它们在适用场景上存在较多的重合部分。根据以上分析,我们对这两种升级方案在适用场景上的区别进行了以下总结:

09server-hardware-update.png

用户案例:方案选择与落地实践

案例 一:采用滚动升级方案实现服务器平滑升级

升级背景

  1. 10 节点 SmartX 超融合(基于原生虚拟化 ELF)集群,单节点存储使用容量为 15TB – 20TB。
  2. 1 周内需要完成其中 4 台服务器升级。
  3. 集群存在业务连续性要求较高且要求 I/O 低延迟的业务,升级期间需尽量保障虚拟机业务不受影响。
  4. 机房无多余机柜空间以及交换机端口,IP 地址段无多余 IP 地址可供分配。

方案选择与实践

用户当前环境无多余网络资源,同时由于仅升级集群中的部分硬件服务器,应选择滚动升级的方式。采用此方案,一方面可以使新服务器复用原有的服务器网络配置,无需更改网络资源;另一方面,升级部分硬件服务器无需将 1 个集群拆分为 2 个集群,这样可避免增加客户的集群维护工作量。

最终,用户采用滚动升级的方式,在一周时间内,顺利地完成了硬件服务器平滑升级的操作。


案例二:采用新建集群方案实现服务器平滑升级

升级背景

  1. 8 节点 SmartX 超融合集群,单节点存储使用容量为 12TB – 15TB。
  2. 3 周内需要完成 8 台服务器升级。
  3. 8 节点集群被规划为测试集群,机房和集群网络需要被重新调整。
  4. 在升级期间需尽量保障虚拟机不到影响。

方案选择与实践

用户有集群调整的需求,应选择新建集群的方式来进行服务器平滑升级。在这个方案中,新建集群的网络调整以及位置重新放置等操作,对原有集群几乎不产生任何影响,仅需要将原有集群的虚拟机进行跨集群迁移,即可完成全部虚拟机的迁移动作。

最终用户采用此方案,同样在一周时间内,顺利地将 8 个节点的硬件服务器进行了平滑升级。

此外,五矿期货有限公司也利用 SmartX 超融合对异构集群的支持特性,从 4 节点纯软件(基于 SmartX 原生虚拟化 ELF)逐步扩容到 10 节点,同时完成了从超微四子星到 Dell PowerEdge R730xd 的服务器升级替换。更多案例细节,请阅读:五矿期货超融合硬件平滑升级与多数据中心管理实战。

您还可以扫码获取《SmartX 超融合技术原理与特性解析合集(含 VMware 对比详情)》介绍,了解更多 SmartX 超融合功能特性与使用场景。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/91145.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

含纽扣电池的产品出口澳洲需要做哪些认证?认证标准是什么?

澳大利亚含纽扣电池产品新规 01纽扣电池安全问题<<<< 在澳大利亚&#xff0c;已有儿童因为误食纽扣电池而导致死亡&#xff0c;且每月至少有一名儿童因吞咽或插入纽扣/硬币电池而严重受伤&#xff0c;导致其中一些儿童永久性损伤&#xff0c;而全世界数以百万计的…

算法通关村第9关【黄金】| 两道有挑战的问题

1. 将有序数组转换为二叉搜索树 思路&#xff1a;二分法&#xff0c;这个算法保证了每次选择的中间元素都能保持左右子树的高度差不超过 1&#xff0c;从而构建一个高度平衡的二叉搜索树。这个过程类似于分治法&#xff0c;通过递归不断将大问题分解成小问题并解决。 找到数组…

饮食保健杂志饮食保健杂志社饮食保健编辑部2023年第38期目录

论著 中青年人群非酒精性脂肪肝与颈动脉粥样硬化之间关系 徐晓萌1-4 阿司匹林与氯吡格雷对老年冠心病的治疗效果观察 张海峰5-8《饮食保健》投稿&#xff1a;yixuebj126.com 临床研究 骨折复位钢板固定联合自体骨泥植入治疗胫骨中下段骨折的研究 杨翼众 李东生 黄三明 刘禄林 曾…

基于Linux操作系统的keepalived双机热备和keepalived+lvs(DR)基本配置操作

目录 keepalived双机热备 一、概述 &#xff08;一&#xff09;具体工作原理如下&#xff1a; &#xff08;二&#xff09;实验拓补 二、安装NFS、配置 1、第一台机器配置&#xff1a;NFS &#xff1a;192.168.11.101 2、更改配置文件 3、安装NFS进行目录共享 4、编辑…

《自然》杂志最新研究成果,新冠卷土重来,仍然凶险,别不当回事儿

我同事又带口罩了&#xff0c;他说已阳。我很奇怪怎么不认为是感冒呢&#xff1f; 他低声地说&#xff0c;家里还有去年囤的试剂盒&#xff0c;我测了一个。 我还好&#xff0c;只在年初时候阳过一次。 应该说&#xff0c;我们比较庆幸&#xff0c;新冠毒株已经温和&#xff0c…

vscode+ros开发环境搭建

目录 介绍 前提 vscode安装 vscode插件安装 工作空间准备 打开vscode 创建catkin包 编写cpp代码 编译 运行 启动ros服务 监听话题 启动ros测试 介绍 ros开发是机器人开发中必不可少的工作&#xff0c;语言选择可以是c,也可以是python。工具的话&#xff0c;不能像wi…

浏览器的事件循环

其实在我们电脑的操作系统中&#xff0c;每一个运行的程序都会由自己的进程&#xff08;可能是一个&#xff0c;也可能有多个&#xff09;&#xff0c;浏览器就是一个程序&#xff0c;它的运行在操作系统中&#xff0c;拥有一组自己的进程&#xff08;主进程&#xff0c;渲染进…

汽车电子笔记之:基于AUTOSAR的多核监控机制

目录 1、概述 2、系统监控的目标 2.1、任务的状态机 2.2、任务服务函数 2.3、任务周期性事件 2.4、时间监控的指标 2.5、时间监控的原理 2.6、CPU负载率监控原理 2.6.1、设计思路 2.6.2、监控方法的评价 3、基于WDGM模块热舞时序监控方法 3.1、活跃监督 3.2、截至时…

平面设计师都在用的6个免费素材网站

常见的设计素材网站太多了&#xff0c;不是要会员就是要花钱买&#xff0c;今天给大家推荐几个可以免费下载的设计素材网站&#xff0c;有需要的朋友赶紧马住了。 1、菜鸟图库 菜鸟图库-免费设计素材下载菜鸟图库汇集了各种免费高清广告图片设计、电商淘宝、企业办公模板、视频…

三、JVM监控及诊断工具-GUI篇

目录 一、工具概述二、jconsole&#xff08;了解即可&#xff09;1、基本概述2、启动3、三种连接方式4、作用 三、Visual VM 一、工具概述 二、jconsole&#xff08;了解即可&#xff09; 1、基本概述 从Java5开始&#xff0c;在JDK中自带的Java监控和管理控制台用于对JVM中内…

如何将下载的安装包导入PyCharm

1. 下载安装包 这里以pyke为例。下载好之后解压缩&#xff0c;然后放入/Lib/site-packages/pyke-1.1.1 2. 打开PyCharm的终端进行安装 python setup.py install 3. 安装好之后导入即可使用 import pyke

nacos import com.alibaba.nacos.consistency.entity.ReadRequest

1. 异常情况 import com.alibaba.nacos.consistency.entity.ReadRequest; import com.alibaba.nacos.consistency.entity.Response; import com.alibaba.nacos.consistency.entity.WriteRequest; 2. 解决方法 安装插件&#xff0c;然后重新编译 记住选择Java8