让公有云服务“宁安如梦”的“定心丸”在哪里?

电视剧《宁安如梦》正在热播中,该剧讲述了主人公在经历人生的重大风险后,重获新生再活一遍,以确定性的方式抵御和化解原有的重大风险。然而,在现实的生活中,却没有这样的重来机会。

2023年11月13日,Gartner发布了2024全球最终用户公有云支出预测,预计2024年将增长20.4%达6788亿美元。“云已经必不可少”, Gartner分析师认为。但同时,公有云的安全高可用,却成为企业数字化转型的高风险事件。

2023年,一方面是大模型和生成式AI加速了上云进程,另一方面是公有云宕机事件频出而凸显基础质量问题。2023年是公有云第17个年头,公有云也已经渡过了市场炒作高峰期而进入了主流,Gartner曾预计到2025年全球50%的企业应用将迁移到主流公有云上,但也将带来“云集中”风险——一旦单个云服务商出现故障,将导致业务发生严重中断。

从2023年来看,单个云服务商出现重大故障事件,已经影响了市场对公有云可靠性和安全性的信心。例如,2023年11月8日,澳大利亚电信运营商Optus的一次故障事件导致澳大利亚40% 的人口超过12个小时无法正常上网,11月12日阿里云发生严重故障,导致阿里巴巴大量产品无法连接,除了阿里系几乎全线产品出现故障外,整数云、理工小蜜蜂、饿乐送、cool easy、IOTTEC、纳思云、语雀等平台均受到影响。

随着越来越多的企业上云,从上IaaS到上PaaS和SaaS,公有云服务商面临着硬件、软件和服务的多重安全与高可用挑战。

不过,总体来说,公有云出现大面积问题的概率依然很低,公有云仍然是数字化转型的基础设施。而企业上云,特别是大规模核心业务上云的企业,要做好多云战略,选择多个云计算服务商,合理分配资源,做好冗余灾备。那么,如何选一家稳定可靠的云服务商?

搭建稳定可靠的运维体系成为云厂商“必修课”

当前,公有云服务商的规模不断扩大,企业上云进程不断深化,从“业务上云”迈向“深度用云”已经成为行业共识。根据Gartner的2022~2024全球最终用户公有云支出数据及预测,PaaS、SaaS、BPaaS和DaaS等支出占公有云支出的75%,其中PaaS、BPaaS和DaaS支出占了近40%。也就是说,越来越多的企业用户直接在公有云上开发和部署应用。

对于公有云服务商来说,IT运维正在面临着颠覆性的变化,正从保障设备稳定的防守型运维转向支撑业务敏捷的进攻型运维,从关注自身平台转向关注客户应用,这个转型的过程对公有云服务商提出了艰巨挑战,特别是当越来越多的政企客户将自身的业务直接连入公有云平台时,如何从硬件、软件和服务等维度,既保证客户业务的快速迭代又保证业务的安全稳定高可用,这是公有云服务商生存和发展的根本。

以华为云为例,过去几年的高速发展,业务量上千倍的增长,经历了从“慢”向“快”的转变,运维如何经受考验?这个过程中也经历了深刻变革。华为云基于ITIL标准,打造标准化运维管理体系,引入SRE文化,构建SRE确定性运维体系,同时实施高可用架构与方案,引入动态风险治理,以及不断探索AIOps智能运维。

华为云从2017年开始实践SRE,目前已经成为国内最大的SRE团队之一。本质上,SRE是用软件工程的思维和方法解决复杂的运维问题,从被动响应为主,演进为构建主动预防式运维的软件工程能力为主。在实践积累的基础上,华为云SRE提出了“确定性运维”理念,即通过一套完备的工程方法,以华为云SRE的高可用架构设计、动态风险治理和高度智能的运维框架,让现网拥有确定性的质量结果,支撑高质量运维实现。

高可用架构是华为云SRE的一大亮点,高可用架构让华为云服务的软件在前端就具备高可靠、高可用的能力,具有确定性的失效率、确定性的恢复时长结束、确定性的爆炸半径。从2017年起,华为云SRE团队积极介入到云服务的开发前端,将后端的运维经验和运维诉求带到前端的开发设计过程中,使得现网在出现非预期的故障时,通过提前预埋的可恢复性和爆炸半径控制能力,迅速隔离影响,实现即时恢复。

此外,华为云高度重视数据中心灾备性能,提供同城AZ (Availability Zone)内、跨AZ、异地跨Region的两地三中心容灾方案和1000公里以上的城市级容灾能力,支持流式容灾,保障业务平稳运行,避免单点、多点故障造成客户业务停顿。

京东云则通过混沌工程理论,结合多年稳定性治理经验入手,建成京东云云泰稳定性主动管理平台。实现主动发现和治理业务连续性风险,提供一站式可见、可查、可管、可控的治理方案,力求做到先于用户发现问题、先于感知修复问题,为云平台稳定、云上业务稳定提供商业服务的可用性从99.975%提升为99.995%。

可用性的扎实内功,才是云客户的“定心丸”

趣丸科技是一家集兴趣社交、电子竞技、人工智能于一体的创新型科技企业。华为云承载趣丸70%以上的IT业务运行,包含计算、存储和网络等基础底座,业务运行还使用了华为云大量的数据库、中间件等高级服务,华为云为趣丸核心业务的高可靠、高稳定运行提供7*24保驾护航。

更进一步,华为云基于确定性运维实践,帮助趣丸在大模型时代下,应对业务上云后的安全可信、稳定可靠、资源高效、业务敏捷等挑战,进一步探索LLMOps等,加速企业高质量增长,让运维成为智能世界变革的加速器,推动趣丸科技的用户粘性不断增强。

服务所有“华为”品牌的各类终端的华为终端云更为典型。作为华为云的最大内部客户之一,华为终端云从2017年开始全面上云。华为终端云业务承载了全球十亿级用户,业务场景越来越多,运维场景也越来越复杂。通过建设SRE能力,华为终端云全球三个运维中心有效协同,保障连续5年业务可用性SLA 99.99%,达成无重大连续性和安全事故的挑战目标。

在汽车行业,数字化转型是一个复杂过程,需要解决业务系统庞大、业务系统应用多、分布广、跨系统、跨区域、跨应用的调用频繁等问题,业务所用的系统由成百上千个应用服务组成,服务之间的关系错综复杂。华为云通过应用运维管理服务(AOM)、云日志服务(LTS)、应用性能管理服务(APM)等服务,实现全链路管理,提高运维效率,帮助汽车业务应用系统稳定运行,提升用户体验。

“让稳定可靠成为华为云核心竞争力”,这条横幅挂在松山湖华为云运维中心最醒目的位置,华为云提出的“一切皆服务”之“根”是质量和平台的稳定性。华为公有云业务总裁高江海曾表示,唯有时刻保持敬畏之心,才能真正服务好客户、有质量地“活下去”。

这或许也是所有云厂商未来最核心的竞争力之一。(文/宁川)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/175817.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI歌姬,C位出道,基于PaddleHub/Diffsinger实现音频歌声合成操作(Python3.10)

懂乐理的音乐专业人士可以通过写乐谱并通过乐器演奏来展示他们的音乐创意和构思,但不识谱的素人如果也想跨界玩儿音乐,那么门槛儿就有点高了。但随着人工智能技术的快速迭代,现在任何一个人都可以成为“创作型歌手”,即自主创作并…

2024上海国际智能驾驶技术展览会(自动驾驶展)

2024上海国际智能驾驶技术展览会 2024 Shanghai International Autonomous driving Expo 时间:2024年3月26-28日 地点:上海跨国采购会展中心 随着科技的飞速发展,智能驾驶已经成为了汽车行业的重要趋势。在这个时代背景下,汽车不…

分类预测 | MATLAB实现基于Isomap降维算法与改进蜜獾算法IHBA的Adaboost-SVM集成多输入分类预测

分类预测 | MATLAB实现基于Isomap降维算法与改进蜜獾算法IHBA的Adaboost-SVM集成多输入分类预测 目录 分类预测 | MATLAB实现基于Isomap降维算法与改进蜜獾算法IHBA的Adaboost-SVM集成多输入分类预测分类效果基本描述程序设计参考资料 分类效果 基本描述 Isomap-Adaboost-IHBA-…

创造者设计模式

Bike package com.jmj.pattern.builder.demo01;public class Bike {private String frame;//车架private String seat;//车座public String getFrame() {return frame;}public void setFrame(String frame) {this.frame frame;}public String getSeat() {return seat;}public…

C++实现ransac

目录 一、ransac算法原理 1.1、算法概念 1.2、图解 二、c实现ransac 2.1、设置随机样本和离群点 2.2、随机抽取样本 2.3、内点计算 2.4、更新参数 2.2、完整代码 一、ransac算法原理 1.1、算法概念 随机抽样一致性 (RANSAC) 是一种迭代方法,用于根据一组包…

目标检测,行人检测,出现了检测框和人物不在一起的情况,怎么解决---一定是配置文件的原因

今天测试发现人物检测有结果输出,但是发现检测出来的检测框和人物不匹配 但是奇怪的的是在orin中可以 再nx中就不行 结局复制所有orin的程序到nx就可以运行,最后对比配置文件发现是配置文件里不一样 dstest3_config.xml里的tiler不一样 orin中的 tiler: …

揭秘Vue中的nextTick:异步更新队列背后的技术原理大揭秘!

🎬 江城开朗的豌豆:个人主页 🔥 个人专栏 :《 VUE 》 《 javaScript 》 📝 个人网站 :《 江城开朗的豌豆🫛 》 ⛺️ 生活的理想,就是为了理想的生活 ! 目录 ⭐ 专栏简介 📘 文章引言 一、N…

WPS常用表格对象应用

一、工作簿操作 function 新建工作簿() {let wbWorkbooks.Add();wb.SaveAs("C:/Users/demo/Desktop/123/test.xlsx");wb.Close(); // Workbooks.Add("C:/Users/demo/Desktop/123/工资表.xlsx")} function 删除文件(){ // Kill("C:/Users/demo/Deskto…

网络运维Day16

文章目录 Docker简介什么是容器命名空间: Docker 的优缺点 Docker安装Docker镜像管理什么是镜像镜像管理 Docker容器管理运行容器容器启动、停止、重启拷贝文件进入容器容器与应用 DockerfileDockerfile 语法案例 总结 Docker简介 什么是容器 容器是用来装东西的&a…

盘点72个ASP.NET Core源码Net爱好者不容错过

盘点72个ASP.NET Core源码Net爱好者不容错过 学习知识费力气,收集整理更不易。 知识付费甚欢喜,为咱码农谋福利。 链接:https://pan.baidu.com/s/1nlQLLly_TqGrs5O8eOmZjA?pwd8888 提取码:8888 项目名称 (Chinese) 物业收费…

【亚马逊云科技】使用Amazon Lightsail快速建站

写在前面:博主是一只经过实战开发历练后投身培训事业的“小山猪”,昵称取自动画片《狮子王》中的“彭彭”,总是以乐观、积极的心态对待周边的事物。本人的技术路线从Java全栈工程师一路奔向大数据开发、数据挖掘领域,如今终有小成…

详解 KEIL C51 软件的使用·设置工程·编绎与连接程序

详解 KEIL C51 软件的使用建立工程-CSDN博客 2. 设置工程 (1)在图 2-15 的画面中点击 会弹出如图 2-16 的对话框.其中有 10 个选择页.选择“Target” 项,也就是图 2-16 的画面. 图 2-16 在图 2-16 中,箭头所指的是晶振的频率值,默认是所选单片机最高的可用频率值.该设置值与单…