阿里云容器服务助力极氪荣获 FinOps 先锋实践者

作者:海迩

可信云评估是中国信息通信研究院下属的云计算服务和软件的专业评估体系,自 2013 年起历经十年发展,可信云服务评估体系已日臻成熟,成为政府支撑、行业规范、用户选型的重要参考。

2022 年 5 月国务院国资委制定印发《提高央企控股上市公司质量工作方案》,重点关注环境、社会及公司治理(ESG),提出要求“贯彻落实新发展理念,探索建立健全 ESG 体系”。FinOps、GreenOps 与 ESG 理念高度契合,云计算作为企业数字化转型的引擎和基石,面向云计算的成本优化与低碳运营将助力企业践行 ESG 发展理念,履行社会治理责任。

在此背景下,中国信息通信研究院正式发起“降本增效,绿色发展丨云成本优化与低碳运营先锋实践者”企业评选活动,通过甄选标杆案例树立云成本优化与低碳运营新范式、新技术下的先锋企业,助力云成本优化与低碳运营理念在企业中持续渗透并落地实践,提高企业上云用云价值,推动云计算产业绿色低碳发展。

在这里插入图片描述

此次 FinOps 成本优化的先锋实践者评选,极氪汽车在过去一年中,基于阿里云 FinOps 成本管理体系的积极实践,荣获此殊荣。通过阿里云容器服务提供的 ACK One 多集群管理、云原生资源画像等功能,对线上及线下数十套 K8s 集群,数千个 Pod 的资源使用情况做闲置检查,并优化发布策略,为集团优化近 25% 的资源用量,每年节省了数百万的 IT 成本投入。

在这里插入图片描述

客户简介

极氪汽车是一家以智能化、数字化、数据驱动的智能出行科技公司,秉承用户型企业理念,聚焦智能电动出行前瞻技术的研发,构建科技生态圈与用户生态圈,以“共创极致体验的出行生活”为使命,从产品创新、用户体验创新,再到商业模式创新,致力于为用户带来极致的出行体验。

在这里插入图片描述

2021 年,极氪 001 迅速崭露头角,仅用 110 天便创下了首款车型交付量“最快破万”的纪录。位居中国新能源汽车品牌销量前六的极氪汽车,去年 11 月份推出的极氪 009,在短短 76 天内便率先完成了首批交付,刷新了中国豪华纯电品牌交付速度的纪录。今年 6 月,极氪汽车再次交付了 10620 辆,成为连续保持五个月同比增长的唯一豪华纯电品牌。极氪 001 更成为全球最快突破 10 万辆销售的豪华车,再次稳居 30 万元以上纯电车型销冠。

公司业务加速发展,公司 IT 成本面临巨大挑战。作为支持公司履约交付、整车交付、支付结算等诸多核心系统的技术部门,团队几乎每天都需要应对不同规模的应用发布,且应用系统所需的云资源消耗日益增加。

客户痛点

多云混合架构,K8s 集群数量多、规模大,运维管理困难

线上线下使用来自于多个云厂商的不同环境,前期随着业务增长,容器集群数量及规模倍增,有限的团队规模下,难以兼顾到业务的稳定性及业务的快速发展。团队面临集群环境配置不一致,发布脚本缺乏标准,应用发布上线变得越来越困难,线上系统稳定性风险极大增加。

应用工作负载难以预估,缺乏数据可见性

Kubernetes 为容器资源管理提供了资源请求(Request)的语义描述。容器的 Request 一般基于人工经验填写,管理员会参考容器的历史利用率情况、应用的压测表现,并根据线上运行情况的反馈持续调整。

但基于人工经验的资源规格配置模式存在以下局限性:

为了保障线上应用的稳定性,管理员通常会预留相当数量的资源 Buffer 来应对上下游链路的负载波动,容器的 Request 配置会远高于其实际的资源利用率,导致集群资源利用率过低,造成大量资源浪费。

当集群分配率较高时,为了提升集群资源利用率,管理员会主动缩小 Request 配置,协调更多的资源容量。该操作会提升容器的部署密度,当应用流量上涨时会影响集群的稳定性。

完全依赖专家经验的管理方式无法适应规模的增长,随着应用数量增多,其管理效率会愈发降低。

预算预估困难,缺乏有效手段支撑企业 IT 精细化治理

在传统架构下,应用的成本摊销基于服务器维度。而云原生架构下费用模型不再完全等同于服务器,业务团队需要更准确的数据估算应用实际投入成本,从而为未来的预算预估做出合理规划。

解决方案

基于 ACK One 构建混合云模式下的 K8s 多集群管理

通过 ACK One 注册集群,用户可以在非 ACK 的 K8s 集群中使用 ACK 的产品化的可观察能力,节省您自己运维外部监控日志系统的成本,也可以统一监控日志系统,快速发现与诊断问题,同时降低运维成本。

通过 ACK 控制台查看注册集群成本分析:可以自定义 K8s 集群节点的成本,根据应用资源使用做成本拆分,多维度分析集群成本、命名空间成本和应用成本,并快速定位异常成本来源,帮助企业降本增效。

在这里插入图片描述

基于 ACK FinOps 套件洞察资源画像,提高整体利用率

ACK 为 K8s 原生的工作负载提供了资源画像的能力,通过对资源使用量历史数据的分析,可以提供容器粒度的资源规格推荐,有效简化了为容器配置 Request 和 Limit 的复杂度。同时,资源画像功能还在 ACK 控制台提供了可视化的交互页面,便于管理员快速分析应用资源规格的合理性,并进行资源规格配置的变更。

在这里插入图片描述

考虑到极氪线上应用较多,通过人工调整不同应用的参数所带来的工作量负担较大,而且调整后的数据无法同应用的发布流程结合,带来业务稳定性的隐患。为此,在项目落地的过程中,ACK 资源画像以 API 的形式提供了资源规格的推荐结果,并与极氪当前发布平台相结合,自动化的获取参数配置的最佳值,渲染发布模版,从而在保证业务稳定性的同时,极大的降低了整体资源使用成本。

建设成果

基于阿里云云原生产品,极氪技术中台团队目前所管理的集群,不仅能准确提供各业务、组织、资源等维度的成本数据,极大的提升了用云性价比,为公司提升整体超过 25% 以上计算资源利用率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/58889.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一文详解 DolphinDB SQL 标准化

为了提升用户体验,降低用户学习成本和脚本迁移复杂度,自 1.30.17 / 2.00.5 版本开始,DolphinDB 逐步支持了标准化 SQL 的书写方法;并于 1.30.22 / 2.00.10 版本起,对标准 SQL 的常用语法和关键字实现了兼容。 1. 与标…

个人对智能家居平台选择的思考

本人之前开发过不少MicroPython程序,其中涉及到自动化以及局域网控制思路,也可以作为智能家居的实现方式。而NodeMCUESPHome的方案具有方便添加硬件、容易更新程序和容量占用小的优势,本人也查看过相关教程后感觉部署ESPHome和编译固件的步骤…

【深度学习注意力机制系列】—— ECANet注意力机制(附pytorch实现)

ECANet(Efficient Channel Attention Network)是一种用于图像处理任务的神经网络架构,它在保持高效性的同时,有效地捕捉图像中的通道间关系,从而提升了特征表示的能力。ECANet通过引入通道注意力机制,以及在…

Java SPI机制的原理和实践

SPI 全称 Service Provider Interface,是 Java 提供的,旨在由第三方实现或扩展的 API,它是一种用于动态加载服务的机制。Java 中 SPI 机制主要思想是将装配的控制权移到程序之外,在模块化设计中这个机制尤其重要,其核心…

Java经典面试题总结(一)

Java经典面试题总结(一) 题一:Java编译运行原理题二:JDK,JVM,JRE三者之间的关系题三:谈一下对冯诺依曼体系的了解题四:重载与重写的区别题五:拆箱装箱是指什么&#xff1…

通过Idea部署Tomcat服务器(详细图文教学)

1.在idea中创建项目 有maven构建工具就创建maven,没有就正常创建一个普通的java程序 创建普通java项目 2.添加框架 3.配置 Tomcat 注意:创建web项目后我们需要配置tomcat才能运行,下面我们来进行配置。 4.添加部署 回到服务器 5.完善配置 6…

算法与数据结构(二十一)二叉树(纲领篇)

备注:本文旨在通过 labuladong 的二叉树(纲领篇)理解框架思维,用于个人笔记及交流学习,版权归原作者 labuladong 所有; 我刷了这么多年题,浓缩出二叉树算法的一个总纲放在这里,也许…

jupyter lab环境配置

1.jupyterlab 使用虚拟环境 conda install ipykernelpython -m ipykernel install --user --name tf --display-name "tf" #例:环境名称tf2. jupyter lab kernel管理 show kernel list jupyter kernelspec listremove kernel jupyter kernelspec re…

Nginx反向代理配置+负载均衡集群部署

文章目录 负载均衡反向代理基础环境部署:什么是代理实验环境图流量过程 环境部署准备两台Web服务器安装Nginx准备页面内容添加主机名 代理服务器配置 修改windos hosts文件测试:终端浏览器 负载均衡反向代理基础环境部署: 什么是代理 正向代…

浅析基于安防监控EasyCVR视频汇聚融合技术的运输管理系统

一、项目背景 近年来,随着物流行业迅速发展,物流运输费用高、运输过程不透明、货损货差率高、供应链协同能力差等问题不断涌现,严重影响了物流作业效率,市场对于运输管理数字化需求愈发迫切。当前运输行业存在的难题如下&#xf…

docker 安装hive

记录一下使用docker快速搭建部署hive环境 目录 写在前面 步骤 安装docker 安装docker安装docker-compose配置docker国内镜像源(可选) 安装git & 配置github部署Hive docker-hive开始部署 使用Hive命令行收尾工作 安装vi、lrzsz关闭相关命令 END…

day5gdb调试模式和makefile

一、gdb调试 1.1gdb调试的作用 gdb调试检查的是逻辑错误,而非语法错误 1.2gdb流程 1、gcc -g 1.c ---->加-g参数的作用,生成可以调试的gdb文件 2、gdb 可执行文件名/a.out ---->进入gdb工具进行调试 3、输入l,带行号打印文件信息…