亚马逊云科技自研芯片,为企业云服务提高性价比

bcd5cb485d844a4f8a5aaa2e7730c1b0.png6月27日至28日,2023亚马逊云科技中国峰会于上海顺利召开。在本次峰会上,似乎找寻到了云计算领域竞争对手均日渐成熟,而亚马逊云科技却能一直保持领先地位的原因——过去的十几年里,亚马逊云科技“基于客户需求,快速进行产品更新与技术迭代”的Day one理念,一直不断地追求基础架构层面的创新。 

企业亟需提高“用云”性价比

随着企业数字化转型的需求增加、市场竞争的加剧,企业需要将业务和数据迁移到云上,以实现更高效的生产和服务,以适应市场的变化。所以可以观察到越来越多的企业开始上云,然而上云的门槛并不低,需要考虑的东西非常多,比如技术能力、安全合规风险、成本费用、用户体验等,很多企业CTO表示,“想上云,但是有心而力不足”,大多企业目前提出了亟需降低云服务使用门槛、提高“用云”性价比的需求。

为了提高企业云服务使用的性价比,亚马逊云科技为用户提供全面和深入的算力支持,提供包括Intel、AMD、英伟达和自研的CPU及加速芯片产品,这其中最值得一提的就是亚马逊云科技的四个自研芯片:Nitro、Graviton、Inferentia、Trainium。

Nitro是亚马逊云科技的第一款自研芯片产品,Nitro主要有三个亮点:第一,做了高度轻量化的虚拟化;第二,实现网络层面的数据通信和存储的隔离;第三,实现了硬件级别的加密。有了Nitro之后,亚马逊云科技能够大大增强EC2整个实例应用的安全性,每个单元可以独立发展,也确保EC2所有实例运行的稳定。因为Nitro的出现,亚马逊云科技大大降低了推出一个新EC2实例工作的复杂性,使得其保持一个非常快的增长的速度,进一步降低客户成本,从而帮助企业达到降本增效的目标。最新一代Nitro V5芯片相比之前的芯片性能有大幅地提升,包括更快的转发率,包括更低的延迟,每瓦特性能提升40%。

基于ARM架构的通用处理器芯片Graviton自2018年起,亚马逊云科技陆续推出三代Graviton服务器芯片,在去年的re:lnvent全球大会上,亚马逊云科技推出了自研的、基于ARM架构的高性能计算服务器CPU芯片Graviton3E芯片。纵观Graviton系列芯片的升级历程,Graviton3计算性能提高25%,浮点性能提高2倍,加密工作负载性能加快2倍;Graviton3E特别关注向量计算的性能,跟前一代相比高35%,这个性能提升对于像HPC高性能计算这样的应用来说是非常重要的。

从具体案例来看,在HPL(线性代数的测量工具)上Graviton3E性能提升35%,在GROMACS(分子运动)上性能提升12%,在金融期权定价的工作负载上性能提升30%;同时,Graviton3E和类似的X86的EC2实例相比,Graviton3E还能节省60%的能耗。

如今Graviton系列芯片的优秀性能表现已经得到了充分验证,在2023亚马逊云科技中国峰会上,陈晓建讲到的世界一级方程式锦标赛(下文简称“F1”)案例便充分体现了亚马逊云科技在算力资源、数据存储方面的能力。F1利用Graviton3运行空气动力学模拟,可以用比以往快70%的速度开发新一代赛车,赛车压力损失可以从50%降低到15%,这使超车更容易,为车迷可以带来更多赛场的缠斗。此外,F1通过5000多次单车和多车模拟,收集了超过5.5亿个数据点,帮助他们进行下一代赛车的优化。用F1团队表示,“Graviton3让系统性能快了40%,可以晚间运行模拟,第二天早上就能得出结果。”

在机器学习技术探索赛道中,目前亚马逊云科技已经发展出三代不同的机器学习芯片。在训练方面,亚马逊云科技先后推出的加速芯片Inferentia和Trainium覆盖了训练和推理的场景,能为企业提供最佳的性价比。因此,许多领先的生成式AI初创公司,例如AI21 Labs、Hugging Face、Runway和Stability AI都选择Inferentia和Trainium作为他们整个研发和应用的平台。

在机器学习训练中,最重要的指标是训练效率和性价比。以HuggingFace BERT模型为例,基于加速芯片Trainium的Trn1实例的性能表现非常不错,从训练吞吐量角度看,其与同类型GPU实例相比,在单节点情况下,可实现1.2倍吞吐量的提升;在多节点情况下,实现1.5倍吞吐量的提升;从成本角度,单节点实现了1.8倍成本降低,集群的成本降低了2.3倍。

随着模型越来越复杂,很多时候靠一个单点的计算训练是无法满足用户的需求,在很多时候都需要一个分布式的训练,比如需要非常大规模的集群,通过Trainium便可以构建一个超大的集群,它可以有3万张的Trainium芯片,使企业可以获得云上6 ExaFlops的超算级性能。这背后涉及很多创新,比如更快的EFA网络以及PB级别的无阻塞网络互联等。

在机器学习推理中,推理往往要考虑延迟和吞吐,企业需要更高的吞吐力来带来更优的性价比,但是往往更高的吞吐率会带来更高延迟,所以开发者往往要在延迟和吞吐中权衡。Inferentia2的设计就考虑到了兼顾吞吐和延迟的优化,如果拿一个基于Inferentia2的实例做测试,以自然语言处理领域常见的BERT模型为例,在Inferentia2上可实现高达3倍的吞吐提升,8.1倍的延迟降低,4倍的成本节约,使得企业开发者二者兼而有之。

另外值得一提的是,Inferentia2在大语言模型中的表现也非常地突出。拿一个OPT模型来做测试,中等规模的OPT模型OPT-30B为例,相较于通用的EC2 GPU实例,Inferentia2可实现65%的吞吐量提升,推理成本可降低52%;660亿参数级别的OPT-66B,通用GPU实例已经显示内存不足的情况下,而在 Inferentia2上还可以实现每秒351个token数的吞吐量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/9439.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2023,中国电商重回元老时代

中国的历史上不缺“太上皇”,但“太上皇”再度站到台前的很少。公元1457年,被囚禁在南宫的“太上皇”朱祁镇复位,上演了中国历史上少见的南宫复辟。而危机时刻被推举为皇帝的朱祁钰,后来的庙号是代宗,阴阳怪气十足。 …

【Unity实战】制作类元气骑士、挺进地牢——俯视角射击游戏多种射击效果(二)

文章目录 前言一、火箭筒1. 编写火箭筒脚本2. 创建火箭弹和新爆炸特效的预制体3. 编写火箭弹脚本4. 设置好火箭弹和火箭筒的脚本和参数5. 运行效果 二、激光枪1. 编写激光枪脚本2. 先运行游戏,看看效果3. 美化射线4. 完善代码5. 再次运行游戏6. 升级URP项目7. 后处理…

Elasticsearch(1)——倒排索引与HTTP操作Elasticsearch

文章目录 1 前言2 Elasticsearch 安装3 数据格式4 倒排索引5 常用HTTP请求操作Elasticsearch5.1 创建索引5.2 查询索引信息5.3 删除索引5.4 创建/修改文档5.5查找文档5.6局部修改文档5.7删除文档5.8分页查询 1 前言 Elastic Stack 核心产品包括 Elasticsearch【存储数据】、Ki…

【观察者模式】 ——每天一点小知识

💧 观察者模式 \color{#FF1493}{观察者模式} 观察者模式💧 🌷 仰望天空,妳我亦是行人.✨ 🦄 个人主页——微风撞见云的博客🎐 🐳 《数据结构与算法》专栏的文章图文并茂🦕…

Lucene介绍与入门使用

https://github.com/apache/lucene Lucene简介 Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎…

【可爱少女】InsCode Stable Diffusion 美图活动一期

在线运行地址 https://inscode.csdn.net/inscode/Stable-Diffusion 模型相关版本和参数配置 Steps(采样迭代步数): 20 Sampler(采样方法): Euler a 采样迭代步数(Steps)Sampling steps:20 生成批次:1 批次…

QScintilla自制代码编辑器系列(1)编译库文件与运行测试例子

1.下载工程源码 我本人机器上的QT是6.4 可以下载最新的代码 https://www.riverbankcomputing.com/static/Downloads/QScintilla/2.14.0/QScintilla_src-2.14.0.zip 2. 编译生成文件 无需改动可以顺利生成库文件 3. 运行例子 1)拷贝头文件 将整个Qsci文件夹拷…

Spark计算引擎介绍

1. Spark是什么 Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎。 Spark是加州大学伯克利分校的AMP实验室(Algorithms, Machines and People Lab)开源的类Hadoop MapReduce的通用并行框架,拥有Hadoop MapReduce所具有的优点&…

Android Studio实现内容丰富的安卓物业管理平台

如需源码可以添加q-------3290510686,也有演示视频演示具体功能,源码不免费,尊重创作,尊重劳动。 项目编号102 1.开发环境 android stuido3.6 jak1.8 eclipse mysql tomcat 2.功能介绍 安卓端: 1.注册登录 2.查看公告…

Linux中Docker详细安装说明

1.准备环境 说明:准备Linux系统centos7版本(以上) 2.切换管理模式 说明:输入一下命令,然后回车,输入密码。 su – 3.更新yum 说明:为了保证doker能够给顺利安装,那么更新一下;如果没有也可以…

从小白到大神之路之学习运维第49天---第三阶段----MHA高可用集群数据库的安装部署

第三阶段基础 时 间:2023年6月29日 参加人:全班人员 内 容: MHA高可用数据库集群 目录 一、MHA基础 (一)简介 (二)发挥过程 (三)组成 (四&#x…

浅析便捷生活的新选择——抖音本地服务

抖音是一款风靡全球的短视频分享平台,其本地服务功能的发展也逐渐引起了广泛关注。本地服务是指抖音平台上的用户可以通过平台直接查找并使用周边的各种服务,比如美食外卖、快递配送、家政服务等。本地服务的发展对用户和商家都带来了很多便利和机遇。 首…