深度解读英伟达新一轮对华特供芯片H20、L20、L2的定位



大家好,我是极智视界,欢迎关注我的公众号,获取我的更多前沿科技分享

邀您加入我的知识星球「极智视界」,星球内有超多好玩的项目实战源码和资源下载,链接:https://t.zsxq.com/0aiNxERDq

因为一直从事 AI 工作,所以对于英伟达的卡会关注的比较多,从刚入行时候的 TITAN 到 20、30、40、A100、H100,从 T4 到 A10、L4,大多都接触过 (当然除了 H100)。这次英伟达要给咱们特供芯片,不是首次,上一次是特供版的 A800、H800,那时候的禁令里边还没有算力密度的限制,所以 A800、H800 也是满算力的,只是带宽给降低了。后来,美国升级了尖端芯片禁令,加入了算力密度 PD 的限制,一方面直接限制了 A800、H800 的出售,另一方面还间接抑制了咱们的 Chiplet 芯粒堆叠技术突破的可能性。这样一来,限制可谓是全方位的。关于这方面,我之前写过一篇解读 <极智AI | 老美升级芯片禁令限制中的性能指标到底指什么>,有兴趣的同学可以去看看。

对于英伟达,一家以利益为先的商业企业,虽然只能 "服从安排",但是肯定不甘,也只能见招拆招了。所以这又一次特供的三款芯片,肯定会照着最新的芯片法案,好好读透它然后绕开它。说实话其实很难绕,因为限制的很死,估计只能阉割降算力。这里需要注意的一点是,对于禁令中的算力限制,主要是针对浮点算力,浮点算力是干嘛的大家应该清楚,说白了就是限制 AI 训练。

从三块型号 H20、L20、L2 来看,H20 应该是训练卡,而 L20、L2 应该是推理卡,H20 基于最新的 Hopper 架构,而 L20、L2 则基于 Ada 架构。来看这几款芯片的性能参数,

据我所知,同为 Ada 架构 L 推理系列的 L4 并没有被禁 (禁的只是 L40S),所以上面的表格中我也特意加入了 NVIDIA L4 的性能数据,以方便直接对比,这样看其实 L20 和 L2 的定位就会比较尴尬一些。先来看 L20、L2 的定位,从性能参数来看,L20 基本会是 2x 的 L2,而 L2 一定会是张半高半长的计算卡,这么看 L20 应该是张全高全长的加速卡。L20 应该会是阉割版的 L40,产品形态应该和 L40 长得一致,如下,

而 L2 会是阉割版的 L4,产品形体应该和 L4 的一致,如下,

我翻了下上一代全高全长卡 A10 的参数,基本上这次的 L20 和上一代 A10 会持平 (L20 的显存带宽会高一点),这样的水平定位应该会比较清楚了。因为 A10 现在还是比较容易可以买到的,所以这对于你是否会入 L20 是个参考。而对于 L2,它的定位应该是介于 T4 和 L4 之间的一款计算卡,它的 INT8 Tensor Core 算力 193 TOPS,也是会介于 L4 485 TOPS 和 T4 130 TOPS 之间的。L2 的功耗虽然网上没有数据,但是很好猜测,估计在 70 ~ 75W 之间,这是这个级别推理卡的标配。这样,对于 L2 的选购也有了一定的参考。

咱们再来分析 H20 的定位,H20 是明显这几款加速卡中最先进的那个,因为它是 Hopper 架构,而其他是 Ada 架构。而从目前的市面上来看,Hopper 架构的卡除了 RTX 40 消费级显卡外,专业的计算卡你是买不到的,所以 H20 必定是个稀罕货。从算力、功耗、互联来看,H20 主要用于训练,而其他主要用于推理;而从显存、显存带宽、浮点算力、MIG、编解码能力、是否支持 NVLink 互联等综合来看,明显 H20 和其他卡不在一个层次 (当然直接用训练卡和推理卡这么对比是不公平的)。由于 A100、H100、A800、H800 被禁了,高端的训练卡是咱们最缺的,是紧俏货,所以 H20 会很香。对于英伟达来说,H20 应该会比 L20、L2 好卖太多;但对老美来说,他们知道我们缺的是什么,他们知道我们想要的是什么。我们想要什么,他们就越不想给。

L20、L2 不是咱们的急需,也不是咱们的痛点。对于这类推理卡,咱们有很多选择的余地,比如 NVIDIA L4、比如咱们一众的国产推理卡。甚至从这个角度,英伟达特供的 L20、L2,对咱们来说并算不上什么 "好事"。怎么说呢,目前 NVIDIA T4 卡已经停产挺久,各厂家都在推 "更新换代",若要用英伟达的卡就基本是要往前推上 L4,而 L4 的性能基本是 T4 的三倍左右,这个跨度还是挺大的。而咱们国产的推理卡,基本就是对标 T4,对于用户来说由于很多场景可能已经适应 T4 的算力,再加上性价比、国产化替代的考虑,使用国产卡平替 T4 可能会是个不错的选择。而 L20、L2 的推出,又给 T4 的 "国产化替代" 带来了一些不确定性。对于更多会考虑生态、考虑可用性、而非国产化替代的产商来说,本来可能是会考虑选择国产卡,但现在来说,L2、L20 似乎是个更加不错的选择,因为这样你的软件生态就能直接延续下来,而不用大规模重新开发。

而 H20 的情况则完全完全不同,国产卡做的比较好的、比较能够拿得出手的主要在推理卡,对于训练卡,大规模商业化的并不算多,大家可能熟知一些是昇腾 910、昇腾910b 这些。对于训练卡,在禁令下各种高端 NVIDIA 训练卡禁售的情况下,加上国产卡平替的一言难尽,国内高端训练卡的供需情况可想而知,若用 "饥渴" 来形容也不为过。所以,对于咱们来说,L20、L2 是个锦上添花的东西,而 H20 是真正雪中送炭的东西。

但从目前的消息来看,英伟达会推迟面向咱们销售 H20,此番深意,你可细品,便略知一二。


【极智视界】

《深度解读英伟达新一轮对华特供芯片H20、L20、L2的定位》

畅享人工智能的科技魅力,让好玩的AI项目不难玩。邀请您加入我的知识星球,星球内我精心整备了大量好玩的AI项目,皆以工程源码形式开放使用,涵盖人脸、检测、分割、多模态、AIGC、自动驾驶、工业等。一定会对你学习有所帮助,也一定非常好玩,并持续更新更加有趣的项目。https://t.zsxq.com/0aiNxERDq

​​​​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/216349.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于Java+Vue+uniapp微信小程序微信阅读网站平台设计和实现

博主介绍&#xff1a;✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精彩专…

蓝桥杯第597题 跑步锻炼 C++ 日期模板题(模拟经典)

题目 跑步锻炼https://www.lanqiao.cn/problems/597/learning/?page1&first_category_id1&name%E8%B7%91%E6%AD%A5%E9%94%BB%E7%82%BC 题目描述 本题为填空题&#xff0c;只需要算出结果后&#xff0c;在代码中使用输出语句将所填结果输出即可。 小蓝每天都锻炼身…

Ubuntu 22.04.3编译AOSP13刷机

文章目录 设备信息下载AOSP并切换分支获取设备驱动编译系统编译遇到的问题Cannot allocate memoryUbuntu设置USB调试刷机参考链接 设备信息 手机&#xff1a;Pixel 4XL 下载AOSP并切换分支 在清华大学开源软件镜像站下载初始化包aosp-latest.tar。 解压缩&#xff0c;切换到…

Linux常用命令——bind命令

在线Linux命令查询工具 bind 显示或设置键盘按键与其相关的功能 补充说明 bind命令用于显示和设置命令行的键盘序列绑定功能。通过这一命令&#xff0c;可以提高命令行中操作效率。您可以利用bind命令了解有哪些按键组合与其功能&#xff0c;也可以自行指定要用哪些按键组合…

《C++PrimePlus》第9章 内存模型和名称空间

9.1 单独编译 Visual Studio中新建头文件和源代码 通过解决方案资源管理器&#xff0c;如图所示&#xff1a; 分成三部分的程序&#xff08;直角坐标转换为极坐标&#xff09; 头文件coordin.h #ifndef __COORDIN_H__ // 如果没有被定义过 #define __COORDIN_H__struct pola…

Ubuntu服务器/工作站常见故障修复记录

日常写代码写方案文档&#xff0c;偶尔遇上服务器出现问题的时候&#xff0c;也需要充当一把运维工程师&#xff0c;此帖用来记录服务器报错的一些解决方案&#xff0c;仅供参考&#xff01; 文章目录 一、服务器简介二、机箱拆解三、基本操作3.1 F2进入BIOS3.2 F12进入Boot Me…

【GPT-3.5】通过python调用ChatGPT API与ChatGPT对话交流

文章目录 一、引言二、AIGC简介三、OpenAI介绍四、GPT-3.5介绍五、获得OpenAI API Key六、调用ChatGPT API实现与ChatGPT对话七、参考链接 一、引言 ChatGPT 的火爆&#xff0c;成功带火了AIGC&#xff0c;让它进入大众的视野。 ChatGPT 和Whisper API 开发者现在可以通过API将…

【opencv】计算机视觉:实时目标追踪

目录 前言 解析 深入探究 前言 目标追踪技术对于民生、社会的发展以及国家军事能力的壮大都具有重要的意义。它不仅仅可以应用到体育赛事当中目标的捕捉&#xff0c;还可以应用到交通上&#xff0c;比如实时监测车辆是否超速等&#xff01;对于国家的军事也具有一定的意义&a…

「Verilog学习笔记」数据串转并电路

专栏前言 本专栏的内容主要是记录本人学习Verilog过程中的一些知识点&#xff0c;刷题网站用的是牛客网 关于什么是Valid/Ready握手机制&#xff1a; 深入 AXI4 总线&#xff08;一&#xff09;握手机制 - 知乎 时序图含有的信息较多&#xff0c;观察时序图需要注意&#xff1a…

Android Frameworks 开发总结之七

1.修改android 系统/system/下面文件时权限不够问题 下面提到的方式目前在Bobcat的userdebug image上测试可行&#xff0c;还没有在user上测试过. 修改前: leifleif:~$ adb root restarting adbd as root leifleif:~$ adb disable-verity verity is already disabled using …

2023亚马逊云科技re:Invent引领科技新潮流:云计算与生成式AI共塑未来

2023亚马逊云科技re:Invent引领科技新潮流&#xff1a;云计算与生成式AI共塑未来 历年来&#xff0c;亚马逊云科技re:Invent&#xff0c;不仅是全球云计算从业者的年度狂欢&#xff0c;更是全球云计算领域每年创新发布的关键节点。 2023年亚马逊云科技re:Invent大会在美国拉斯…

php获取当前域名方法

使用$_SERVER[HTTP_HOST]变量只获取到域名&#xff1a; $domain $_SERVER[HTTP_HOST]; echo $domain; 获取包含协议和域名的完整URL $protocol isset($_SERVER[HTTPS]) && $_SERVER[HTTPS] on ? https:// : http://; $domain $_SERVER[HTTP_HOST]; $current_url…