字号:TTT

英伟达GTC 2024: 绝对霸主的权力与遥远的野心


在万众瞩目的英伟达年度GTC大会中,黄仁勋告诉台下的上万名参会者:新一代AI革命是百万亿美元的市场,而他的赌注在远方。

1: 英伟达GTC 2024

英伟达,2024财年四季度营收是前一年同期水平的3.5倍。

利润是前一年同期水平的9倍。

股价在16个月内上涨了6倍。

AI浪潮给予英伟达的荣耀让这家公司坐上了全球市值第三的位置,也吸引了上万人来到英伟达在美国时间3月18日到21日举办的2024年度GTC大会现场,包括作为受邀媒体参会的我们硅谷101。

我们在参会前非常好奇,已经成为AI芯片霸主的英伟达在接下来面对AMD、英特尔以及Groq等众多竞争对手的追击,以及英伟达的大客户们,包括谷歌、Meta、亚马逊等等科技巨头都正在自研芯片的压力下,它如何向市场传达出,英伟达能守住霸主地位并且这个市场在未来还有巨大增长潜力的信号,来继续激励华尔街和硅谷。

我们经过四天的参会、逛展会、听论坛和分析师采访,带大家云参会2024年英伟达GTC,也顺便聊聊,作为AI芯片市场绝对霸主的英伟达想要传达出的野心和布局。

点击图片看原样大小图片

在今年英伟达GTC大会中,有四大板块和议程是我们非常关注的,分别是:

1)英伟达创始人和CEO黄仁勋在第一天的重磅演讲keynote中将传达出的信号;

点击图片看原样大小图片

第三天议程中,黄仁勋会主持一场座谈panel,邀请了当今生成式AI浪潮的奠基石论文Transformer架构的AttentionIs All YouNeed论文8位作者到场,这8位作者当年都在谷歌,但后来都纷纷出来自己创业,所以这会是第一次他们8人再聚在一起讨论AI的未来,非常是历史性一刻;

点击图片看原样大小图片

3)前来参展的各家英伟达合作公司,因为这显示出英伟达的业务前景,以及软硬件落地的实际效果我们能有一个很直观的感受;

4)就是分别在这四天中英伟达请来的演讲和论坛嘉宾,从各个科技巨头和AI独角兽的科技领袖分享中,大家对AI行业传递出的信号。

接下来,我们就结合以上四点来聊聊我们对这次GTC的观察。

2: 芯片架构更新Blackwell

黄仁勋的整场演讲从下午1点到3点,持续两个小时,其中涵盖了英伟达的硬件和软件的各类产品更新,现场PPT和视频效果非常震撼。

点击图片看原样大小图片

老黄非常善于演讲,没有请任何的嘉宾,就一个人在台上讲了两个小时,很会控场也有幽默,台下的效果和观众反应都很热烈,特别是最后讲到英伟达机器人业务那一块,老黄把迪士尼正在研发的Wall-E小机器人请到台上互动,开了些小玩笑,简直太可爱了,效果非常好。

整体来说,除了有几个段子没响之外,气氛都拉到了顶点,很多人看了keynote出来之后都直呼兴奋。

点击图片看原样大小图片

这场万众聚焦的GTC演讲的重点之一就是:重磅GPU架构更新,所以黄仁勋把很大一部分演讲重点放在了名为Blackwell的下一代GPU架构。

他告诉台下观众们:“如今AI训练需要更大的算力,那么就需要研发出更大的AI芯片来支持训练”。

点击图片看原样大小图片

(我们很快会上线一个和业内人士一起逐帧讲解这个动画的视频,详细讲讲每一步,英伟达在Blackwell系列芯片硬件更新上做了哪些设计优化,以及接下来对AI芯片产业将带来如何的影响。)

总的来说,新的架构下,Blackwell系列包括三个型号:B100、B200 和Grace-BlackwellSuperchip(GB200)将是下一代更强大的芯片性能更新,也继续实现着黄仁勋之前制定的黄氏定律Huang’s Law –也就是,GPU将推动AI性能实现逐年翻倍。

点击图片看原样大小图片

黄仁勋,NVIDIA创始人兼首席执行官:

如果要训练一个1.8万亿参数GPT模型,大约需要三到五个月的时间:如果使用传统的安培芯片,大约需要25000个。如果用Hopper来做,可能需要8000个GPU,并且会消耗15兆瓦。8000个GPU和15兆瓦,它会需要90天,大约三个月的时间。如果你用Blackwell来做,只需要2000个GPU。2000个GPU,同样的90天。但这是惊人的部分,只需要4兆瓦的电力。

点击图片看原样大小图片

这里还有几个值得注意的点:对于新一代的B100、B200 和GB200,这些芯片的工作功率范围在700W到1200W之间。随着新一代芯片的功率和性能都大幅度升级,在AI数据中心领域,想要发挥Blackwell的最大潜力,转向液态冷却几乎成为必须,这也给超微电脑SuperMicro等数据中心硬件供应商提出了新的挑战。

点击图片看原样大小图片

陈茜,硅谷101联合创始人:

新出来的B200他可能算力更大、耗能更大对吧?装载的rack跟现在来比是不是技术上面、设计上面需要更大的更多的一些提升?

Chiawei Chen博士,Senior Director, Super Micro Computer:

基本上以现在我们都按热设计功耗(TDP),它以GPU来讲是越来越高,像比如说现在的H100大概一颗大概700瓦,那B200已经到一颗到1千瓦,所以水冷这件事情已经不是可以有,是必须有。对,我们必须要做这件事情。那因为算力需求越来越高,你用ChatGPT,那就算力需求越来越高,但是它又是一个比较highpowerconsumption(高耗能)的东西,所以你必须要有一个很有效率的Thermal(散热)的解决方法,去把算力保持住或者甚至提高。但是你去lowdown去降低所有环境,或者是说空调设备的使用电量,那大概就是水冷。

另外,芯片的产能问题也一直是困扰英伟达的一个方面,因为虽然发布了B200,但是市面上能配置到H200的公司都不多。在这次大会上,英伟达也试图直面这个问题,包括台积电TSMC和Synopsys将 NVIDIA合作,将在生产中使用 NVIDIA计算光刻平台,希望在加速芯片制造速度的同时,也加快了对未来最新一代NVIDIA Blackwell架构GPU的支持。

点击图片看原样大小图片

3: 华尔街“暂不接招”

整体来说,黄仁勋的keynote期间在硬件上的发布效果还是非常好的,但是,从GTC这几天的股价震荡就可以看出来,华尔街并不觉得惊喜,因为之前在2月公布财报的时候,利好都已经出尽了,市场已经知道英伟达会出新的芯片,这些硬件的更新已经被市场提前消化了。

点击图片看原样大小图片

Yang Ren,Senior Analyst&Partner at Jirong InvestmentManagement (济容投资):

新发布的这个硬件的产品来看的话,其实我觉得没有什么特别大的意外。因为其实目前供应链的这些渠道检查,大家做得确实也都比较细致,比较到位了。我觉得就是硬件,如果让我来总结我的感受的话,我觉得是“预期之内的好”。我觉得可能是比较客观的一个评价了。

陈茜,硅谷101联合创始人:

你们会觉得说这个新的硬件的发布会,对整个英伟达在AI芯片中的地位造成任何的影响吗?会进一步的去巩固它的现状?还是会跟其他的,例如MI300等其他的一些竞争对手其实拉得更远?

Yang Ren,Senior Analyst&Partner at Jirong InvestmentManagement (济容投资):

我觉得其实现在这是一个大家交替领先,同时在进步的这么一个状态。因为可能放在几个月之前,MI300刚刚出来的时候,大家会觉得MI300在硬件层面上,其实在已经一定程度上超越了H100。然后当时大家对AMD的预期就拔得很高,认为MI300可以很快地占据市场。但是我觉得这种角度去看可能是过于静态了,因为没有一家公司他真的就会止步不前,然后不再进步。包括像Jensen英伟达,他们是已经对于MI300的这些进步吧,他们是完全是看在眼里,也是有预期。他们自己在B100里面也是了加入了很多:比如像内存一致性、比如将更大的高带宽内存,这些东西加入到B100里面,其实是大家共同进步,交替领先的一个状态。所以我觉得整体来看,我觉得硬件上英伟达确实还是走得很稳,还是在全速地往前推的这么一个状态。他跟其他的竞争对的是持续性地一个差距,没有再缩短的状态。

点击图片看原样大小图片

所以,在这次GTC上,硬件的发布更新固然重要,但我们能强烈感觉到,黄仁勋想要强调的是,英伟达不仅仅是一家GPU公司,英伟达想要通过软件的升级,不仅仅是已经成功变成英伟达牢固护城河的CUDA,还有更远的布局。

黄仁勋在他的keynote中强调的很清楚,他眼中的新一代市值100万亿美元的新工业革命市场,英伟达是这样布局的:除了Blackwell硬件算力平台,黄仁勋还着重推出NIMs,帮助企业级客户接入AI。

点击图片看原样大小图片

NVIDIA NIM是经过优化的推理微服务,用于大规模部署 AI模型,为开发AI驱动的企业应用程序和在生产中部署AI模型提供了比较便捷和简化的路径。也就是说,企业想要部署AI,英伟达在生态上已经给你提供了各种api和基础大模型,让企业更快的上手。

此外的生态重点是英伟达的AI foundry和NeMo。去年英伟达发布的AI foundry具备三个要素:英伟达的AI基础模型,NVIDIA NeMo 框架和工具、用于构建、自定义和部署生成式AI 模型,以及NVIDIADGX 云AI 超级计算服务。这样依赖,AI foundry就可以用于为企业软件、电信、媒体等各个行业的生成式AI应用定制模型。而在今年,英伟达进一步在这样的AI foundry生态上继续更新各种基础模型和生态服务。

点击图片看原样大小图片

下一个重点就是英伟达的Omniverse,也就是物理模拟反馈的平台,通过模拟与物理世界中各种互动的过程,来训练AI。我们在之前讲机器人那一集的时候就着重提过,AI机器人在模拟环境中的训练非常重要,而现在来看,不仅仅是AI机器人,还有无人驾驶,气候模拟,药物发现,计算生物学,乃至于VisionPro所构建的XR生态,英伟达的Omniverse都已经在布局。

点击图片看原样大小图片

这次GTC上,英伟达宣布了Omniverse CloudAPI接口,让开发者能够轻松地将Omniverse的核心技术直接集成到现有的数字孪生设计与自动化软件应用中,或是集成到用于测试和验证机器人或自动驾驶汽车等自主机器的仿真工作流中。

点击图片看原样大小图片

同时在keynote中,黄仁勋进一步强调IsaacSim,这个基于Omniverse平台之上的机器人培训与模拟系统,这相当于给机器人构建了一个全新的“操作系统”,同时,英伟达还宣布了一个名为GROOT的机器人通用基础大模型,和新型计算机JetsonThor来加速机器人训练。

点击图片看原样大小图片

而且,黄仁勋的一对儿女都在Omniver部门就职,女儿MadisonHuang是Omniverse部门的高级产品营销经理,儿子SpencerHuang是Omniverse旗下机器人仿真和扩展组的产品经理,可见老黄对这个Omniverse这项业务的重视程度。



  • | 共3 页 :
  • 1
  • 2
  • 3

还没有人评论



    还可输入500个字!
    ©2023 wailaike.net,all rights reserved
    0.016127824783325 is seconds