来源:银柿财经
2025-03-19 17:27:02
(原标题:GTC 2025|黄仁勋公布芯片架构路线图,英伟达拥抱AI推理新纪元)
GTC大会素有“AI届春晚”的外号,而在当地时间3月18日举行的GTC 2025的开幕主题演讲中,英伟达(NVDA.US)创始人黄仁勋主动玩起了“梗”。他说,“GTC大会被称为AI届的‘超级碗’,但唯一的区别是,在这里AI会让每个人成为赢家。”
在这场大会上,黄仁勋再次重申对“Scaling law”(扩展定律)的信仰,称推理和代理AI使计算需求激增,并基于此将在今年下半年推出新品Blackwell Ultra,性能是前代产品的1.5倍。
“全世界几乎都对Scaling Law看走眼”
与以往GTC开场即抛出“硬通货”不同,今年GTC开场,黄仁勋用约40分钟解读英伟达在Agentic AI时代的立身之本——愈发高效处理tokens(词元),而tokens也被视为AI的语言与货币。
“AI真正进入大众视野仅仅过去十年而已。”黄仁勋回顾了AI已经历的三代技术范式的转移。最早从perception AI(感知AI)——计算机视觉和语音识别开始,然后是Generative AI(生成式AI),再到当下热门的Agentic AI(代理AI),未来是会影响世界的Physical AI(物理AI)。
过去两三年,技术范式进入Agentic AI,出现人工智能的根本性飞跃。Agentic AI的基础是推理,其具备主动性,能感知并理解当前语境的上下文,能思考如何回答并解决问题,能制定并执行计划。而在Agentic AI之后,下一波浪潮正在发生,机器人领域的AI进展由Physical AI推动,是理解物理世界、三维世界的AI——这种理解能力将开辟AI的新纪元,使智能机器人变得可行。
黄仁勋表示,从本质上说,每个阶段的AI,都涉及三大根本问题。第一,如何解决数据问题。因为AI是一门数据驱动的数据科学,需要数字化的经验来学习、获取知识。第二,如何在没有人工参与的情况下进行模型训练。因为人工干预是有极限的,而人们想要AI能以超越人类的速度来实时学习,而且规模足够大到人类无法企及。第三,如何进行扩展(Scale)。如何使得人们提供越多的算力、数据等资源,AI模型就变得越聪明,这被称为“Scaling law”。
Scaling Law背后蕴含的逻辑是“大力出奇迹”。而在去年,AI界掀起Scaling Law是否失效的讨论,引起市场对算力需求不再坚挺的担忧,而黄仁勋在演讲中提出了截然相反的观点。“针对Scaling law放缓,过去一年几乎全世界都看走眼了。”黄仁勋谈到,由于Agentic AI及推理的出现,如今所需的计算量比一年前的预期至少高出100倍。AI的计算需求及其扩展定律其实更具韧性,甚至加速。
由此可以预见,AI所生成的token数量会急剧增多。黄仁勋表示,AI的底层技术本质仍是根据上一个token来预测下一个token。不同的是,现在“下一个token”对应的是推理的某个步骤——AI生成第一步的token,然后把这一步的输出再次输入给AI,用来生成后续推理。这样一来,AI不再只是一字一句地往外“吐”token,而是生成一大段文字来表示推理的步骤,最终产生的token量会大大增加。
“如果我们想让模型具备交互性、实时性,不因它‘思考’太久而让人失去耐心,就要把计算速度提高10倍。”黄仁勋表示,伴随着token、速度双双增加,推理所需的算力远超以往。
与今年2月业绩会上的表述一致,黄仁勋对英伟达未来业务增长表示乐观。演讲中,黄仁勋提到推理与强化学习的需求推动AI计算的需求,并用Hopper在四大CSP(云服务提供商)中的出货量来解读AI基础设施的激增,他预计数据中心建设将会达到万亿美元规模。
公布芯片架构路线图,开启AI推理新纪元
本次主题演讲中,黄仁勋宣告了新产品发布,预告了接下来两代AI芯片架构进展,并公布了英伟达接下来的芯片路线图。
黄仁勋表示,英伟达将推出新品Blackwell Ultra芯片,在今年下半年出货。下一次芯片升级则是在2026年下半年,预计将推出下一代AI芯片架构“Rubin”,该架构以“证实暗物质存在”的女性科学先驱Vera Rubin来命名,而Rubin Ultra将于2027年下半年推出。
据介绍,英伟达将于今年下半年推出的新品Blackwell Ultra基于公司一年前推出的Blackwell架构,包含GB300 NVL72机架级解决方案和NVIDIA HGX B300 NVL16系统,预计将比前代产品GB200 NVL72提供1.5倍的AI性能,而与使用NVIDIA Hopper构建的工厂相比,Blackwell的AI工厂收入机会增加了50倍。
据介绍,GB300 NVL72机架级解决方案集成了72个Blackwell Ultra GPU和36个基于Arm Neoverse架构的NVIDIA Grace CPU,形成一个庞大的单体GPU,专为测试时的扩展推理而打造。通过GB300 NVL72,AI模型可以利用平台增强的算力,探索不同的解决方案,并将复杂请求拆解为多个步骤,从而实现更高质量的响应。
将在2026年下半年问世的英伟达下一代架构Rubin则是一个全新架构,“只保留现有的机箱和底层基础设施。”黄仁勋表示,Rubin和定制CPU Vera 对标现在的Blackwell和Grace CPU。据介绍,Vera Rubin由Rubin GPU和Vera CPU组成,后者拥有88个定制Arm核心、176个线程。而Rubin Ultra系统由Rubin Ultra GPU和Vera CPU组成。Rubin Ultra由4块掩模尺寸的GPU组成,FP4峰值推理能力可达100PFLOPS。
同时,黄仁勋还在大会现场展示了两个机架级解决方案——Vera Rubin NVL144和Rubin Ultra NVL576。Vera Rubin NVL144的FP4推理算力可达到3.6EFLOPS,FP8训练算力可达到1.2EFLOPS,是新发布的GB300 NVL72的3.3倍。Rubin Ultra NVL576的FP4峰值推理算力高达15EFLOPS,FP8训练算力达到5EFLOPS,是GB300 NVL72的14倍。
同时黄仁勋还公布了英伟达接下来的芯片路线图,在Rubin之后的下一代芯片的架构已经被命名为Feynman,将于2028年问世,该架构以著名理论物理学家Richard Feynman命名。
在介绍完英伟达完整路线图后,黄仁勋表示,英伟达的节奏是“一年一次”,每年都会带来一次新架构,每两年一次大的产品线迭代,每次都实现数量级提升,“我们会分步承担硅片、网络、机箱等方面的风险,从而推动整个行业不断前进,朝着这些不可思议的技术迈进。”
机器人、自动驾驶……AI迈进千行百业
除了公布芯片架构路线图,黄仁勋还在演讲中发布了多项产品,并公布多个合作伙伴。他表示,AI将会进入各行各业,涉及机器人、自动驾驶汽车、工厂和无线网络领域。
在汽车领域,黄仁勋表示,英伟达与汽车行业的合作方式十分灵活,面向车企需求,提供三种计算机:训练计算机、仿真计算机、自动驾驶计算机,以及基于其的整套软件栈、模型和算法。
同时,黄仁勋还宣布了英伟达与通用汽车在自动驾驶领域的合作。通用汽车将利用英伟达的平台构建人工智能系统,为工厂规划训练人工智能制造模型;并使用英伟达的人工智能芯片和软件开发未来的自动驾驶技术。此外,英伟达推出用于自动驾驶汽车的综合安全系统Halos,涵盖芯片和软件、工具等。
在机器人领域,黄仁勋宣布推出全球首款开源人形机器人功能模型GR00T N1,并发布了Simulation Frameworks,用于加速机器人开发。此外,黄仁勋透露,英伟达、谷歌DeepMind和迪士尼合作开发了一个用于机器人模拟的Newton开源物理引擎。
“现在已经是机器人时代了,机器人能与物理世界交互,执行纯数字世界无法实现的工作。”黄仁勋进一步表示,到21世纪20年代末,全球至少有5000万劳动力短缺,物理AI和机器人正在飞速发展,可能会成为规模最大的产业。
智通财经
2025-03-20
智通财经
2025-03-20
智通财经
2025-03-20
智通财经
2025-03-19
智通财经
2025-03-19
子弹财经
2025-03-19
证券之星资讯
2025-03-19
证券之星资讯
2025-03-19
证券之星资讯
2025-03-19