来源:智通财经
2026-03-19 11:45:50
(原标题:广发证券:英伟达(NVDA.US)新平台加强Agent应用竞争力 AI推理驱动存储周期持续向上)
智通财经APP获悉,广发证券发布研报称,英伟达(NVDA.US)在GTC展示Vera RubinPOD,此次重点加强针对Agent应用在集群化算力和推理算力产品线的竞争力。AI的进击时刻,模型创新与CAPEX筑基,AI产业链协同发展;AI推理驱动存储周期持续向上,扩产与升级同发力。建议关注产业链核心受益标的。
广发证券主要观点如下:
英伟达发布Vera Rubin POD平台
根据英伟达官网,2026年3月16日,英伟达在GTC展示Vera RubinPOD,包括5个专为Agentic AI工作负载打造的全新机架级系统。由于Agentic工作负载对高吞吐量、极低延迟的推理、密集的CPU沙箱和庞大的上下文内存存储提出更高要求,英伟达此次重点加强针对Agent应用在集群化算力和推理算力产品线的竞争力。Vera Rubin POD主要分为两种机架:(1)MGXNVL机架:即VeraRubin NVL72,机架内部通过NVLink互连,承担核心GPU计算任务;(2)MGXETL机架:包括Groq3 LPX机架、Vera CPU机架、BlueField-4 STX存储机架和Spectrum-6 SPX网络机架,这些机架均通过SpectrumX以太网或Groq3 LPU的芯片直接互连进行协同。按照官网示意图测算,一个Vera Rubin 1152 SuperPOD由16个Vera Rubin NVL72机架、2个Vera CPU机架、10个Groq 3 LPX机架、2个BlueField-4 STX存储机架以及10个Spectrum-6 SPX网络机架组成,体现其围绕Agentic AI所构建的异构协同系统架构。
Groq3 LPX机架用于加速decoding。
Groq3 LPX机架集成256个LPU处理器,配备128 GB片上SRAM和640TB/s的带宽。在Vera Rubin NVL72与LPX的组合架构中,GPU主要负责Prefill以及Decode阶段中的Attention计算,LPU则负责加速Decode阶段的FFN计算,对每层每个输出token的解码过程进行加速,并通过定制化Spectrum-X互连与Vera Rubin机架协同。根据英伟达官网披露,在每用户400 TPS的条件下,Vera Rubin NVL72与LPX的组合相比NVIDIAGB200 NVL72,每兆瓦可实现高达35倍的TPS提升,在提升系统整体产出的同时,也更适配低时延、强交互的Agent应用场景。
Vera CPU机架承担RL/Agent沙箱环境支撑
Vera CPU机架集成256个Vera CPU,采用高密度液冷设计,单个机架可支持超过22500个并发强化学习(RL)或代理沙箱环境,用于对Vera Rubin NVL72与LPX输出结果进行测试、执行与验证。
风险提示
AI产业发展以及需求不及预期;AI服务器出货量不及预期,国产厂商技术和产品进展不及预期。
智通财经
2026-03-19
智通财经
2026-03-19
智通财经
2026-03-19
智通财经
2026-03-19
智通财经
2026-03-19
智通财经
2026-03-19
证券之星资讯
2026-03-19
证券之星资讯
2026-03-19
证券之星资讯
2026-03-19