(以下内容从东兴证券《超节点行业:从计算托盘角度拆解英伟达VR NVL72,通信速率三重升级,超级网卡价值显著提升》研报附件原文摘录)
投资摘要:
2026年英伟达最新发布的超节点Vera-Rubin NVL72,是全球领先的Scale up网络算力平台。Rubin平台由六款全新芯片组成,包括Vera CPU、Rubin GPU、NVLink6交换机、ConnectX-9SuperNIC、BlueField-4DPU和Spectrum-6以太网络交换机。据英伟达公布的数据,Rubin平台的训练性能达到前代Blackwell的3.5倍,运行AI软件的性能提升5倍。此外,与前一代相比,英伟达Rubin平台在训练MoE模型时所需的GPU数量减少至原来的四分之一,进一步推动人工智能的普及应用。
在VR NVL72中,AI计算任务从外部网络进来,数据经过ConnectX-9、BlueField-4、Vera CPU,再分配到GPU和机架内其他71颗GPU协同完成计算,最后计算结果通过网络传送出去。在计算托盘中,数据传输路径可以分为三段:Vera CPU至Rubin GPU之间通过NVLink C2C高速链路互联;Vera CPU至CX-9之间通过两条PCIe Gen6链路分别连接到两个CX9的PCIe Switch模块;以及CX-9至OSFP之间通过800G以太网/InfiniBand互联。
NVLink-C2C技术重构异构计算的互联范式,在裸片/芯片间互联领域建立巨大的领先优势。在VR200NVL72中,Rubin-Vera之间依托NVLink-C2C(Chip-to-Chip,芯片到芯片互联)实现双向带宽1.8TB/sCPU-GPU互联,延迟纳秒级,相比GB200NVL72的NVLink-C2C的900GB/s,提升一倍。而主流PCleGen5架构双向带宽为128GB/s带宽,非一致性内存访问增加编程复杂性以及计算资源闲置等待。
NVLink-C2C的核心技术原理在于:通过AMBACHI协议实现硬件级缓存一致性,CPU和GPU缓存自动同步;CPU内存与GPU显存在软件视角呈现为单一内存池;对系统范围跨处理器的原子读写无需额外同步原语。
采用PCIe Gen6协议实现Vera CPU与超级网卡CX-9互联。PCIe Gen6是第六代高速外设互联标准,CPU与网卡、存储等外设的通用接口。PCIe6接口支持48条Lane,每条Lane单向速度64Gbps。因此,Vera与CX-9之间接口双向总带宽达到768GB/s。PCIe Gen6信号需要使用高端PCB与玻纤布传输。在VR200NVL72计算托盘中,PCIe Gen6信号从Strata模块传输到Orchid模块前端,PCB距离长达约500mm。为实现信号完整性,VR200NVL72除了升级双向SerDes技术外,还需要升级PCB材料。在材料层面,CCL(覆铜板)从M7升级到M8/M9,主计算板和网络板的铜箔升级到HVLP4,材料价值显著上升;为了降低介质损耗,玻璃纤维布或价值更高的石英材料被用于Orchid板和中置板。
采用以太网/InfiniBand协议实现超级网卡CX-9与OSFP光模块笼口互联。CX-9一项重要升级在于,其在以太网模式下通过单个端口即可提供1x800G的传输能力,无需依赖多链路聚合实现总吞吐量。相比之下,CX-8仅在InfiniBand架构下支持800G速率,但在以太网模式下通常以2x400G的配置呈现。在VRNVL72计算托盘中,8个800G的CX-9网卡对应OSFP笼位的数量有两种方案:一种是每颗GPU配1个1.6T OSFP笼口,则每个计算托盘共4个1.6T OSFP笼口;另一种则是每颗GPU配2个800G OSFP笼口,则每个计算托盘共8个800G OSFP笼口。
ConnectX‑8/9定位超级网卡(SuperNIC),性能远超传统网卡。2025年8月,英伟达正式发布专为Blackwell架构和加速超大规模AI工作负载而设计的ConnectX-8SuperNIC。ConnectX-8SuperNIC单端口800Gb/sInfiniBand(XDR)或双端口400Gb/s Ethernet(Spectrum-X),为上一代ConnectX-7(200Gb/s)的4倍,是当前业界最高带宽网卡。2026年1月,英伟达推出高性能智能网络接口卡ConnectX-9,核心变革在于实现单端口800Gb/s的以太网传输能力。
超级网卡内置PCIe Gen6交换模块,替代传统独立PCIe交换机。ConnectX-8内置48通道PCIe Gen6交换机,单芯片实现“网络接口+GPU间交换”二合一,有助于消除IO瓶颈,并加快GPU、NIC和存储之间的数据移动速度。基于ConnectX-8的优化设计可为集群内的所有GPU间通信提供高达每个GPU50GB/s的IO带宽,因为NCCL直接通过网络转发所有流量。
ConnectX集成Spectrum‑X交换逻辑,构成端到端800G AI网络。SuperNIC内部集成Spectrum‑X风格的交换与加速逻辑”并作为Spectrum‑X以太网平台的终端侧关键组件,与外部Spectrum‑X交换机(如SN5600列)端到端协同。交换机(Spectrum‑X Switch)与终端SuperNIC(ConnectX‑8)协同优化,为AI/超算以太网带来的五大关键性能提升。负载均衡方面,实现1.6X更高有效带宽;尾延迟优化方面,实现1.3X更高集合通信带宽;噪声隔离方面,实现2.2X更高All-reduce带宽;弹性性能方面,实现1.3X更高All-to-all带宽;高频遥测方面,实现1000X更快遥测采集。
投资策略:
自2025年开始,超节点成为AI算力网络重要的技术创新方向。本篇报告从计算托盘角度拆解英伟达VRNVL72,可以看到,英伟达VR NVL72以1.8TB/s NVLink-C2C+PCIe Gen6+800G SuperNIC构建三重高速通信壁垒,其核心竞争力源于芯片级互联、高速总线、超级网卡的全栈技术垄断。当前我国AI算力网络在超高速互联协议、800G SuperNIC、PCIe Gen6交换芯片等领域仍存代差,自主可控需求迫切。建议聚焦高速互联芯片、800G/400G SuperNIC、高端光模块、高速PCB/覆铜板、超节点整机方案五大国产替代主线。
相关公司:
(1)高速网卡:裕太微(688515)、盛科通信(688702);
(2)光模块:中际旭创(300308)、新易盛(300502)、天孚通信(300394)、东山精密(002384)、华工科技(000988)、光迅科技(002281);
(3)高速交换芯片:盛科通信(688702)、紫光股份(000938)、锐捷网络(301165)、中兴通讯(000063);
(4)高速互联芯片:海光信息(688041)、龙芯中科(688047)、长电科技(600584);
(5)高速PCB/覆铜板:胜宏科技(300476)、生益科技(600183)、深南电路(002916)、东材科技(601208);
(6)国产超节点:浪潮信息(000977)、中科曙光(603019)、工业富联(601138)、华勤技术(603296)。
风险提示:(1)技术代差;(2)国产超节点生态割裂;(3)地缘政治风险。