|

股票

CES 2026:英伟达六大芯片协同升级,算力+存力迈入新纪元

来源:信达证券

2026-01-12 09:29:00

(以下内容从信达证券《CES 2026:英伟达六大芯片协同升级,算力+存力迈入新纪元》研报附件原文摘录)
本期内容提要:
Vera Rubin:六大芯片协同升级,推理性能大幅提升。美国拉斯维加斯时间1月5日,英伟达创始人兼CEO黄仁勋在国际消费电子展CES2026上发表主题演讲,并正式发布Rubin平台。该平台由六款专为打造超凡AI超级计算机而设计的全新芯片组成,包括Vera CPU、Rubin GPU、NVLink6交换机、ConnectX-9SuperNIC、BlueField-4DPU和NVIDIA Spectrum-6以太网交换机,6款芯片协同设计,从而大幅缩短训练时间并降低推理token成本。(1)算力方面,Rubin GPU引入Transformer引擎,NVFP4推理性能高达50PFLOPS,是Blackwell GPU的5倍,向后兼容,在保持推理精度的同时提升BF16/FP4级别的性能;NVFP4训练性能达到35PFLOPS,是Blackwell的3.5倍。(2)存储方面,针对大量KV Cache问题,Rubin平台引入了由BlueField-4驱动的NVIDIA推理上下文内存存储,构建了一个AI原生的基础设施层,用于存储KV Cache,通过扩展GPU内存容量为上下文记忆提供基础设施。(3)PCB方面,从Cable Tray到Cableless互联,Rubin NVL72PCB价值量显著提升,这种机械简化使得组装速度比上一代托盘架构快18倍,并且显著缩短了现场维护期间的服务时间,降低了部署时间和持续的运营成本。(4)Rack方面,系统协同设计显著提升,ODM环节核心受益。由于在6款芯片、托盘、机架、Pod、数据中心与软件层面实现了极致协同设计,Rubin平台在训练与推理成本上实现了大幅下降。
开源模型:从数据到代码全覆盖,Nemotron3重构Agentic AI范式。本次CES上,黄仁勋宣布扩展其开源模型生态(Open ModelUniverse),新增和更新了一系列模型、数据集、代码库和工具。这个生态覆盖六大领域:生物医学AI(Clara)、AI物理模拟(Earth-2)、Agentic AI(Nemotron)、物理AI(Cosmos)、机器人(GR00T)和自动驾驶(Alpamayo)。Nemotron系列是此次更新的重点,覆盖了推理、RAG、安全和语音四个应用方向。
物理AI:从Cosmos到Alpamayo,走向商业化落地。在物理AI领域,英伟达更新了用于理解和生成物理世界视频的Cosmos,机器人通用基础模型Isaac GR00T、自动驾驶视觉-语言-行动模型Alpamayo。Cosmos是一个开源的物理AI世界基础模型,目前已经用海量视频、真实驾驶与机器人数据,以及3D模拟做过预训练。Alpamayo是一个面向自动驾驶领域的开源工具链,也是首个开源的视觉-语言-行动(VLA)推理模型。
投资建议:英伟达Rubin平台正式发布开启AI算力新纪元,全球算力设施向“AI工厂”范式全面转型。我们认为,Rubin通过协同设计实现性能飞跃,算力、存储、PCB、机架等多环节价值量或显著提升,产业链核心环节在基建投资化趋势下仍具备较大的成长空间,建议关注:【海外AI】工业富联/沪电股份/鹏鼎控股/胜宏科技/生益科技/生益电子等;【国产AI】寒武纪/芯原股份/海光信息/中芯国际/深南电路等;【存储】德明利/江波龙/兆易创新/聚辰股份/普冉股份等;【SoC】瑞芯微/乐鑫科技/恒玄科技/晶晨股份/中科蓝讯等。
风险提示:AI发展进程不及预期,下游需求发展不及预期。





fund

证券之星资讯

2026-01-12

首页 股票 财经 基金 导航