|

财经

AI存储,再度爆火

来源:半导体行业观察

2025-10-02 09:18:55

(原标题:AI存储,再度爆火)

过去几年,AI 的飞速发展让算力成为全球争夺的核心,但很多人忽视了一个同样至关重要的环节——存储。没有存储的支撑,算力就像没有燃料的引擎,再强大也难以释放全部潜能。尤其是在大模型和生成式 AI 的浪潮下,数据体量和推理场景不断膨胀,存储的需求也随之水涨船高。

在这个关键节点上,三种存储技术正在重新定义AI基础设施的未来格局。HBM(高带宽内存)作为当前高端AI芯片的标配,已经从技术概念走向大规模商用,成为决定AI算力上限的关键因素;HBF(高带宽闪存)则试图突破DRAM的容量限制,为超大规模模型提供全新的存储路径;而GDDR7的崛起,更是在成本与性能之间找到了巧妙的平衡点,为AI推理的普及化铺平道路。

这三种技术路线的竞合演进,不仅关乎存储产业数千亿美元的市场格局,更决定着人工智能能否真正突破当前的技术天花板,迈向通用人工智能的新纪元。



HBM:高带宽的王者之战



步入“后AI”时代,HBM已不仅仅是高性能AI芯片的标配组件,更演变为存储行业激烈角逐的战略制高点。这种通过3D堆叠技术实现的超高带宽存储,已经成为决定AI芯片性能上限的关键因素。从H100的80GB容量、3.4TB/s带宽,到GB300的288GB容量、8.0TB/s带宽,不到三年时间里,HBM实现了容量超过两倍、带宽约2.5倍的惊人提升。

当前的市场格局呈现出明显的分化态势。SK海力士凭借技术和市场的双重优势,稳居霸主地位。据最新报道,SK海力士和美光已进入第六代高带宽存储器(HBM4)的最终测试阶段,计划本月向英伟达供应样品。特别值得关注的是,SK海力士在质量测试方面遥遥领先,目前已宣布完成下一代HBM4内存开发,并已具备全球首个大规模量产条件

相比之下,三星电子的处境略显尴尬。尽管在HBM4性能方面颇有信心——采用4纳米代工工艺应用于逻辑芯片,相比SK海力士的台积电12纳米工艺和美光的12纳米级DRAM工艺更为先进——但在向英伟达供应HBM方面屡遭挫折,测试进度也落后竞争对手约两个月。这种时间差距在快速迭代的AI市场中可能造成致命影响。

另外,一个引人注目的新趋势是HBM的定制化发展。早在两年前HBM初露锋芒之际,这一趋势就已初现端倪。随着云巨头纷纷推出自研AI芯片——从谷歌的TPU到亚马逊的Trainium,从微软与OpenAI的合作到Meta的自研芯片——对HBM的个性化需求成为必然。

SK海力士副总裁柳成洙去年8月透露:“所有M7(Magnificent 7)公司都来找我们,要求定制HBM。”今年6月,韩国媒体报道SK海力士已同时锁定英伟达、微软、博通等重量级客户,开始根据各家公司的需求开展设计工作。从第七代HBM(HBM4E)开始,SK海力士将全面转向定制化路线,并与台积电展开深度合作。

定制化HBM(cHBM)的核心在于将基础芯片功能集成进由SoC团队设计的逻辑芯片中。这种集成赋予设计人员更大的灵活性和对HBM核心芯片堆栈访问的控制能力,可以更紧密地集成内存与处理器芯片,并根据具体应用在功耗、性能与面积之间进行优化。这种定制化能力对于追求极致性能和能效比的AI应用来说,具有不可替代的价值。

面对在HBM市场的落后局面,三星电子正在发起一场“背水一战”。在董事长李在镕的直接支持下,三星副董事长全永铉正为HBM业务投入全部精力。据业内人士透露,三星正在量产HBM4样品,产量约为10,000片晶圆——这对于样品生产而言是异常高的数量。

这种“过度生产”策略背后有其深层考量。三星的HBM4采用了尚未完全成熟的10nm级第六代(1c)DRAM,而竞争对手仍在使用已商业化的第五代(1b)DRAM。尽管面临良率挑战,三星仍利用其卓越的EUV工艺和压倒性产能优势,抢先采用下一代DRAM技术。

更激进的是三星的定价策略。业内估计12层HBM4的价格将比HBM3E高出60-70%,SK海力士寻求至少30-40%的单价溢价,而三星正考虑低于20%的溢价,几乎没有留下利润空间。这种近乎"自杀式"的定价策略,令人想起三星过去在内存市场低迷时期通过“胆小鬼博弈”击败日本和台湾竞争对手的历史。

与此同时,三星正加速建设平泽第五工厂,该工厂将配备10纳米第六代(1c)DRAM生产线,专门用于批量生产HBM4所需的DRAM。这一举措显示出三星试图通过产能优势和成本控制重夺存储霸主地位的决心。



HBF:NAND 闪存的新冒险



随着AI基础设施对存储需求的指数级增长,传统存储的局限性日益凸显。高带宽闪存(HBF)作为一种全新的技术路径,正试图在带宽与容量之间找到新的平衡点。与用DRAM层叠而成的HBM不同,HBF是将NAND闪存层叠而成的产品,利用NAND闪存的特性实现更大的存储容量。

今年2月,美国闪存企业Sandisk率先宣布正在开发HBF技术,将其定位为"结合3D NAND容量和HBM带宽"的创新产品。Sandisk强调,HBF能够同时满足带宽、容量、低功耗的综合要求,这对于需要处理海量数据的AI应用来说具有特殊意义。

这一技术路线的提出并非偶然。当前AI模型正在向多模态、长上下文方向发展——GPT-4V的视觉理解、Claude的100K token上下文、Gemini的多模态能力——这些应用需要在内存中维护庞大的中间状态数据。传统DRAM虽然速度快,但容量扩展成本极高;而NAND闪存虽然容量大,但访问速度相对较慢。HBF试图通过架构创新,在两者之间找到最优解。

今年8月,Sandisk与SK海力士签订了开发HBF的谅解备忘录(MOU),标志着这项技术从概念走向产业化的重要一步。根据计划,Sandisk将于明年下半年向客户提供HBF样本,并于2027年初为推理AI提供正式产品。这一消息直接推动Sandisk股价从43美元飙升至86美元,翻了一番,反映出市场对这项技术的强烈期待。

然而,HBF的技术实现仍面临诸多挑战。半导体业内人士指出,将SSD直接连接到处理器的技术长期以来一直在研究,但实际应用中困难重重。最大的问题在于内存与存储角色的根本性差异——CPU等处理器为了快速运算需要极快的数据访问,而NAND闪存的访问速度远低于DRAM。如果CPU将基于NAND的存储当作主存使用,运算速度必然大幅下降。

值得一提的是,英伟达与IBM及多所大学合作开发的BaM(Big Accelerator Memory)技术,通过新一代NVMe协议实现了SSD与GPU的直接连接,为HBF的实际应用提供了技术参考。这种架构能够显著降低数据搬运的能耗成本——在现有架构中,数据需要经过"SSD→NAND闪存控制器→DRAM→处理器"的复杂链路,每一步都会产生额外的功耗和延迟。

据了解,业内普遍认为,HBF和HBM并非竞争关系,而是作为补充来发挥作用。韩国科学技术院教授郑明秀指出,HBF处理的块存储单元较大,需要能够一次性处理和传输大规模信息的软件和基础设施支持。这意味着HBF更适合特定的应用场景。

未来AI将迎来超越文本或图像、制作长视频的时代。在这种需要超大容量的场景下,虽然比DRAM慢但容量优势明显的NAND闪存将发挥关键作用。例如,视频生成模型Sora需要处理数TB的中间数据,传统HBM的容量限制使其难以胜任;而HBF通过牺牲部分带宽换取更大容量,恰好满足了这类应用的需求。

此外,HBF在成本控制方面也具有潜在优势。NAND闪存的每GB成本远低于DRAM,这使得HBF在需要大容量但对带宽要求相对宽松的应用场景中具有明显的经济性。随着AI应用的多样化发展,这种差异化的存储解决方案将找到越来越多的用武之地。



GDDR7:推理架构的“降配”与新机遇



今年9月10日,英伟达推出Rubin CPX GPU,这款专为长上下文AI工作负载设计的处理器做出了一个引人注目的选择:采用128GB GDDR7显存,而非更高端的HBM4。这一决定背后,体现了英伟达对AI推理架构的全新思考。

英伟达提出了“解耦推理”(disaggregated inference)的创新理念,将推理过程拆分为两个阶段:计算型GPU负责处理庞大的“上下文阶段”,高带宽GPU则专注于"生成阶段"的吞吐量密集计算。在这种架构下,Rubin CPX主要承担上下文构建任务,此时GDDR7的带宽和延迟已完全足够;而在生成阶段,工作会交由配备HBM4的标准Rubin GPU执行。

这种设计的精妙之处在于避免了资源浪费。分析显示,在计算密集型的预填充阶段,由于并行度高,KV Cache的生成对带宽依赖有限,HBM的额外带宽并未被充分利用;只有在解码阶段,HBM的高带宽价值才真正释放。考虑到HBM在加速器BOM中已成为最昂贵的单一组件——从Hopper到Blackwell,其成本占比不断攀升——合理配置不同类型的存储成为优化成本的关键。

GDDR7需求的激增,也对存储供应链造成了更大的影响。英伟达最初为RTX Pro 6000下达的大量GDDR7订单,主要由三星承接。凭借灵活的产能调配能力,三星成功满足了这些突发需求,而SK海力士和美光的晶圆产能则更多被锁定在利润更高的HBM订单上。

近期,英伟达要求三星将GDDR7产量翻倍,三星不仅扩大了生产设施,还增加了必要的材料与组件。据业内人士透露,所有量产准备工作已基本完成,预计本月就能启动扩产后的供应链。这种快速响应能力使三星在图形DRAM市场占据了有利位置。

更值得关注的是,英伟达正准备推出代号“B40”的新产品,将搭载三星GDDR7并针对中国市场销售。该产品通过降低数据处理能力来规避出口限制,预计今年出货量可能达到100万片,仅GDDR7基板需求就高达约2000亿韩元。摩根士丹利分析指出,若地缘政治不确定性持续,B40的市场潜力将进一步释放。

GDDR7的采用不仅是成本优化的选择,更可能成为AI推理普及化的重要推手。通过大幅降低显存在系统总成本中的比重,GDDR7使得更多企业能够负担得起AI推理基础设施。这种成本下降带来的连锁反应不容小觑。

当token成本显著下降,用户对推理的需求会随之激增。就像许多降低成本的技术创新一样,需求增长往往远远抵消成本下降的影响,最终推动整个市场规模的持续扩大。这意味着,虽然单个系统使用了成本更低的GDDR7,但整体市场对高端HBM的需求反而可能因为应用普及而进一步增长。

此外,GDDR7在特定应用场景中展现出独特优势。对于那些需要大量并行处理但对单一任务带宽要求不高的应用——如批量图像处理、自然语言理解的预处理阶段——GDDR7提供了近乎完美的性价比。随着AI应用场景的不断细分,这种差异化的存储方案将找到更广阔的市场空间。



把握AI存储机遇,尽在湾芯展2025



2025年湾区半导体产业生态博览会(简称“湾芯展”)将于10月15—17日在深圳会展中心(福田)盛大开幕。作为中国半导体产业的年度盛会,本届展会规模扩容50%,展示面积突破60,000平方米,汇聚600+全球头部企业,预计吸引60,000名专业观众,共同见证全球半导体创新成果与无限商机。

在AI加速进入“存储为王”的时代,湾芯展将重点展示HBM、HBF、GDDR7等前沿存储技术及其在AI算力中心、智能汽车、超算平台中的应用突破。无论是高带宽存储推动AI大模型推理,还是新一代高速接口助力数据中心提效,都将在这里得到最直观的呈现。同时,来自国内外的存储巨头与创新企业将带来最新产品与解决方案,为产业上下游创造深度合作契机。

区别于传统展会,2025湾芯展首创“项目采购展”模式和全年服务体系,贯穿展前精准匹配、展中高效对接、展后持续跟进,切实推动百亿级产业合作落地。作为连接全球半导体生态的重要桥梁,湾芯展将助力中国半导体实现从“跟跑”到“领跑”的跨越,成为企业开拓市场、拓展合作的首选平台。

半导体行业观察&湾芯展

边缘AI赋能硬件未来创新论坛

2025.10.15

深圳会展中心(福田)

9:00-9:50

观众签到入场

9:50-10:00

开幕致辞

深芯盟

执行秘书长 张建

10:00-10:20

面向个人智能体的端侧大模型芯片

深港微电子学院

副院长 余浩教授

10:20-10:40

释放端侧AI潜力,NPU助力开启硬件创新“芯”时代

安谋科技 Arm China

产品总监 鲍敏祺

10:40-11:00

打造智算时代的新质生产力

深圳云天励飞技术股份有限公司

副总裁 罗忆

11:00-11:20

AI赋能,扬帆出海

中国联通

总监 杨程

11:20-11:40

海外云计算与AI应用的made in china情怀

浪潮云

高级战略总监 张晟彬

11:40-12:00

创新 RISC-V 架构——铸建新一代智算未来

阿里巴巴达摩院(杭州)科技有限公司

商务拓展负责任人 李珏

12:00-13:30

午休&抽奖

13:30-13:50

中国电信国际公司大湾区市场洞察

中国电信

信息科技客户部总经理 张黎明

13:50-14:10

AI新时代下的“通推一体”处理器

知合计算技术(上海)有限公司

首席科学家 苏中

14:10-14:30

大模型部署的规模化实践

魔形智能科技(上海)有限公司

创始人 金琛

14:30-14:50

光计算系统重构智算基建新范式

光本位智能科技(上海)有限公司

产品与市场副总裁 姚金鑫

14:50-15:10

联想凌拓半导体行业高效存储解决方案

联想凌拓科技有限公司

半导体部总经理 余晓丹

15:10-15:30

预见未来:大模型+工程智能赋能半导体未来工厂“制造革命”

深圳智现未来工业软件有限公司

副总裁 朱军

15:30-15:50

AI芯片测试技术发展与挑战

工业和信息化部电子第五研究所

副主任 王之哲

15:50-16:20

圆桌&抽奖

**最终议程以现场为主

扫描下方二维码即可报名

结语:存储技术的协同演进

AI存储的"再度爆火"并非单一技术的胜利,而是多种技术路线协同演进的结果。HBM继续在高端训练和推理领域保持不可替代的地位,其不断提升的带宽和容量仍是突破AI性能天花板的关键;HBF作为新兴技术,虽然商业化进程仍需时日,但其在超大容量应用场景的潜力不容忽视;GDDR7则通过精准的市场定位,在成本敏感但性能要求适中的领域找到了自己的生态位。

这三种技术的竞合关系,反映出AI产业对存储需求的多样化和精细化。没有一种技术能够包打天下,但每种技术都在特定领域发挥着不可替代的作用。对于存储厂商而言,这意味着必须在多条技术路线上同时布局,既要在HBM的高端市场保持竞争力,也要在GDDR7的规模市场占据份额,还要为HBF等前瞻技术储备研发能力。

展望未来,随着AI应用从实验室走向千行百业,存储技术的创新将继续加速。无论是追求极致性能的科研机构,还是注重成本效益的企业用户,都将在这个百花齐放的存储技术生态中找到适合自己的解决方案。而这种多元化的技术演进,正是推动AI产业持续突破、走向更广阔未来的坚实基础。

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4182期内容,欢迎关注。

加星标第一时间看推送,小号防走丢

求推荐

半导体行业观察

2025-10-02

半导体行业观察

2025-10-02

半导体行业观察

2025-10-02

半导体行业观察

2025-10-02

半导体行业观察

2025-10-02

半导体行业观察

2025-10-02

证券之星资讯

2025-09-30

首页 股票 财经 基金 导航