|

财经

AMD首颗客户端APU:Strix Halo详解

来源:半导体行业观察

2025-10-21 08:52:54

(原标题:AMD首颗客户端APU:Strix Halo详解)

公众号记得加星标,第一时间看推送不会错过。

来 源: 内容 编译自 chipsandcheese 。

今天,我们来聊聊 AMD 迄今为止最大的客户端 APU——Strix Halo。这款 APU 旨在打造真正的一体化移动处理器,能够毫不妥协地处理高端 CPU 和 GPU 工作负载。其 TDP 范围为 55W 至 120W,与标准 Strix Point 相比,其功耗目标更高,但无需独立显卡。

为了让大家了解这款 APU 的历史和规格,AMD 在今年早些时候的 CES 2025 上首次发布了 Strix Halo,引起了广泛关注。Strix Halo 是 AMD 在消费市场上推出的首款 Chiplet APU,AMD 将其用作一个展示品,展示了在足够强大的 APU 下,CPU 和 GPU 的性能表现。


AMD 的 Strix Halo 可配备双 8 核 Zen 5 核心处理器 (CCD),总计 16 个核心,并具有与桌面版相同的 512b FPU。这与更主流、单片化的 Strix Point APU 有所不同,后者具有与 Zen 4 类似的“双泵”256b FPU,用于 AVX512 代码。与更主流的 Strix Point 相似的是,其最大睿频频率均为 5.1GHz,但与桌面版旗舰 Zen 5 CPU Ryzen 9 9950X 相比,频率低了 600MHz。

转到 Strix Halo 封装上的第三个芯片,RDNA 3.5 iGPU 占据了 SoC 芯片的大部分空间,具有 40 个计算单元、32MB 的 Infinity Cache 和高达 2.9GHz 的升压时钟,将原始计算能力置于 RX 7600 XT 和 RX 7700 之间。

为了给这款芯片供电,AMD 为 Strix Halo 配备了 256b LPDDR5X-8000 内存总线,所有组件共享最高 256GB/s 的传输速度。这略低于 RX 7600 XT 的 288GB/s,但远高于我们测试过的任何其他 APU。

从 CPU 角度看内存子系统

从 Zen 5 的内存延迟来看,我们发现 Strix Point 和 Strix Halo 之间的延迟差异可以忽略不计,Strix Point 的内存延迟约为 128 纳秒,而 Strix Halo 的内存延迟约为 123 纳秒。然而,正如您所见,CPU 无法访问 IO 芯片上的 32MB Infinity Cache。Mahesh Subramony在 CES 2025 上接受我们关于 Strix Halo 的采访时证实了这一点。


虽然这里看到的 123ns DRAM 延迟对于移动部件来说相当不错,但像我们的 9950X 这样的台式机处理器在 75-80ns 时的表现要好得多。

继续讨论内存带宽,我们发现 Strix Halo 在我们测试过的 SoC 中属于一个独特的类别。


当在两个 CCD 上执行读取-修改-添加操作时,16 个 Zen 5 核心可以从内存中提取超过 175GB/s 的带宽,并且在两个 CCD 上读取速度均达到 124GB/s。

然而,从单个 CCD 的带宽来看,与台式机 CPU 一样,单个 Strix-Halo CCD 到 IO 芯片的读取链路速度仅为每周期 32 字节。与台式机芯片一样,芯片间链路的运行频率约为 2000MHz,这使得单个 CCD 的读取速度上限为 64GB/s。与台式机芯片不同的是,写入链路速度为每周期 32 字节,我们看到的写入带宽约为 43GB/s。这使得单个 CCD 的理论总带宽达到 128GB/s,实际观察到的带宽略高于 103GB/s。

CPU 的性能

Strix Halo 的 CPU 性能比 Strix Point 的 CPU 强大得多。


Strix Halo 的 CPU 在整数运算性能上可与上一代桌面旗舰 CPU 7950X 匹敌,尽管主频相差 11.7%。在浮点运算性能上,它几乎与 AMD 目前的桌面旗舰 CPU 9950X 匹敌,尽管主频相差 11.7%。


查看 SPEC CPU 2017 Integer 子测试,虽然 Strix Halo 无法与台式机 9950X 完全匹敌,这可能是因为 Strix Halo 的 LPDDR5X 总线的内存延迟较高,但它在许多子测试中确实很接近。


转到 FP 子测试,情况与 Integer 子测试类似,但 Strix Halo 可以更接近 9950X,甚至在 fotonik3d 子测试中击败它。

从 GPU 角度看内存

说到 GPU 方面,Strix Halo 的亮点就在于此。我们用来与 Strix Halo 对比的笔记本电脑是 HP Omen Transcend 14 2025,它搭载了 5070M 处理器,GPU 的最大功耗约为 75 瓦。


Strix Halo 的内存带宽是我们测试过的其他移动 SoC 的两倍多。不过,RTX 5070 移动版的内存带宽比 Strix Halo 高出约 50%。


看看 Strix Halo 的缓存,Infinity Cache(又名 MALL)能够提供比 5070M 的 L2 高 40% 以上的带宽,同时容量也增加了 33%。此外,Strix Halo 拥有 4MB 的 L2,能够为 GPU 提供 2.5TB/s 的带宽。


说到延迟,Strix Halo 更复杂的缓存布局确实使其在 128KB 之后具有延迟优势,Strix Halo 的 L2 延迟明显低于 5070M 的 L2,而在更大的 32MB MALL 之后,Strix Halo 的延迟与 5070M 的 L2 相似。此外,Strix Halo 的内存延迟比 5070M 的内存延迟低约 35%。

GPU 的计算吞吐量


从浮点吞吐量来看,考虑到 Strix Halo 的计算单元数量约为 Strix Point 的 2.5 倍,Strix Halo 的吞吐量大约是 Strix Point 的 2.5 倍,这不足为奇。Strix Halo 的吞吐量通常可以匹敌甚至超越 5070 Mobile。需要注意的是,5070 Mobile 的 FP16 结果只有我预期的一半;5070 Mobile 的 FP16:FP32 比率应该是 1:1,所以我不确定那里发生了什么。


转向整数吞吐量,我们看到 5070 Mobile 稳居 Radeon 8060S 之列。

GPU 性能

从 GPU 性能来看,Strix Halo 再次闪耀,凭借其庞大的计算单元 (CU) 数量和相对较高的显存带宽,iGPU 的性能达到了惊人的水平。我们的对比套件包含几款英特尔/AMD 的最新 iGPU,以及最新一代 RTX 5070 Mobile @ 75W(作为中高端笔记本电脑专用显卡的参考)和老款 GTX 1050(作为低端专用显卡的参考)。


在 Fluid X3D 的计算密集型工作负载测试中,我们可以看到 Radeon 8060S 的表现完全碾压了英特尔/AMD 的其他 iGPU,稳居榜首。不过,5070 的表现也不逊色,仍然保持着 64.1% 的领先优势,这主要得益于 5070M 更高的内存带宽。


切换到《赛博朋克 2077》的游戏工作负载,我们首先在电池供电的情况下进行了基准测试。与其他核显的差距仍然很大,但现在 5070M 的功耗被限制在 55W,并且在 1080p 低设置下的性能比 Radeon 8060S 低 7.5%


最后,切换到壁式电源模式,让 Radeon 8060S 和 5070M 在 CP2077 中同时达到最大功率限制,我们可以看到 8060S 在 1080p 低分辨率下仍然领先 2.5%,而在 1440p 中等分辨率下则出现了逆转,5070M 领先 8.3%。总体而言,这两款显卡在《赛博朋克 2077》中的体验相当,只是设置或功率限制的变化会调整两者之间的差距。对于一款与独立显卡竞争的 iGPU 来说,这是一个令人印象深刻的转变,也展现了该芯片在游戏等工作负载下的多功能性,而这些工作负载是 iGPU 一直以来难以胜任的。

结论

Strix Halo 追随众多其他公司的脚步,致力于设计一款真正适用于台式机和笔记本电脑的全能型 SoC。其 CPU 和 GPU 性能远超标准低功耗笔记本电脑芯片,甚至能够与配备独立显卡的大型系统相媲美。CPU 性能尤其令人印象深刻,堪比桌面 Zen 5 CPU。GPU 性能堪比中端独立显卡,同时仍提供 iGPU 的效率和集成度。高端独立显卡仍然比 Strix Halo 更胜一筹,但这种设计在小型设备上的多功能性更是领先同级。

然而,这并不意味着 Strix Halo 是完美的。我原本希望在本文中专门讨论 Strix Halo 的机器学习性能,但 AMD 才刚刚在 ROCm 7.0.2 版本中发布了对 Strix Halo 的预览支持,该版本距本文发布大约一周。由于 Strix Halo 的发布和 ROCm 7.0.2 的发布之间间隔很长,机器学习性能的介绍只能等到以后的文章中再说了。

然而,抛开 ROCm 不谈,Strix Halo 本身就是一项非常非常酷的技术,我很期待看到 Strix Halo 的后续产品,它们拥有更新的 CPU 和 GPU IP,甚至可能拥有更大的内存总线,类似于苹果 Max 系列和 Ultra 系列 SoC,分别配备 512b 和 1024b 内存。AMD 有一套利用 Strix Halo 打造更大 APU 的方案,这为未来许多有趣的硬件可能性打开了大门。

https://chipsandcheese.com/p/amds-chiplet-apu-an-overview-of-strix

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4201期内容,欢迎关注。

加星标第一时间看推送,小号防走丢

求推荐

半导体行业观察

2025-10-21

半导体行业观察

2025-10-21

半导体行业观察

2025-10-21

半导体行业观察

2025-10-20

半导体行业观察

2025-10-20

首页 股票 财经 基金 导航