来源:半导体行业观察
2025-09-16 09:42:19
(原标题:苹果新芯片,乏善可陈)
公众号记得加星标,第一时间看推送不会错过。
来源 : 内容编译自morethanmoore 。
本周,苹果发布了其最新一代 iPhone——iPhone 17 系列,并带来了新一代苹果尖端智能手机 SoC:A19 和 A19 Pro。凭借台积电最新的 3nm 制程以及苹果多个功能模块架构的重大升级,苹果一如既往地承诺,其性能将比上一代略有提升。
多年来,智能手机行业以其芯片的高更新率而独树一帜。几乎所有其他行业,从独立CPU到GPU,再到FPGA等等,厂商都以两年(甚至更长时间)的周期,用更新的设计替换其高端芯片。智能手机及其相关移动设备已成为我们唯一仍然每年都能看到芯片发布的领域,尤其是苹果公司,每年九月都会准时发布一款新芯片。而尤其是在过去几年里,这种模式已经转变为推出两款配置略有不同的芯片。
所有这些都进一步凸显了高端SoC领域的竞争和盈利能力,因为每年以这种方式推出多款芯片设计需要投入大量的工程资源。与此同时,这也意味着苹果的工程团队必须年复一年地推出新的改进,无论人们对摩尔定律的看法如何。
A19 制造:又是工艺进步有限的一年
A19 代标志着第三代 A 系列芯片采用台积电 3nm 工艺节点生产。作为台积电历史上最亲密的合作伙伴(以及最富有的买家),苹果公司往往是首家获得台积电最新工艺节点批量生产的芯片设计公司。就 A19 系列而言,苹果公司已确认他们正在使用“最先进的 3nm 技术”,该技术源于 A18 代使用的 N3E 节点,我们将其解读为苹果公司已转向使用性能更高的 N3P 节点。
N3P 主要是 N3E 的光学缩减——源自对台积电扫描工具的调整——在硬件其他方面完全相同的情况下,它能让芯片设计人员将晶体管密度提高约 4%,性能提升 5%,功耗降低 5-10%。与 A18 系列相比,A19 的硬件并不完全相同,但这些仍然是工艺上的改进,苹果可以将其投入到提升最终芯片性能上。
目前,我们还没有这两款芯片的芯片尺寸或晶体管数量,所以我们不太清楚 A19 系列在这些方面与 A18 相比如何。即使换到了稍新的节点,N3 的良率在过去一年中也应该会进一步提高,这为苹果提供了将芯片规模扩大一些的机会。但 A 系列 SoC 的功耗已经基本受限,因此苹果在其他方面仍然受到限制。考虑到它们的缓存和 GPU 架构的变化,我预计 A19 Pro 的芯片尺寸和晶体管数量至少会适度增加,但这还有待证实。同时,与 A19(原始版)相比,任何此类等效增加都应该最终能够使其突破自 A15 以来该系列芯片一直停留在的 150 到 160 亿个晶体管的瓶颈。
A19 CPU:改进的 P 核心、更大的缓存和重大的安全升级
从总体上看,A19 系列的 CPU 架构与 A18 系列,或者说过去几代 A 系列 SoC 非常相似。苹果再次坚持其久经考验的 2+4 配置,将两个性能核心与四个效率核心搭配在一起。这适用于 SoC 的 vanilla 版本和 Pro 版本,因此就原始理论吞吐量而言,两款芯片几乎完全相同。
苹果通常会在产品即将发布,记者收到评测样机时,才会向媒体透露更多有关其架构的信息。因此,我们目前掌握的关于苹果在这一代 CPU 架构上做出的改变的信息非常有限。
对于性能核心,苹果表示他们已经提升了前端带宽。苹果的 CPU 架构已经以其带宽而闻名,因此这听起来像是进一步帮助“野兽”保持运转的改变,但这还有待证实。同时,苹果还对其分支预测单元进行了进一步改进,这一直是 CPU 开发人员关注的重点,因为减少错误的分支预测(从而避免无用的工作)仍然是提高 CPU 性能的可靠方法。
在效率核心方面,苹果尚未概述任何架构改进。
然而,与此同时,他们却罕见地宣称,A19 Pro 的最后一级缓存 (LLC) 容量增加了 50%。由于苹果主题演讲中提到的所有内容都经过了不到六人审核,我假设这里没有错误——也就是说,有人并非有意提及二级缓存——而是苹果选择将有关整个芯片 LLC 的讨论混杂到演讲的这一部分。这样一来,就意味着苹果将 LLC 从 A18 Pro 的 24MB 提升到了 A19 Pro 的 36MB。
LLC 不仅支持 CPU 核心,而且与分支预测器的改进一样,它是一项可以提升 CPU 整体性能的通用改进,因为 LLC 的访问速度比相对较慢的 DRAM 更快。此外,它还带来了一些能效提升(使用 DRAM 的成本较高),不过这在一定程度上被额外的 SRAM 单元供电所抵消。
至于具体的性能声明,苹果并未提供 A19 设备和 A18 设备之间的任何 CPU 峰值性能对比。他们给出的最接近的评价是, iPhone 17 Pro 的持续性能比 iPhone 16 Pro 提升高达 40%,而这很可能更多地依赖于他们对散热系统所做的改进以及对均热板的使用。
除此之外,下一个最接近的比较对象是 iPhone 17 Pro 与 iPhone 15 Pro,苹果声称后者的 CPU 速度最高提升了 20%。与非 Pro 版 iPhone 的比较结果更为有利,因为标准版 iPhone 15 系列使用的是更老的 A16 SoC,因此苹果声称非 Pro 版 iPhone 的 CPU 性能比后者提升了 40%。早期(且粗心的)测试人员提供的未经证实的 Geekbench 数据看起来很不错,但我们必须拭目以待,看看已确认的性能数据如何比较。
最后,除了常见的架构性能改进之外,苹果在这一代 CPU 核心设计上的另一项重大投资在于内存安全性以及抵御基于 CPU 和内存的攻击的能力。这项名为“内存完整性强制”的技术,其全面性远超这篇聚焦硬件的新闻报道,但苹果正在推出多项改进,力求杜绝缓冲区溢出和释放后使用漏洞。
内存完整性强制 (MTE) 是一种多层安全方法,但硬件层面的重大变化是 Apple 终于以 Arm增强型内存标记扩展 (MTE ) 的形式支持内存标记。支持 MTE 的硬件旨在通过标记(锁定)内存区域来规避内存攻击,它会阻止(通常会导致)恶意指针访问它们不应该访问的内存区域,因为访问该内存区域需要密钥。
Arm 多年来一直向其授权厂商提供内存标记功能,并且该功能已在部分生态系统中得到采用。但苹果公司选择等待更新、改进的增强型 MTE 来采用该技术,理由是 MTE 缺乏对未标记内存的保护。
除了实现内存标签之外,苹果的安全博客还概述了该公司如何改进其 CPU 核心内部的管道,以确保 EMTE 标签不会被旁道攻击嗅探。为此,虽然苹果在使用 EMTE 时不会阻止推测执行,但他们对其进行了配置,使其不会以任何方式影响推测执行,从而防止攻击者隔离有效标签。
虽然苹果博客文章的全文内容详尽,很少有消费者会喜欢,但苹果选择在首批支持该技术的SoC发布的同一天发布这篇博客文章,这本身就说明了问题。为开发者提供工具来增强其应用抵御(并有望杜绝)目前iOS上最常见的攻击媒介的能力,对苹果来说意义重大,尤其是在如今大多数国家行为者入侵iPhone时,都是利用基于内存攻击的复杂漏洞。
A19 GPU:Apple10架构具有更快的 FP16 运算和 Tensor 核心
在 GPU 方面,A19 SoC 引入了苹果新一代的 GPU 架构。在苹果开发者文档中,A19 SoC 已被标记为Apple10 ,它带来了一些重要的新增功能,这些功能是苹果自今年 WWDC 大会上宣布Metal 4 API以来一直在向开发者展示的。
从硬件角度来看,A19 和 A19 Pro SoC 的 GPU 配置并没有太大变化。A19 搭载了 5 个 Apple 第十代GPU 核心,而 A19 Pro SoC 则配备了第6 个GPU 核心。这与 A18 系列 SoC 上的 5 个或 6 个 GPU 核心配置相同。
苹果并没有增加更多的 GPU 核心,而是选择通过几种方式来增强其现有的 GPU 核心。
从图形的角度来看,这里最大的变化是FP16性能的提升。苹果声称,与之前的GPU架构相比,他们的FP16性能提高了一倍。假设所有这些都是真的,并且内部工作原理与简单的解释相符,那么听起来苹果似乎已经扭转了Apple7 GPU架构中一个奇怪的变化,该架构相对而言恢复了FP16。
苹果至少早在 A8 SoC(Apple2 GPU 架构)上就一直在推广 FP16 的使用,当时他们增加了对 FP16 寄存器的支持,允许开发者尽可能使用 FP16 数据类型来节省功耗和内存带宽。同时,苹果 SoC 上的 FP16 吞吐量是 FP32 吞吐量的两倍。然而,在 Apple7 架构中,FP32 和 FP16 的性能持平,这意味着虽然使用 FP16 仍然节省了寄存器压力、内存压力和内存带宽,但它并没有直接释放更多的 FLOPS。
随着 Apple10 GPU 架构向 FP16 转型,所有迹象都表明苹果将把 FP16 吞吐量恢复到 FP32 吞吐量的两倍。这是否意味着他们将 FP16 ALU 的数量翻倍,还是现在正在执行打包 FP16 运算(将两个 FP16 运算打包成一个 FP32 ALU),还有待观察。但无论如何,这都会对图形工作负载的性能产生一定的影响。
更模糊的是,Apple10 GPU 架构还集成了 Apple 动态缓存系统的更新版本。需要提醒的是,动态缓存是 Apple 对其动态视频内存分配系统的名称,该系统旨在避免为缓冲区分配超过必要数量的内存。Apple 从未详细说明过该系统的工作原理,但强调它能够提升性能并减少寄存器和内存压力。因此,该系统的进一步迭代可能会带来性能提升,但这还有待观察。
苹果还在 GPU 架构中引入了所谓的“统一图像压缩”,但没有透露更多细节。所有主流 GPU 都已经大量使用图像/缓冲区压缩来节省缓存压力和内存带宽,因此,问题主要在于“统一”在此语境下的含义。据推测,苹果已经做出了进一步的改进,使其 GPU 中的所有单元都能接收压缩缓冲区。
在图形性能方面,苹果提供了一些不同的指标。将原生 A19 与去年的原生 A18 进行比较,苹果声称 iPhone 17 的 GPU 性能应该比 iPhone 16 快 20% 左右。此外,与 iPhone 15 相比,苹果声称 iPhone 17 比 iPhone 15 快 80%,而 iPhone 17 Pro 比 iPhone 15 Pro 快 50%。
最后,苹果在 GPU 方面新增的另一项重要硬件虽然对图形处理能力的影响不大,但对于 GPU 计算用户来说却意义非凡:张量核心(Tensor Core)。或者用苹果的话说,神经加速器(Neural Accelerators)。
与 NVIDIA GPU 架构上的张量核心、AMD GPU 架构上的矩阵核心以及其他 GPU 架构上的类似单元一样,张量核心是高度优化的计算块,用于操作多维数字数组(张量)。张量在机器学习任务中尤为常见,其中张量核心用于执行大量的矩阵乘法运算。
GPU 本身就是强大的矩阵乘法引擎(图形处理领域已经有大量此类数学运算),但张量核心通过增加运算数组和矩阵的大小,进一步提升了性能。这些核心的设计本质上是强化版的 SIMD,每个周期可以运算数百个数字,而不是十几个,从而将控制流所需的硬件数量降至最低,同时最大限度地增加了可用的 ALU 数量。
苹果此前在 WWDC 上透露了这一新增功能,并在 Metal 4 API 中增加了对张量的支持。实际上,Metal 4 将支持从 Apple7 GPU 开始的张量运算,并在这些 GPU 的 SIMD 上执行张量运算,但用户需要 Apple10 架构 GPU 才能充分发挥张量带来的性能优势。
值得注意的是,这些神经加速器核心与 Apple 现有的神经引擎核心不同,后者位于芯片的独立区域。神经引擎用于高效、低功耗的机器学习推理,而神经加速器张量核心位于 GPU 内部,旨在实现更高的整体性能。尽管代价是更高的功耗。
总而言之,苹果承诺 iPhone 17 Pro 中的 A19 Pro SoC 将提供 A18 Pro 峰值 GPU 计算吞吐量的 4 倍,这与增加专用张量核心后预期的性能非常接近。此外,苹果对 iPhone 17 Pro 和 iPhone 17 Air 分别给出了 4 倍和 3 倍的性能声明,这很能说明问题。这些张量核心在设计上非常密集,因此小巧的Air在保持其散热方面会遇到更多困难也就不足为奇了。
A19 的配置:更快的 DRAM、升级的神经引擎、ProRes RAW
完善苹果 2025 年移动 SoC 的还有剩余的功能模块和其他主要方面。
在内存方面,苹果已确认 A19 芯片拥有更高的内存带宽,但并未透露具体提升幅度。A18 系列芯片搭载的是 LPDDR5X-7500,而一年后 LPDDR5X 也已上市,速度超过 8000 MT/秒。因此,苹果几乎可以肯定将使用更快的内存——唯一的问题是,究竟快多少?
与此同时,A19 芯片也配备了改进的神经引擎模块。该模块仍然由 16 个核心组成,但苹果宣称其内存带宽有所提升,整体性能也得到了提升。然而值得注意的是,他们并未公布这一代芯片的任何性能数据,而 A18 芯片则提前公布了 35 TOPS(INT8)的性能数据。我预计重大改进(例如新的、精度更低的格式)会提前公布,因此我们推测此次改进可能包含一些更细微的性能提升变化。
新的 SoC 还配备了新的显示引擎,不过苹果并未透露具体变化。主要改进似乎是为了更好地支持最新 iPhone 的显示屏,尤其是 iPhone 17 上 ProMotion 技术的支持。
虽然苹果的幻灯片中没有提到这一点,但该公司的团队似乎一直在修改其相机的 ISP 及其相关的视频编码模块。特别值得注意的是,A19 Pro SoC(也是唯一一款 Pro SoC)加入了对 Apple ProRes RAW录制的支持,这与上一代 Pro SoC 对常规 ProRes 的支持相得益彰。ProRes RAW 的支持实际上是苹果对专业视频拍摄格式支持的两倍,苹果在传统 RAW 相机格式的基础上增添了自己的特色。
这确实稍微扩大了普通版 SoC 和 Pro SoC 之间的差距,因为它增加了一项只有 Pro SoC 才具备的功能。同时,除了缓存大小之外,A18 SoC 之间的主要差异还在于相机/视频功能,因此这次更新延续了这一趋势,普通版 iPhone 17 用户只能以 H.264 和 HEVC 格式录制视频。虽然支持 AV1 解码,但这一代芯片并不支持 AV1 编码。
最后,苹果似乎将 USB 数据速率作为两款 SoC 之间的进一步区别。基于 A19 Pro 的手机支持高达 10 Gbps 的 USB 数据速率(USB 3.2 Gen 2,又称 SuperSpeed+),而基于 A19 的 iPhone 17 则仅限于 480 Mbps 的 USB 数据速率(USB 2.0,又称 High-Speed)。
Apple N系列无线网络芯片N1首次亮相
最后,虽然它本身不属于 A 系列 SoC,但这一代 iPhone 凭借 Apple N1 无线网络芯片在 Apple 平台上最后一次亮相。
N1 是苹果首款自主研发的短距离无线芯片——不要将其与 C 系列蜂窝芯片或 U 系列超宽带芯片混淆——它将为苹果设备提供蓝牙和 Wi-Fi 支持,以及 Thread 网络技术。在此之前,苹果一直是博通的忠实客户,Mac 和 i 设备都依赖博通提供无线芯片。因此,转向自主研发芯片尤为引人注目,因为这意味着苹果在自主研发设备时,无需再从外部芯片制造商采购芯片。
就高端规格而言,N1 相当符合高端无线芯片的典型配置。苹果支持 Wi-Fi 7,最高支持 2 个空间流(但未透露信道宽度)。同时,在蓝牙方面,苹果正在推出蓝牙 6.0 支持,将去年的规格引入硬件。虽然蓝牙 6.0 没有带来任何华丽的新功能,但信道探测功能可以让蓝牙设备感知彼此之间的距离,这最终将有助于改进苹果的“查找”功能,使其与超宽带技术区分开来。
博通的无线网络芯片一直以来都是业内口碑最好的。因此,苹果能否在博通产品上做出实质性的改进,或者说,此次调整主要是为了将 iPhone 的这部分功能纳入苹果内部,这值得拭目以待。也有可能,这款芯片的底层(或通过物理设计)是博通芯片,但顶部则由苹果进行增强。
https://morethanmoore.substack.com/p/apple-announces-a19-and-a19-pro-socs
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4158期内容,欢迎关注。
加星标第一时间看推送,小号防走丢
求推荐
黑鹰光伏
2025-09-16
半导体行业观察
2025-09-16
半导体行业观察
2025-09-16
半导体行业观察
2025-09-16
半导体行业观察
2025-09-16
半导体行业观察
2025-09-16