|

财经

最强Arm CPU发布:192核,3nm工艺

来源:半导体行业观察

2025-12-05 09:47:33

(原标题:最强Arm CPU发布:192核,3nm工艺)

公众号记得加星标,第一时间看推送不会错过。

亚马逊周四在re:invent大会上发布了 Graviton5,这是迄今为止密度最高、性能最强的 CPU,将 192 个处理器核心塞进一个插槽中,并承诺将 AWS 的性能提升到新的水平。

自 2018 年首次推出以来,Graviton 芯片已成为 AWS 计算服务的主力军。亚马逊声称,在过去三年中,Graviton 芯片的新增 CPU 容量占比超过一半。

Graviton5 拥有充足的存储容量,配备 192 个采用台积电 3nm 工艺制造的 Arm Neoverse V3 内核。这些内核由容量更大的 192MB L3 缓存提供支持,有助于减少缓存未命中,并通过减少从速度较慢的 DRAM 中读取的数据量来提升性能。该芯片还配备了改进的内存子系统,可将速度提升至 7200 MT/s,并且正在开发对 8800 MT/s DIMM 的支持。

CPU 核心数量翻倍至 192 个的原因之一被认为是工艺节点的微型化,但人们认为在相同的成本下(简而言之,芯片尺寸;基本上,芯片尺寸越大,制造成本越高)不可能将核心数量增加这么多。

一种可能性是采用Chiplet技术,即将芯片分成两部分,然后将它们集成到封装上。当我们就此询问赛义迪先生时,他回答说:“目前我们不便透露更多信息。”

从Graviton 3开始,Graviton系列处理器的内存控制器采用独立芯片设计,并以芯粒(chiplet)的形式集成到单个封装中。据透露,Graviton 5的内存控制器至少也采用了芯片组(chiplet)的形式,因此至少在内存控制器领域已经应用了芯片组(chiplet)技术。至于CPU芯片是否也采用了这种技术,则需要在未来公布更多细节信息后才能确定。

他们还透露,L3缓存容量从Graviton 4的36MB提升至192MB,增长了5.3倍,这意味着每个核心的缓存容量从376KB提升至1MB。缓存容量越大,内存延迟越低,这对于需要低延迟的应用来说显然是有利的。

虽然 L1 和 L2 缓存的规格尚未公布,但 Arm 的 Neoverse V3 的 L1 缓存为 64KB/64KB,L2 缓存为 1MB 至 3MB,因此 L1 缓存很可能具有此容量,而 L2 缓存约为 2MB,与 Graviton 4 相同。

此外,DRAM 控制器的数量尚未公布,但由于 Graviton 4 中 DRAM 控制器的通道数从 8 个增加到 12 个,我们预计 DRAM 控制器很可能也是 12 个通道。

亚马逊表示,其新款 M9g 实例的整体性能比基于 Graviton4 的 M8g 实例提升了 25%。后者配备了两个各有 96 个核心的 CPU。而 AWS 的 Graviton5 则将这些核心整合到了单个插槽中。这使其性能足以与目前AMD和Intel最高核心数的 CPU 相媲美,后者的核心数分别高达 192 个和 144 个。

可以肯定的是,亚马逊周四在re:invent大会上发布了 Graviton5,这是迄今为止密度最高、性能最强的 CPU,将 192 个处理器核心塞进一个插槽中,并承诺将 AWS 的性能提升到新的水平。

自 2018 年首次推出以来,Graviton 芯片已成为 AWS 计算服务的主力军。亚马逊声称,在过去三年中,Graviton 芯片的新增 CPU 容量占比超过一半。


Graviton5 拥有充足的存储容量,配备 192 个采用台积电 3nm 工艺制造的 Arm Neoverse V3 内核。这些内核由容量更大的 192MB L3 缓存提供支持,有助于减少缓存未命中,并通过减少从速度较慢的 DRAM 中读取的数据量来提升性能。该芯片还配备了改进的内存子系统,可将速度提升至 7200 MT/s,并且正在开发对 8800 MT/s DIMM 的支持。

亚马逊表示,其新款 M9g 实例的整体性能比基于 Graviton4 的 M8g 实例提升了 25%。后者配备了两个各有 96 个核心的 CPU。而 AWS 的 Graviton5 则将这些核心整合到了单个插槽中。这使其性能足以与目前AMD和Intel最高核心数的 CPU 相媲美,后者的核心数分别高达 192 个和 144 个。

AWS EC2 副总裁 David Brown 在周四的主题演讲中表示:“连接处理器会引入新的延迟路径,当一个核心需要访问另一个 CPU 上的内存时,请求必须通过该互连传输,这会增加延迟、额外的协议开销,有时甚至会导致排队。在某些情况下,所需时间可能会延长三倍。”

亚马逊表示,Graviton5 拥有更高的核心数量,可有效降低核心间延迟约三分之一,从而提升在线游戏、高性能数据库、电子设计自动化和数据分析等工作负载的性能。虽然 Graviton5 实例仅需一个插槽即可运行,但亚马逊副总裁兼杰出工程师 Ali Saidi 告诉我们,实际的计算节点仍然包含两个插槽,并共享一个 Nitro 智能网卡。

与首款支持 PCIe 5.0 的服务器 CPU Graviton3 类似,Graviton5 也将是首款开箱即支持 PCIe 6 的服务器 CPU。

从 Graviton4 的 96 个核心到 Graviton5 的 192 个核心,这一跃升意义重大,因为 AWS 历来并不追求核心数量。正如 Brown 在 2023 年接受The Register 采访时所说,该公司更倾向于采用可以通过调整内存与计算比例或每个实例的互连速度等参数来适应多种角色的 CPU。

亚马逊旗下 Annapurna Labs 部门的联合创始人 Nafea Bshara本周在 re:Invent 大会上告诉El Reg,Graviton5 的理念并没有改变。

他说:“降低成本的最佳方法是打造一款能够服务于所有人的产品。因为使用量会有波动,早上可能在运行高性能计算程序,晚上可能在玩《堡垒之夜》。”

Graviton芯片性能卓越且用途广泛,能够胜任亚马逊所需的任何任务,而一些更专业的部件则可能闲置待用。“高利用率意味着更低的成本,从而惠及客户。”

对于 AWS M9g 实例,Graviton5 已与该公司定制的 Nitro 6 智能网卡配合使用,使网络带宽翻倍至 100 Gbps。

Nitro 的真正价值在于能够卸载存储、网络和虚拟化功能,从而释放原本会被这些进程占用的 CPU 资源,用于处理客户端工作负载。这些网卡还引入了 Nitro 隔离技术,旨在通过数学证明确保客户工作负载彼此隔离。

亚马逊的 M9g 实例目前提供预览版,更多计算优化型 (C9g) 和内存优化型 (R9g) 计划于新年发布。与之前的 Graviton 实例一样,这些实例都使用相同的芯片,但会调整每个核心的内存容量或带宽比例。

Graviton5 的首次亮相距离 AWS 推出其 Trainium3 UltraServers AI 机架系统仅几天之隔。该系统采用类似于 Nvidia 的 NVL72 的可扩展交换结构,与上一代产品相比,性能提升了 4.4 倍。

亚马逊首次放弃了之前 UltraServer 中使用的 x86 内核,转而采用包括 Graviton、Trainium 和 Nitro 在内的全套 Annapurna 硅芯片。

亚马逊可能是最早部署自主研发CPU的公司之一,但它并非唯一一家。上个月在微软Ignite大会上,微软发布了代号为Cobalt 200的第二代Arm CPU。

该芯片基于 Arm 的 Neoverse 计算子系统 V3,采用台积电 3 纳米工艺制造。每个处理器拥有 132 个活动核心,每个核心配备 3 MB 的 L2 缓存,共享 L3 缓存总量达 192 MB。此外,该芯片还采用定制内存控制器,默认启用内存加密,并搭载 Arm 的机密计算架构,以防止客户工作负载与虚拟机管理程序混杂。

谷歌在构建定制AI加速器方面拥有悠久的历史,最近也加入了定制CPU的竞争,推出了Axion系列实例。该系列实例去年在Cloud Next大会上首次亮相。这些芯片比Graviton或Cobalt都要小得多,每个实例最多可配备72个Arm Neoverse V2核心,并辅以576GB内存和100Gbps的网络带宽。

虽然Oracle目前还没有自己的CPU,但这家蓬勃发展的云服务提供商和数据库巨头运营着规模最大的基于Arm架构的Ampere CPU集群之一。早在去年10月,Oracle就发布了基于192核AmpereOne M处理器的全新实例。

AWS推出Graviton5——功能最强大、效率最高的CPU

随着云工作负载的复杂性和规模不断增长,企业面临着一个持续的挑战:如何在提升性能、降低成本的同时,履行可持续发展承诺。传统方法往往需要权衡取舍,让您在速度和效率之间做出选择。为了解决这一难题,我们今天推出了 Graviton5 处理器——AWS 迄今为止最先进的定制芯片,适用于各种云工作负载。Graviton5 的计算性能比上一代产品提升高达 25%,同时保持领先的能效,使您能够更快地运行应用程序、降低成本并实现可持续发展目标。

基于 Graviton5 的 EC2 M9g 实例可让您更高效地处理信息,其 CPU 核心密度在 Amazon EC2 中最高——单个实例包含 192 个核心。这种高效的设计减少了数据在核心之间的传输距离,将核心间通信延迟降低高达 33%,同时提高了带宽。实时游戏、高性能数据库、大数据分析、应用服务器和电子设计自动化 (EDA) 等高要求工作负载现在可以借助处理核心之间更快的数据交换进行扩展。

该芯片配备了容量提升 5 倍的 L3 缓存——一种高速内存缓冲区,可将频繁访问的数据保存在处理器附近。每个 Graviton5 核心可访问的 L3 缓存容量是 Graviton4 的 2.6 倍,这意味着更少的等待数据延迟和更快的应用程序响应速度。内存性能也得到了提升,Graviton5 提供更快的内存速度,使您能够更高效地处理更大的数据集并运行内存密集型应用程序。

网络和存储带宽也得到了提升,平均而言,各种实例大小的网络带宽提高了 15%,Amazon Elastic Block Store (EBS) 带宽提高了 20%,而最大实例的网络带宽更是提高了一倍——从而实现了更快的数据传输、更快的备份以及分布式应用程序性能的提升。

Graviton5 在提供更佳性能的同时,还能显著提升能效,帮助您在不牺牲性能的前提下实现可持续发展目标。这些创新得益于从芯片设计到服务器架构的端到端自主研发。Graviton5 采用最新的 3nm 工艺,针对 AWS 应用场景进行了优化设计,并支持裸芯片散热等系统级优化。

Graviton5 实例基于 AWS Nitro 系统构建,该系统是全球最注重隐私的机构(包括政府、医疗保健和金融服务机构)信赖的安全性和性能基础架构。Graviton5 实例利用第六代 Nitro 卡将虚拟化、存储和网络功能卸载到专用硬件。这种架构几乎将服务器的所有计算和内存资源直接提供给您的工作负载,同时实施零操作员访问设计,从根本上防止任何其他系统或人员登录 EC2 服务器、读取实例内存或访问客户数据。

Graviton5 推出 Nitro 隔离引擎,作为 Nitro 系统的增强功能。该引擎利用形式化验证,从数学层面确保工作负载彼此隔离,并与 AWS 运维人员完全隔离。Nitro 隔离引擎采用精简且经过形式化验证的代码库,并使用数学证明来确保其行为完全符合定义,从而开创了基于数学证明的云安全新标准。我们将与客户合作,提供 Nitro 隔离引擎实现的访问权限,以便他们评估该引擎及其相关的证明。

Adobe 利用 Graviton 将广播转化为数百万用户的个性化观看体验,并借助其提升的计算性能实时处理视频流。Epic Games 依靠 Graviton 为数百万玩家提供每日精彩纷呈的竞技游戏体验,其降低的延迟和提升的带宽确保即使在高峰时段也能流畅运行。一级方程式赛车 (F1) 使用 Graviton 帮助车迷追踪时速高达 350 公里的赛车,处理遥测数据并为全球观众提供实时信息。Pinterest 基于 Graviton 的基础设施承载着超过 5 亿月活跃用户,并受益于其卓越的性价比,大规模提供个性化内容。

Airbnb诞生于2007年,当时两位房东在旧金山的家中接待了三位房客。如今,Airbnb已发展成为拥有超过500万房东、接待房客超过20亿人的全球平台,几乎遍布世界各地。“基于AWS Graviton5的Amazon EC2实例是我们测试过的速度最快的EC2实例之一,”Airbnb首席性能工程师Denis Sheahan表示,“在我们使用Airbnb生产搜索工作负载进行的性能测试中,我们发现其性能比同代其他系统架构提升高达25%,比上一代Graviton4实例提升高达20%。我们尤其对关键工作负载的P95延迟感到满意,这有助于为Airbnb房客和房东提供一致的体验。”

作为软件开发、工作管理和企业服务管理软件领域的公认领导者,Atlassian 致力于帮助企业通过人工智能驱动的工作系统连接业务团队和技术团队,从而大规模提升生产力。Atlassian 首席工程师 Tibo Delor 表示:“Atlassian 已将超过 3000 个用于 Jira 和 Confluence 的 EC2 实例迁移到基于 AWS Graviton4 的 EC2 实例。在基于 AWS Graviton5 的 M9g 实例上对 Jira 进行测试时,我们观察到与上一代产品相比,性能提升了 30%,延迟降低了 20%,我们期待 AWS Graviton5 的正式发布。”

西门子数字化工业软件利用西门子Xcelerator业务平台的软件、硬件和服务,帮助各种规模的企业实现数字化转型。西门子Calibre设计解决方案提供完整的集成电路验证和面向制造优化的设计EDA平台。“半导体物理验证的未来在于云端高性能计算,”西门子数字化工业软件高级副总裁兼总经理Juan Rey表示,“我们与AWS的合作使Calibre处于这一变革的前沿。我们很高兴地宣布Calibre现已支持基于Arm架构的AWS Graviton处理器,与AWS其他实例相比,AWS Graviton4的性能提升高达20%,计算成本降低超过30%。早期AWS Graviton5测试显示,性能进一步提升了30%,从而为我们的客户带来更快的验证速度和更短的产品上市时间。”

50多年来,众多企业信赖SAP,借助其整合涵盖财务、采购、人力资源、供应链和客户体验等关键业务运营,实现卓越运营。“自2023年以来,我们一直与AWS紧密合作,在AWS Graviton上运行SAP HANA Cloud,并且每一代新的Graviton都带来了显著的性能提升,”SAP高级副总裁兼SAP HANA与持久性负责人Stefan Bäuerle表示,“借助基于AWS Graviton5的Amazon EC2 M9g实例,我们在SAP HANA Cloud上观察到OLTP查询性能提升了惊人的35%至60%——这在短短一代产品中就取得了如此巨大的进步。”

Synopsys 是芯片到系统工程解决方案领域的领导者,致力于帮助客户快速创新人工智能产品。“自 Annapurna Labs 成立以来的十余年间,Synopsys 和 AWS 一直携手合作,助力亚马逊的定制芯片开发,”Synopsys 战略与产品管理高级副总裁 Sanjay Bali 表示,“Synopsys 的 EDA 工具,例如 VCS、PrimeTime、Fusion Compiler 和 IC Validator,对 AWS Graviton 的支持对于 Graviton 以及 Nitro 和 Trainium 芯片的设计至关重要。如今,Synopsys 和 AWS 正在扩展对 Graviton 的支持,以加速客户的半导体创新。与 Graviton4 相比,Graviton5 的早期测试结果显示,Fusion Compiler 和 PrimeTime 的运行时间提升高达 35%。此外,我们的合作伙伴 Arm 也观察到,与前几代产品相比,Synopsys VCS 在 Graviton5 上的运行速度提升高达 40%。”

面向通用工作负载的基于 Graviton5 的 M9g 实例现已推出预览版。面向计算密集型工作负载的 C9g 实例和面向内存密集型工作负载的 R9g 实例计划于 2026 年推出。

(来 源 : 综合自亚马逊等 )

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4249期内容,欢迎关注。

加星标第一时间看推送,小号防走丢



求推荐


半导体行业观察

2025-12-05

AI蓝媒汇

2025-12-05

半导体行业观察

2025-12-05

半导体行业观察

2025-12-05

证券之星资讯

2025-12-05

证券之星资讯

2025-12-05

首页 股票 财经 基金 导航