来源:半导体行业观察
2025-08-01 09:16:24
(原标题:CPU主频,越高越好吗?)
公众号记得加星标,第一时间看推送不会错过。
来源:内容编译自XDA。
多年来,时钟速度占据了主导地位。它是你唯一可以指着它衡量某个组件比另一个组件“更快”的指标,无需任何上下文。它的名字就说明了一切。时钟速度直接表明了组件的运行速度;它每秒能够执行多少条指令。然而,如今,时钟速度却是你最不重要的规格之一。
它仍然很重要,但硬件设计和为其编写的软件的变化已经将主频推到了后视镜中。更高的主频仍然可以提升性能,但与几年前不同,能够很好地适应主频的应用程序越来越少。
时钟速度是一个极具欺骗性的指标,它经常被误用为营销宣传的噱头。时钟速度决定了 CPU 在一个时钟周期内能够完成的指令数量。因此,一个 5GHz 时钟速度的 CPU 每秒能够完成 50 亿条指令。你可以取时钟周期的倒数,算出 CPU 完成一条指令需要多长时间——也就是说,5GHz CPU 完成一条指令需要 1/5,000,000,000 秒。
这是 CPU 的时钟速度,但你也可以将其应用于其他组件。GPU 和 RAM 都有时钟速度,但它在市场营销中的使用频率远不及 CPU。
几十年前,当 CPU 只有一个核心时,时钟速度几乎直接衡量了性能。每秒能完成的指令越多,芯片的速度就越快。如今,情况不同了。你很难找到双核 CPU,更不用说单核 CPU 了,所以在如今多线程芯片的格局下,时钟速度变得不那么重要了。此外,指令流水线等架构技术优化了跨线程的指令执行,这进一步混淆了时钟速度如何直接转化为性能。
鉴于硬件的变化,软件也随之变化。如今,大多数应用程序(包括游戏)对时钟频率的响应方式已不像以前那样,而以前时钟频率是一个更为重要的指标。大多数应用程序在设计时都考虑到了多线程 CPU,利用各种可用的线程来加速原本需要顺序处理而非并行处理的工作负载。
时钟速度很重要,有些应用程序可以清晰地随时钟速度变化。然而,大多数情况并非如此。选择硬件时,时钟速度并非您首先要考虑的指标,而且,如果您不小心,它可能会让您误入歧途。
过去十年,硬件和软件发生了翻天覆地的变化,一些曾经重要的规格逐渐被遗忘,而新的规格却日益受到重视。除了时钟速度之外,以下是一些系统中最重要组件需要关注的关键规格。
CPU 的规格繁多,但我假设你已经掌握了一些基本知识。核心数量至关重要,但根据核心数量选择 CPU 也很容易。功耗也很重要,但除非你购买的是旗舰级硬件,否则即使是像酷冷至尊 Hyper 212 Evo 这样的经济实惠的散热器也能满足你的需要。缓存是尚未引起足够重视的隐性规格。
缓存革命真正始于AMD 的 3D V-Cache和锐龙 7 5800X3D,这证明了一个大多数人认为不重要的规格可能会对性能产生重大影响。缓存在现代 CPU 中扮演着重要的角色,这也很正常。英特尔和 AMD 不仅增加了芯片的缓存容量,甚至在 X3D 产品之外,其架构也纷纷效仿。例如,在 Zen 5 架构中,AMD 利用前端解码器之前的运算缓存来对指令进行排队。将此缓存放置在解码器之前,使得偶尔的缓存丢失变得毫无意义,因为核心的数据是由解码器而不是运算缓存提供的。
如果您觉得这听起来像胡言乱语,别担心。增加缓存不会对性能产生负面影响。它主要受芯片设计时的功耗、散热和空间限制所限。有些应用程序不会因为增加缓存而获得显著的性能提升,但对于需要将多条复杂指令排队等待立即执行的情况(例如许多现代开放世界游戏),增加缓存可以显著提升性能。
时钟速度从来都不是 GPU 的主要卖点,这是有原因的。CPU 可以处理大型复杂数学运算,但每次只能处理有限的运算量。而 GPU 则可以并行处理大量简单的数学运算。显卡的核心数量通常高达数千个,而 GPU 架构的并行性又如此之高,这严重影响了时钟速度。
过去几年,显存(VRAM) 成为一项备受瞩目的规格,这并非偶然。像RTX 5060这样的新 GPU一直拒绝突破 8GB 的限制,而现代游戏也不断证明 8GB 不足以满足最高画质设置的需求。您应该关注 GPU 的显存容量,这比关注主频更重要。不过您可能已经知道这一点了。我在此建议您将显存容量视为 GPU 更大内存系统的一部分。
与 CPU 一样,GPU 也拥有系统内存 (VRAM)、缓存以及用于传输数据的内存接口。这些规格参数可能会对性能产生影响。RTX 3060 就是一个很好的例子。它拥有 12GB 的 VRAM,你应该认为这比新款 RTX 4060 Ti 的 8GB VRAM 要好得多。然而,RTX 4060 Ti 配备了 32MB 的二级缓存,而 RTX 3060 却只有区区 3MB。RTX 3060 的 VRAM 可能更大,但 RTX 4060 Ti 显著增大的缓存减轻了其 8GB 帧缓冲区的压力,至少比单凭容量来衡量要好得多。
最后,关于内存。内存速度通常以 MHz 为单位,但正确的测量单位是 MT/s,即每秒兆次传输。现代内存采用双倍数据速率 (DDR),这意味着有效速度是时钟速度的两倍。例如,DDR4-3200 内存的速度为 3,200 MT/s,但其技术上的时钟速度为 1,600MHz。无论如何,内存速度很重要,但它也是更大系统的一部分。
定义内存速度的时序有很多种,但真正重要的两个规格是速度和 CAS 延迟,特别是它们共同造成的延迟。虽然 CAS 延迟描述的是内存内部的延迟,但它并不是指 DIMM 的总延迟或响应速度。要找出以纳秒为单位的实际延迟,可以使用 RAM 延迟计算器,该计算器会计算套件的速度和 CAS 延迟。运行这个计算可能会让人大开眼界。例如,CL30 的 DDR5-6000 套件的延迟为 10 纳秒,而 CL36 的 DDR5-6400 套件的延迟为 11.25 纳秒。尽管从技术上讲速度更快,但速度越快的内存延迟就越大。
以上只是对内存延迟的简单介绍,但应该能说明一些情况。我喜欢把内存看作是 CPU 的扩展。不同的 CPU 架构对更快内存的响应方式不同,因此有必要了解你的具体芯片,看看它支持哪种类型的内存。也许你可以用更快的套件来解锁额外的性能,或者你可以省下一些买“慢”的套件可能会浪费的钱。
无论您谈论的是时钟速度、缓存、显存还是 CAS 延迟,规格都只能说明这么多。它们是了解各种硬件选项之间差异以及某些组件为何比其他组件更昂贵的良好试金石。但即使是世界上最详细的规格表也无法说明实际性能。您的硬件并非孤立存在。它会与其他硬件,以及最重要的,正在运行的软件相互作用。性能变量太多,无法仅凭规格得出结论。
实际测试是评判组件的唯一方法。这不仅仅是因为纸面上令人印象深刻的规格在实践中可能不尽如人意。还因为某些应用程序比其他应用程序更在意某些规格。例如,游戏不需要大量的 CPU 线程。超过八核后,你实际上看不到扩展到更高核心数的可能性。另一方面,视频编辑应用程序、编码和编译可以通过增加核心数来扩展性能。重要的是要关注实际性能,但随后要将该性能与实际运行的工作负载联系起来。
https://www.xda-developers.com/i-stopped-chasing-clock-speeds-heres-what-actually-matters/
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4112期内容,欢迎关注。
加星标第一时间看推送,小号防走丢
求推荐
半导体行业观察
2025-08-02
半导体行业观察
2025-08-02
半导体行业观察
2025-08-02
半导体行业观察
2025-08-02
半导体行业观察
2025-08-02
半导体行业观察
2025-08-02
证券之星资讯
2025-08-01
证券之星资讯
2025-08-01
证券之星资讯
2025-08-01