|

财经

英伟达下一代GPU,我所知道的全在这了

来源:半导体行业观察

2025-01-04 10:03:15

(原标题:英伟达下一代GPU,我所知道的全在这了)

如果您希望可以时常见面,欢迎标星收藏哦~

来源:内容编译自tomshardware,谢谢。

下一代 Nvidia Blackwell GPU 架构和 RTX 50 系列 GPU 即将问世,基本符合计划。虽然 Nvidia 官方没有透露太多消息,但在过去的一个月里,我们看到该公司围绕数字 50 发布了大量的营销材料。一切看起来都有望在CES上发布,很可能是在 1 月 6 日首席执行官黄仁勋的主题演讲中。我们预计各种 Blackwell GPU 将加入最佳显卡的行列,取代即将成为上一代的产品。

当我们在 2024 年初与一些人交谈时,他们预计到 2024 年假期到来时,我们至少会看到 RTX 5090 和 RTX 5080。但随后Blackwell B200 的推迟以及包装问题,这似乎推迟了事情的发生。现在,我们正在关注 2025 年 1 月的公告,该月底之前至少会有一两种型号推出,也许会有多达四种不同的台式机卡——笔记本电脑 RTX 50 系列也有可能。Nvidia 已经提供了其数据中心 Blackwell B200 GPU的许多核心细节。AI 和数据中心变体将不可避免地与消费者部件有所不同,但过去的消费者和数据中心 Nvidia GPU 之间有一些共同点,而且这种情况应该会继续下去。这为未来 RTX 50 系列 GPU 的某些方面提供了一些很好的迹象。仍有许多未知数,包括硬规格和定价细节。后者可以在最后一刻更改,因此任何定价“泄露”都很可能只是瞎猜,而不是实际信息。另一方面,规格现在应该已经确定,特别是如果我们要在 1 月底之前看到零售可用性的话。让我们来了解各种谣言和细节,包括发布日期、潜在规格和其他技术。

Blackwell 和 RTX 50 系列发布日期

在所有未知数中,发布日期(至少对于首批 Blackwell GPU 而言)可能是最容易确定的,尤其是现在。尽管我们个人在 2024 年初就听说了,但 RTX 50 系列预计将于 2025 年 1 月发布,并在 CES 2025 上亮相。这是一个延迟,但有充分的理由。Nvidia的数据中心 Blackwell B100/B200 GPU 遇到了封装问题,也被推迟了。考虑到数据中心部门在过去一年中赚了多少钱(参见Nvidia 的最新收益),投入更多资金和晶圆来准备和提供 B200 是有意义的。游戏玩家?是的,我们不再是 Nvidia 的首要任务。

这意味着根据历史先例,消费者 Blackwell GPU 已经“迟到了”。Ada Lovelace RTX 40 系列 GPU于 2022 年 10 月首次亮相。Ampere RTX 30 系列 GPU于 2020 年 9 月首次亮相。在此之前,RTX 20 系列于两年前的 2018 年 9 月推出,GTX 10 系列于 2016 年 5 月/6 月推出,GTX 900 系列于 2014 年 9 月推出。这意味着,每两年就会有新的 Nvidia GPU 架构问世,整整十年如此。即便如此,我们也只比正常节奏晚了几个月。

这不仅仅是关于两年的消费级 GPU 节奏。Nvidia于 2022 年 3 月在其年度 GPU 技术大会 (GTC) 上首次披露了Hopper H100 架构的核心细节,Ada Lovelace 将于 2024 年 10 月发布。2020 年 5 月,它首次发布了Ampere A100 架构,几个月后又发布了消费者版本。2018 年也发生了同样的事情,当时推出了 Volta V100 和 Turing,2016 年推出了Tesla P100和 Pascal。

因此,在过去四代中,我们首先了解了数据中心和 AI GPU,大约六个月后才发布并推出消费者 GPU。Nvidia 发布了Blackwell B200 架构,如果不是因为那个讨厌的 CoWoS 封装问题,我们可以肯定地说,我们会在 2024 年秋季听到有关消费者版本的消息。

随着 Blackwell B200 的完整上市推迟到 2025 年,其他所有产品也都推迟了。人工智能工作负载和销售正在蓬勃发展,一些地方抢购了数十万个 Nvidia GPU。这些产品的利润率远远超过任何消费级产品,不过我们仍然可能会看到专业级和数据中心级显卡使用与消费级型号相同的 GPU。

我们不知道Nvidia 计划为下一代 Blackwell 部件提供确切的名称或型号,但我们确信我们将拥有 RTX 5090、RTX 5080、RTX 5070 和 RTX 5060 卡,以及可能是 Ti 和/或 Super 变体的某种组合。毫无疑问,其中一些变体将在首次发布后约一年的中期更新期间推出。我们也很好奇 Nvidia 是否会有 RTX 5050 GPU——它在 40 系列和 20 系列的台式机 GPU 上跳过了这一级别,尽管后者有 GTX 1660 和 1650 级 GPU。

顶级 RTX 5090 和 5080 应该会率先于 2025 年 1 月上市。有传言称我们还可能会看到 RTX 5070 Ti 和 RTX 5070,不过它们是否会在 CES 主题演讲期间正式亮相还有待观察。5060 级硬件可能会在首批 50 系列 GPU 推出后的未来六个月内随时推出。与往常一样,我们预计 Blackwell GPU 将遵循典型的交错发布时间表。

台积电4NP,精炼4nm Nvidia

GTC 2024 上一个令人惊讶的公告是,Blackwell B200 将使用台积电 4NP 节点——“4nm Nvidia Performance”,或者基本上是 RTX 40 系列上使用的 N4 节点的调整/微调版本。虽然工艺名称已经与物理特性基本脱节,但许多人预计 Nvidia 将转向台积电尖端 N3 工艺技术的变体。相反,它选择改进现有的 4N 节点,该节点在过去两年中已用于 Hopper 和 Ada Lovelace GPU。

走这条路肯定会节省一些成本,尽管台积电没有披露与其各个合作伙伴的合同定价协议。Blackwell B200 还使用双芯片解决方案,两个相同的芯片通过 10 TB/s NV-HBI(Nvidia 高带宽接口)连接。也许 Nvidia 只是认为这一代不需要转向 3nm 级节点。

然而,这为 AMD 甚至英特尔打开了大门,使其有可能转向更新、更先进的工艺节点,将更高效的晶体管塞进更小的芯片中。Nvidia 对 RTX 30 系列采取了类似的方法,使用更便宜的三星 8N 工艺,而不是更新、更好的台积电 N7。目前尚不清楚即将推出的下一代 GPU 将如何发展,不过英特尔 Battlemage 至少似乎坚持使用落后节点工艺,因为 Arc B580 使用台积电 N5——在很多方面都不如 RTX 40 系列先进。

仍有可能(直到主题演讲发布之前)虽然 Blackwell B200 变体使用台积电 4NP,但消费芯片可能会使用不同的节点。这里有使用不同节点甚至制造商的先例,例如 Ampere A100 使用 TSMC N7,而 RTX 30 系列芯片使用三星 8N。但很有可能,所有 Blackwell GPU 都将使用 TSMC N4P。

下一代 GDDR7 内存

人们早就预料到,消费级和专业级(即严格来说并非数据中心级) Blackwell GPU 将转向GDDR7 显存。所有迹象都表明,GDDR7 将及时为下一代 GPU 做好准备,并且全面生产正在顺利进行中。三星和 SK 海力士在 GTC 2024 上展示了 GDDR7 芯片,美光证实 GDDR7 也在生产中。

当前一代 RTX 40 系列 GPU 使用 GDDR6X 和 GDDR6 显存,主频从 17Gbps 到 23Gbps。GDDR7 的目标速度高达 36Gbps,比 GDDR6X 高 50%,比普通 GDDR6 高 80%。SK 海力士表示它甚至会有 40Gbps 芯片,尽管尚未给出这些芯片可能上市的具体时间表。无论如何,GDDR7 将在各个级别提供急需的内存带宽提升。

Nvidia 不太可能真正推出内存频率为 36Gbps 的显卡。过去,它使用 24Gbps GDDR6X 芯片,但频率为 22.4Gbps 或 23Gbps——在我们测试的各种 RTX 4090 显卡中,一些 24Gbps 的 Micron 芯片显然被降频至 21Gbps。目前有迹象表明,RTX 5090 的 GDDR7 频率将达到 28Gbps,而 RTX 5080 可能会选择更高的内存速度,达到 32Gbps 或更高。无论哪种方式,这仍然是带宽的一个健康提升。

在 28Gbps 下,与 RTX 4090 上使用的 21Gbps GDDR6X 相比,GDDR7 内存将提供 33% 的显存带宽提升。如果我们的预测正确,并且 RTX 5080 选择 32Gbps GDDR7,那么与 RTX 4080 Super 相比,带宽同样将增加 39%,与原始 4080 的 22.4Gbps 内存相比,带宽将增加 43%。与 Blackwell 的许多其他方面一样,Nvidia 及其合作伙伴将推动其发展到何种程度还有待观察。

我们还预计 Nvidia 将继续在 Blackwell 中使用大型 L2 缓存。这将提供更有效的内存带宽——每次缓存命中都意味着不需要进行内存访问。以 50% 的缓存命中率为例,这将使有效内存带宽翻倍,但请注意,命中率因游戏和设置而异,尤其是更高的分辨率会降低命中率。

GDDR7 还可能解决内存容量与接口宽度的问题。在 GTC 上,我们被告知 16Gb 芯片(2GB)正在生产中,24Gb(3GB)芯片也即将推出。容量非 2 的更大芯片是否已为即将推出的 Blackwell GPU 做好准备?至少有传言称 Nvidia 可能会推出16GB(2GB 芯片)和 24GB(3GB 芯片)版本的 RTX 5080。只要价格差异不是太大,其他规格保持不变,这不是一个坏方法。基本型号可能配备 2GB 芯片,而升级版本可能配备 3GB 芯片,VRAM 容量增加 50%。

目前,消费级显卡并不急需超过 24GB 的内存。但据称 RTX 5090 具有 512 位接口,这意味着它将采用默认的 32GB 配置,未来可能会提供 48GB 版本。容量更大的 GDDR7 芯片可能对专业和 AI 专用显卡特别有益,因为大型 3D 模型和 LLM 在这些领域越来越常见。512 位接口,PCB 两侧均有 3GB 芯片,可以产生具有 96GB 内存的专业 RTX 6000 Blackwell Generation。

更重要的是,24Gb 芯片的推出意味着 Nvidia(以及 AMD 和英特尔)可以在 192 位接口上放置 18GB VRAM,在 128 位接口上放置 12GB,在 96 位接口上放置 9GB,所有 VRAM 都位于 PCB 的一侧。我们还可以看到 256 位接口的 24GB 显卡,以及 384 位接口的 36GB 显卡——专业显卡的容量是这个数字的两倍。定价肯定会影响 VRAM 容量,但我们更有可能在消费级 GPU 上看到 24GB GDDR7 内存芯片,而不是“是否”的问题。

Blackwell 架构更新

Blackwell 架构几乎肯定会包含上一代 Ada Lovelace 架构的各种更新和增强,但现在我们确切知道的内容可以用两个词来概括:不多。但每一代 Nvidia GPU 都至少包含一些架构升级,我们可以期待这一轮也会出现同样的情况。

我们确实知道数据中心 Blackwell B200 GPU 再次重新设计了张量核心,为 FP4 和 FP6 数值格式提供原生支持。这些将主要用于 AI 推理,考虑到消费级 GPU 将与专业卡一起承担双重任务,可以肯定所有 Blackwell 芯片也将支持 FP4 和 FP6。(作为相关示例,Ada 在其张量核心中添加了与 Hopper 相同的 FP8 支持。)

Nvidia 在每一代 RTX 中都提高了潜在的光线追踪性能,而 Blackwell 似乎可能会延续这一趋势。随着《心灵杀手 2》和《赛博朋克 2077》等更多游戏推动全路径追踪——更不用说模组制作者可能使用RTX Remix来增强具有全路径追踪功能的旧 DX10 时代游戏——对更高光线追踪吞吐量的需求也随之增加。可能还会有其他以 RT 为中心的更新,就像 Ada 提供的 SER(着色器执行重新排序)、OMM(不透明度微图)和 DMM(位移微网格)一样。但这些变化可能是什么目前尚不清楚。

Blackwell还会带来哪些其他架构变化?如果我们正确地认为 Nvidia 坚持使用 TSMC 4NP 作为消费级部件,我们预计不会有大规模的改动。仍然会有一个大的 L2 缓存,用于 DLSS 3 帧生成的增强型 OFA(光流加速器)当然会保留。它很可能也会进行一些调整以改进它,有传言称我们可以在 RTX 50 系列中获得DLSS 4“神经渲染”。请注意,Nvidia 之前曾将 DLSS 升级和帧生成都称为“神经渲染”,因此我们需要拭目以待。

对于图形和更一般的工作负载,原始计算几乎肯定会大幅增加,但可能更接近 30% 的提升,而不是 50% 或更大的提升。例如,RTX 4080 提供 40 TeraFLOPS 的 FP32 计算,而 3080 为 30 TeraFLOPS,增幅为 33%,而 4090 提供 83 TeraFLOPS,而 3090 为 40 TeraFLOPS,增幅高达 107%。也许 Nvidia 也会在 RTX 5090 上“大展宏图”,同时在其他方面做出较小的改进,我们很快就会发现答案。

RTX 50 系列定价

RTX 50 系列 GPU 的价格是多少?坦率地说,考虑到目前的市场状况,几乎没有理由指望 Nvidia 会降低相对于当前 RTX 40 系列 GPU 的价格。Nvidia 会将这些显卡的价格定得尽可能高,只要它认为市场可以接受。由于 AI 性能可能更高,而且非游戏领域的需求增加,如果下一代显卡的定价结构与当前一代相同,我们可能会很幸运。

我们希望代际定价不会上涨,但这种希望可能落空了。“降级” RTX 4080 Super 售价 1,000 美元意味着特定级别的 GPU 现在比 RTX 2080 Super 时代贵了 43%。

当然,中间还有“699 美元”的 RTX 3080 10GB 和“1,199 美元”的 RTX 3080 Ti,当时由于 GPU 加密挖矿的盛行以及 Covid-19 的影响,价格出现了各种混乱。值得庆幸的是,虽然目前使用 GPU 挖掘某些加密货币在技术上是有利可图的,但WhatToMine估计 RTX 4090 的收入远低于每天 1 美元——这意味着按照目前的速度和价格,需要十年以上才能收支平衡。(没有人应该这样做,因为 GPU 更有可能在收支平衡之前就死掉。)

预算 GPU 行业也基本消亡了。集成显卡已经达到了“足够快”的程度,可以满足大多数常见工作负载,甚至包括适度的游戏——对于移动处理器来说尤其如此,而桌面选项通常要弱得多。上一代真正瞄准预算领域的新 GPU 是 AMD 相当不起眼的RX 6500 XT和RX 6400——自2019 年推出GTX 1650 Super以来,Nvidia 还没有生产过一款低于 200 美元的新 GPU (除非你想算上GTX 1630的悲剧)。

这意味着对于专用的台式机显卡,我们现在生活在这样一个世界里:“预算”意味着 300 美元左右,“主流”意味着 400-600 美元,“高端”是指售价 800 至 1,000 美元的 GPU,而“发烧友”部分的目标是 1,500 美元或更高。或者至少,这似乎是 Nvidia 对这种情况的看法。AMD 的 GPU 往往更实惠一些,尤其是从市场价格来看,但 Nvidia 至少在过去四年里一直保持着较高的定价结构。

Blackwell GPU 上市后价格会好坏参半吗?如果所有产品的价格都比上一代产品高,请不要感到惊讶,尤其是带有工厂超频功能的定制 AIB 合作伙伴型号。未来几个月价格是否保持高位可能在很大程度上取决于 AI 泡沫是否破裂。如果对 AI 的需求持续增长,那么 RTX 5090 的价格降至 2 美元也不足为奇。499——与旧款Titan RTX一样。

鉴于我们迄今为止所说的一切,希望可以清楚的是,目前还没有关于 Blackwell 的任何官方信息。2022年的 Nvidia 黑客攻击给了我们 Blackwell 这个名字和一些潜在的代号,但那是两年多前的事了,这段时间里很多事情都可能发生变化。此外,关于 Blackwell 的细节一开始就很少。但现在距离所谓的发布还有几周的时间,泄密事件也变得更加具体。

这是我们更新的推测规格表,其中包含适当的名称和规格。官方公告尚未确定任何事情,但下个月推出的任何产品都可能与我们在此处展示的非常相似,我们也会在 GPU 正式发布后更新表格。

https://www.tomshardware.com/pc-components/gpus/nvidia-blackwell-rtx-50-series-gpus-everything-we-know

半导体精品公众号推荐

专注半导体领域更多原创内容

关注全球半导体产业动向与趋势

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第3996期内容,欢迎关注。

『半导体第一垂直媒体』

实时 专业 原创 深度

公众号ID:icbank

喜欢我们的内容就点“在看”分享给小伙伴哦

AI蓝媒汇

2025-01-06

证券之星资讯

2025-01-06

证券之星资讯

2025-01-06

证券之星资讯

2025-01-06

首页 股票 财经 基金 导航