|

财经

英伟达RISC-V,去年出货10亿颗

来源:半导体行业观察

2025-03-03 09:13:17

(原标题:英伟达RISC-V,去年出货10亿颗)

如果您希望可以时常见面,欢迎标星收藏哦~

来源:内容编译自riscv,谢谢。

在最近的 RISC-V 北美峰会上,NVIDIA 多媒体架构副总裁 Frans Sijstermans 深入阐述了 NVIDIA 选择 RISC-V 作为其嵌入式微控制器架构的原因,以及它如何成为其产品成功的重要组成部分。

NVIDIA 与 RISC-V 的历史可以追溯到 2016 年,当时该公司开始将其内部 Falcon 微处理器(用作 GPU 产品的逻辑控制器)转换为新的替代方案。在评估了可用的架构后,NVIDIA 选择了 RISC-V ISA,从那时起,他们一直在将 RISC-V 微控制器添加到其产品中并替换掉传统的 Falcons。

在其 10 年的生命周期中,NVIDIA 估计已出货了约 30 亿台 Falcon 处理器,而这一转变最终将导致数十亿台 RISC-V 处理器的出货量。通常,每个 NVIDIA 芯片组包含 10 到 40 个 RISC-V 核心,具体取决于配置。2024 年,根据出货的芯片总数,它们将突破 10 亿台 RISC-V 处理器大关。

自首次社区会议以来,NVIDIA 一直是 RISC-V 社区的积极成员,并且几乎一直在董事会层面拥有代表权。他们参与了许多技术工作组,既贡献和分享他们的工作,也从其他社区成员的共同贡献中受益,同时还参与了 RISE 软件组织。

尽管如此,NVIDIA 并不经常与 RISC-V 联系在一起,这可能是因为它的大部分工作都是内部完成的,而且虽然很重要,但往往与其产品的非面向客户方面有关。这些可以分为三个关键领域,其中 RISC-V 在 NVIDIA 产品组合中发挥着重要作用:

  • 功能级控制器包括视频编解码器、显示器、摄像头、内存控制器(训练)、Chip2Chip 接口和上下文切换;

  • 芯片/系统级控制,包括资源管理、电源管理和安全;

  • 数据处理包括网络中的数据包路由和激活以及 DLA(非 GPU)中的其他 DL 网络层;

NVIDIA 从 32 位 Falcon 核心过渡到 RISC-V 最初是出于对 64 位功能的需求。他们的第一个 RISC-V 开发是一个相当普通的双发射无序 RISC-V 核心,带有标准扩展,可部署为多处理器版本。随后,他们为面积受限的应用程序添加了 32 位版本,以及带有 1024 位矢量单元的矢量处理器。


NVIDIA 还开发了几个自定义扩展,其中一些是 NVIDIA 独有的,另一些则对普通用户有益。例如,2kB 页面大小扩展是 NVIDIA 独有的,可将旧软件性能提高 50% 。同样,64 位地址扩展在非常大的系统中很有用,例如数据中心,其中内存是分布式的,并且可能相距甚远。

相反,他们的指针掩码扩展对于整个社区的安全应用具有实用潜力。因此,NVIDIA 将该扩展提交给 RISC-V 标准,该标准已获得批准,目前已被众多社区成员使用。

NVIDIA 具有额外的扩展,可实现一般功能、安全性和性能,虽然这些都不是特别先进,但对于整个系统来说至关重要。

NVIDIA 的 SoC 使用自己的 RISC-V 子系统,名为 Peregrine。除了 RISC-V 内核之外,它还包括其他外设,例如 DMA 和安全 IP。Peregrine 对 NVIDIA 至关重要,因为它允许他们选择和重复使用他们想要包含的 30 多个系统控制和管理应用程序中的任何一个,而无需每次都进行特定的独立开发工作。RISC-V 架构使 NVIDIA 能够灵活和模块化地根据需求配置子系统。例如,他们可以选择 32 位或 64 位内核,然后选择工作负载所需的特定扩展,从而最大限度地提高开发重用率和投资回报率。


类似地,在软件方面,所有 30 多个应用程序都使用一个单一的堆栈,这允许在应用程序级别大量重用启动、操作系统、分离内核和库等项目。


NVIDIA 同样致力于使其产品尽可能安全,包括使用内部攻击性安全团队部署为“黑客”,积极尝试通过查找弱点、漏洞和错误来破坏设计。

Peregrine 子系统的核心组件是分离内核,可以将其视为非常基本的虚拟机管理程序系统。它将系统划分为彼此独立且可以单独验证的不同部分。这允许用户在单独的分区上运行不同的软件。例如,符合安全要求且获得 ASIL-D 认证的应用程序可以在一个分区上运行,而另一个未经认证的应用程序可以在另一个分区上独立运行。


NVIDIA 拥有 30 多个不同的系统控制和管理应用程序,这些应用程序使用 RISC-V 核心,并且可以根据具体用例灵活部署。下面详细介绍了其中两个应用程序。

首先,GPU 系统处理器 (GSP:GPU System Processor) 为 NVIDIA 带来了软件处理方式的根本性变化。GSP 是位于 GPU 顶部的处理器,它抽象了 GPU 中可以执行的操作。主机处理器和内核驱动程序不再使用 GPU 内部的单独控制寄存器,而是直接与 GSP 通信,GSP 将这些高级命令转换为低级控制寄存器速率。


GSP Peregrine 拥有 64 位 RISC-V 处理器,提供单 hart 和多 hart 版本。最重要的是,GSP 可以完全访问 GPU 中的所有内容,包括内存和显示控制器,这些都需要在软件中非常小心地管理。从软件角度来看,用户可以部署具有内核驱动程序和多个客户虚拟机的主机处理器。客户虚拟机在 GSP 上有相应的 vGPU 运行时分区,分离内核确保它们相互隔离且不会相互干扰。资源管理器交换不同的客户机并确保分配公平。此功能支持特定用例,例如机密计算,其中 GPU 移交给客户机而不会受到虚拟机管理程序的任何影响。在这种情况下,RISC-V 架构对于安全性至关重要,因为它具有特定的隔离功能以及 NVIDIA 自己的扩展属性。

描述的第二个支持 NVIDIA RISC-V 的应用程序是深度学习加速器,它是某些 AI 专用 SoC 的一部分。这本质上是一个在图形处理中编程的推理引擎。一个例子是 ONNX 程序,它表示在深度学习网络中处理的层图。然后,它使用标准 RISC-V 编译器获取内核代码并将其编译为可执行文件。最重要的是,有一个 RVV 编译器将其转换为可加载文件。还可以将不同的内核组合成一个内核,以便在运行时实现最快的执行速度。

DLA 并不会在 RISC-V 处理器上运行所有东西,主卷积核心和矩阵乘法器是独立的实体。在下面的硬件图中,有两个 RISC-V 处理器,一个是控制;一个简单的 32 位单元,然后是矢量,即 NVRVV,一个 1024 位矢量单元。有一个卷积核心和总共六个硬件引擎。例如,Rubik 是一个智能 DMA 数据转换器,可以移动数据,而 RISC-V RVV 矢量处理器用于大多数非矩阵乘法器的层。简而言之,它本质上是在 DLA 上运行的完整 ONNX 实现。


总而言之,NVIDIA 选择 RISC-V ISA 以及它取得成功的原因有 5 个:

  1. 定制:定制能力是关键,因为它允许 NVIDIA 最大限度地利用硅片。RISC-V 许可模式允许他们使用基本 ISA 作为构建块来调整芯片,并添加适合特定应用要求的扩展和配置文件;

  2. 硬件/软件协同设计:这是关键,因为它可以确保硬件针对软件工作负载进行优化,从而提高效率和性能;

  3. 配置选项:标准的“现成”处理器通常针对应用程序进行了过度指定。借助 RISC-V,NVIDIA 可以通过仅使用特定所需的扩展来配置其实现,从而节省成本和开发工作;

  4. 自定义扩展:允许 NVIDIA 添加自己的功能要求,如特定功能、安全性和/或性能;

  5. 一个通用的硬件和软件架构:允许 NVIDIA 在其 30 多个应用程序中重复使用资产,而无需为每个应用程序创建或调整新架构。减少开发工作量、简化部署并降低成本;


https://riscv.org/blog/2025/02/how-nvidia-shipped-one-billion-risc-v-cores-in-2024/

半导体精品公众号推荐

专注半导体领域更多原创内容

关注全球半导体产业动向与趋势

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4052期内容,欢迎关注。


『半导体第一垂直媒体』

实时 专业 原创 深度

公众号ID:icbank

喜欢我们的内容就点“在看”分享给小伙伴哦


半导体行业观察

2025-03-03

半导体行业观察

2025-03-03

半导体行业观察

2025-03-03

半导体行业观察

2025-03-03

半导体行业观察

2025-03-03

半导体行业观察

2025-03-03

证券之星资讯

2025-03-03

证券之星资讯

2025-03-03

证券之星资讯

2025-03-03

首页 股票 财经 基金 导航