来源:半导体行业观察
2025-09-07 10:09:52
(原标题:芯片五十年来的最大突破)
公众号记得加星标,第一时间看推送不会错过。
来源 :内容 编译自 semiwiki 。
半个多世纪以来,计算的基础一直建立在单一架构之上:冯·诺依曼模型或哈佛模型。几乎所有现代芯片——CPU、GPU,甚至许多专用加速器——都依赖于这种设计的某种变体。随着时间的推移,业界不断提升复杂性和专业化程度,以满足新的需求。超长指令字 (VLIW) 架构、数据流芯片和 GPU 最初都是作为针对特定瓶颈的单点解决方案而引入的,但都未能提供全面的替代方案。直到现在。
Simplex Micro 开发出的技术可能是半个多世纪以来对传统范式最重大的突破——在单一确定性流水线中实现统一的标量、矢量和矩阵计算。其核心是一个革命性的概念:预测执行。与猜测下一步会发生什么的动态执行不同,预测执行以周期级精度静态地调度每个操作,将处理器转变为具有已知执行时间线的确定性机器。这使得单芯片架构无需单独的加速器即可同时处理通用任务和高吞吐量 AI 工作负载。
确定性执行消除了动态执行的低效性和漏洞。预测性执行无需动态调度指令并回滚错误路径,而是确保每条指令都在正确的时间以正确的资源发出。它不仅更高效,而且可预测、可扩展,并且本质上更安全。
突破在于 Simplex 所谓的“时间资源矩阵”:这是一种新颖的专利调度机制,可以跨时间分配计算、内存和控制资源。每条指令都有指定的时隙和访问窗口,确保零重叠并消除流水线停顿。可以将其想象成火车时刻表——只不过火车是在同步计算结构中移动的标量、矢量和矩阵运算。
这项创新允许单个处理器同时充当 CPU 和加速器,无需切换开销,无需内存层次结构不匹配,也无需在异构单元之间进行昂贵的数据传输。它是一种通用架构,性能堪比专用 AI 引擎,在许多情况下甚至超越了它们。
这种统一是通过一系列已获专利的创新技术实现的,这些创新技术已被证明与现有技术并无直接关联。时间资源矩阵提供了基础的执行调度,而其他突破则将其扩展到新的领域:幻影寄存器允许系统超越物理寄存器文件的限制来流水线化指令;矢量数据缓冲器和扩展矢量寄存器集则支持无缝扩展AI操作的并行计算。指令重放缓冲器确保即使是可变延迟的内存或分支事件也能得到可预测的解析,而无需进行动态执行猜测。
这些发明共同构成了计算引擎的基石,它拥有与 CPU 类似的灵活性,但又能提供加速器般的持续吞吐量,无需两块独立的芯片。无论是矩阵密集型的 AI 推理,还是控制密集型的实时决策,同一个处理器都能高效、同步地处理,无需架构切换。这不仅代表着通用计算的一次演进,更是一次真正的重塑。
随着人工智能工作负载规模和复杂性的不断增长,传统架构不堪重负。GPU 需要巨大的功耗预算,并且仍然面临内存瓶颈。CPU 缺乏现代推理和训练任务所需的并行性。同时,多芯片解决方案也面临延迟、同步和软件碎片化等问题。
借助预测执行,Simplex 提供了一个统一的、时间驱动的机器,该机器已在 RISC-V 矢量处理器中实现,并已准备好集成到下一代 AI 基础架构中。这并非一个理论概念——它实际上是一个基于仿真结果的 RTL 级执行器,可以运行生产代码。
对于芯片架构师而言,这意味着更简单的系统设计,更小的硅片占用空间。对于软件开发人员而言,这意味着可以编写统一、可预测的目标,并具有一致的时序行为——这对于安全关键型和性能敏感型应用来说都是理想的选择。
这不仅仅是性能的提升,更是对架构优雅的回归,一颗芯片即可胜任多种任务,且性能丝毫不受影响。通过消除动态执行,并将执行置于确定性时间窗口内,Simplex 打造了一个可根据未来 AI、边缘计算和云应用需求进行扩展的平台。
随着我们迈入人工智能驱动应用的新时代,对可扩展、统一且确定性计算的需求空前高涨。预测执行奠定了基础,我们诚邀研究和工程界在此基础上继续发展。
https://semiwiki.com/ip/361169-beyond-von-neumann-toward-a-unified-deterministic-architecture/
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4149期内容,欢迎关注。
加星标第一时间看推送,小号防走丢
求推荐
半导体行业观察
2025-09-08
半导体行业观察
2025-09-08
半导体行业观察
2025-09-08
半导体行业观察
2025-09-08
半导体行业观察
2025-09-08
半导体行业观察
2025-09-08
证券之星资讯
2025-09-08
证券之星资讯
2025-09-08
证券之星资讯
2025-09-08