来源:半导体行业观察
2025-07-08 09:40:49
(原标题:思科用一颗芯片,硬刚博通)
公众号记得加星标⭐️,第一时间看推送不会错过。
来源:内容编译自nextplatform。
人工智能是自互联网泡沫以来 IT 基础设施领域最大的变革,因此上个月在圣地亚哥举行的思科年度现场活动上,焦点集中在人工智能(尤其是代理人工智能)上,以及这家网络巨头如何在新兴技术方面与其他基础设施供应商区分开来,这并不奇怪。
思科推出了全新的网络架构,其中包含专为人工智能 (AI) 打造的设备,并高度重视嵌入式安全。公司高管宣称,思科以最完整的堆栈迈入人工智能时代,其Silicon One 网络芯片是其基础元素。关键在于 Silicon One 的可编程性,思科总裁兼首席产品官 Jeetu Patel 指出,这使得该芯片无需流片即可承担新的工作负载。
Patel 表示,Silicon One E4 解决了路由逻辑、扩展、跨大型集群的负载平衡以及将安全性融入芯片本身等方面的严峻挑战。他补充道:“它创造了一种更具可扩展性的方式,可以满足企业对 AI 的需求。这是一个极具战略意义的领域。我们通常不会过多地谈论它,因为我们不想讨论基础设施中的所有细节。我们想讨论应用程序是什么。但其超强能力来自于构建整个堆栈并将其集成在一起的方式。”
Silicon One 芯片背后的推手是思科通用硬件事业部执行副总裁马丁·伦德 (Martin Lund)。Next Platform在展会上采访了伦德,探讨了这款芯片及其在不断发展的人工智能领域中的作用。
问:对于思科来说,在谈论人工智能时,拥有硅片和 SiliconOne 为何如此重要?
Martin Lund:硅片是引擎。这就是创建高性能网络的方式。你不能只用软件来实现。你无法满足性能、延迟和功耗要求,所以你必须构建专用硅片。思科已经打造ASIC芯片40年了,所以这并不是什么新鲜事。其他所有从事网络(高性能网络)的公司都在使用某种形式的硅片,无论是他们自己制造的(很少有人这样做),还是他们自己制造的所谓的商用交换芯片。为了让你了解过去20年(也就是20年)的性能提升,芯片的性能在20年内提升了10000倍,达到了4个数量级。
问:思科与英伟达建立了密切的合作关系,英特尔也生产芯片,云服务提供商也在自主研发芯片。但选择其中任何一家都不是思科的正确选择。
Martin Lund:很少有厂商会自己生产交换芯片。大多数供应商会为特定计算资源生产自己的芯片。谷歌有一个张量处理单元 (Tensor Processing Unit),在某些情况下,他们会用它来替代英伟达。网络芯片很复杂。制造这类芯片的成本很高,而且实际上只有少数几家公司能够生产这样的芯片。
对我们来说,这是我们的核心业务。我们是一家网络公司。我们的独特之处在于,在2019年宣布Silicon One时,我们就决定:“超级销售商,我们会在您所在的地方与您见面。我们会向您出售搭载思科软件的思科系统。我们会向您出售一个装有我们芯片的盒子,您可以安装自己的软件,就像一个白盒。或者,我们只卖芯片,您可以自行构建系统。无论您想以何种方式使用这项技术,我们都能接受。我们会提供支持。”
这在很大程度上是一种合作模式和开放的生态系统方法,这确实引起了他们的共鸣。他们也意识到,他们需要替代供应商,因为在产品组合广度和性能方面,无论是高端还是低端,可能只有一家供应商能与我们匹敌。
问:那么我们在谈论博通吗?
Martin Lund:是的。
问: 在 Cisco Live 上,大家对 Silicon One 芯片的可编程性进行了大量讨论。这对于思科和你们在 AI 时代的客户意味着什么?
Martin Lund:可编程性是一种交付方式。如何使用它才是最重要的。我们拥有的设备还有许多其他特性,使它们非常出色且具有竞争力。例如流量管理功能、缓冲方式、故障管理和负载平衡方式等等。但这些都与我们的编程能力息息相关。如果你还记得的话,在过去,它被称为网络处理单元 (NPU)。后来人们称之为 DPU,即数据处理单元,它是一种内置编程功能的网卡 (NIC)。现在我们有了 GPU 和 XPU。这些本质上就是 NPU,但我们不一定称之为 NPU,因为 NPU 的内涵是它们在那个年代速度慢、延迟大。但它就是这样可编程的。它采用一种非常独特的架构,因此我们不必像过去那样因为可编程而付出代价。这是一种非常新颖的架构。
这对超大规模企业来说有很多好处。服务提供商和企业客户都有好处,只是领域略有不同。在人工智能时代,它已经以我们最初未曾预见的速度迅速发展,这种灵活性体现为优势。超大规模企业往往拥有非常庞大、非常复杂的网络,他们确实需要非常高效地实现流量负载平衡。我们有能力通过我们的编程模型提出新颖、高效的负载平衡技术。他们的网络运行得更好、更快。服务提供商可能还有另一个痛点。例如,分段路由。分段路由是现有的关键功能之一,当我们构建用于该网络的另一款芯片时,它还没有完全标准化,所以我们对其进行了软件升级,现在我们支持分段路由。
对于企业而言,我们在此宣布的智能交换技术——将安全性融入网络——我们正在利用可编程性来启用和加速我们在 HyperShield 和其他智能交换机产品中所拥有的网络功能。人工智能的另一个例子是超级以太网联盟 (UEC)。这是一个规范。同样,在编写规范时,我们利用了可编程性来支持它。正是由于我们的可编程性,我们才能够支持所有这些功能。具体优势取决于您的视角。您可以获得性能更佳的网络,获得更长的使用寿命,并获得更快的创新速度。所有这些都源于同一种架构方法。
问:在与记者和分析师的问答环节中,我们谈到了这种可编程性如何让企业无需等待即可引入新的用例。您能简单谈谈这一点吗?
Martin Lund:说到底,网络必须支持各种各样的应用。你可以在上面运行电子邮件、视频、语音,现在你还要用到AI代理来进行网络通信。如果有很多这样的代理,你可能会对网络提出更高的要求。我们正在构建的灵活性,部分原因在于它尚未发明。我们目前还不知道它是什么,但我们有信心我们完全有能力支持它。面向未来。代理会是什么?我们如何知道它们需要多少个代理以及它们想要什么样的QoS模型?我们还不知道,因为它们还没有被构建出来。它还没有被发明出来。这只是面向未来,我知道我可以升级它,这样就能解决未来的问题。这就像反叉车一样。这就像投资保护,而且还能获得一个具有可观察能力的网络,这样您就可以真正看到正在发生的事情,并且拥有良好的遥测技术。
这是超大规模数据中心运营商一直非常努力推动的需求之一。他们需要了解自己的网络,需要了解正在发生的事情,而我们已将许多此类功能引入到其他产品线中,因此我们在这些设备中拥有非常非常好的遥测功能。
问:投资保护也变得有趣,因为正如这里所讨论的,Nvidia 每年都会推出新的 GPU,而企业无法像跟上每个新加速器那样快速改变。
Martin Lund:我们的许多客户希望解决方案能够运行七到十年,因此,满足未来需求并灵活应对这些需求和支持的能力至关重要。这是一个关键优势。有些供应商会声称他们的产品是可编程的,因为你可以使用软件来改变行为,但这并不是我们所说的可编程。我们的意思是,芯片中运行的代码可以实现这些功能。其他一些供应商的方法则是,他们称之为可编程,但实际上更具可配置性,被称为“表驱动”,也就是说,你可以更改配置,但无法改变其本质或特性。而我们可以改变这些设备的特性。
问:ChatGPT 发布后的头两年,主要关注的是训练。训练永远都会存在,但现在更侧重于推理。对于像思科这样拥有 Silicon One 的公司来说,这意味着什么?
Martin Lund:我认为训练就是训练。这就像你去上学,学习一些东西。推理是你离开学校后真正投入工作。未来工人的数量将远远超过在校学生的数量,而且他们将从事生产性工作。除了模型性能、幻觉和其他所有这些东西之外,是什么限制了人工智能作为一种工具的适用性呢?归根结底,这取决于运行机器的成本。其效益系数是每令牌成本。每令牌的成本是多少美分,或者皮美分,或者其他任何分数?我能多快完成?每个令牌的吞吐量是多少,花费多少美元?也许,每百万令牌一美元是另一种思考方式。
但随着成本的下降——因为所有的硅片集成、优化和beta模型,每个代币的价格都在下降——这意味着将有更多的工作负载。还有其他方面,因为随着模型的改进,它们会运行同样的问题,也许不是一次,而是在同一个循环中运行12次。你会进行更多的循环。你会进行强化学习。这会增加更多的力量。培训过去很重要,现在仍然很重要。大型数据中心需要培训。但生产性工作才是真正创造价值的地方,而这将无处不在。它将在云端。它将在私人数据中心。它将在边缘。它在手机上。这个机会是巨大的。
问:这是否会改变您对 Silicone One 所需要做的事情的看法?
Martin Lund:确实如此。这有点像我们的瀑布模型。我们在超大规模领域不断突破极限,尽可能快地发展。这就是我们正在进行的竞赛,就像在跑步机上一样。不断前进。然后,我们会采用一些技术,并进行规模化。我们目前的芯片速度是 51.2 Tb/秒。对于某些企业来说,这可能有点过头了。他们仍然需要同样的技术,但这实在是太多了。他们不需要那样的速度。将来会有类似的版本,但他们无法冷却它,所以我们会推出一个尺寸可能是一半或四分之一的版本。我们会把它做得更小,这样更适合。我们仍然会推进前沿技术的发展,然后我们以瀑布式的方式逐步推进剩余的技术。这个瀑布式的推进大概需要半年到一年的时间,不会太久。
问:那么我们可以预期,大概一两年后,你们会推出不同的版本来满足不同公司不同的工作量或至少是规模需求?
ML:是的,根据时间框架,您可能会对未来更加乐观。
问:这里提出的一个问题是,考虑到 Silicon One 的功能,您是否考虑将其扩展到包括 GPU 或类似的东西。
Martin Lund:Silicon One 架构就是思科的 Silicon One 架构。它是一种交换架构。我们还有其他自己开发的定制硅片,比如 NIC。我们还有其他技术,其他 ASIC。我们可能不会称之为 Silicon One,因为它有点像交换机。也许我们会叫它 Silicon Two?我不知道。就加速器部分而言,这很难。加速器不是我们的核心业务。我们也不自己生产服务器芯片。我们从合作伙伴那里采购。
真正的问题是,在计算市场,GPU 才是主力。有些应用可能不适合 GPU,需要其他专门的解决方案,但就目前而言,我认为我们非常专注于自己的业务。我们在网络和安全领域拥有足够广阔的舞台,我们拥有优秀的合作伙伴和解决方案,而且这个领域发展非常迅速。我们有能力制造处于芯片开发绝对前沿的大型复杂芯片吗?是的,我们有。这或许是一个鲜为人知的秘密。
问:展会上人们经常谈论思科和Silicon One不仅专注于交换,还涉足安全领域。从芯片的角度来看,这对您意味着什么?
Martin Lund:网络安全领域及其增值方式非常广阔。我们可以与安全架构师等共同创新,其中很大一部分是加速。很多安全措施都基于采样,因为你无法满足所有需求。但如果可以的话,如果你有硅片加速技术驱动,或许你可以在硬件上实现,在芯片上进行分析,或者在芯片上进行部分分析,并将其卸载。
如果你听过思科总裁兼首席产品官 Jeetu Patel 的评论,他表示,关键在于精简数据,因为数据量太大了。你可以通过采样来精简数据,也可以通过在芯片上进行计算和分析来精简数据,然后再将精简后的信息发送出去。此外,我们还在设备中内置了加密和其他功能,例如 MacSEC 和 IPSEC 加速等。
软件什么都能做,对吧?只是速度不够快。服务器不够用,所以硅片就成了加速器。我有个经验法则,现在看来可能仍然正确:用硅片(比如晶体管、定制硅片)进行优化,比用通用CPU运行要快一千到一万倍。更快通常意味着速度和功耗在同一条曲线上——速度越快,性能就越好,功耗也就越低。我们现在看到的手机就是一个很好的例子。它们有GPU,有各种芯片,但功耗仍然很低。
问:人工智能最有趣的一点是创新速度。再说一次,从芯片的角度来看,当您考虑芯片的未来发展方向时,这意味着什么?这其中是否涉及猜测?
Martin Lund:在芯片制造中,我们通常不靠猜测。我们恰恰相反。我们狂热地认为每个晶体管都必须正常工作,否则芯片就无法工作。但我们必须下注,我们必须下注某些事情会实现。虽然我们说,它们今天还没有实现,但两年后它们会实现。我们就是这样下注的。
很少有人真正理解整个堆栈——模型、计算软件、加速器、网络——的发展速度有多快。在网络堆栈内部,有光学器件、芯片,还有从电源管理角度整合的硬件系统。整个系统正以闪电般的速度发展。这非常令人兴奋,但也有一些团队或公司偏离了正轨,很遗憾,他们已经不复存在了。
你可能不会想到,但你造了这样的东西,你的公司依赖它,你犯了一个非常严重的错误,所以现在你不得不重蹈覆辙。下次你再看到它,已经是一年或一年半之后了。你的竞争对手已经完成了比赛。也许这就是我非常喜欢可编程性的一个小原因,因为如果出现问题,我可以修复。但很多事情都很难。这很困难,我们正在突破物理极限,还有很大的创新空间。当然,也有可能出错,但我认为这也正是它的乐趣所在。
https://www.nextplatform.com/2025/07/07/silicon-one-many-cisco-chips-with-one-architecture-chasing-many-ai-workloads/
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4088期内容,欢迎关注。
加星标⭐️第一时间看推送,小号防走丢
求推荐
大众证券报
2025-07-08
半导体行业观察
2025-07-08
半导体行业观察
2025-07-08
半导体行业观察
2025-07-08
半导体行业观察
2025-07-08
半导体行业观察
2025-07-08
证券之星资讯
2025-07-08
证券之星资讯
2025-07-08
证券之星资讯
2025-07-08