来源:半导体行业观察
2025-02-23 12:15:41
(原标题:为何大家还在抢AI芯片?)
如果您希望可以时常见面,欢迎标星收藏哦~
来源:内容来自MSN,谢谢。
尽管投资者曾短暂怀疑,但大型科技公司、国家政府和风险投资家以前所未有的规模向人工智能投入资金。要理解原因,我们需要了解人工智能本身正在发生的变化。
技术正从传统的大型语言模型转向推理模型和人工智能代理。训练传统的大型语言模型(你在大多数人工智能聊天机器人的免费版本中遇到的那种)需要大量的电力和计算时间。但我们正在迅速找到减少它们在人类调用时运行所需资源的方法。推理模型基于大型语言模型,不同之处在于它们的实际运行消耗更多的资源,包括微芯片和电力。
自OpenAI在9月预览其第一个推理模型o1以来,人工智能公司一直在竞相发布能够与之竞争的系统。这包括DeepSeek的R1(在今年年初震撼了人工智能界以及许多科技和电力公司的估值)和埃隆·马斯克的xAI(刚刚推出了其Grok 3推理模型)。
DeepSeek引发了一场恐慌,因为它表明可以用比其他模型低得多的成本训练人工智能模型,这可能会减少对数据中心和昂贵的高级芯片的需求。但DeepSeek实际上做的是将人工智能行业推向资源密集型推理模型,这意味着计算基础设施仍然非常需要。
由于其增强的功能,这些推理系统很可能很快成为人们在许多任务中使用人工智能的默认方式。OpenAI首席执行官萨姆·奥特曼表示,该公司人工智能模型的下一次重大升级将包括高级推理功能。
为什么推理模型以及它们所支持的产品(如“深度研究”工具和人工智能代理)需要更多的电力?答案在于它们的工作方式。
英伟达人工智能产品管理副总裁卡里·布里斯基在最近的一篇博客文章中写道,人工智能推理模型可以轻松使用比传统大型语言模型多100倍的计算资源。这种倍增效应来自于推理模型花费数分钟甚至数小时与自己对话(并非用户都能看到),形成一个漫长的“思维链”。模型使用的计算资源量与生成的单词数成正比,因此生成100倍单词来回答问题的推理模型将使用更多的电力和其他资源。
当推理模型访问互联网时,情况会变得更加资源密集,例如谷歌、OpenAI和Perplexity的“深度研究”模型。
这些对计算能力的需求只是开始。反映这一点,谷歌、微软和Meta Platforms计划在2025年集体支出至少2150亿美元的资本支出,其中大部分用于人工智能数据中心。这将比他们去年的资本支出增加45%。
为了展示对未来人工智能需求的预测,我们可以列出一个简单的等式。
等式中的第一个值是处理人工智能(如ChatGPT)中的单个信息令牌所需的计算资源量。
1月份,在中国人工智能模型DeepSeek R1发布后,每个令牌的成本(包括计算能力和美元)似乎会暴跌。DeepSeek及其随附的论文表明,以一种比美国人工智能实验室先前披露的方法更有效的方式训练和交付人工智能是可能的。
从表面上看,这似乎表明人工智能未来对计算能力的需求将是当前数量的一部分,比如十分之一甚至更少。但推理模型在回答查询时增加的需求可能会弥补这一点。最简单地说,如果基于DeepSeek见解的新型更高效人工智能模型将人工智能的计算能力需求削减十分之一,但推理模型成为标准并将这些模型的需求增加100倍,那么未来人工智能的电力需求仍然会增加10倍。
这只是起点。随着企业发现新型人工智能模型功能更强大,他们越来越频繁地调用它们。这正在将计算能力的需求从训练模型转向使用它们,即人工智能行业所说的“推理”。
为其他公司提供人工智能计算资源的Baseten首席执行官图欣·斯里瓦斯塔瓦表示,向推理的转变已经开始。他的客户包括在其应用程序和服务中使用人工智能的科技公司,例如Descript(允许内容创作者直接从录音的文字记录中编辑音频和视频)和PicnicHealth(一家处理医疗记录的初创公司)。斯里瓦斯塔瓦说,Baseten的客户发现,随着他们自己产品的需求迅速增长,他们需要更多的人工智能处理能力。
“对于一位客户,我们在六个月前将他们的成本降低了大约60%,但在三个月内,他们的消耗量已经高于最初的消耗量,”他补充道。
OpenAI、谷歌和Meta等公司所有大型人工智能实验室仍在竞相通过训练功能更强大的人工智能模型来超越彼此。无论成本如何,目标都是尽可能多地占领仍处于萌芽状态的人工智能市场。
“我认为前沿实验室需要不断投入大量资金以推动前沿发展是完全有可能的,”Fractional AI首席执行官克里斯·泰勒说。该公司总部位于旧金山,帮助其他软件公司构建和集成定制人工智能。与Baseten和蓬勃发展的人工智能生态系统中的许多其他公司一样,他的公司依靠这些尖端模型为其客户提供结果。
风险投资家和Theory Ventures创始人托马斯·通古兹表示,在未来几年内,新的创新和更多人工智能专用微芯片可能意味着向最终客户交付人工智能的系统比现在高效一千倍。他补充说,投资者和大型科技公司正在押注,由于推理模型和快速采用,未来十年人工智能模型的需求量可能会增加一万亿倍或更多。
“你键盘上的每一次按键,或你对着麦克风发出的每一个音素,都将由至少一个人工智能转录或操作,”通古兹说。他补充说,如果是这样,人工智能市场很快就会比现在大1000倍。
半导体精品公众号推荐
专注半导体领域更多原创内容
关注全球半导体产业动向与趋势
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4044期内容,欢迎关注。
『半导体第一垂直媒体』
实时 专业 原创 深度
公众号ID:icbank
喜欢我们的内容就点“在看”分享给小伙伴哦
半导体行业观察
2025-02-23
半导体行业观察
2025-02-23
半导体行业观察
2025-02-23
半导体行业观察
2025-02-23
半导体行业观察
2025-02-23
半导体行业观察
2025-02-23
证券之星资讯
2025-02-22
证券之星资讯
2025-02-21
证券之星资讯
2025-02-21