364元就能开发DeepSeek模型？假的！

来源：21世纪经济报道

媒体

2025-02-07 21:44:17

（原标题：364元就能开发DeepSeek模型？假的！）

近日，一则“炸裂”的AI新闻引发全球关注。

斯坦福大学和华盛顿大学的研究人员发表的一篇研究论文显示，他们以不到50美元(约364元)的云计算费用，训练出一款名为S1的推理模型。该模型在数学和编码能力测试中，与OpenAI的o1和DeepSeek的R1表现不相上下。

这是AI领域的又一次重大突破吗？事实并非如此。

根据研究论文，S1模型并不是从零开始训练，而是以阿里通义千问Qwen2.5-32B开源模型为底座，然后在16块H100 GPU上进行了26分钟的监督微调，最终训练出新模型S1-32B。

在推理能力方面，研究人员则通过蒸馏技术，从谷歌的AI推理模型Gemini 2.0中提取了推理能力。

某大模型厂商的研发人员告诉21世纪经济报道记者，S1模型本质上是在前人研究的基础上复制了推理能力，而非真正创新。

但S1模型的出现，也为头部大模型厂商敲响警钟。如果头部大模型厂商投入巨大资源训练出来的模型，其他人用极少的资源就能复制并实现相似的能力，那头部厂商的“护城河”究竟是什么？

相关阅读

智通财经

2026-03-18

阿里、上汽旗下斑马智能再次递表港交所

观点

2026-03-18

金吾财讯

2026-03-18

远洋服务预计2025年度亏损13.5亿-14.5亿元

观点

2026-03-18

迪士尼正式换帅 D’Amaro接任首席执行官

观点

2026-03-18

中建东孚上海宝山中环麓岛二批次开盘售罄

观点

2026-03-18

重罚！监管层重磅出手

证券之星资讯

2026-03-18

券商今日金股：5份研报力推一股（名单）

证券之星资讯

2026-03-18

“一人公司”爆火！多家银行争先布局OPC金融

证券之星资讯

2026-03-18

首页股票财经基金导航

举报专区联系我们