|

财经

中美Ai叙事和背后的算力逻辑

来源:雪球

2025-04-03 09:36:30

(原标题:中美Ai叙事和背后的算力逻辑)

自DS出现以后,我看网上没有很好的一篇文章去总结目前中美ai叙事的差异以及背后的算力需求。简单来说:

China Ai叙事:DS开源带来的LLM平权以及由此延伸的各种ds蒸馏小模型端侧(包括一体机)、边缘侧的ai应用落地,大有全面开花之势。

China算力:H20和国产Asic就行,甚至端侧还有更简单的方案。当然杰文森悖论还是适用的,大厂加大数据中心投入。

北美Ai叙事:继续大力出奇迹通往AGI,各种多模态高阶模型推出,万亿参数大模型继续走起。

北美算力:高端NV卡仍然供不应求,GPUs are melting。。。

现在的gap在于:显然北美这条路出成果没这么快,而国内ai叙事(还有考虑到我们的文化和商业环境)出成果很快,毕竟国人比较务实,成本要算得过来,朱xh不是说了嘛,ai会议纪要就能一个月赚几千万,这种ai应用需要毛线NV Rubin。

所以在这种微妙的北美空档期,对NV的质疑就比较多了,再叠加DS和Qwen这种百亿参数LLM模型达到了和gpt4一样的效果。。。不得不赞叹国人Ai infra能力。

另外DS的Ai infra能力可能是一个变数(下文会反复提)

另外还有一些关键问题:那就是随着DS的出现和国产芯片的崛起,我们究竟还需不需要高端NV芯片(比如GB300),是不是以后H20和国产芯片就够用了?DS究竟改变了算力什么又没有改变什么。以及像zj、ali这种只能大规模部署H20的将来和北美csp大规模部署GB300和A100的究竟有什么差距?

先说结论:1、如果ai应用只是LLM chatbot(比如Deepseek)这种形式。或,2、几乎所有的端侧ai推理(自动驾驶除外)。那么无论是H20或910c其实真的够用了,甚至一些异构芯片比如fpga+risc-v都能跑一些简单的例如ai端侧(包含一体机)的推理。这也是为什么前段时间有声音说中国的ai叙事和北美不一样,或我们在没有高端芯片的前提下依然实现了ai大规模应用。这也是投资人在诟病NV股价预期的一个关键背景。

那么什么情况下H20和910c不太行呢?

1、像GPT-4o这种文生图以及大部分多模态应用。尤其是4o这种需要高并发并实时生成的应用,用H20卡不说(需要3-5秒而H100只需要1秒),且需要高显存+大宽带,这时候就得用GB300这种芯片来跑。

所以各位小伙伴期待的国内版文生图可能就要等等了,哪怕推出了估计也会卡得要死。主要是还是卡不行。

其实你看tx的微信就是聊天,所以llm对于他们暂时就够用。而zj因为是视频起家,肯定对于高端卡的需求是更大的。前面没说的是Ai视频生成更需要500+tflops和48G显存,更需要NV的高端卡。

这也是为什么我们直到现在都没看到国内的csp推出多模态的Ai应用

有一个变数是DS的Ai infra的能力,如果V4是多模态而又不耗卡(很难想象是否能做到),这也是对NV的致命一击。

2、千亿乃至万亿参数大模型的训练(比如GPT5)。这个很好理解了,for AGI需要继续加大算力投入,NV高阶芯片主要是互联厉害,非常有利于训练百万卡集群的大模型。

3、Ai for Science。比如Ai医疗生物科技里面我非常看好的AlphaFold3,可以预测大分子相互作用的Ai算法对于创新药研发和合成生物学的选品可能是革命性的影响(顺便吐槽一下晶泰这种小分子还属于上一代ai叙事几乎没法用于实战)。另外一些手术机器人或者多模态的Ai诊断因为其低延时的需求(毕竟做手术嘛,1秒都宝贵)。

4、高阶Agent应用。主打一个高并发(例如Ai游戏可能1秒钟内有数百万个Ai NPC交互)、超长上下文记忆(例如Ai医疗诊断,法律判决、超复杂办公场景解决输出,ai可能一下子需要记住数万个token)、多模态(比如有视频介入的agent)。反之就是一些简单的agent,比如朱xh举例的会议纪要agent、简单的做题agent等等,用国产芯片足矣。

所以总结一下:当出现高并发、多模态、超低延时需求的场景的时候,NV的高端卡是很吃香的,尤其是多模态,单次交互可能就需要500 TFlops(H20也就750 TFLops,可能一次就用光了。。。)

可以看到1、2、3、4也就1刚刚有些苗头,234出成果都没那么快。如果只是基于chatbot这种llm模型那无疑是DS(还有我们特色的Ai)就完胜了:成本比你低、落地比你快、赚钱比你有路子,比如tx的元宝一接入DS就有2000万DAU日活,这就使得无论是投资人甚至是北美csp自己都在怀疑自己的路线是否值得(太正常了,都是人嘛),所以最近北美算力鬼故事很多,而国产算力一开始就是瞄着落地去的,所以capex反而更扎实。

但一旦上面的1234有了突破,我相信情况马上就会反转,这也是为什么像国内csp大厂一直不敢大规模部署国产算力而要抢NV卡的原因(这跟三大运营商不一样,运营商几乎都配国产),我们假设GPT-4o文生图是一个巨大的赚钱利器,很难想象国内不去follow还停留在chatbot模式,而这必然会带来高阶NV卡的供不应求而动摇国内各种端侧的ds叙事。此外再次强调DS V4可能的Ai infra能力看看能否继续撼动NV卡的逻辑,这确实是一个很大的变数。

fund

首页 股票 财经 基金 导航