图灵奖得主杨立昆质疑人形机器人热潮：智能瓶颈与产业泡沫何解？

来源：盖世汽车

2025-03-28 11:26:32

（原标题：图灵奖得主杨立昆质疑人形机器人热潮：智能瓶颈与产业泡沫何解？）

2025年3月，计算机视觉领域泰斗、Meta首席AI科学家杨立昆在一档科技播客又发表了一场“爆论”："当下人形机器人的所有演示都令人印象深刻，但这些机器人实际上都很蠢。"这位2018年图灵奖得主的批评，犹如冷水浇向如火如荼的机器人产业。

杨立昆指出三重困境：当前既没有能完成猫狗基本任务的机器人，也缺乏家用服务机器人，更未实现完全自主的L5级自动驾驶。其核心观点直指AI系统的根本缺陷——现有技术无法让机器人真正理解物理世界。"它们不能做人类能做的事情，不是因为缺乏身体能力，而是根本不够聪明。"这种认知差距在家庭场景尤为明显：能完成前后空翻的机器人，面对叠衣服、擦桌子等基础任务却频频失误。

“AI教父”杨立昆为何发表“爆论”

作为卷积神经网络（CNN）之父，杨立昆的质疑绝非外行妄言。1987年提出CNN概念，1998年开发的LeNet-5模型首次实现手写体识别突破，其主导的Llama系列开源大模型更推动AI产业落地。这位学界与工业界的双栖权威，对智能本质有着深刻认知。

在技术层面，他持续批判行业两大误区：

感知缺陷：现有系统无法处理视觉等复杂感官输入，RT-X项目数据显示，即使收集超100万片段覆盖500多项技能，机器人仍难应对桌子高度变化的简单调整。
规划短板：生成式AI仅擅长文本预测，缺乏分层规划能力。家务清洁需分解数十个决策节点，现有算法难以实现因果推理与动态调整。

产业层面，他警示资本市场的"豪赌"风险。数据显示，截至2024年底中国智能机器人企业超45万家，注册资本达6.44万亿元。即便1%企业专注人形机器人，投入规模仍堪称天文数字。但杨立昆直言："很多公司赌未来3-5年AI会突飞猛进，这缺乏科学依据。"

人形机器人的技术难题在哪儿？

物理理解鸿沟。人类叠衣服需实时感知布料质地、判断褶皱形态、动态调整施力，这些涉及多模态感知与物理建模的能力，恰是AI的短板。杨立昆团队提出的联合嵌入预测架构（JEPA）正是试图突破这一瓶颈，但距离实用仍有差距。

机械性能桎梏。人手22个自由度的精妙结构难以复刻，顶尖仿生手如Shadow hand虽达20+自由度，但能耗与成本激增。智元机器人工作人员坦言，其产品效率仅人类20%-30%，且续航不足两小时，行业普遍存在"充电两小时，工作五分钟"的窘境。

图片来源：波士顿动力官网

能源不可能三角。动力、续航、成本的矛盾尖锐。为维持双足行走，某国产机器人需搭载48个关节电机，单日耗电量相当于普通家庭全天用电。硬件工程师戏称："这不是造机器人，是在造移动充电宝。"

行业内是怎么解决的？

面对技术困局，前沿机构已转向务实路线：

场景深耕：蓝橙实验室与清华合作的五轴并联机器人专攻航空发动机叶片打磨，精度达微米级；华中科大吸附式机器人专注船舶焊接，放弃人形换取环境适应性。
技术开源：哈工大朱延河团队建立工业机器人开源架构，共享运动控制算法降低研发成本。
智能重定义：RT-2模型虽在泛化能力上受挫，但特斯拉Optimus通过限定仓储场景，将分拣准确率提升至92%。

这些实践揭示新方向：与其追求"通用智能"的虚幻目标，不如在特定场景建立技术闭环。正如工业机器人历经60年发展，从Unimate机械臂到现代协作机器人，突破均源于对专用场景的深度适配。

总结

杨立昆的言论其实正反映出了当下行业正面临的根本性路线之争：一方坚持"人形是通用智能最佳载体"，认为双足移动与人类环境天然兼容；另一方主张"形态服务于功能"，推崇轮式、模块化设计。现实数据给出警示——在2024世界机器人大会上，人形机器人热舞视频刷屏社交网络的同时，其擦桌失败视频播放量却高出37%，舆论期待与实际表现形成鲜明反差。

杨立昆的批评恰逢其时：机器人产业的终极目标不应是创造"人造人"，而是拓展人类能力边界。当45万家企业深陷仿生迷思，或许更需要冷思考：继续追逐人形幻想，可能重蹈早期自动驾驶追求全场景的覆辙；转向场景创新，或能开辟真正的商业蓝海。

站在2025年的技术临界点，杨立昆预测未来十年将迎来AI实质性突破。但要实现从"人工智障"到"智能伙伴"的跨越，行业需要回归本质——少些炫技演示，多些场景深耕；警惕资本泡沫，专注技术攻坚。唯有如此，机器人才能真正从实验室走向千家万户，完成从"玩具"到"工具"的历史性蜕变。