|

汽车

图灵奖得主杨立昆质疑人形机器人热潮:智能瓶颈与产业泡沫何解?

来源:盖世汽车

2025-03-28 11:26:32

(原标题:图灵奖得主杨立昆质疑人形机器人热潮:智能瓶颈与产业泡沫何解?)

2025年3月,计算机视觉领域泰斗、Meta首席AI科学家杨立昆在一档科技播客又发表了一场“爆论”:"当下人形机器人的所有演示都令人印象深刻,但这些机器人实际上都很蠢。"这位2018年图灵奖得主的批评,犹如冷水浇向如火如荼的机器人产业。

杨立昆指出三重困境:当前既没有能完成猫狗基本任务的机器人,也缺乏家用服务机器人,更未实现完全自主的L5级自动驾驶。其核心观点直指AI系统的根本缺陷——现有技术无法让机器人真正理解物理世界。"它们不能做人类能做的事情,不是因为缺乏身体能力,而是根本不够聪明。"这种认知差距在家庭场景尤为明显:能完成前后空翻的机器人,面对叠衣服、擦桌子等基础任务却频频失误。

“AI教父”杨立昆为何发表“爆论”

作为卷积神经网络(CNN)之父,杨立昆的质疑绝非外行妄言。1987年提出CNN概念,1998年开发的LeNet-5模型首次实现手写体识别突破,其主导的Llama系列开源大模型更推动AI产业落地。这位学界与工业界的双栖权威,对智能本质有着深刻认知。

在技术层面,他持续批判行业两大误区:

  1. 感知缺陷:现有系统无法处理视觉等复杂感官输入,RT-X项目数据显示,即使收集超100万片段覆盖500多项技能,机器人仍难应对桌子高度变化的简单调整。

  2. 规划短板:生成式AI仅擅长文本预测,缺乏分层规划能力。家务清洁需分解数十个决策节点,现有算法难以实现因果推理与动态调整。

产业层面,他警示资本市场的"豪赌"风险。数据显示,截至2024年底中国智能机器人企业超45万家,注册资本达6.44万亿元。即便1%企业专注人形机器人,投入规模仍堪称天文数字。但杨立昆直言:"很多公司赌未来3-5年AI会突飞猛进,这缺乏科学依据。"

人形机器人的技术难题在哪儿?

物理理解鸿沟。人类叠衣服需实时感知布料质地、判断褶皱形态、动态调整施力,这些涉及多模态感知与物理建模的能力,恰是AI的短板。杨立昆团队提出的联合嵌入预测架构(JEPA)正是试图突破这一瓶颈,但距离实用仍有差距。

机械性能桎梏。人手22个自由度的精妙结构难以复刻,顶尖仿生手如Shadow hand虽达20+自由度,但能耗与成本激增。智元机器人工作人员坦言,其产品效率仅人类20%-30%,且续航不足两小时,行业普遍存在"充电两小时,工作五分钟"的窘境。

图片来源:波士顿动力官网

能源不可能三角。动力、续航、成本的矛盾尖锐。为维持双足行走,某国产机器人需搭载48个关节电机,单日耗电量相当于普通家庭全天用电。硬件工程师戏称:"这不是造机器人,是在造移动充电宝。"

行业内是怎么解决的?

面对技术困局,前沿机构已转向务实路线:

  • 场景深耕:蓝橙实验室与清华合作的五轴并联机器人专攻航空发动机叶片打磨,精度达微米级;华中科大吸附式机器人专注船舶焊接,放弃人形换取环境适应性。

  • 技术开源:哈工大朱延河团队建立工业机器人开源架构,共享运动控制算法降低研发成本。

  • 智能重定义:RT-2模型虽在泛化能力上受挫,但特斯拉Optimus通过限定仓储场景,将分拣准确率提升至92%。

这些实践揭示新方向:与其追求"通用智能"的虚幻目标,不如在特定场景建立技术闭环。正如工业机器人历经60年发展,从Unimate机械臂到现代协作机器人,突破均源于对专用场景的深度适配。

总结

杨立昆的言论其实正反映出了当下行业正面临的根本性路线之争:一方坚持"人形是通用智能最佳载体",认为双足移动与人类环境天然兼容;另一方主张"形态服务于功能",推崇轮式、模块化设计。现实数据给出警示——在2024世界机器人大会上,人形机器人热舞视频刷屏社交网络的同时,其擦桌失败视频播放量却高出37%,舆论期待与实际表现形成鲜明反差。

杨立昆的批评恰逢其时:机器人产业的终极目标不应是创造"人造人",而是拓展人类能力边界。当45万家企业深陷仿生迷思,或许更需要冷思考:继续追逐人形幻想,可能重蹈早期自动驾驶追求全场景的覆辙;转向场景创新,或能开辟真正的商业蓝海。

站在2025年的技术临界点,杨立昆预测未来十年将迎来AI实质性突破。但要实现从"人工智障"到"智能伙伴"的跨越,行业需要回归本质——少些炫技演示,多些场景深耕;警惕资本泡沫,专注技术攻坚。唯有如此,机器人才能真正从实验室走向千家万户,完成从"玩具"到"工具"的历史性蜕变。

fund

询价

询价信息已提交

确定
首页 股票 财经 基金 导航