来源:经济观察报
媒体
2025-06-07 10:54:45
(原标题:智源研究院发布“悟界”系列大模型:让AI看见并理解物理世界)
经济观察报 记者 周悦
6月6日,北京智源大会开幕,吸引了包括图灵奖得主约书亚·本吉奥、强化学习之父理查德·萨顿,以及来自谷歌、Meta、华为等全球知名AI机构的顶尖学者和从业者。
这场大会被视为“AI内行人的学术盛会”,也见证了中国AI科研机构智源研究院(下称“智源”)的最新动作:发布“悟界”系列大模型。
智源研究院院长王仲远认为:“大模型技术远没有到发展的尽头,但我们已经看见了大语言模型的增长天花板。”在他看来,过去一年“百模大战”的热闹,实则是围绕大语言模型的同质化竞争。互联网数据的天花板,限制了它们性能的持续爬升。
他认为,AI要真正走向下一个阶段,关键在于突破多模态的世界模型——让AI不只是语言的拼图玩家,而是理解和适配物理世界的智能体。智源正在试图回答一个更宏大的命题:如何让AI真正看见、理解并影响物理世界?
智源发布“悟界”四大模型 探索物理世界的交互边界
在本次智源大会上,智源正式披露了“悟界”系列的四款模型:包括原生多模态世界模型Emu3、脑科学多模态通用基础模型见微Brainμ、跨本体具身大小脑协作框架RoboOS 2.0与具身大脑RoboBrain 2.0以及全原子微观生命模型OpenComplex2。
Emu3是一种原生多模态世界模型,利用全新的视觉Tokenizer技术,把图像和视频像文本一样编码成离散符号,实现同框架下的统一表征和生成。它让文字、图像、视频不再“各说各话”,而是被AI放进同一个“大脑”里理解和使用。
Brainμ能跨物种、跨模态、跨个体建模,目标是成为神经科学研究和临床应用的新引擎。它已整合超百万单位神经信号数据,与清华、北大、复旦和强脑科技等多个机构达成合作,验证在睡眠分型、脑疾病诊断、脑机接口等领域的潜力。
在具身智能领域,智源发布了RoboOS 2.0和RoboBrain 2.0。其中,RoboOS 2.0相较于初代版本整体性能提升30%,可将全链路平均响应时延缩短至毫秒级,支持像下载App一样快速整合开发者插件;RoboBrain 2.0相比于RoboBrain 1.0,进一步扩展了基于多本体-环境动态建模的多机协同规划能力,可实时构建包含本体定位的场景图,并自动完成跨本体的任务规划。
最后,OpenComplex2 则瞄准生命科学,能在原子分辨率层面模拟分子运动中的功能生成,弥补AI只能做静态结构预测的短板。智源希望它能加速药物研发和生物研究,缩短周期、降低成本。
王仲远在接受经济观察报在内的媒体采访时指出,大语言模型下一步要么靠强化学习做更好的推理(如今年大厂扎堆优化的O1、DeepSeek R1等模型),要么靠合成数据自我生成新样本。智源认为,单靠语言生成能力的提升已不足以支撑AI的下半场。大模型的下半场不只是“说得更像人”,而是看得见真实世界。这一破局点是进入到物理世界——用多模态、尤其是原生多模态世界模型,让AI能真正感知和理解空间、物体和动态场景。
在这个思路下,智源的“悟界”系列不仅是模型的堆叠,更像是一个物理AGI(人工通用智能)路线的蓝图。比如,Brainμ整合神经科学数据,完成了超过100万单位的神经信号预训练,可以支持神经科学领域从基础研究到临床研究和脑机接口应用的不同方向;而RoboOS 2.0和RoboBrain 2.0,则是让机器人有了“大小脑”式的交互和实时反应能力。
此次“悟界”系列的推出,被王仲远称作“从语言模型到世界模型的转向”。世界模型意味着AI不再停留在用海量文本做生成和问答,而是能在虚拟空间里,模拟物理世界的运行、预测变化,并在一定程度上与真实环境深度交互。
具身智能的落地周期:短期仍有争议,但趋势不可逆
在大会上,理查德·萨顿表示:“AI正从人类数据时代迈向体验时代,但要让AI像人一样从物理交互中获得经验,还需要更长期的探索。”
王仲远也提到,尽管“悟界”系列让智源在多模态和具身智能领域迈出了新步伐,短期的商业化挑战仍然很现实。多模态数据的采集、神经信号数据的合规和伦理问题、具身智能的适配成本,都意味着相关技术尚未进入规模化盈利的窗口。
为了达到长期的目标,作为一家非营利科研机构,智源同时需要来自资本的持续的投入和耐心。王仲远在会上披露,智源与香港投资管理有限公司(港投)已签署战略合作,双方希望借助香港的国际化平台和港投的“耐心资本”,在人才、技术、资本之间形成正向循环。
“港投在帮助我们看项目上也有优势,但合作更多是汇聚人才和推动技术全球化的视野。”他没有披露具体投资额度,只提及合作的重点是“汇聚全球顶尖人工智能人才、支持人工智能创业、加速人工智能创业全球化”。
在国际化方面,王仲远强调,尽管今年的国际形势波动大,智源仍在坚定走开源和国际合作的路。比如,4月底在新加坡举办的“青源会”,就是智源连接全球青年AI人才的新尝试。他还透露,欧洲的合作正在加强,中东市场也出现了新的热度,智源正在评估如何抓住这些新兴机会。
这不是智源第一次在通用人工智能的道路上开路。2021年,智源推出的“悟道”1.0,填补了中文超大规模预训练模型的空白;同年“悟道”2.0以1.75万亿参数一度成为全球最大模型之一。到2023年,“悟道”3.0在多模态技术上取得新突破,并全面开源。
智源始终以开源开放为导向。目前,智源已累计开源200个模型,全球下载量达6.4 亿次,其中多款模型已被广泛应用。
经济观察报
2025-06-07
经济观察报
2025-06-07
经济观察报
2025-06-07
经济观察报
2025-06-07
经济观察报
2025-06-07
经济观察报
2025-06-07
证券之星资讯
2025-06-06
证券之星资讯
2025-06-06
证券之星资讯
2025-06-06