来源:21世纪经济报道
媒体
2025-02-22 15:30:42
(原标题:阶跃星辰CEO姜大昕:进入Agent发展阶段,落地智能终端)
21世纪经济报道记者 董静怡 上海报道
在大模型“六小虎”中,阶跃星辰一直比较低调。
据悉,阶跃星辰成立于2023年4月,总部位于上海,由前微软全球副总裁、微软亚洲互联网工程院首席科学家姜大昕创立。2024年底,阶跃星辰完成了数亿美元的B轮融资,获得了国有资本和腾讯等机构的支持。
从成立之初,阶跃星辰就以实现通用人工智能(AGI)为目标,规划了一条清晰的技术发展路线:从单模态到多模态,再到多模理解和生成的统一,最终构建世界模型。
2月21日,在阶跃星辰首届Step UP生态开放日上,阶跃星辰创始人、CEO姜大昕介绍了阶跃星辰的系列成果。不难看出,随着DeepSeek大模型的发布以及市场竞争加剧,“六小虎”的技术路线和战略布局已走向分化,而对于阶跃星辰来说,则是注重多模态和开源。
姜大昕曾表示:“多模态模型是实现AGI的必经之路。”这一理念贯穿了阶跃星辰的发展历程。
阶跃星辰的技术核心在于其Step系列多模态大模型。在短短两年多的时间里,阶跃Step系列模型矩阵已经发布了11款多模态大模型,覆盖语音识别、语音生成、多模态理解、图像及视频生成的全面能力。今年1月,阶跃星辰发布Step R-mini,成为Step系列的首款推理模型。
开源是阶跃星辰多模态技术发展的重要战略之一。此前,DeepSeek的开源引发全球市场的关注,随后的2月18日,阶跃星辰联合吉利开源了Step-Video-T2V和Step-Audio模型。据介绍,这两款模型分别是全球参数量最大、性能最好的视频生成开源模型和行业内首款产品级开源语音交互大模型。
姜大昕表示,自模型开源以来,受到广泛关注和反馈。他透露,今年3月,阶跃星辰还将开源公司自研的图生视频模型。
在应用层面,姜大昕特别提到了Agent(智能体)的发展。
他在主旨演讲中表示,“我们朝着实现AGI的目标稳步前进,目前已进入Agent的发展阶段。”
Agent的核心特征是能够自主帮助人类完成复杂任务,姜大昕表示,所谓“自主”,包含“自动”与“主动”两层含义。“自动”指Agent在执行任务时尽可能减少或无需人类干预,独立完成任务;“主动”则指Agent能够根据用户所处的环境主动发起任务,而不仅仅是被动接受任务。
他指出,智能体的发展依赖于两大关键要素:一是多模态能力,让智能体充分地感知和理解世界;二是推理能力,使智能体能够进行长思维链的慢思考,主动规划、尝试、反思,通过不断纠错提供准确的答案。过去一年,这两个能力均取得进展。
阶跃星辰将智能终端Agent视为大模型技术落地的核心突破点,并重点布局汽车、手机、具身智能、IoT等关键应用场景。
“无论是AI手机、PC、智能汽车、IoT设备以及机器人,我们判断未来每一台终端设备都会有一个Agent,这个Agent会用多模态的方式和我们交互,帮助我们完成复杂任务。”姜大昕表示。
他认为汽车是终端Agent最关键的落地场景。千里科技董事长印奇在圆桌论坛中分享称,“通过AI大模型、端到端智驾、驾舱融合等技术的突破,智能汽车的体验将实现从量变到质变的跨越。”
姜大昕认为,Agent的能力将随着底座大模型的多模态能力和推理能力的增强而不断演化。智能终端Agent的发展可划分为五个层级:
Level 1:完成简单任务,如单一App内的操作。
Level 2:完成组合任务,涉及多个步骤和多个App。
Level 3:完成复杂任务,需要深度思考,如综合分析和报告生成。
Level 4:从被动完成任务转变为能主动提示或完成任务,需深入了解用户环境和偏好。
Level 5:从智商提升至情商,实现情感陪伴和情绪价值。
在开放日上,阶跃星辰宣布与吉利汽车集团、OPPO、智元机器人等企业深化合作关系。业内普遍认为,随着多模态和推理技术的进一步发展,智能终端Agent领域有望实现更大的突破,推动AI技术在更多场景中的落地应用。
观点
2025-02-22
21世纪经济报道
2025-02-22
21世纪经济报道
2025-02-22
21世纪经济报道
2025-02-22
21世纪经济报道
2025-02-22
子弹财经
2025-02-22
证券之星资讯
2025-02-22
证券之星资讯
2025-02-21
证券之星资讯
2025-02-21