|

财经

新模型来了,百度最新发布!多家AI厂商迭代

来源:证券时报网

媒体

2025-03-16 17:51:00

(原标题:新模型来了,百度最新发布!多家AI厂商迭代)

在发布文心一言两周年之际,百度又发布新款模型。

3月16日,百度正式发布文心大模型4.5及文心大模型X1。与此前不同的是,此次百度并未召开发布会,而是直接宣布新模型在文心一言官网上线,并免费向用户开放。

近期,国内AI大模型厂商纷纷宣布“迭代”。3月10日,字节跳动豆包大模型团队官宣开源一项针对MoE架构的关键优化技术,可将大模型训练效率提升1.7倍,成本节省40%。3月6日,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B,通过强化学习,可在数学推理、代码生成等任务上实现精度提升。

百度发布两款新模型

3月16日,百度发布文心大模型4.5及文心大模型X1。据介绍,文心大模型4.5是百度首个原生多模态大模型。百度称,文心大模型4.5在多项测试中表现优于GPT4.5,API调用价格仅为GPT4.5的1%;文心大模型X1为深度思考模型,性能对标DeepSeek-R1,调用价格约为R1的一半。

具体来看,百度方面称,文心大模型4.5多项基准测试成绩优于GPT4.5、DeepSeek-V3等,并在平均分上以79.6分高于GPT4.5的79.14。而文心大模型4.5在多模态理解能力上提升,不仅有较强的图形推理、图表分析能力,还具备理解梗图、漫画、歌曲、电影等多模态内容的能力。

文心大模型X1定位为深度思考模型,在性能上对标DeepSeek-R1,具备“长思维链”,擅长中文知识问答、文学创作、逻辑推理等,而且增加了多模态能力和多工具调用,能理解和生成图片,还能调用工具生成代码、图表等内容。

作为能自主运用工具的大模型,文心大模型X1支持高级搜索、文档问答、图片理解、AI绘图、代码解释器、网页链接读取、TreeMind树图、百度学术检索、商业信息查询、加盟信息查询等多款工具。

据百度介绍,文心大模型4.5已上线百度智能云千帆大模型平台,企业用户和开发者登录即可调用API;文心大模型X1也即将在千帆上线。百度搜索、文小言APP等产品,将陆续接入文心大模型4.5和文心大模型X1。

随着大模型技术的快速迭代,训练和推理成本的降低,大模型开源已成大势所趋。

今年2月,百度曾宣布文心一言将于4月1日免费,并宣布推出的文心大模型4.5,将于6月30日正式开源。彼时百度还表示,将在今年下半年发布文心大模型5.0。

“从DeepSeek身上,我们学到了一件事,那就是开源最佳模型能大大促进人们使用或采纳这个模型。”2月18日晚,在百度2024年第四季度及全年财报电话会上,百度创始人李彦宏表示,开源的决策源自对技术领先地位的坚定信心,开源将进一步促进文心大模型的广泛应用,并在更多场景中扩大其影响力。他还强调,无论开源还是闭源,基础模型只有在大规模解决现实问题时,才具备真实价值。

AI厂商加速迭代

近期,AI大模型领域呈现技术迭代加速、多模态与深度思考能力突破、开源生态完善等趋势。国内外厂商在模型能力、应用场景等方面展开全方位竞争。

3月12日,谷歌DeepMind推出用于机器人技术的人工智能模型,这个机器人基座大模型名为 Gemini Robotics 和 Gemini Robotics-ER,旨在利用大语言模型的推理能力,帮助机器人适应复杂环境,从而完成现实世界中的复杂任务。

3月10日,字节跳动豆包大模型团队官宣开源一项针对MoE架构的关键优化技术,可将大模型训练效率提升1.7倍,成本节省40%。据介绍,MoE是当前大模型的主流架构,但其在分布式训练中存在大量跨设备通信开销,制约了大模型训练效率和成本。针对这一难题,字节在内部研发COMET计算-通信重叠技术,可大幅压缩MoE专家通信空转时间。

3月6日,阿里巴巴宣布推出最新的推理模型通义千问QwQ-32B。这是一款拥有320亿参数的模型,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现提升,整体性能比肩DeepSeek-R1,在消费级显卡比如家用电脑上也能实现本地部署。随后,国家超算互联网平台正式上线通义千问QwQ-32B API服务,向用户提供免费100万tokens的试用额度。

日前,全球知名创投机构Andreessen Horowitz(a16z)发布了2025年全球100大生成式AI 应用排行榜,中国的AI技术实力在此次榜单中展现出强劲的竞争力。其中,DeepSeek在网页版应用中排名第二,仅次于OpenAI 的ChatGPT,其惊人的成长速度引起全球关注。

此外,在中国生成式AI中,字节跳动旗下的豆包也位列第十。中国其他知名的大型模型也成功进入榜单,包括月之暗面(第11名)、海螺视频(第12名)和快手可灵(第20名),它们的排名均超越了Sora、Midjourney、Runway 等全球知名应用。

平安证券研报认为,全球大模型的竞争仍然激烈,这种激烈竞争将持续拔升全球大模型的能力上限。同时,全球领先大模型厂商对大模型研发的持续投入,也将为AI算力需求的持续增长提供有力支撑。

中国银河证券研报分析认为,AI Agent(智能体)落地使得大模型集成度更高、算力资源需求更加旺盛,重心逐步从预训练转移到了特定应用场景的后训练,推理端算力规模有望提升。总体来说,推理算力有望推动应用的进一步增长,低成本算力时代带动应用端繁荣度提升,AI能力边际扩张依然需要依赖更强的模型和强大的算力支撑,有望开拓AI行业大模型共振发展新局面。

校对:李凌锋‍‍‍‍‍‍‍‍‍‍‍‍‍

fund

首页 股票 财经 基金 导航