来源:大众证券报
2025-01-22 09:38:00
(原标题:AI交互水平再升级 关注端侧应用落地带来的投资机会)
近日,豆包实时语音大模型正式推出,并在豆包App全量开放。作为一款语音理解和生成一体化的模型,豆包实时语音大模型实现了端到端语音对话。相比传统级联模式,该模型在语音表现力、控制力、情绪承接上有显著提升,并具备低时延、对话中可随时打断等特性,语音表达接近真人水准。
业内人士表示,豆包实时语音大模型的发布,进一步丰富了字节AI生态,看好字节AI在国内的领先地位,未来发展潜力可期。同时,情感陪伴和AI玩具产品有望伴随语音类模型能力的强化,提升用户交互体验。
事件驱动 豆包实时语音大模型上线
1月20日,豆包实时语音大模型正式推出,并在豆包APP全量开放。模型实现了语音理解和生成一体化、端到端语音对话,主要面向中文语境和场景。根据豆包大模型团队公众号,经外部众测,模型整体满意度较GPT-4o有明显优势,语音语气自然度和情绪饱满度高于GPT-4o。
该模型可理解输入语言情绪、实时联网,在输出时具备强大声音控制能力,且高度近似人类、有超低延迟、可随时打断。其真人级语音对话能力具体表现在以下方面:拟人化的情感承接,能够理解用户的内容及情绪,并用恰当的语气做出回应;强大的声音控制和丰富的情感演绎能力,能够遵循丰富的复杂指令,配合不同的音色、情绪及状态输出,可以讲故事、讲方言和口音,甚至可以唱歌;智商与表现力之间的平衡,该模型的表现力高度接近真人,包括类人的语气词、停顿思考等,模型也有实时联网功能,使其能够根据问题,动态获取最新信息,对时效问题给到精准、及时的回应;丝滑的交互体验和超低延迟,实现在更低系统时延情况下的生成准确性、自然度,并且具有敏锐的语音打断与用户对话判停能力。
豆包团队围绕拟人度、有用性、情商、通话稳定性、对话流畅度等多个维度选取数十名外部测试者进行考评,豆包实时语音大模型整体满意度(以5分为满分)得分为4.36,GPT-4o为3.18,超过半数的测试者对豆包模型表现打出满分,且豆包模型在情绪理解和情感表达方面优势明显,尤其在“一听就是AI与否”的评测中被认为AI的概率极低。
行业现状 实时语音大模型丰富人工智能生态
目前,字节运营约20款AI应用,在对话、助手、虚拟社交、图像、视频、智能体、办公、社区、音乐、编程、教育、电商、硬件等几乎全领域都有布局。根据AI产品榜数据,2024年12月,豆包MAU为7116万,环比增长18.64%。其海外版Cici的MAU达到1133万,位列第26位。虚拟角色APP猫箱MAU为688万,环比增速达50.18%。豆包实时语音大模型的推出有望进一步赋能AI产品,推动用户增长。豆包实时语音大模型可提供涵盖从个人助手到行业解决方案的服务,并覆盖家居、医疗、教育、金融等多个领域。
此外,AI情感陪伴能力提升,或为端侧AI落地提供新的思路。据OpenAICEO奥特曼指出,通用人工智能(AGI)是指AI能够像人一样熟练完成重要工作的阶段。OpenAI定义了AGI五个层级,依次为语言对话、逻辑推理、代理行动、辅助创新、组织工作。豆包实时语音大模型更加 “人性化”,模型模拟人类情感、意识与价值观,或意味着在通用人工智能(AGI)上取得了重要进展。
除字节跳动外,科大讯飞、百度、中国电信、趣丸科技等纷纷开发语音大模型,并在语音同传、方言识别、语音合成等领域取得了丰富成果。在当前及未来一段时间内,高质量语料,端到端架构,跨领域识别,以及情感个性化等仍是语音大模型厂商发力的重要方向。
根据IDC数据,2024年全球人工智能资本开支有望达2350亿美元,并预计2028年增长至6320亿美元,复合增速达29%。此外,生成式人工智能资本开支2024—2028年年均复合增长率有望达59%,显著高于其他人工智能技术的22%。
投资思路 关注端侧应用落地带来的投资机会
广发证券表示,豆包实时语音大模型的发布,进一步丰富了字节AI生态,看好字节AI在国内的领先地位,未来发展潜力可期。同时,情感陪伴和AI玩具产品有望伴随语音类模型能力的强化,提升用户交互体验。建议关注与字节在AI领域具有合作基础的公司,如易点天下、蓝色光标等;布局AI语音相关业务的公司,如盛天网络(音乐社交类平台“给麦”等)、昆仑万维(AI音乐产品Melodio和Mureka)等;布局AI玩具的公司,如上海电影、奥飞娱乐等;行业层面来看,AI大模型能力提升、成本边际下降,持续完善的AI基础设施有望更好地赋能AI游戏、AI影视、AI营销、AI情感陪伴、AI教育、AIagent等场景。
华创证券认为,大模型升级迭代与端侧应用落地将带来投资机会。芯片关注海光信息、寒武纪、芯原股份、景嘉微;服务器关注中科曙光、浪潮信息、沃尔核材、欧陆通;数据中心关注润泽科技、宝信软件、金山云、光环新网;交换机关注锐捷网络、紫光股份、光讯科技、华工科技等;数据关注海天瑞声等;应用关注科大讯飞、金山办公、第四范式、同花顺等;硬件关注恒玄科技、瑞芯微、移远通信、乐鑫科技、中科创达等。
浙商证券表示,AI有望用于陪伴老人儿童、可用于游戏公司为虚拟人物配音等。建议关注AI硬件相关公司中兴通讯、润欣科技、乐鑫科技、兆易创新、移远通信、恒玄科技、国光电器;AI算力相关公司寒武纪、海光信息、润泽科技、光环新网、光迅股份、高澜股份、英维克、欧陆通、云赛智联、亚康股份、中科曙光、浪潮信息;AI应用相关公司海天瑞声、东软集团、慧博云通、视觉中国、汉得信息、中科创达。 宗禾
大众证券报
2025-01-22
大众证券报
2025-01-22
大众证券报
2025-01-22
大众证券报
2025-01-22
大众证券报
2025-01-22
大众证券报
2025-01-22