来源:中国基金报
媒体
2025-02-16 10:33:27
(原标题:DeepSeek爆火!字节跳动反思:跟进速度不够 今年要追求智能上限)
日前,对于当下正火的DeepSeek,字节跳动高层反思了团队在相关技术跟进速度方面的问题。
字节跳动CEO反思DeepSeek影响
据记者了解,字节跳动于2月13日上午举办了新一期的AllHands全员会,字节CEO梁汝波、CFO高准、人力资源负责人华巍、电商业务负责人康泽宇、AI业务负责人朱文佳、TikTok CEO周受资出席与员工交流。
在会上,针对AI业务,梁汝波谈到了最近火爆全球的DeepSeek。他表示,DeepSeek-R1创新点之一的长链思考模式不是业界首创。
梁汝波提到,去年9月OpenAI发布长链思考模型并成为行业热点后,字节意识到技术的重大变化,但没有特别觉得一定要马上复现,早1个月晚1个月差别不大。“如果一开始重大问题就争先,我们有机会更早实现。”梁汝波说。
与此同时,他提出2025年字节在AI领域的重点目标,包括追求“智能”上限,探索新的交互和加强规模效应。
他指出,相比于追求某个具体产品,把智能本身作为最重要的目标可以激发更多尝试、不忽略关键技术节点。新的交互应该会是更可穿戴、更便携、更自然的,去年上线的Ola Friend耳机只是初步尝试。
事实上,速度问题在去年的内部会上便被梁汝波批评过。他称,与创业公司相比,字节跳动在对待大模型新机会时的敏感度明显不足。业内做得比较好的大模型创业公司,在2018年至2021年就已经创立并开始布局相关领域。而字节公司层面的半年度技术回顾直到2023年才开始讨论GPT等前沿技术,这种迟钝的反应速度使字节跳动在市场竞争中处于不利地位。
另外,针对电商业务,梁汝波在全员会上表示,今年抖音电商有三个目标,即增加用户覆盖、增加直播电商规模和增加搜索产生的GMV。
针对公司形象,梁汝波称,把TikTok在用户信任和口碑方面追上YouTube作为今年业务目标。
他还提到,抖音和今日头条要做好虚假信息和谣言的治理,打击无底线搏流量的行为,增加治理的公平性和可预期性。
多家巨头接入Deepseek模型
日前,各家互联网巨头都在深度整合Deepseek模型,并积极探索应用场景。
2月4日,字节跳动旗下火山引擎宣布,全面支持DeepSeek系列大模型,包括V3和R1等不同尺寸的模型,企业用户可在火山引擎机器学习平台veMLP中部署或通过火山方舟平台直接调用。
火山引擎旗下最重要的产品之一是字节跳动十分重视的豆包大模型。数据显示,豆包大模型的调用量在过去一年快速增长,去年12月的日均tokens使用量已超过4万亿次,较5月首次发布时增长了33倍。
值得一提的是,2月13日,文心一言在官网宣布,随着文心大模型的迭代升级和成本不断下降,文心一言将于4月1日0时起全面免费。同日,百度智能云事业群总裁沈抖在全员会上表示:“国内大模型去年‘恶意’的价格战,导致行业整体创收相较国外差了多个数量级。”
对此,字节跳动旗下火山引擎总裁谭待隔空回应表示,豆包1.5Pro模型的预训练成本、推理成本均低于DeepSeek-V3,更是远低于国内其他模型,在当前的价格下有非常不错的毛利。
“国内外的厂商都在依靠技术创新,降低模型价格。我们也只是实现了Gemini 2.0 Flash的价格水平而已。这个价格,依赖技术进步完全是可以做到的。”谭待进一步呼吁,“大家应该像DeepSeek一样聚焦基本功,聚焦创新,不急不躁,少无端猜测,归因外部。”
除了火山引擎外,阿里云、华为云、百度云、腾讯云、优刻得、青云科技、天翼云、移动云等厂商也都陆续在其云服务平台上线了DeepSeek的大模型。
阿里云结合其电商场景,优化商品描述生成和客服问答,同时探索金融风控应用。腾讯云则将Deepseek模型集成至其云AI开发平台,为企业客户提供代码助手、数据分析等工具链。
证券时报
2025-02-19
中国基金报
2025-02-19
券商中国
2025-02-19
中国基金报
2025-02-19
21世纪经济报道
2025-02-19
中国基金报
2025-02-19