来源:证券之星港美股
2025-04-24 13:00:39
4月23日,快手Kwaipilot团队发布全新大模型训练方法SRPO并宣布开源。该方法仅用 GRPO 1/10的训练成本,在数学与代码双领域基准测试中实现性能突破:AIME2024 得分50,LiveCodeBench 得分41.6,成为业界首个在两大专业领域同时复现DeepSeek-R1-Zero 的方法。
以上内容为证券之星据公开信息整理,由智能算法生成(网信算备310104345710301240019号),不构成投资建议。
证券之星港美股
2025-04-24
证券之星港美股
2025-04-24
证券之星港美股
2025-04-24
证券之星港美股
2025-04-24
证券之星港美股
2025-04-24
格隆汇
2025-04-24
证券之星资讯
2025-04-24
证券之星资讯
2025-04-24
证券之星资讯
2025-04-24