|
股票
豆包提出全新稀疏架构 推理成本较MoE最高可降83%
来源:
证券时报网
媒体
2025-02-12 12:37:48
(原标题:豆包提出全新稀疏架构 推理成本较MoE最高可降83%)
证券时报e公司讯,随着模型规模的扩大,推理成本和访存效率已成为限制大模型规模应用的关键瓶颈。近期,字节跳动豆包大模型团队提出了全新的稀疏模型架构UltraMem,该架构有效解决了MoE推理时高额的访存问题,推理速度较MoE架构提升2—6倍,推理成本最高可降低83%。该研究还揭示了新架构的Scaling Law,证明其不仅具备优异的Scaling特性,更在性能上超越了MoE。实验结果表明,训练规模达2000万value的UltraMem模型,在同等计算资源下,可同时实现业界领先的推理速度和模型性能,为构建数十亿规模value或expert开辟了新路径。
相关个股
更多关联个股
相关阅读
艾艾精工:将于4月30日起实施退市风险警示
证券时报网
2025-04-28
2025年五一档新片预售票房破3000万元
证券时报网
2025-04-28
国内期货夜盘收盘 焦煤跌超1%
证券时报网
2025-04-28
深夜!美国财长,突然宣布!
券商中国
2025-04-28
新规后首单:战配突破10家!分析师看好今年北交所战配机遇
券商中国
2025-04-28
168轮竞价,溢价58.8%!杭州土拍热度分化
券商中国
2025-04-28
特别推荐
协鑫集成2024年营收超162亿元 组件出货量跻身行业前八
证券之星资讯
2025-04-28
盈康生命一季度扣非净利劲增25.8%,AI战略驱动盈利质量持续优化
证券之星资讯
2025-04-28
刚刚,央行重磅发声!
证券之星资讯
2025-04-28
首页
股票
财经
基金
导航