|
股票
豆包提出全新稀疏架构 推理成本较MoE最高可降83%
来源:
证券时报网
媒体
2025-02-12 12:37:48
(原标题:豆包提出全新稀疏架构 推理成本较MoE最高可降83%)
证券时报e公司讯,随着模型规模的扩大,推理成本和访存效率已成为限制大模型规模应用的关键瓶颈。近期,字节跳动豆包大模型团队提出了全新的稀疏模型架构UltraMem,该架构有效解决了MoE推理时高额的访存问题,推理速度较MoE架构提升2—6倍,推理成本最高可降低83%。该研究还揭示了新架构的Scaling Law,证明其不仅具备优异的Scaling特性,更在性能上超越了MoE。实验结果表明,训练规模达2000万value的UltraMem模型,在同等计算资源下,可同时实现业界领先的推理速度和模型性能,为构建数十亿规模value或expert开辟了新路径。
相关个股
更多关联个股
相关阅读
公告精选:丰山集团与清华大学签署《技术开发合同书》;上海建工等提示风险
证券时报网
2025-09-18
西大门:控股股东之一致行动人拟减持公司不超15.7万股股份
证券时报网
2025-09-18
上交所:天普股份近期多次出现异常波动情形 提请广大投资者审慎投资
证券时报网
2025-09-18
安徽合力拟2.74亿元收购江淮重工51%股权 标的公司经营持续向好
证券时报网
2025-09-18
集邦咨询:英伟达尝试调升HBM4规格 预计明年SK海力士仍是最大供应商
证券时报网
2025-09-18
东软集团:为国内某知名车企供应智能座舱域控制器 预计总金额56亿元左右
证券时报网
2025-09-18
特别推荐
今晚,4家公司发布利空!
证券之星资讯
2025-09-18
刚刚,多家公司发布利好公告
证券之星资讯
2025-09-18
A股,突发跳水!四大原因找到
证券之星资讯
2025-09-18
首页
股票
财经
基金
导航