|
股票
豆包提出全新稀疏架构 推理成本较MoE最高可降83%
来源:
证券时报网
媒体
2025-02-12 12:37:48
(原标题:豆包提出全新稀疏架构 推理成本较MoE最高可降83%)
证券时报e公司讯,随着模型规模的扩大,推理成本和访存效率已成为限制大模型规模应用的关键瓶颈。近期,字节跳动豆包大模型团队提出了全新的稀疏模型架构UltraMem,该架构有效解决了MoE推理时高额的访存问题,推理速度较MoE架构提升2—6倍,推理成本最高可降低83%。该研究还揭示了新架构的Scaling Law,证明其不仅具备优异的Scaling特性,更在性能上超越了MoE。实验结果表明,训练规模达2000万value的UltraMem模型,在同等计算资源下,可同时实现业界领先的推理速度和模型性能,为构建数十亿规模value或expert开辟了新路径。
相关个股
更多关联个股
相关阅读
股价二连板!600170,旗下金矿传来“喜讯”?公司公告:旧闻而已!
证券时报网
2025-09-15
“十四五”时期北京GDP预计超5万亿元!经济增量等于“新增一个海淀区”
券商中国
2025-09-15
外汇局最新发布!便利境外个人境内购房,允许FDI项下外汇利润境内再投资
券商中国
2025-09-15
趣睡科技:股东拟合计减持不超4.88%公司股份
证券时报网
2025-09-15
光大同创:股东拟减持不超1%公司股份
证券时报网
2025-09-15
英联股份拟定增募资不超过15亿元 用于复合集流体项目等
证券时报网
2025-09-15
特别推荐
皮肤科学创新转化业务收入萎缩拖后腿,华熙生物中报营利双降,赌“小核酸”谋破局
证券之星资讯
2025-09-15
突然爆发!四大利好来袭
证券之星资讯
2025-09-15
打新必看 | 9月16日两只新股申购
证券之星资讯
2025-09-15
首页
股票
财经
基金
导航