|
股票
豆包提出全新稀疏架构 推理成本较MoE最高可降83%
来源:
证券时报网
媒体
2025-02-12 12:37:48
(原标题:豆包提出全新稀疏架构 推理成本较MoE最高可降83%)
证券时报e公司讯,随着模型规模的扩大,推理成本和访存效率已成为限制大模型规模应用的关键瓶颈。近期,字节跳动豆包大模型团队提出了全新的稀疏模型架构UltraMem,该架构有效解决了MoE推理时高额的访存问题,推理速度较MoE架构提升2—6倍,推理成本最高可降低83%。该研究还揭示了新架构的Scaling Law,证明其不仅具备优异的Scaling特性,更在性能上超越了MoE。实验结果表明,训练规模达2000万value的UltraMem模型,在同等计算资源下,可同时实现业界领先的推理速度和模型性能,为构建数十亿规模value或expert开辟了新路径。
相关个股
更多关联个股
相关阅读
卓郎智能龙虎榜:营业部净卖出4994.75万元
证券时报网
2026-03-20
奥瑞德跌停,沪股通龙虎榜上净买入2119.79万元
证券时报网
2026-03-20
天山电子发生大宗交易 成交溢价率4.65%
证券时报网
2026-03-20
瑞斯康达龙虎榜:营业部净买入4153.88万元
证券时报网
2026-03-20
柏诚股份换手率34.30%,沪股通净卖出1445.03万元
证券时报网
2026-03-20
永臻股份涨停,机构净买入3316.19万元,沪股通净买入2209.09万元
证券时报网
2026-03-20
特别推荐
欧伦电气IPO:实控人夫妇突击分红,业绩逆势增长遭拷,客户经销商现“自家人”身影
证券之星资讯
2026-03-20
沃森生物易主背后:股权长期分散,营收三连下降
证券之星资讯
2026-03-20
社保基金最新持仓出炉!新进这些股
证券之星资讯
2026-03-20
首页
股票
财经
基金
导航