|
股票
豆包提出全新稀疏架构 推理成本较MoE最高可降83%
来源:
证券时报网
媒体
2025-02-12 12:37:48
(原标题:豆包提出全新稀疏架构 推理成本较MoE最高可降83%)
证券时报e公司讯,随着模型规模的扩大,推理成本和访存效率已成为限制大模型规模应用的关键瓶颈。近期,字节跳动豆包大模型团队提出了全新的稀疏模型架构UltraMem,该架构有效解决了MoE推理时高额的访存问题,推理速度较MoE架构提升2—6倍,推理成本最高可降低83%。该研究还揭示了新架构的Scaling Law,证明其不仅具备优异的Scaling特性,更在性能上超越了MoE。实验结果表明,训练规模达2000万value的UltraMem模型,在同等计算资源下,可同时实现业界领先的推理速度和模型性能,为构建数十亿规模value或expert开辟了新路径。
相关个股
更多关联个股
相关阅读
收评:沪指涨近1%,地产、券商等板块拉升,半导体板块爆发
证券时报网
2025-02-12
国内商品期货收盘 锰硅主力合约跌超5%
证券时报网
2025-02-12
收评:创业板指涨近2% 万科A尾盘涨停
证券时报网
2025-02-12
平顶山市城航低空经济发展有限公司登记成立
证券时报网
2025-02-12
中芯国际赵海军:一季度淡季不淡 丰富产品组合来对抗周期
证券时报网
2025-02-12
全国统计工作会议:建立健全数字经济、网上零售等领域统计制度
证券时报网
2025-02-12
特别推荐
景林出手,竟买了光伏!
证券之星资讯
2025-02-12
苹果携手阿里开发中国版iPhone AI功能,十大概念股盘点(名单)
证券之星资讯
2025-02-12
阿里巴巴港股涨超6%创年内新高,官宣与苹果合作开发中国版iPhone AI功能
证券之星资讯
2025-02-12
首页
股票
财经
基金
导航