|
股票
豆包提出全新稀疏架构 推理成本较MoE最高可降83%
来源:
证券时报网
媒体
2025-02-12 12:37:48
(原标题:豆包提出全新稀疏架构 推理成本较MoE最高可降83%)
证券时报e公司讯,随着模型规模的扩大,推理成本和访存效率已成为限制大模型规模应用的关键瓶颈。近期,字节跳动豆包大模型团队提出了全新的稀疏模型架构UltraMem,该架构有效解决了MoE推理时高额的访存问题,推理速度较MoE架构提升2—6倍,推理成本最高可降低83%。该研究还揭示了新架构的Scaling Law,证明其不仅具备优异的Scaling特性,更在性能上超越了MoE。实验结果表明,训练规模达2000万value的UltraMem模型,在同等计算资源下,可同时实现业界领先的推理速度和模型性能,为构建数十亿规模value或expert开辟了新路径。
相关个股
更多关联个股
相关阅读
美图公司(01357.HK)6月23日回购1986.30万港元,年内累计回购2.…
证券时报网
2026-06-23
建滔积层板获南向资金连续11天净买入
证券时报网
2026-06-23
建滔集团获南向资金连续6天净买入
证券时报网
2026-06-23
华虹宏力获南向资金连续5天净买入
证券时报网
2026-06-23
第七大道(00797.HK)6月23日回购1462.80万股,耗资1645.68…
证券时报网
2026-06-23
阅文集团(00772.HK)6月23日回购1176.20万港元,已连续13日回购
证券时报网
2026-06-23
特别推荐
利好!九部门发文力挺汽车后市场,途虎养车核心商业模式获政策呼应
证券之星资讯
2026-06-23
最高增至140%!银行密集上调贵金属交易保证金
证券之星资讯
2026-06-23
海外股市,突发暴跌!美联储大消息
证券之星资讯
2026-06-23
首页
股票
财经
基金
导航