|
股票
豆包提出全新稀疏架构 推理成本较MoE最高可降83%
来源:
证券时报网
媒体
2025-02-12 12:37:48
(原标题:豆包提出全新稀疏架构 推理成本较MoE最高可降83%)
证券时报e公司讯,随着模型规模的扩大,推理成本和访存效率已成为限制大模型规模应用的关键瓶颈。近期,字节跳动豆包大模型团队提出了全新的稀疏模型架构UltraMem,该架构有效解决了MoE推理时高额的访存问题,推理速度较MoE架构提升2—6倍,推理成本最高可降低83%。该研究还揭示了新架构的Scaling Law,证明其不仅具备优异的Scaling特性,更在性能上超越了MoE。实验结果表明,训练规模达2000万value的UltraMem模型,在同等计算资源下,可同时实现业界领先的推理速度和模型性能,为构建数十亿规模value或expert开辟了新路径。
相关个股
更多关联个股
相关阅读
国家发改委组织召开磷石膏综合治理工作电视电话会议
证券时报网
2025-02-12
京北方最新股东户数环比下降6.43% 筹码趋向集中
证券时报网
2025-02-12
券商股尾盘拉升 天风证券涨停
证券时报网
2025-02-12
万科企业涨幅扩大至逾11%
证券时报网
2025-02-12
万马股份:被低估的机器人潜力股,线缆有应用于机器狗订单!
证券时报网
2025-02-12
万科A尾盘拉升 涨逾3%
证券时报网
2025-02-12
特别推荐
苹果携手阿里开发中国版iPhone AI功能,十大概念股盘点(名单)
证券之星资讯
2025-02-12
阿里巴巴港股涨超6%创年内新高,官宣与苹果合作开发中国版iPhone AI功能
证券之星资讯
2025-02-12
家电行业盘点:除了“三巨头”外,有哪些细分龙头值得关注
证券之星资讯
2025-02-12
首页
股票
财经
基金
导航