直指端侧痛点，豆包新模型架构最高降本83%

来源: 陀螺科技406天前

2月12日讯，据豆包大模型团队消息，字节跳动豆包大模型Foundation团队近期提出一种全新的稀疏模型架构——UltraMem，该架构在保证模型效果的前提下，推理速度较传统的MoE架构提升2-6倍，推理成本最高可降低83%。这项创新成果已被机器学习和AI领域的顶级会议ICLR 2025接收，为解决大模型推理效率和扩展能力问题提供了全新思路。