小米与MiniMax同步发布Agent模型,国产AI定价战打响
3月18日和19日,两家中国公司相继发布了各自的Agent方向大模型。国内AI初创公司MiniMax推出了M2.7,而小米旗下的大模型团队MiMo则发布了V2-Pro。两款模型在Agent benchmark上均跻身全球第一梯队,但它们的API输出定价却分别仅为Claude Opus 4.6的1/21和1/8。
两家公司在同一周内出牌,但各自的技术路线截然不同,代表了Agent时代的两种未来。
同一场考试,1/17的学费
先来看最直观的对比。

据OpenRouter和各公司官方定价页数据显示,以API输出价格(每百万tokens)计,MiniMax M2.7为1.2美元,MiMo-V2-Pro为3美元。作为参照,Claude Opus 4.6的输出价是25美元,GPT-5.2为14美元,Claude Sonnet 4.6为15美元。
价格差距显著,但能力差距并不明显。在SWE-bench Verified(当前衡量代码工程能力最主流的benchmark)上,MiMo-V2-Pro取得78%的成绩,Sonnet 4.6为79.6%,两者相差不到两个百分点。M2.7的SWE-Pro成绩为56.22%,与GPT-5.3-Codex持平。在VIBE-Pro(端到端项目交付能力)上,M2.7取得55.6%,接近Opus 4.6的水平。
这张图的重点不在于谁高谁低——各家的benchmark体系并不完全对齐,直接比较需谨慎。重点在于那个“价格-性能剪刀差”:国产Agent模型已经挤进了同一个能力带,但站在完全不同的价格区间里。
万亿参数 vs 自我进化
价格只是表象,两家公司展示了两套完全不同的技术底牌。
MiMo-V2-Pro走的是“大力出奇迹”路线。据小米官方公告,V2-Pro拥有超过1万亿总参数,激活参数42B,支持100万tokens的超长上下文。其核心创新是Hybrid Attention混合注意力机制,将滑动窗口注意力(SWA)与全局注意力(GA)的比例调至7:1——前代V2-Flash为5:1。这套架构让模型在处理长文档、多工具并行调用的Agent场景时更稳定。在PinchBench(Agent工具调用能力评测)上,MiMo-V2-Pro取得84%的成绩。
M2.7则选择了另一条路。据MiniMax 3月18日发布的官方技术博客,M2.7的参数量未公开,但它展示了一种“自迭代进化”机制:模型自主运行100轮以上的优化循环,包括分析失败轨迹、规划修改、修改自身代码架构、跑评估、再循环,最终在内部评估集上实现了30%的性能提升。在MLE Bench Lite(机器学习竞赛难度评测)的22道高难度题中,M2.7拿下9金5银1铜,平均奖牌率为66.6%。

从五个维度看,两条路线的锋芒朝向完全不同:MiMo-V2-Pro在上下文长度和代码工程维度上明显占优,M2.7则在办公自动化和自迭代能力上拉开距离。据MiniMax同篇技术博客,M2.7在GDPval-AA(办公文档处理评测)上取得ELO 1495分,居开源模型首位,在覆盖40多个复杂技能的MM-Claw测试中保持了97%的技能遵循率。
五个月四版本
两家公司不仅技术路线不同,迭代节奏也截然不同。
据公开发布记录,MiniMax从2025年10月发布M2到2026年3月发布M2.7,五个月内迭代了四个版本,平均每49天一个大版本。其中M2.5到M2.7的间隔只有约30天。
小米MiMo的节奏则不同:2025年4月发布MiMo-7B(7B参数的开源推理模型),同年12月发布V2-Flash(309B总参数),2026年3月发布V2-Pro(1T总参数)。每一代之间的参数规模跨越更大,但版本间隔也更长。
MiniMax选择了小步快跑,每次迭代幅度不大但频率极高,M2.7的自迭代机制本身就是为“持续进化”设计的。小米则选择了蓄力一击,每个版本都是参数规模和架构的大幅跃迁。

匿名8天,登顶OpenRouter
除了技术路线,小米的发布策略也打破了行业惯例。
据Reuters报道,3月11日,一个名为Hunter Alpha的匿名模型出现在全球最大API聚合平台OpenRouter上。没有品牌背书,没有发布会,没有技术博客。它的API定价极低,性能却出人意料地强。
社区开始猜测它的来历。据Republic World和多家科技媒体报道,最主流的猜测是DeepSeek V4,因为MiMo团队负责人罗福莉此前曾在DeepSeek从事研究工作。调用量迅速攀升,匿名期内总调用量突破1万亿tokens,登顶OpenRouter周榜第一。

3月19日凌晨,小米揭榜:Hunter Alpha就是MiMo-V2-Pro。据Reuters同篇报道,揭榜后小米港股一度涨幅达5.8%。
这是国产大模型第一次在全球平台上以纯盲测的方式证明自己。不靠品牌,不靠宣传,用8天时间让开发者用脚投票。
免责声明:
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代币币情的观点或立场
首页
快讯