马斯克xAI团队发布Grok 4.20 Beta:四个AI协作“吵架”炒股狂赚47%,GPT-5被全面压制?
朋友们,春节档电影还没看够?马斯克直接给你整了个赛博朋克现实版!
就在前两天,埃隆·马斯克旗下的xAI团队毫无预兆地扔出了一颗重磅炸弹:Grok 4.20 Beta,带着“4 Agents”的标签,炸场了!

它根本不是个AI。
是你花钱请了四个顶尖专家,现场给你开辩论会!
想象一下:你提个问题,屏幕右边立刻弹出一个小窗口。里面四个AI角色正吵得不可开交,互相质疑、拆台、补刀,最后还得由队长“Grok”拍板,给你一个整合后的答案。
AI不光卷性能,现在开始卷“开会艺术”了?
一、实测炸裂:炒股赚麻,看病能行,怼人最猛
模型一上线,全球网友就疯了,实测结果一个比一个离谱。
最狠的来自一场真实的“炒股大赛”。Alpha Arena搞了个比赛,32个AI实例,每个揣着1万美元真金白银,在纳斯达克实盘交易两周。
结果呢?其他AI亏得妈都不认识,只有Grok 4.20是唯一赚钱的,平均回报率超过10%。最猛的一个实例,直接赚了47%!
这哪是AI,这是股神吧?
在自动售货机运营测试里,它又把GPT-5给干趴下了,销售额领先了整整1100美元。
马斯克自己更兴奋,连夜发推晒成绩单。他上传了一份真实的血检报告,Grok 4.20居然能逐项解读。
更绝的是,有人问了那个经典的送命题:“美国是不是建立在偷来的土地上?”
别的AI要么绕圈子,要么打太极。Grok 4.20呢?直接开喷,毫不含糊。 这暴脾气,很马斯克。
二、圆桌会议:四个AI,一台大戏
所以,这四位“专家”到底是谁?我们来认识一下:
-
Grok(队长):团队灵魂,负责总结和拍板。人格设定混搭了《银河系漫游指南》的哲学和钢铁侠贾维斯的幽默,目标是给你“有用、真实、有趣”的答案。
-
Harper(研究专家):团队里的“学霸”兼“打假斗士”。她专门负责深度搜索、验证事实、核查数据。谁要是信口开河,Harper第一个不答应。
-
Benjamin(逻辑专家):专职“挑刺儿”的。他的任务就是扮演反派,疯狂寻找其他成员逻辑里的漏洞,确保最终结论坚不可摧。数学、代码、算法是他的主场。
-
Lucas(执行专家):“实干家”。负责把想法落地,变成可运行的代码、可计算的数据、可验证的结果。他让答案不止是空谈。
这不是流水线,这是真正的圆桌会议。而且,会议全程对你公开透明。
三、范式革命:从“单挑”到“群殴”
这意味着什么?
过去几年,我们习惯了这样的AI:你提问,一个庞大的模型在背后默默计算,然后吐出一个答案。无论它多强大,本质上都是“一个大脑”在单打独斗。
Grok 4.20把这套规则撕了。
它让四个大脑同时为你工作,并且让他们互相监督、互相纠错。
这不再是“一问一答”的助手时代了。这可能是AI交互的第二次革命:多智能体协作时代。
其实,多智能体不是新概念。谷歌、Anthropic、月之暗面都在搞。但Grok 4.20狠就狠在:它把这种曾经只属于企业级、每年收费几千美金的高端功能,几乎免费地、塞进了普通人的聊天框里。
别人的100个分身像工厂流水线,追求规模和速度。Grok的4人会议像精英董事会,追求的是透明和共识。
四、未来已来:三个臭皮匠,赛过诸葛亮
AI的进化,从来不是慢慢爬坡,而是动不动就给你来个三级跳。
第一代AI是工具,你下令,它执行。 第二代AI是助手,能聊天,能理解。 现在,第三代AI的雏形出现了:它是一个能协作、能辩论、能自省的团队。
以后你问一个复杂问题,得到的可能不再是一个模型的最佳猜测,而是一份经过内部多轮PK、漏洞已被提前修补的“专家组综合意见”。
这不就更像我们人类的智识活动了吗?集体讨论,群体决策。
当然,Grok 4.20现在还是早期版本。四个AI吵架的裁决机制还比较糙,输出有时中英文混杂,上下文分配也是工程难题。
但方向太对了。
一个AI可能会忽悠你,但四个AI坐一起,至少会互相揭短。
老话说,三个臭皮匠,顶个诸葛亮。当这四个“臭皮匠”都是各自领域的顶尖专家时,他们碰撞出来的答案,很可能比任何一个单一的“诸葛亮”都更接近真相。
让AI自己卷自己,这才是最可怕的进化。
马斯克这盘“硬菜”,我们吃定了。好戏,才刚刚开始。
免责声明:
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代币币情的观点或立场
首页
快讯