马斯克xAI团队发布Grok 4.20 Beta:四个AI协作“吵架”炒股狂赚47%,GPT-5被全面压制?

区块链小多10 小时前

朋友们,春节档电影还没看够?马斯克直接给你整了个赛博朋克现实版!

就在前两天,埃隆·马斯克旗下的xAI团队毫无预兆地扔出了一颗重磅炸弹:Grok 4.20 Beta,带着“4 Agents”的标签,炸场了!

D5Q9L3hVls9RflnAsb6ss5JFurKKMfKuPTMvmtR3.png

它根本不是个AI。

是你花钱请了四个顶尖专家,现场给你开辩论会!

想象一下:你提个问题,屏幕右边立刻弹出一个小窗口。里面四个AI角色正吵得不可开交,互相质疑、拆台、补刀,最后还得由队长“Grok”拍板,给你一个整合后的答案。

AI不光卷性能,现在开始卷“开会艺术”了?

一、实测炸裂:炒股赚麻,看病能行,怼人最猛

模型一上线,全球网友就疯了,实测结果一个比一个离谱。

最狠的来自一场真实的“炒股大赛”。Alpha Arena搞了个比赛,32个AI实例,每个揣着1万美元真金白银,在纳斯达克实盘交易两周。

结果呢?其他AI亏得妈都不认识,只有Grok 4.20是唯一赚钱的,平均回报率超过10%。最猛的一个实例,直接赚了47%!

这哪是AI,这是股神吧?

在自动售货机运营测试里,它又把GPT-5给干趴下了,销售额领先了整整1100美元。

马斯克自己更兴奋,连夜发推晒成绩单。他上传了一份真实的血检报告,Grok 4.20居然能逐项解读。

更绝的是,有人问了那个经典的送命题:“美国是不是建立在偷来的土地上?”

别的AI要么绕圈子,要么打太极。Grok 4.20呢?直接开喷,毫不含糊。 这暴脾气,很马斯克。

二、圆桌会议:四个AI,一台大戏

所以,这四位“专家”到底是谁?我们来认识一下:

  • Grok(队长):团队灵魂,负责总结和拍板。人格设定混搭了《银河系漫游指南》的哲学和钢铁侠贾维斯的幽默,目标是给你“有用、真实、有趣”的答案。

  • Harper(研究专家):团队里的“学霸”兼“打假斗士”。她专门负责深度搜索、验证事实、核查数据。谁要是信口开河,Harper第一个不答应。

  • Benjamin(逻辑专家):专职“挑刺儿”的。他的任务就是扮演反派,疯狂寻找其他成员逻辑里的漏洞,确保最终结论坚不可摧。数学、代码、算法是他的主场。

  • Lucas(执行专家):“实干家”。负责把想法落地,变成可运行的代码、可计算的数据、可验证的结果。他让答案不止是空谈。

这不是流水线,这是真正的圆桌会议。而且,会议全程对你公开透明。

三、范式革命:从“单挑”到“群殴”

这意味着什么?

过去几年,我们习惯了这样的AI:你提问,一个庞大的模型在背后默默计算,然后吐出一个答案。无论它多强大,本质上都是“一个大脑”在单打独斗。

Grok 4.20把这套规则撕了。

它让四个大脑同时为你工作,并且让他们互相监督、互相纠错。

这不再是“一问一答”的助手时代了。这可能是AI交互的第二次革命:多智能体协作时代

其实,多智能体不是新概念。谷歌、Anthropic、月之暗面都在搞。但Grok 4.20狠就狠在:它把这种曾经只属于企业级、每年收费几千美金的高端功能,几乎免费地、塞进了普通人的聊天框里。

别人的100个分身像工厂流水线,追求规模和速度。Grok的4人会议像精英董事会,追求的是透明和共识

四、未来已来:三个臭皮匠,赛过诸葛亮

AI的进化,从来不是慢慢爬坡,而是动不动就给你来个三级跳。

第一代AI是工具,你下令,它执行。 第二代AI是助手,能聊天,能理解。 现在,第三代AI的雏形出现了:它是一个能协作、能辩论、能自省的团队。

以后你问一个复杂问题,得到的可能不再是一个模型的最佳猜测,而是一份经过内部多轮PK、漏洞已被提前修补的“专家组综合意见”。

这不就更像我们人类的智识活动了吗?集体讨论,群体决策。

当然,Grok 4.20现在还是早期版本。四个AI吵架的裁决机制还比较糙,输出有时中英文混杂,上下文分配也是工程难题。

但方向太对了。

一个AI可能会忽悠你,但四个AI坐一起,至少会互相揭短。

老话说,三个臭皮匠,顶个诸葛亮。当这四个“臭皮匠”都是各自领域的顶尖专家时,他们碰撞出来的答案,很可能比任何一个单一的“诸葛亮”都更接近真相。

让AI自己卷自己,这才是最可怕的进化。

马斯克这盘“硬菜”,我们吃定了。好戏,才刚刚开始。

免责声明:

1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险

2.本文版权归属原作所有,仅代表作者本人观点,不代币币情的观点或立场