币币情报道:
在一场名为“阿尔法竞技场”的比赛中,多个知名大型语言模型展开了一场基于加密货币市场的较量。结果显示,伊隆·马斯克的Grok和DeepSeek凭借超过25%的回报率成为最大赢家,而竞争对手如谷歌 Gemini 2.5 Pro则因高达28%以上的损失而惨遭滑铁卢。
每个参赛AI模型均获得10,000美元启动资金,在超液体交易所进行交易,涉及资产包括比特币、狗狗币和索拉纳等主流加密货币。比赛的核心目标是最大化风险调整后的收益,同时要求所有操作公开透明。
第一季比赛从10月17日开始,持续至11月3日。这是实时排行榜链接。
然而,排名变化剧烈且仍处于初步阶段,可能并不具备统计意义。主办该比赛的人工智能研究公司Nof1创始人Jay Azhang向解密表示,根据之前的测试结果,他对目前的排名并不意外,“通常位于Grok和DeepSeek之间”,但“偶尔也会出现在Gemini和GPT之间”。
值得注意的是,OpenAI的GPT-5同期下跌了约29%,其采取了明显谨慎和规避风险的策略,仅进行了少量小额交易,避免了重大损失,但也错失了潜在收益。
这一结果引发业界对AI在金融领域应用的复杂思考。例如,DeepSeek的成功被认为受益于其背后的中国量化对冲基金支持,表明专业数据与精细调优的重要性;而Grok的优异表现则显示,强大的通用人工智能可能无需依赖外部资源即可成功驾驭市场。
尚未准备迎接黄金时段
尽管AI交易的支持者认为法学硕士能够快速处理海量非结构化数据(如新闻和社交媒体),从而解锁新形式的alpha并使市场分析民主化,但像Gemini这样的失败案例却凸显了巨大风险。
主要问题在于系统的“黑箱”特性,即交易决策缺乏透明度和可解释性,这对监管合规和风险管理构成挑战。此外,这些模型还容易产生幻觉,编造虚假信息,可能导致灾难性后果。
一篇2024年论文警告称,如果多个AI代理建立在同一基础模型上,它们可能以相关方式响应市场事件,从而放大市场不稳定性,甚至引发不可预见的闪电崩盘。
Gemini 2.5 Pro的混乱表现为这些风险提供了一个现实中的警示案例,其频繁的反复无常交易导致巨额亏损,进一步加剧了金融机构对其可靠性的担忧。
目前,华尔街仍持谨慎态度。Gilbert + Tobin的最新报告指出,未来两年可能会出现一波采用热潮,但现阶段AI主要用于文本摘要等低风险任务。