苹果AI研究质疑大模型推理能力,WWDC开幕在即却面临产品空窗
苹果公司即将于周一召开年度全球开发者大会(WWDC),但其在人工智能领域的进展却显得步履维艰,未能达到科技竞争对手的预期。这家iPhone制造商声称,现有大型语言模型“失败”了,因为它们更注重基准测试,而非实际解决问题。
上周末,苹果人工智能研究部门的一篇研究论文在社交媒体上传播开来。该论文对OpenAI、谷歌DeepMind、Anthropic和DeepSeek开发的推理模型能力提出了质疑。
根据这篇论文,这些模型在任务复杂度增加的情况下准确率持续下降,最终达到“彻底失败的地步”。
目前的评估主要依赖于已建立的数学和编码基准,尽管这些基准具有一定价值,但往往存在数据污染问题,并且无法在不同环境和复杂程度下进行受控实验。此外,这些评估无法提供对推理轨迹结构和质量的洞察。”论文中写道。
当问题变得更难时,人工智能就会失败
通过设计可控复杂度的谜题,苹果研究人员发现,随着问题难度的提升,大型人工智能模型无法维持其性能,甚至逐渐减少努力。
分析师通过衡量响应生成过程中使用的推理时间令牌得出结论,称人工智能的表现为“崩溃”。
被测试的模型包括OpenAI的o3-mini变体以及Anthropic的Claude 3.7 Sonnet。其中,o3-mini表现“不佳”,而Claude模型则展现出一定的韧性。
即使提供了汉诺塔难题的正确算法,这些模型的性能也未见提升。苹果研究人员最终得出结论:这些人工智能系统的推理能力可能并不如人们普遍认为的那样先进。
WWDC 即将开幕,一切取决于产品发布的动向
在以往的WWDC活动中,苹果通常会借此机会发布新产品,例如2022年的Vision Pro耳机及2023年的苹果智能倡议。然而,在今年的会议上,市场观察人士普遍认为几乎没有什么值得期待的内容。
彭博社在预览WWDC日程时表示,这些更新“令人失望”。此外,苹果去年承诺的许多功能至今仍未上线。报道指出,本周苹果可能发布的人工智能公告规模较小,不足以在由谷歌、Meta、OpenAI等AI优先公司主导的行业中留下深刻印象。
2025年,苹果股价已下跌超过18%。首席执行官蒂姆·库克否认了有关公司新产品和人工智能整合计划落空的传言。
Deepwater Asset Management的执行合伙人Gene Munster在今年早些时候接受CNN采访时指出:“苹果在人工智能领域落后的问题越来越明显。”
Wedbush Securities的Dan Ives估计,全球约25%的人口最终可以通过Apple设备访问人工智能,但截至目前,“潜力尚未实现”。
在上个月的财报电话会议上,首席执行官蒂姆·库克承认,改进版人工智能功能(如更加个性化的Siri)的推出有所延迟。
库克表示:“我们需要更多时间来完善这些功能,以确保它们符合我们的高质量标准。我们正在取得进展,并期待将这些功能交付给用户。”
与此同时,苹果的竞争对手正在蚕食这家科技巨头的客户群,希望抢走那些一直期待库克团队带来“更好”产品的忠实用户。
三星据报道正与人工智能初创公司Perplexity合作,将增强型数字助理集成到即将推出的Galaxy手机中。摩托罗拉新款Razr手机也集成了由Perplexity支持的功能及其他人工智能特性。
苹果在其生态系统中迟迟未推出人工智能体验,这使其面临在曾经主导的市场中落后的风险。
KEY 差异线帮助加密货币品牌快速突破并占据头条新闻
免责声明:
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代币币情的观点或立场