OpenAI发布GPT-4.5模型:性能提升显著,但在部分任务中表现有限
OpenAI正式发布了其最新的语言模型GPT-4.5,代号为Orion。这是该公司迄今为止规模最大的模型,备受科技界期待。这一系列模型在过去已展现出在写作、数学、编码等多个领域的显著进步。
OpenAI采取了分阶段推出的方式,率先向订阅200美元/月的ChatGPT Pro用户开放访问权限,同时开发者也可通过OpenAI API付费层级立即使用GPT-4.5。据OpenAI发言人透露,ChatGPT Plus和团队用户将在下周获得访问权限。企业与教育用户则需等待更长时间。OpenAI表示,这种分阶段推出的策略是由于该“巨型”系统对计算资源的巨大需求。
今天,我们发布了GPT-4.5的研究预览,这些预览是我们最大、最佳的聊天模型。
- OpenAI(@openai)2025年2月27日
现在向所有ChatGPT Pro用户推出,然后在下周将提供给Plus和团队用户,接着是企业和教育用户。pic.twitter.com/br5win5OEB
GPT-4.5的发布被视为测试传统训练方法是否仍能带来显著性能提升的重要指标。过去,GPT系列模型随着计算能力的增加和更多训练数据的投入,功能实现了显著飞跃。然而,GPT-4.5在某些测试中的结果表明,单纯依赖扩展可能不再具有显著回报。
GPT-4.5的功能与局限性
OpenAI明确指出,GPT-4.5并非GPT-4O的直接替代品。它引入了一些高级功能,例如支持文件和图像上传以及ChatGPT的Canvas工具以实现创造性输出。但目前尚不支持最近推出的双向语音模式。
早期评估显示,GPT-4.5在多个测试类别中表现优于GPT-4O。例如,在SimpleQA基准测试中,GPT-4.5的精确度得分高于GPT-4O,并且超越了OpenAI的O1和O3-Mini推理模型。此外,GPT-4.5“幻觉”现象的频率较低,意味着其生成内容与真实信息不符的概率更低。

然而,在编码评估中,结果较为复杂。在SWE基础验证的基准测试中,GPT-4.5的表现与GPT-4O和O3-Mini大致持平,但未能超越它们。这使其在OpenAI的深入研究模型和Anthropic的Claude 3.7十四行诗模型之下。

在另一项名为SWE-Lancer的编码测试中,GPT-4.5的表现优于GPT-4O和O3-Mini,但仍落后于深入研究模型。

在更具挑战性的学术基准测试中,GPT-4.5的表现参差不齐。在AIME和GPQA等测试中,它未能达到顶级模型如O3-Mini、DeepSeek的R1或Anthropic的Claude 3.7十四行诗的表现。不过,GPT-4.5在某些情况下能够匹配甚至超越未归类为“推理”系统的领先模型,展现了强大的数学和科学能力。
OpenAI还强调了GPT-4.5在情感和社会意识方面的改进。非正式测试显示,当用户输入“我考试失败后感到很难过”时,GPT-4.5表现出更高的同理心和情感敏感性。
OpenAI在博客文章中写道:“[W]我们期待通过此版本获得更完整的GPT-4.5功能图片,因为我们认识到学术基准并不总是反映现实世界中的实用性。”

扩展法则面临挑战
GPT-4.5延续了与前几代GPT模型相同的无监督训练策略,但其在某些高级基准测试中的表现有限,可能表明行业传统的“扩展法则”正逐渐失去效力。
OpenAI联合创始人兼前首席科学家Ilya Sutskever曾在去年12月指出,“我们已经达到了峰值数据”,并暗示未来的进展将依赖于其他方法,例如能够更深入推理论问题的系统,而不仅仅是记住大量信息。
GPT-4.5的训练成本极高,其白皮书也证实了这一点。由于性能和成本障碍,OpenAI推迟了多次发布的计划。尽管如此,GPT-4.5并未在许多高级任务中超越竞争对手的专业推理模型。OpenAI将其视为迈向GPT-5集成“O”推理系统的重要里程碑。
CEO对GPU短缺的评论
OpenAI首席执行官Sam Altman在社交媒体X(原Twitter)上解释了为何新模型采用分阶段推出。他表示:“我们的增长超出了GPU的供应能力。” GPT-4.5不仅体积庞大,而且运行成本高昂。
GPT-4.5已经准备好了!
- Sam Altman(@sama)2025年2月27日
好消息:这是第一个感觉就像在与我交谈的人。我有片刻的时间坐在椅子上,并惊讶地从AI那里得到很好的建议。
坏消息:这是一个巨大、昂贵的模型。我们…
GPT-4.5的运行成本确实惊人。OpenAI的定价为每百万个输入代币75美元,每百万个输出代币150美元,分别是GPT-4O模型的30倍和15倍。
Altman补充道:“我们将在下周增加数千个GPU,然后将其推广到更多用户群体。这不是我们理想的操作方式,但难以完全预测导致GPU短缺的增长激增。”
密码大都会学院:厌倦了市场波动?了解DeFi如何帮助您建立稳定的被动收入。立即注册
免责声明:
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代币币情的观点或立场