OpenAI计划发布具备推理能力的“开放权重”模型

Wendy2025-04-01

摘要

在DeepSeek和Meta的竞争日益激烈的竞争中，AI巨头将推出以来GPT-2以来的首个开放模型。

币币情报道：

人工智能爱好者们，你们的期待终于有了回应。

OpenAI首席执行官Sam Altman于周一宣布，OpenAI将重返开源技术领域，并计划在未来几个月内推出一款具有强大推理能力的“开放权重”语言模型。

Altman在X平台上发文表示：“我们计划发布自GPT-2以来的第一个‘开放权重’语言模型。”

这一消息的背景是，OpenAI正面临来自竞争对手的强大压力。其中包括Meta及其开源模型Llama系列、具备多模态功能的Google Gemma，以及中国AI实验室DeepSeek。后者最近发布的一款开源推理模型，据称性能超越了OpenAI的O1。

当开发人员向公众共享模型的所有内容时，该模型被称为开源——用户可以访问代码、训练数据集和架构等。

相比之下，“开放权重”模型的开放程度较低：用户可以对其进行微调，但由于无法获取如训练数据集或架构等关键元素，他们无法从零构建模型。

为了更好地了解开发者的需求，OpenAI在其官网发布了反馈表，同时还宣布了未来几周内的开发者活动计划。活动将从旧金山开始，随后扩展至欧洲和亚太地区。

OpenAI在公告中表示：“我们非常期待与开发者、研究人员以及更广泛的社区合作，收集反馈并尽可能提供帮助。”

OpenAI API团队成员Steven Heidel也透露，该模型将能够在本地运行：“我们今年会发布一个可以在您自己的硬件上运行的模型。”

不过，他并未提及模型的具体参数数量、上下文窗口大小、训练数据集、所用技术或发布许可等细节，这些因素可能会限制逆向工程或特定国家/地区的微调操作。

这一公告标志着OpenAI对其最新战略的调整，此前该公司选择将其最先进的模型锁定在API之后。

这与Altman近期在Reddit问答中的评论一致，他首次提到公司正在考虑发布完整开源模型的可能性。

“是的，我们正在讨论（发布部分模型权重及研究成果），”Altman写道。“我个人认为我们在这一问题上的历史判断有误，需要探索不同的开源策略；尽管并非所有人都认同这一观点，但这并不是我们当前的最高优先事项。”

根据Altman的帖子，即将发布的模型将具备与OpenAI O3-Mini相当的推理能力，这将使其成为目前最强大的开放推理模型，性能甚至超越DeepSeek R1。

编辑：塞巴斯蒂安·辛克莱（Sebastian Sinclair）和乔什·奎特纳（Josh Quittner）

免责声明：

1.资讯内容不构成投资建议，投资者应独立决策并自行承担风险

2.本文版权归属原作所有，仅代表作者本人观点，不代币币情的观点或立场