OpenAI计划发布具备推理能力的“开放权重”模型

Wendy2025-04-01
摘要
在DeepSeek和Meta的竞争日益激烈的竞争中,AI巨头将推出以来GPT-2以来的首个开放模型 。
币币情报道:

人工智能爱好者们,你们的期待终于有了回应。

OpenAI首席执行官Sam Altman于周一宣布,OpenAI将重返开源技术领域,并计划在未来几个月内推出一款具有强大推理能力的“开放权重”语言模型。

Altman在X平台上发文表示:“我们计划发布自GPT-2以来的第一个‘开放权重’语言模型。”

这一消息的背景是,OpenAI正面临来自竞争对手的强大压力。其中包括Meta及其开源模型Llama系列、具备多模态功能的Google Gemma,以及中国AI实验室DeepSeek。后者最近发布的一款开源推理模型,据称性能超越了OpenAI的O1。

当开发人员向公众共享模型的所有内容时,该模型被称为开源——用户可以访问代码、训练数据集和架构等。

相比之下,“开放权重”模型的开放程度较低:用户可以对其进行微调,但由于无法获取如训练数据集或架构等关键元素,他们无法从零构建模型。

为了更好地了解开发者的需求,OpenAI在其官网发布了反馈表,同时还宣布了未来几周内的开发者活动计划。活动将从旧金山开始,随后扩展至欧洲和亚太地区。

OpenAI在公告中表示:“我们非常期待与开发者、研究人员以及更广泛的社区合作,收集反馈并尽可能提供帮助。”

OpenAI API团队成员Steven Heidel也透露,该模型将能够在本地运行:“我们今年会发布一个可以在您自己的硬件上运行的模型。”

不过,他并未提及模型的具体参数数量、上下文窗口大小、训练数据集、所用技术或发布许可等细节,这些因素可能会限制逆向工程或特定国家/地区的微调操作。

这一公告标志着OpenAI对其最新战略的调整,此前该公司选择将其最先进的模型锁定在API之后。

这与Altman近期在Reddit问答中的评论一致,他首次提到公司正在考虑发布完整开源模型的可能性。

“是的,我们正在讨论(发布部分模型权重及研究成果),”Altman写道。“我个人认为我们在这一问题上的历史判断有误,需要探索不同的开源策略;尽管并非所有人都认同这一观点,但这并不是我们当前的最高优先事项。”

根据Altman的帖子,即将发布的模型将具备与OpenAI O3-Mini相当的推理能力,这将使其成为目前最强大的开放推理模型,性能甚至超越DeepSeek R1。

编辑:塞巴斯蒂安·辛克莱(Sebastian Sinclair)乔什·奎特纳(Josh Quittner)

免责声明:

1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险

2.本文版权归属原作所有,仅代表作者本人观点,不代币币情的观点或立场