警惕: 网上好友、短信、电话、群聊的都是骗子,远离虚拟币防止受骗!
¥ 10.4582
≈$ 1.4354 ( -5.6% )
流通市值 ¥ 12.58亿
NO.1000123
24H最高 ¥ 11.96
24H最低 ¥ 10.64
7D最高 ¥ 20.93
7D最低 ¥ 8.99
初始价格
24H量 2,669.81万
24H额 ¥ 2.79亿
历史最高 ¥ 33.98
历史最低 ¥ 8.99
投资回报 0
5 小时前
研究人员以不到50美元创建可与OpenAI o1模型相媲美的s1模型
根据上周五发布的一篇新研究论文,斯坦福大学和华盛顿大学的人工智能研究人员能够以不到 50 美元的云计算积分训练一个人工智能“推理”模型。 在衡量数学和编码能力的测试中,被称为 s1 的模型表现类似于尖端推理模型,例如 OpenAI 的 o1 和 DeepSeek 的 r1。s1 模型以及用于训练它的数据和代码可在 GitHub 上找到。 s1 背后的团队表示,他们通过提炼(distillation)创建了人工智能模型,这是一种通过训练另一个人工智能模型的答案来提取“推理”能力的过程。研究人员表示,s1 是从谷歌的推理模型之一 Gemini 2.0 Flash Thinking Experimental 中提炼出来的。提炼是伯克利研究人员上个月以约 450 美元的价格创建人工智能推理模型所采用的相同方法。 s1 背后的研究人员正在寻找实现强大推理性能和“测试时间扩展”的最简单方法,或者让 AI 模型在回答问题之前进行更多思考。这些是 OpenAI 的 o1 中的一些突破,其他 AI 实验室试图通过各种技术复制这些突破。s1 论文提出,可以使用一种称为监督微调(SFT)的过程,利用相对较小的数据集提炼推理模型,在此过程中,明确指示 AI 模型模仿数据集中的某些行为。SFT 往往比 DeepSeek 用于训练其对 OpenAI 的 o1、R1 的答案的大规模强化学习方法更便宜。 s1 基于阿里巴巴旗下中国 AI 实验室 Qwen 的一个小型现成 AI 模型,可免费下载。为了训练 s1,研究人员创建了一个仅包含 1,000 个精心策划的问题的数据集,并附上这些问题的答案以及 Google 的 Gemini 2.0 Flash Thinking Experimental 中每个答案背后的“思考”过程。 据研究人员称,在使用 16 个 Nvidia H100 GPU 不到 30 分钟的时间内训练 s1 后,s1 在某些 AI 基准测试中取得了强劲的表现。参与该项目的斯坦福大学研究员 Niklas Muennighoff 称,他现在就可以以大约 20 美元的价格租用必要的计算机。(TechCrunch)