研究人员以不到 50 美元的价格创建了 OpenAI o1“推理”模型的开放竞争对手

根据一份研究论文，斯坦福大学和华盛顿大学的人工智能研究人员能够以不到 50 美元的云计算积分来训练人工智能“推理”模型。报告摘自：该模型被称为 s1，在测量数学和编码能力的测试中，其表现与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型类似。 s1 模型以及用于训练它的数据和代码可在 GitHub 上获取。 s1 背后的团队表示，他们从一个现成的基础模型开始，然后通过蒸馏对其进行微调，这是一个通过训练另一个人工智能模型的答案来提取“推理”能力的过程。研究人员表示，s1 是从 Google 的推理模型之一 Gemini 2.0 Flash Thinking Experimental 中提炼出来的。伯克利研究人员上个月以约 450 美元的价格创建人工智能推理模型，采用的方法与蒸馏法相同。