根据一份研究论文,斯坦福大学和华盛顿大学的人工智能研究人员能够以不到 50 美元的云计算积分来训练人工智能“推理”模型。报告摘自:该模型被称为 s1,在测量数学和编码能力的测试中,其表现与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型类似。 s1 模型以及用于训练它的数据和代码可在 GitHub 上获取。 s1 背后的团队表示,他们从一个现成的基础模型开始,然后通过蒸馏对其进行微调,这是一个通过训练另一个人工智能模型的答案来提取“推理”能力的过程。研究人员表示,s1 是从 Google 的推理模型之一 Gemini 2.0 Flash Thinking Experimental 中提炼出来的。伯克利研究人员上个月以约 450 美元的价格创建人工智能推理模型,采用的方法与蒸馏法相同。
在 Slashdot 上阅读这个故事的更多内容。