中国人工智能实验室 DeepSeek 上周放弃了名为 R1 的新“开放推理”法学硕士,引起了轰动。但上周末,他们的成就(复数)的全面影响开始在整个行业中得到体现。我的 Dithering 合作伙伴 Ben Thompson 今天在 Stratechery 上写了非常有用的常见问题解答风格的解释。如果你和我一样,在看今天的新闻时会想“天哪,DeepSeek 到底是怎么回事?”,请先阅读 Thompson 的文章。两个选择摘录,首先是关于 OpenAI:
然而,R1 值得注意,因为 o1 是市场上唯一的推理模型,也是 OpenAI 市场领导者的最明显标志。
R1 通过几个重要的方式打破了 o1 的神话。首先,它存在的事实。 OpenAI 没有某种无法复制的特殊武器。其次,R1——就像 DeepSeek 的所有模型一样——具有开放权重(说“开源”的问题是我们没有创建它的数据)。这意味着您无需支付 OpenAI 费用来获得推理,而是可以在您选择的服务器上运行 R1,甚至可以在本地运行,成本要低得多。
其次,关于 DeepSeek 对蒸馏的使用(使用现有的法学硕士来训练新的较小的法学硕士):
在这里,DeepSeek 似乎再次受益于蒸馏,特别是在训练 R1 方面。不过,这本身就是一个重要的结论:我们面临的情况是,人工智能模型正在教授人工智能模型,而人工智能模型正在自学。我们正在实时观看人工智能起飞场景的组装。