Anthropic 今天发布了Claude 3.7 Sonnet – 跳过了“Claude 3.6”这个名称,因为 Anthropic 用户社区已经开始使用它作为10 月份更新的 3.5 Sonnet 的非官方名称。
正如您所料,3.7 Sonnet 比 3.5 Sonnet 有所改进,并且价格相同,输入为 3 美元/百万代币,输出为 15 美元/百万代币。
最大的区别在于,这是 Anthropic 的第一个“推理”模型 – 应用了我们现在从 OpenAI o1 和 o3、Grok 3、Google Gemini 2.0 Thinking、DeepSeek R1 和 Qwen 的 QwQ 和 QvQ 中看到的相同技巧。现在唯一没有官方推理模型的大型模型家族是 Mistral 和 Meta 的 Llama。
我仍在努力为我的 llm-anthropic 插件添加支持,但我已经有足够的工作代码,我能够让它为我画一只骑自行车的鹈鹕。这是非推理模型:
这是相同的提示,但启用了“思考模式”:
这是第二个的记录,它将思考和输出标记混合在一起。我仍在研究如何最好地区分这两种类型的令牌。
Anthropic 今天发布的另一个重要版本是Claude Code的预览版 – 一个用于与 Claude 交互的 CLI 工具,包括在终端聊天中提示 Claude 并让它读取和修改文件以及执行命令的功能。这意味着它既可以迭代代码又可以执行测试,使其成为编码辅助的极其强大的“代理”。
标签:法学硕士、人类学、克劳德、人工智能代理、推理缩放、人工智能、 LLMS 、人工智能辅助编程、生成人工智能、鹈鹕骑自行车
原文: https://simonwillison.net/2025/Feb/24/claude-37-sonnet-and-claude-code/#atom-everything