r1.py 脚本,使用 min-thinking-tokens 参数运行 R1
Theia Vogel 的创意十足。 DeepSeek R1 系列模型在<think>...</think>
块内输出其思想链。 Theia 发现你可以截取结束语</think>
并将其替换为“等等,但是”或“所以”或“嗯”,并欺骗模型扩展其思维过程,产生更好的解决方案!
您可以在几次迭代后停止这样做,或者您可以继续拒绝</think>
字符串并有效地强制模型永远“思考”。
Theia 的代码适用于 Hugging Face 转换器,但我相信相同的方法可以移植到 llama.cpp 或 MLX。
标签:生成人工智能、 deepseek 、变形金刚、人工智能、 LLMS
原文: https://simonwillison.net/2025/Jan/22/r1py/#atom-everything