r1.py 脚本，使用 min-thinking-tokens 参数运行 R1

Theia Vogel 的创意十足。 DeepSeek R1 系列模型在<think>...</think>块内输出其思想链。 Theia 发现你可以截取结束语</think>并将其替换为“等等，但是”或“所以”或“嗯”，并欺骗模型扩展其思维过程，产生更好的解决方案！

您可以在几次迭代后停止这样做，或者您可以继续拒绝</think>字符串并有效地强制模型永远“思考”。

Theia 的代码适用于 Hugging Face 转换器，但我相信相同的方法可以移植到 llama.cpp 或 MLX。