这些新车型的发布一直在源源不断地涌现。今天,它被 Google 活泼地命名为gemini-2.0-flash-thinking-exp
,这是他们第一个进入 o1 风格推理扩展类模型的产品。今天早上我发表了一篇关于这些重要性的精彩文章。
来自Gemini 模型文档:
Gemini 2.0 Flash 思维模式是一个实验模型,经过训练可以生成模型作为其响应的一部分所经历的“思维过程”。因此,思考模式的响应推理能力比基础 Gemini 2.0 Flash 模型更强。
我刚刚发布了llm-gemini 0.8,支持该模型。您可以使用LLM尝试一下,如下所示:
llm install -U llm-gemini #如果您还没有设置 Gemini 键: llm 键设置双子座 #将密钥粘贴到此处 llm -m gemini-2.0-flash-thinking-exp-1219 “解决山羊生菜狼河谜题的更难变体”
这是一个非常健谈的模型– 2,277 个输出标记回答该提示。
一个更有趣的例子
到目前为止,我发现的示例提示的最佳来源是Gemini 2.0 Flash Thinking 食谱– 一个 Jupyter 笔记本,其中充满了模型功能的演示。
到目前为止我最喜欢的是这个:
What's the area of the overlapping region?
该模型是多式联运的!
以下是使用llm-gemini
运行该示例的方法:
llm -m gemini-2.0-flash-thinking-exp-1219 \
-a https://storage.googleapis.com/generativeai-downloads/images/geometry.png \
“重叠区域的面积是多少? ”
这是完整的回复,包括 MathML 的工作。最终结论:
最终答案是9π/4
这与 Google 在示例笔记本中提供的答案相同,所以我认为它是正确的。感人的!
骑自行车的鹈鹕的 SVG 怎么样?
llm -m gemini-2.0-flash-thinking-exp-1219 \
“生成鹈鹕骑自行车的 SVG ”
这是完整的回复。有趣的是,它稍微破坏了答案的开头:
This thought process involves a combination of visual thinking, knowledge of SVG syntax, and iterative refinement. The key is to break down the problem into manageable parts and build up the image piece by piece. Even experienced SVG creators often go through several adjustments before arriving at the final version.00" height="250" viewBox="0 0 300 250" fill="none" xmlns="http://www.w3.org/2000/svg">
<g>
<!-- Bicycle Frame -->
在我手动修复它以添加<svg
开始标记后,我得到了这个:
所以也许不是艺术大师,但无论如何读一下它的思想链还是很有趣的。
标签: google 、 ai 、生成式 AI 、 llms 、 llm 、 Gemini 、 o1 、推理缩放
原文: https://simonwillison.net/2024/Dec/19/gemini-thinking-mode/#atom-everything