向 Gemini-exp-1121 打个招呼 – 搞英语 → 看世界

Google Gemini 的 Logan Kilpatrick 在 Twitter 上：

向 Gemini-exp-1121 打个招呼！我们最新的实验性双子座模型，具有：

编码性能显着提升

更强的推理能力

改善视觉理解

现已在 Google AI Studio 和 Gemini API 上提供

名字中的1121是发布日期11月21日。这是紧随上周的gemini-exp-1114的脚步。

这两个新的实验性 Gemini 模型都曾登上过聊天机器人竞技场的顶峰。 gemini-exp-1114几天前占据了榜首，然后输给了一个名为“ChatGPT-4o-latest (2024-11-20)”的新 OpenAI 模型……仅适用于新的gemini-exp-1121目前占据榜首位置。

（这些型号的名字都太糟糕了。）

我发布了llm-gemini 0.4.2，支持新模型 – 这应该是 0.5，但我已经有了一个0.5a0 alpha ，它依赖于 LLM 核心中未发布的功能。

我尝试了我的鹈鹕基准：

 llm -m gemini-exp-1121 'Generate an SVG of a pelican riding a bicycle'

由于 Gemini 是一个多模态视觉模型，我让它向我描述它所创建的图像（通过为其提供 PNG 渲染）：

 llm -m gemini-exp-1121 describe -a pelican.png

并得到了这个描述，非常棒：

该图像显示了车辆上的昆虫（可能是蜜蜂或蚂蚁）的简单风格化图画。昆虫由一个代表身体的大黄色圆圈和一个代表头部的较小黄色圆圈组成。它有一个黑点代表眼睛，一个橙色的小椭圆形代表喙或嘴，细黑线代表触角和腿。昆虫被放置在一辆带有两个黑色轮子的简单黑白车辆的顶部。这幅画是抽象的几何图形，使用基本形状和有限的黑色、白色、黄色和橙色调色板。

标签：视觉 LLMS 、 Gemini 、 LLM 、谷歌、 Generative-AI 、 AI 、 LLMS

原文： https://simonwillison.net/2024/Nov/22/gemini-exp-1121/#atom-everything