我对 12 月有一个宏伟的计划:一方面,我希望能够获得 Datasette 1.0 的实际 RC,为 1 月份的完整发布做准备。相反,我发现自己被不断涌现的新法学硕士版本分散了注意力。
12 月 4 日,亚马逊推出了Amazon Nova系列多式联运机型,价格清晰,可与 Google 优质且廉价的 Gemini 1.5 系列竞争。我通过一个新的llm-bedrock插件让那些与LLM一起工作的人。
下一个重大版本是 12 月 6 日发布的Llama 3.3 70B-Instruct 。 Meta 声称这款 70B 型号在质量上可与更大的 405B 型号相媲美,这些说法似乎很有说服力。
我写过关于现在如何在我的笔记本电脑上运行 GPT-4 类模型的文章– 20 个月前运行 GPT-3 类模型的同一台笔记本电脑。
Llama 3.3 70B 现在已经开始从 API 提供商那里出现,包括来自Groq (276 个令牌/秒)和Cerebras (坦率地说,荒谬的 2,200 个令牌/秒)的超快托管版本。如果您还没有尝试过 Val Town 的Cerebras Coder演示,那么您真的应该尝试一下。
我认为模型效率的巨大提升是 2024 年法学硕士的决定性故事之一。受益的不仅仅是本地模型:专有托管法学硕士的价格已经跌破底线,这是供应商和法律硕士之间竞争的结果。提高模型本身的效率。
去年流行的一个笑话是,每次 Google 推出新的 Gemini 版本时,OpenAI 都会在同一天发布一些更令人印象深刻的东西来削弱他们。
潮流已经逆转!本月,谷歌发布了三项更新,让 OpenAI 的风帆荡然无存。
第一个是12月11日发布的Gemini 2.0 Flash ,这是Google Gemini 2.0系列的第一个版本。流媒体支持尤其令人印象深刻,在 OpenAI 在 ChatGPT 更新中发布自己的流媒体摄像头/音频功能之前一整天, https://aistudio.google.com/live演示了与多模式 LLM 的流媒体音频和网络摄像头通信。
今天早上,谷歌发布了Gemini 2.0 Flash“思考模式” ,这是 OpenAI 的 o1 首创的推理扩展技术的版本。我没想到 Gemini 在 2024 年结束之前就发布了该版本。
OpenAI 为期12 天的 OpenAI活动还剩一天。之前的亮点包括完整的 o1 模型(o1-preview 的升级)和 o1-pro、 Sora (一周后被 Google 的Veo 2取代)、Canvas(带有令人困惑的第二种运行 Python 的方式)、带有视频的高级语音流媒体和圣诞老人以及非常酷的新WebRTC 流媒体 API 、ChatGPT 项目(几乎是类似 Claude 功能的直接提升)和 1-800-CHATGPT 电话线。
明天是最后一天了。我不会尝试预测他们将推出什么产品,但我想这将是今年结束时值得注意的事情。
博客文章
- Gemini 2.0 Flash“思维模式”
- 使用 uv run 和 Claude Projects 通过一次性提示构建 Python 工具
- Gemini 2.0 Flash:具有科幻流媒体模式的杰出多模式法学硕士
- ChatGPT Canvas 现在可以发出 API 请求,但很复杂
- 我现在可以在笔记本电脑上运行 GPT-4 类模型
- 提示.js
- 新 Amazon Nova LLM 的第一印象(通过新的 llm-bedrock 插件)
- 存储人类事件的时间
- 在终端中询问有关 SQLite 数据库和 CSV/JSON 文件的问题
发布
- LLM-双子座 0.8 – 2024-12-19
用于访问 Google Gemini 系列模型的 LLM 插件 - 数据集丰富-慢 0.1 – 2024-12-18
丰富了慢循环以帮助调试进度条 - LLM-人类 0.11 – 2024-12-17
法学硕士可以访问 Anthropic 的模型,包括 Claude 系列 - llm-openrouter 0.3 – 2024-12-08
OpenRouter 托管模型的 LLM 插件 - 提示-js 0.0.4 – 2024-12-08
浏览器alert()、prompt()和confirm()的异步替代方案 - 数据集丰富-LLM 0.1a0 – 2024-12-05
通过提示法学硕士丰富数据 - 法学硕士 0.19.1 – 2024-12-05
从命令行访问大型语言模型 - llm-基岩 0.4 – 2024-12-04
针对 AWS Bedrock 上托管的模型运行提示 - 数据集查询 0.1a0 – 2024-12-03
将 SQL 查询保存在 Datasette 中 - 数据集-llm-用法 0.1a0 – 2024-12-02
跟踪 SQLite 表中 LLM 令牌的使用情况 - LLM-米斯特拉尔 0.9 – 2024-12-02
LLM 插件提供使用 Mistral API 访问 Mistral 模型的权限 - llm-克劳德-3 0.10 – 2024-12-02
用于与 Claude 3 系列模型交互的 LLM 插件 - 数据集 0.65.1 – 2024-11-29
用于探索和发布数据的开源多功能工具 - sqlite-utils-ask 0.2 – 2024-11-24
在法学硕士的协助下询问您的数据问题 - sqlite-utils 3.38 – 2024-11-23
用于操作 SQLite 数据库的 Python CLI 实用程序和库
TIL
- 修复了 Python 中的日期时间 UTC 警告– 2024 年 12 月 12 日
- 使用 GitHub Actions 将简单的客户端 JavaScript 包发布到 npm – 2024-12-08
- 使用 Cloudflare Workers 的静态站点的 GitHub OAuth – 2024-11-29
标签:谷歌, ai , weeknotes , openai , Generative-ai , chatgpt , llms , Gemini , o1
原文: https://simonwillison.net/2024/Dec/20/december-in-llms-has-been-a-lot/#atom-everything