我在法学硕士发表了对 2024 年的评论,然后通过电话麦克风与互联网上的大多数定向广告阴谋论进行了斗争。
在我上一篇周记中,我谈到了法学硕士十二月的经历。那是在 12 月 20 日,事实证明,在今年年底之前,至少还有三个新的 LLM 重大故事即将发布:
- OpenAI 宣布了其 o3 推理模型的初始基准,我在其混合质量 12 天 OpenAI 系列的最后一天的实时博客中对此进行了介绍。 o3确实令人印象深刻。
- 阿里巴巴的 Qwen 发布了他们的QvQ 视觉推理模型,我使用 mlx-vlm在本地运行该模型。这是应用于图像提示的 o1/o3 风格技巧,它在我的笔记本电脑上运行。
- DeepSeek – 另一个大型开放许可的中国人工智能实验室 – 在圣诞节那天发布了 DeepSeek v3 ,震惊了所有人,这是一个开放模型,与最好的封闭模型相比毫不逊色,并且训练费用仅为 560 万美元,比 Meta 最好的 Llama 3 模型低 11 倍。骆驼 3.1 405B。
12 月 31 日,我连续第二年发表了对过去一年法学硕士发展的回顾。我估计在过去的几周里,这至少需要四个小时的电脑时间来写,另外还需要两个小时的杂项笔记,但这可能是低估的。
进展非常顺利。我收到了很多关于它的很好的反馈,其中既有来自想要赶上的人,也有来自一直密切关注该领域的人。我什至被火球击中了!
2025 年的开局比我预期的要慢。在线写作的一个挑战是,就像代码一样,写作需要维护:每当我放弃一篇受欢迎的文章时,我都觉得有义务跟踪并参与任何由此产生的对话。
然后,正当关于我的 2024 年评论的讨论开始消退时,Apple Siri 麦克风和解的故事爆发了,我无法抗拒发布“我仍然不认为公司会根据通过麦克风进行间谍活动为您提供广告” 。
试图说服人们不要相信阴谋论是我的有毒特质。我知道尝试是没有意义的,但我不能把自己拖走。
我想我的新年决心可能应该是少花时间与互联网上的人争论!
无论如何:一月已经到来,我决心利用它在 Datasette 1.0 和 Datasette Cloud 的付费发布方面取得进展。
博客文章
- 我仍然不认为公司会通过你的麦克风进行间谍活动来向你提供广告
- 结束了长达一年的连续发帖
- 2024 年我们对法学硕士的了解
- 尝试 QvQ – Qwen 的新视觉推理模型
- 我运行链接博客的方法
- 直播博客:OpenAI 第 12 天 – “OpenAI o3 的早期评估”
TIL
- 计算存储库中所有 LFS 文件的大小– 2024-12-25
- 使用 dslim/distilbert-NER 进行命名实体解析– 2024-12-24
标签: ai 、 datasette 、 weeknotes 、 openai 、 Generative-ai 、 llms 、 qwen 、 deepseek
原文: https://simonwillison.net/2025/Jan/4/weeknotes/#atom-everything