三周的会议和 Datasette Cloud 工作,四天的 OpenAI 混乱。
十一月的第二周对我来说非常忙碌。周一,我参加了OpenAI DevDay会议,会上发布了一系列令人眼花缭乱的公告。那天我发布了LLM 0.12 ,支持全新的 GPT-4 Turbo 模型(比 GPT-4 便宜 2-3 倍,速度更快,并且新增加了 128,000 个代币限制),并在那天晚上构建了ospeak作为 CLI 工具,用于与他们出色的新文本转语音 API。
周二,我与 Latent Space 工作人员一起录制了一个播客节目,谈论 DevDay 上发布的内容,并参加了面向开源维护者的 GitHub Universe 预峰会。
然后周三我在 GitHub Universe 上发表了演讲。我在这里发布了我的演讲的完整注释版本: GitHub Universe 开源项目的财务可持续性。它只有十分钟长,但需要做很多工作才能组合起来——十分钟需要大量的编辑和计划才能完成。
随着今年所有会议的结束,我在接下来的一周与 Alex Garcia 一起在Datasette Cloud上工作。 Alex 一直在构建datasette-comments ,这是一个出色的新插件,它允许 Datasette 用户通过在各行上留下评论来协作处理数据 – 非常适合协作调查报告。
与此同时,我一直在整合第一个工作版本的丰富功能——这是我几年来一直威胁要构建的功能。这里的关键思想是轻松地将丰富操作(地理编码、语言模型提示评估、OCR 等)应用于 Datasette 中存储的行。我很快就会有更多关于此的内容要分享。
OpenAI DevDay 上最重要的公告是 GPT——创建和共享自定义 GPT 配置的能力。我又花了一周时间才完全理解这些,我在《探索 GPT:穿着风衣的 ChatGPT?》中写下了我的探索。 。
然后上周五,一切都变得完全疯狂,控制 OpenAI 的非营利组织的董事会解雇了萨姆·奥尔特曼,原因是含糊地指责他“在与董事会的沟通中始终不坦诚”。
现在已经过去四天了,情况仍在发展中。它激发了我写一篇我一直想发表的主题:破译新闻文章中的线索以了解它是如何报道的。
sqlite-utils 3.35.2 和 shot-scraper 1.3
我将在这里复制我的两个项目的完整发行说明,因为我想强调外部开发人员的贡献。
这几周发布
- 数据集哨兵 0.4 – 2023-11-21
用于配置 Sentry 的 Datasette 插件 - 数据集丰富 0.1a4 – 2023-11-20
用于对 Datasette 中存储的数据运行丰富的工具 - 说话 0.2 – 2023-11-07
用于通过 OpenAI 文本转语音运行文本的 CLI 工具 - 法学硕士 0.12 – 2023-11-06
从命令行访问大型语言模型 - 数据集编辑架构 0.7.1 – 2023-11-04
用于修改表模式的数据集插件 - sqlite-utils 3.35.2 – 2023-11-04
用于操作 SQLite 数据库的 Python CLI 实用程序和库 - llm-anyscale-endpoints 0.3 – 2023-11-03
适用于 Anyscale Endpoints 托管模型的 LLM 插件 - 射击刮刀 1.3 – 2023-11-01
用于自动截取网站屏幕截图的命令行实用程序
直到这几周
- 用 ElevenLabs 克隆我的声音– 2023-11-16
- 使用 DuckDB 对远程 Parquet 文件中的列求和– 2023-11-14
原文: http://simonwillison.net/2023/Nov/22/weeknotes/#atom-everything