代替我的常规周记(我假期休假两周)这里回顾一下 2022 年,主要是关于我写的项目和事情。
一月
- sqlite-utils 3.20 和 3.21 中的新功能:–lines、–text、–convert –
sqlite-utils
的一些简洁的新功能扩展了其在日志处理方面的功能。 - Datasette 0.60:带注释的发行说明– 改进 Datasette 用于写入数据库的内部 API,以及用于自定义表过滤器的新插件挂钩。
二月
- 帮助抓取:通过使用 Git 记录它们的 –help 来跟踪对 CLI 工具的更改——这是 git 抓取的一个新变化,当 AWS 发布我一直在等待的 Lambda 函数 URL 时,我曾尝试发现它。
- Google Drive to SQLite – 一个用于为您的 Google Drive 中的文件创建 SQLite 元数据数据库的项目。
行进
- shot-scraper:文档的自动屏幕截图,基于 Playwright 构建。这是一个非常有趣的新项目,随着时间的推移,我向各个方向扩展了它。
- 使用
shot-scraper
和 GitHub Action 模板存储库即时创建 GitHub 存储库以截取网页屏幕截图。
四月
- Pillar Point Stewards、pypi-to-sqlite、对 shot-scraper 的改进和欣赏数据集仪表板– Pillar Point Stewards 是我与 Natalie Downe 一起建立的一个项目,用于管理她为我们当地的珊瑚礁运行的管理计划。
- 建立一个 Covid 污水 Twitter 机器人(和其他周记)
- 跟踪文件内容更改时自动打开问题
可能
六月
- 如何使用 GPT-3 语言模型
- Weeknotes:Datasette Cloud 准备好预览
- 一个微型网络应用程序,用于从 OpenStreetMap 地图创建图像
- 使用 Datasette Lite 在浏览器中加入 CSV 文件
- AI: DALL-E的第一印象,从文本生成图像
- s3-ocr:从存储在 S3 存储桶中的 PDF 文件中提取文本
七月
八月
九月
- 探索稳定扩散背后的训练数据
- 针对 GPT-3 的即时注入攻击
- TIL:将 Python Web 应用程序部署为 AWS Lambda 函数– 多年来我一直想解决这个问题!
- 探索用于训练 Meta 的 Make-A-Video 文本到视频模型的 1000 万抓取的 Shutterstock 视频
- 使用 Whisper 和 GitHub 问题/操作对在线视频运行字幕提取的工具
十月
十一月
十二月
- Datasette 的新 JSON 写入 API:Datasette 1.0 的第一个 alpha
- AI 辅助学习:使用 ChatGPT、Copilot 和 Advent of Code 学习 Rust
- 使用 Python 密码学和数据集过度设计秘密圣诞老人
- 数据集 1.0a2:更新和细粒度权限
原文: http://simonwillison.net/2022/Dec/31/2022-in-projects/#atom-everything