我向shot-scraper添加了一项新功能,可以更轻松地共享脚本以供其他人使用shot-scraper javascript命令。
shot-scraper javascript
允许您在不可见的 Chrome 浏览器中加载网页(通过 Playwright),针对该页面执行一些 JavaScript 并将结果输出到您的终端。这是一种有趣的方式,可以将复杂的屏幕抓取例程作为终端会话的一部分运行,甚至可以使用管道与其他命令链接在一起。
-i/--input
选项允许您从磁盘上的文件加载 JavaScript – 但现在您也可以使用gh:
前缀来指定从 GitHub 加载代码。
引用发行说明:
shot-scraper javascript
现在可以通过shot-scraper javascript -i/--input
选项的新gh:
前缀选择性地加载托管在 GitHub 上的脚本。第173章脚本可以引用为
gh:username/repo/path/to/script.js
,或者,如果 GitHub 用户创建了专用的shot-scraper-scripts
存储库并将脚本放置在其根目录中,则使用gh:username/name-of-script
。例如,要针对任何网页运行此readability.js脚本,您可以使用以下命令:
shot-scraper javascript -i gh:simonw/readability \ https://simonwillison.net/2025/Mar/24/qwen25-vl-32b/
该示例的输出如下所示:
{ "title" : " Qwen2.5-VL-32B:更智能、更轻" , “署名” : “西蒙·威利森” , “目录” :空, “lang” : “ en-gb ” , “内容” : “ <div id= \”可读性-第1页\“...
到目前为止,我的simonw/shot-scraper-scripts存储库中只有一个文件,但我期待着扩大该集合,并希望看到其他人也创建和共享他们自己的shot-scraper-scripts
存储库。
此功能是对 LLM 下一版本中即将推出的类似功能的模仿。
标签:剧作家、 shot-scraper 、抓取、 javascript 、项目、 github 、带注释的发行说明
原文: https://simonwillison.net/2025/Mar/25/shot-scraper/#atom-everything