一位匿名读者引用了 404 Media 的报道:一位匿名编码员创建并发布了一个开源“焦油坑”,将 AI 训练网络爬虫无限期地困在无限、随机生成的一系列页面中,浪费他们的时间和计算能力。该程序被称为“猪笼草”,是一种捕食猎物的肉食性猪笼草属植物,可以由网页所有者部署,以保护自己的内容不被抓取,也可以“攻击性地”部署为蜜罐陷阱,浪费人工智能公司的资源。 。 “它不太像捕蝇纸,而更像是一个容纳牛头怪的无限迷宫,只不过爬虫是无法出去的牛头怪。典型的网络爬虫似乎没有太多逻辑。它会下载一个 URL,如果它看到链接对于其他 URL,Nepenthes 也会下载那些总是指向自身的随机链接——爬虫会很高兴地返回越来越多的指向自身的链接列表。”猪笼草的创造者 Aaron B 告诉 404 Media。 “当然,这些爬虫规模很大,并且在任何给定时间都从互联网上的大片区域下载链接,”他们补充道。 “但他们仍然在消耗资源,四处转悠,没有做任何有帮助的事情,除非他们找到一种方法来检测自己是否陷入了这个循环。”您可以通过此链接尝试 Nepenthes(它加载缓慢并故意无休止地链接)。
在 Slashdot 上阅读这个故事的更多内容。