Web 基础设施提供商 Cloudflare 本周推出了“AI Labyrinth”,该功能旨在通过向机器人提供真实但不相关的内容而不是完全阻止它们来阻止未经授权的 AI 数据抓取。该系统引诱爬虫进入人工智能生成的包含中立科学信息的页面“迷宫”,故意浪费那些试图未经许可收集语言模型训练数据的人的计算资源。 Cloudflare 解释说:“当我们检测到未经授权的爬行时,我们不会阻止请求,而是链接到一系列人工智能生成的页面,这些页面足以吸引爬虫遍历它们。”该公司报告称,AI 爬虫每天会向其网络生成超过 500 亿个请求,占其处理的所有网络流量的近 1%。该功能可供所有 Cloudflare 客户使用,包括免费套餐的客户。这种方法标志着传统保护方法的转变,因为 Cloudflare 声称阻止机器人有时会提醒操作员它们已被检测到。虚假链接包含元指令,以防止搜索引擎索引,同时保持对数据抓取机器人的吸引力。
在 Slashdot 上阅读这个故事的更多内容。