对档案工作者、学者、研究人员和记者来说,好消息是:根据美国上诉法院的一项裁决,抓取可公开访问的数据是合法的。
美国第九巡回上诉法院的这一具有里程碑意义的裁决是 LinkedIn 发起的一场长期法律战中的最新一项,旨在阻止竞争对手公司从用户的公开资料中窃取个人信息。该案于去年到达美国最高法院,但被送回第九巡回法院,由原上诉法院重新审理。
在周一的第二次裁决中,第九巡回法院重申了其最初的决定,并发现抓取可在互联网上公开访问的数据并不违反《计算机欺诈和滥用法案》或 CFAA,该法案根据美国法律规定了构成计算机黑客行为的内容.
第九巡回法院的决定是档案工作者、学者、研究人员和记者的重大胜利,他们使用工具大量收集或抓取互联网上可公开访问的信息。在没有裁决的情况下,长期运行的网站存档项目不再在线,并使用可公开访问的数据进行学术和研究研究,这些项目一直处于法律边缘。
但是,已经发生了令人震惊的抓取案例,引发了隐私和安全问题。面部识别初创公司 Clearview AI 声称已经抓取了数十亿张社交媒体资料照片,促使几家科技巨头对该初创公司提起诉讼。多年来,包括Facebook 、Instagram、 Parler 、 Venmo和 Clubhouse 在内的几家公司都收集了用户数据。
第九巡回赛之前的案件最初是由 LinkedIn 对 Hiq Labs 提起的,Hiq Labs 是一家使用公共数据分析员工流失的公司。 LinkedIn 表示,Hiq 对 LinkedIn 用户资料的大量抓取违反了其服务条款,相当于黑客行为,因此违反了 CFAA。在第九巡回法院发现 CFAA 并未禁止任何人抓取可公开访问的数据后,LinkedIn 于 2019 年首次败诉Hiq 。
在第二次审理此案时,第九巡回法院表示,它依赖于去年 6 月最高法院的裁决,在此期间,美国最高法院首次审查了已有数十年历史的 CFAA。在其裁决中,最高法院将构成违反 CFAA 的范围缩小为那些未经授权访问计算机系统的人——而不是对超出现有授权的更广泛解释,法院认为这可能会将刑事处罚定为“惊人的数额”常见的计算机活动。”最高法院使用“门向上,门向下”的类比说,当计算机或网站的门打开时——因此信息可以公开访问——不需要授权。
第九巡回法院在引用最高法院的“上门、下门”类比时裁定,“‘未经授权’的概念不适用于公共网站。”
提起此案的领英没有回应置评请求。
原文: https://techcrunch.com/2022/04/18/web-scraping-legal-court/