由于可能复制现有警务偏见,使用人工智能预测犯罪的努力一直充满争议。但是一个由机器学习驱动的新系统不仅可以做出更好的预测,还可以突出这些偏见。
如果说现代机器学习擅长一件事,那就是发现模式并做出预测。因此,政策和执法领域的许多人热衷于使用这些技能也许不足为奇。支持者希望使用历史犯罪记录和其他相关数据来训练AI 模型,以预测犯罪可能发生的时间和地点,并使用结果来指导警务工作。
问题在于,这类数据往往隐藏着各种偏见,当用于不假思索地训练算法时,这些偏见很容易被复制。以前的方法有时包括虚假变量,例如涂鸦或人口统计数据的存在,这很容易导致模型根据种族或社会经济标准做出有缺陷的关联。
即使是关于报告的犯罪或逮捕人数的基本警方数据也可能包含隐藏的偏见。由于预先存在的偏见,对某些被认为犯罪率高的地区进行严格的治安几乎不可避免地会导致更多的逮捕。而在对警察高度不信任的地区,犯罪往往不会被举报。
尽管如此,能够提前预测犯罪活动的趋势可能会使社会受益。因此,芝加哥大学的一个小组开发了一种新的机器学习系统,该系统可以比以前的系统更好地预测犯罪何时何地发生,还可以用来探测警务中的系统性偏见。
研究人员首先整理了芝加哥警方几年来关于暴力和财产犯罪的数据,以及每起事件导致的逮捕人数。他们使用这些数据训练了一套 AI 模型,这些模型显示了每个变量的变化如何影响其他变量。
这使得该团队能够提前一周以 90% 的准确率预测城市 1,000 英尺宽的地区的犯罪水平,正如最近在Nature Human Behavior上发表的一篇论文中所报道的那样。研究人员还表明,在对来自其他七个美国城市的数据进行训练时,他们的方法也达到了类似的准确性。当他们在来自国家司法研究所运行的预测性警务挑战的数据集上对其进行测试时,他们在 120 个测试类别中的 119 个中优于最佳方法。
研究人员将他们的成功归功于放弃对模型施加空间限制的方法,即假设犯罪在蔓延到周边地区之前出现在热点地区。相反,他们的模型能够捕捉到更复杂的联系,这些联系可以通过交通联系、通信网络或城市不同地区之间的人口相似性来调节。
然而,鉴于用于研究的数据可能已受到警务实践中现有偏见的影响,研究人员还调查了如何使用他们的模型来揭示这些偏见如何扭曲执法部门部署其资源的方式。
当该团队人为地提高富裕社区的暴力犯罪和财产犯罪水平时,逮捕人数猛增,而贫困地区的逮捕人数下降。相比之下,当贫困地区的犯罪率上升时,逮捕人数并没有增加。研究人员说,这意味着较富裕的社区被警察优先考虑,并且可以从较贫穷的社区中抽走资源。
为了验证他们的发现,研究人员还分析了原始警察数据,利用夏季月份犯罪率的季节性增长来调查不同地区犯罪率上升的影响。结果反映了他们的模型确定的趋势。
尽管其准确性,研究负责人 Ishanu Chattopadhyay 在新闻稿中表示,该工具不应用于直接确定警察资源的分配,而应作为调查更好警务策略的工具。他将该系统描述为“城市环境的数字双胞胎”,可以帮助警方了解城市不同地区不同犯罪或执法水平的影响。
这项研究是否有助于引导预测性警务领域朝着更加认真和负责任的方向发展还有待观察,但任何平衡该技术的公共安全潜力与其巨大风险的努力都是朝着正确方向迈出的一步。