防止滥用是一种交易技巧（以前是：@doctorow 的“Como 是 Infosec”）#ContentModeration 不是 #Infosec

现在是星期天晚上；作为一个全职爸爸有很多话要说，老实说，经过 35 多年的自学“所有 Unix 和网络安全，所有时间”的生活。

但我不喜欢写这篇文章。尤其是我需要把衣服拿进来，装上洗碗机，然后做准备，这样我的搭档就可以开始她的朝九晚五——更准确地说是在线 7:30 到 6——明天不用大惊小怪，同时我为每个人准备早餐并在为我光荣的 13 个月女儿更换尿布之间开始充满Hey Duggee、Bluey、Teletubbies和其他文化福利的一天。

但我也不想写这篇文章，因为这篇文章的主题是科里，他写了一些非常不明智和误解的东西；我欠 Cory 一些小债，这不仅是因为我模糊地同时为Open Rights Group工作，而且还因为我在几年前帮助沉淀了我的想法，即如果我有机会——当时似乎不太可能——我会辞职以养家糊口，继续及时对世界产生影响，而不是像我的大多数同龄人那样：希望他们有更多的时间和孩子在一起。

所以我不想写这篇文章，但我必须写，因为他的博文反映了 Cory 的行为模式。

长话短说：Cory 希望~~Facebook~~技术平台的内容和社区管理更加开放，被带到日光之下，让每个人都能看到它是如何运作的，因为……好吧，Cory 从来没有完全绕开“x 因此 y” ”据我所知（？）除了合理地指出在没有明显解释的情况下关闭您的帐户是一件痛苦的事情之外，还可以类比任何数量的内容审核保密都是“通过默默无闻的安全” ——任何信息安全从业者都知道这是“坏事”。

除了这不是——不完全是——一个公平的比较；但我们会谈到这一点。

Cory 的博文突然结束，好像突然意识到了什么。我不知道为什么或那是什么，但让话语悬而未决可能会给读者留下一些不正确的印象，除非他们费心去深入挖掘。我特别想解决一些问题，因为我曾经在 Facebook 工作，我了解这些东西的真正工作原理，我显然比 Cory 做得更多，而现在到处乱飞的错误印象对数字化来说真的很危险权利：

https://transparency.fb.com/en-gb/policies/community-standards/hate-speech/ https://transparency.fb.com/en-gb/policies/community-standards/hate-speech/

圣克拉拉原则？

科里写道：

这就是为什么像 Facebook 这样的公司对他们适用于社区审核的规则以及他们用来自动发现违反这些规则的行为的工具都保密。

前半部分肯定是不正确的； Facebook 以非同寻常的篇幅（显然包括历史版本）撰写了关于哪些活动会导致您被 Facebook 踢出的文章。

后半部分渗入下一段：

他们坚称，披露政策和执行机制将帮助那些想要骚扰、欺诈或冒充用户并上传违禁材料的不良行为者，从虚假信息到错误信息，从儿童性虐待材料到侵犯版权到恐怖主义暴行视频，应有尽有。

是的，Facebook 的分析是正确的，而 Cory 的批评（ “然而，同样的科技巨头……经常通过默默无闻地使用和捍卫安全性作为保持其内容审核程序正常运行的唯一方法” ）在技术上是准确的，但在功能上是不正确的，因为：

“信息不对称”不等于“通过默默无闻的安全”

Security Through Obscurity 的问题是（是的）它很容易被打败。通常的例子是“房子有一把备用钥匙，放在门垫下面” ，即：有一个简单的技巧可以完全消除被保护事物的所有安全机制。

但是信息不对称 (IA) 与 STO 不同，它是信息安全或信息安全的基础，因为我们处于性感术语的土地上。

但是，当您处于（例如）反滥用领域时，您甚至不在二元真理的“是或否”世界中；相反，您处于聚合信号的世界中：

IA 知道俄罗斯垃圾邮件发送者使用具有特定 TLS 指纹的 Curl 客户端
IA 知道巨魔农场正试图通过（可检测地）将大量维基百科文章作为对话内容发布来减少语法语言错误
IA 知道什么图像库压缩怪癖暗示帖子不是从“官方”平台客户端发送的，而是来自一些自定义的机器人农场

所以，是的，“揭示……执法机制 [绝对]将帮助那些想要骚扰、欺诈或冒充用户并上传违禁材料的不良行为者，从虚假信息到错误信息，从儿童性虐待材料到侵犯版权到恐怖主义暴行视频” ，科里。

你想阻止这种情况发生吗？

再次科里：

这与所有隐匿安全性的故障模式相同。保密意味着坏人知道系统中的缺陷，而这些系统应该保护的人却在黑暗中，他们可以将他们的防御武器化为武器来对付他们。

好吧，也许我明白了；也许 Cory 的目标是“加速进化论” ，如果我们强迫大型科技平台披露他们是如何检测垃圾邮件的，那么账户被关闭的无辜受害者将获得一些透明度，而所有“坏演员”的结果突然变得免费通行证以提高他们的游戏/更好地不被抓住，将需要 Facebook（等）一劳永逸地找到一种“修复”滥用的方法。

甚至令人遗憾的是，这是一个糟糕的主意。如果有什么事情会迫使世界各国政府开始要求数字身份证或其他比疾病更糟糕的治疗方法，那就是这个。我们甚至不应该去那里。

所以：Facebook（仅举一个例子）不会对其规则保密，它（以及平台社区的其他成员）是正确的，并且可能明智地对它每天如何尝试对不断变化的变化做出反应保持沉默行为“告诉”垃圾邮件和滥用。

是的，施虐者可以很好地推断（当前）规则，知道如果他们停止将受压迫少数群体的成员称为[一些预先存在的诽谤] ，那么他们可以在一定程度上逍遥法外，这是一种痛苦——这似乎是科里所说的防止滥用的“门垫下的钥匙”。

然而，这实际上是对更细粒度、更好的资源和（理想情况下）社区整合的温和的论据——因此社区自己可以监管自己的成员——顺便指出，这样当然会允许（例如）白人至上主义者保护自己免受有害的、有害的思想，例如自由主义、平等和公平。

但相反——“完美”的自上而下控制——会更糟。

所以：Cory 的博文毫无根据；但也许他的观点是，平台至少应该在他们自己和彼此之间更透明地分享这些反滥用扑克“告诉”，以便共同更好地防止滥用？

我们越早开始将 como 视为信息安全，越好。一个好的第一步是采用圣克拉拉原则，这是一份多利益相关方文件，规定了一个负责任和透明的审核计划。

大型平台已经举行了关于相互分享通用（有时是详细）滥用预防机制技术的会议；例如，在 Facebook 赞助的At Scale 会议上，有关于“垃圾邮件打击”和“打击滥用”（搜索视频，非常值得的努力）的曲目，当然还有著名的 USENIX 的“谜”会议，其中涵盖了一些最好的- 这个领域的最佳作品。

因此，当 Cory 链接并呼吁采用圣克拉拉原则时，我就像……“什么？”因为：

2018 年，与规模会议的内容审核一起

……等等，我们之前不是在什么地方见过这个名字吗？ …

2018 年，在美国举行的大规模内容审核会议上，一群人权组织、倡导者和学术专家制定并推出了一套三项原则，以最佳方式围绕互联网平台日益激进的行为获得有意义的透明度和问责制审核用户生成的内容。
[…删除…]

自 2018 年以来，包括 Apple、Facebook (Meta)、谷歌、Reddit、Twitter 和 Github 在内的 12 家主要公司已经认可了圣克拉拉原则，提供透明度和程序保障的公司总数以及透明度水平都有所增加许多大公司提供的程序保障。
[…删除…]

出于这些原因，组织、倡导者和学术专家的广泛联盟在 2020 年和 2021 年共同制定了圣克拉拉原则的第二次迭代……

哦，这就解释了一切。我们已经从 2018 年第 1 版的“公司需要做什么才能对用户公平”的清单转变为大幅扩展的 2021 年第 2 版“设计原则的人权”文件；这篇博文是科里（可能是整个 EFF）认为让平台采用新文档版本的最佳方式是让人们对此事感到愤怒，就好像文档没有出来一样首先是平台社区？

我并不是说新版本的文档不好——v2 中有很多内容是 v1 文档的合理和相称的演变，尽管一些新的部分非常繁琐并且明显旨在迎合公民社会数据的利益科学家们想要他们可以用来鞭打邪恶的资本主义平台的材料以证明他们的薪水是合理的：

帖子在被删除之前被查看的次数。利益相关者强调，帖子在被删除之前收到的浏览量或其病毒式传播对于了解一条内容在被删除之前的影响非常重要。
内容删除的时间表。这包括以下数据：
- 帖子发布与删除之间的时间
- 被错误删除的帖子恢复之前的时间（由于上诉或公司主动识别错误的结果）
- 用户标记和平台响应之间的时间
- 一段内容被自动化工具或公司识别然后删除的时间
- 一段内容被标记给公司并被自动化工具删除的时间。

这是个人删除的数据；每年必须有数百万个这样的数据，如果没有别的，从这些数据中对某些帖子进行法医重新识别的风险将引起对作者隐私的担忧；更不用说如何处理今天的报告导致几天前（如果不是几周前）发布的内容被删除的追溯行动？有了这么多的数据，就会产生更多永远无法获得的上下文；随后的权威人士和基于此的意见充其量只能是虚假陈述或可疑的。

但我离题了，因为这一点分析对于批评 Cory 的博文无关紧要。相反，我将总结一下：

对防止滥用如何运作的沉默不是通过默默无闻的安全
对防止滥用的运作方式有所保留，有助于保持这些机制的价值
平台，尤其是 Cory 的bête noire ，通常已经详细描述了他们如何判断滥用材料……
……而且，如果有的话，他们可能会因为过于冗长而受到批评
发布平台如何检测滥用内容的全部细节将导致滥用发生的危机，这将进一步导致对不自由的“镇压”和进一步追求国家控制互联网、数字身份证等的需求，以“防止”相同的
更不用说：方法每周都在变化，每周都在调整，因为每个级别都有人参与；与扑克的比较并非不准确，但 v2 文件似乎并未承认打击滥用是一项充满活力和多样化的追求
试图让人们生气让他们殴打平台/强迫平台采用他们在第一（和第二）处参与编写的内容的 v2，这不是一个非常诚实的策略

我希望在公开辩论中看到更好的情况。

原文： https://alecmuffett.com/article/16257