如何写一篇糟糕的文章 – 搞英语 → 看世界

死刑有用吗？我讨厌死刑的想法——不是因为我认为有大量证据表明它并不能真正阻止罪犯，也不是因为我知道被处死的确切人数后来证明是无辜的。我实际上并没有真正认真地查看证据。老实说，我反对死刑的真正原因是感觉不对——我认为一个文明国家不应该杀死罪犯，无论他们的罪行多么令人发指。根据你的道德直觉，这种说法很可能会引起你的强烈共鸣或几乎没有，但我本能地强烈认为死刑是错误的。显然，如果有压倒性的证据表明死刑具有巨大的威慑作用，可以挽救很多人的生命，我可能（理论上）会动摇。但证据究竟有多好？

关于死刑威慑效果的最佳论文之一是Dezbakhsh 和 Shepherd (2007) ，它采用了非常好的设计。在 1970 年代，美国最高法院暂停执行死刑——我没有意识到这一点（我是不是太年轻了？太英国人了？太无知了？），但在 1967 年至 1977 年间，美国的处决显然为零，而各州只是逐渐恢复执行死刑。这给了我们一个很好的准实验机会——你可以直接比较暂停执行前后的谋杀率，看看死刑是否有威慑作用。上图显示了主要结果——处决次数与处决次数明显呈负相关，至少似乎有很强的威慑作用。以下是论文的结论：

结果非常明确：处决阻止了谋杀，并且在暂停期间谋杀率大幅增加。无论数据的聚合级别、时间段或用于衡量执行的特定变量如何，前后比较和回归的结果都是一致的。

稳健性检查看起来很合法，我对研究设计印象深刻。还有其他论文我也觉得很有说服力。美国的暂停似乎是弄清楚死刑是否真的有威慑作用的最佳机会之一——虽然我们绝对应该担心普遍性，但这些论文可能是大多数文献中最有说服力的。

所以，让我们跳入这篇论文。在这里，他们使用的是县级暂停后面板数据，这是暂停结束后的数据。自 1977 年暂停结束以来，直到 2003 年撰写本文为止，已有 31 个州执行了 683 次死刑，另外 7 个州采用了死刑，但实际上并未执行任何人。那么，与执行死刑概率低的县相比（控制大量其他县级变量），我们在死刑犯被处决的可能性很高的县中看到了谋杀案的哪些变化？结果非常清楚——一个县的额外处决与未来平均减少 18 起谋杀相关（95% 的置信区间为减少 10 到 28 起谋杀）。再一次，证据似乎很好地证明了死刑确实可以阻止人们谋杀。

这是另一篇似乎显示大致相同的事情的论文，发现在一个州每多执行一次，就与少三起谋杀有关。有些人认为死刑可能只会威慑那些以某种方式“理性”的罪犯——他们可能不适用于激情犯罪或丈夫谋杀妻子（反之亦然）。这里的作者发现，即使这不是真的，而且似乎死刑也减少了密友谋杀的数量，减少死囚牢房的等待时间似乎对减少犯罪有一定的效果。

还值得关注荟萃分析，而不仅仅是那些似乎拥有最严格设计的研究。 Yang and Lester (2008)似乎是这里最有用的一个，它查阅了很多最好的经济学文献。这是多汁的一点：

对于有足够数据的 95 项研究，60 项表明具有总体威慑作用，而只有 35 项表明具有残酷效应，具有统计学意义的差异（X2 = 6.58，df = 1，双尾 pb .02）。所有 Pearson 相关系数的简单未加权平均值为 – 0.115（标准误差 = .025），具有统计学意义的威慑效应（t = 4.60，df = 94，双尾 pb .001）。通过每项研究中的估计数加权系数并包括数据不足的研究也表明具有统计学意义的威慑作用。

所以，是的，我主要相信死刑具有威慑作用。威慑效果有多强可能还有待商榷，但我相信的元分析（即那些查看精心制作的经济学论文而不是，咳咳，更可疑的犯罪学论文）似乎表明存在威慑效果，我找到的最好的论文似乎也找到了同样的东西。

谎言、该死的谎言和元分析

好吧，是时候表白了。上面的研究都是挑剔的，我真的不知道死刑具有强大威慑作用的证据是不是特别好（也许这是我在某个时候可以尝试正确回答的问题）。过去，我一直对我有多少文章似乎以一个模糊的答案结尾感到恼火——例如，我关于性别平等悖论的文章是这样结束的：

关于性别平等悖论的文献仍然很新，我们所说的任何事情都应该反映这一点。一个理性的人可能不确定性别平等与 STEM 中女性人数之间的相关性。

这种情况一遍又一遍地发生。以下是关于性别工资差距的文章的结论：

我认为值得从有关 GWG 的文献中删除的主要内容是，很难弄清楚性别歧视对工资的影响！你不能只比较女性挣的钱和男性挣的钱，也不能只使用回归与大量与收入相关的控制。实验可以更好地隔离歧视的影响，但它们的外部有效性可能相当低（发现墨西哥对拥有 STEM 学位的年轻母亲的歧视并不能告诉你很多关于英国 40 多岁无子女妇女的歧视想从事公关工作的人）。所以，基本上：*耸肩*。

有很多有趣的问题，答案基本上是这样的：“看起来 X 增加了 Y，但也有一堆研究表明 X 没有增加 Y。这些其他研究表明，在一个国家，它似乎X 实际上减少了 Y 。还有另一篇论文表明，当你控制 Z 时，X 对 Y 的影响就会消失。在更多的研究中，似乎 X 实际上对 Y 的影响比第一次研究显示的更大”。这些结论可能非常不令人满意，更重要的是，写一篇没有这样结论的文章非常容易，就像我在上面对死刑所做的那样。有多容易？

打开Elicit 1或 Google 学者。写下你想回答的问题——对于这篇文章，“死刑会减少谋杀吗？”会很好用。嗯，“从摘要中得出的结论”列结果对于我想在这里提出的观点来说看起来不太有希望，尽管最终的研究看起来可能很有用。让我们阅读并写一个简短的总结。啊，看起来这篇论文的作者写了另一项研究，发现了同样的事情！我也可以把它放在那里，虽然我不应该说它是由同一个人写的。我写“让我们跳到这篇论文”而不是给出作者的名字怎么样？完美的。

但我也可能想要进行荟萃分析，因为斯科特亚历山大已经警告人们要小心一项研究的人。我在 Elicit 上找到的所有元分析在这里都没有对我特别有用，但我会检查第三个，以防它给我一些有趣的东西。啊，我们走吧。尽管这项荟萃分析最有趣的结论是威慑效果的证据取决于研究的类型，但它也声称更多的研究发现了效果。我可以只引用那一点，而忽略任何其他内容。

你完成了！你已经制作了一个似乎是基于证据的文章，同时也从一开始就提出了你想要表达的观点。如果你清楚表明你对你所争论的职位没有任何个人依恋（事实上，你本能地对此持怀疑态度），你会得到加分。如果你正在写一篇相当短的专栏文章，你甚至不需要写任何关于研究的适当细节，你只需在给出一些支持你立场的轶事后链接到荟萃分析。

你可能已经知道所有这些东西了。你知道挑选樱桃，你知道糟糕的科学新闻，你遇到过耸人听闻的江湖骗子。但我认为有些人可能低估了仅仅通过挑选研究来提出一个似乎是基于证据的论点是多么容易。作家也很容易通过浏览他们发现的前几项研究来欺骗自己认为文学中存在共识，即使他们不是故意试图欺骗人们。而且很容易得出结论，支持他们论点的研究似乎非常稳健和严谨，但反对他们论点的研究似乎有他们在仔细观察后发现的缺陷。我知道我已经一遍又一遍地提出了这一点，但请注意那些暗示在一个有争议的话题上有一些强烈的学术共识的论点——当它实际上不是真的时，很容易给人留下这种印象。

现在订阅

这绝对不是要批评 Elicit – 它肯定不是一个主要帮助人们撒谎的工具！我喜欢 Elicit，它对于在思考如何回答问题时查看文献非常有用，但也很容易挑选出你想要的答案。这也适用于谷歌学者和其他一切，我只是更喜欢使用 Elicit，因为它很容易使用。

原文： https://atis.substack.com/p/how-to-write-a-bad-article