拥抱边缘
贝叶斯主义的第一步是停止以全有或全无的方式思考。贝叶斯主义者希望超越“要么相信,要么不相信”的二分法,开始将信念视为有程度的东西。这些程度可以从 0 到100%的等级来衡量。如果您确信某个事件会发生,那就有100 % 的信心。如果你确定它不会发生,那就是0%。
但贝叶斯主义者再次建议不要走极端。在极少数情况下,确定某件事会发生或不会发生是有意义的。贝叶斯主义者丹尼斯·林德利(Dennis Lindley)在他的《决策》 (1971)一书中赞许地引用了奥利弗·克伦威尔(Oliver Cromwell)的格言,即始终“认为你可能会错”。除非某个事件绝对不可能发生,否则您不应该确定它不会发生。
好吧,那就好。也许我们不应该将任何严格意义上可能的置信度指定为零。但我们都听过有人将这种可能性描述为“百万分之一”。如果某件事是那么不可能,那么它几乎不会发生,对吗?那么,百万分之一也可能为零?丹尼斯·林德利还表示,他可以将月球是由绿色奶酪制成的置信度设定为百万分之一。
在用概率进行推理时,一个常见的错误是认为一个百分点的一小部分——尤其是接近0 % 或100 % 等极端值——实际上并不重要。任何有幸获得高质量现代产前护理的父母都会看到基因测试报告他们正在成长的胎儿患某些疾病和出生缺陷的可能性有多大。我记得我和怀孕的妻子一起查看了0.0004 % 和0.019 % 等概率,并想知道我们应该担心什么以及我们可以注销什么。如此小的概率差异很难直观地掌握。但概率为0.019 % 的情况发生的可能性几乎是概率为0.0004% 的情况的 50 倍。
人们很容易看到像0.0001 %(百万分之一)这样的概率值,并假设该值与0 % 之间的差异只不过是舍入误差。但是概率为0 % 的事件实际上不可能发生,而概率为0.0001 % 的事件却一直在发生。如果你有几分钟的时间和一些零钱,可以抛硬币 20 次。 (我们会等待。)无论您最终观察到正面和反面的顺序是什么,该特定顺序发生的可能性都小于百万分之一。
为了更好地评估几乎不可能和几乎确定的事情的重要性,贝叶斯学派有时会从用百分比衡量概率转变为用赔率来衡量概率。如果我给你买了足够多的彩票,让你有 0.001% 的机会赢得彩票,并且给你的朋友买了足够多的彩票,让他有 0.1% 的机会,你可能想知道你应该有多么生气。将这些值以赔率形式表示,我们发现我给你朋友的概率是千分之一,而你的概率只有十万分之一!以赔率形式表达概率可以清楚地表明,您的朋友每一张票都有 100 张票,并且澄清了这两个概率(诚然都接近于零)仍然存在重要差异。
证据支持其可能性
贝叶斯牧师做了什么让整个统计运动以他的名字命名?在贝叶斯之前,许多概率论都涉及“直接推理”问题。这是你在学校多次被要求解决的概率问题。有人告诉您掷出两个公平的六面骰子,并要求您计算它们的总和为 8 的概率。更抽象一点:你会得到一个关于世界上某些概率过程的假设,并被要求计算它产生特定类型证据的概率。
贝叶斯对相反的东西感兴趣:所谓的“逆推论”。假设您观察到一些证据,并想要推断出关于世界上什么样的过程可能产生该证据的假设。在《概率论》 (1935)中,汉斯·赖辛巴赫列出了我们用这种结构进行推理的许多场合:
医生从观察到的症状到对特定疾病的诊断的推论就属于这种类型;历史学家的推论也是如此,这些推论决定了为解释记录的观察而必须假设的历史事件;同样,侦探根据不显眼的可观察数据得出犯罪行为的推论。
贝叶斯对逆向推理最重要的贡献在他生前并未得到认可。 1761 年牧师去世后,一位名叫理查德·普莱斯 (Richard Price)的威尔士牧师发表了他在贝叶斯笔记中发现的一个定理。这个定理后来被皮埃尔-西蒙·拉普拉斯独立地重新发现,他在很大程度上推动了该定理的早期普及。
普赖斯、拉普拉斯等人将贝叶斯定理推广为在发现一些新证据后调整人们对假设的信心的规则。现代贝叶斯主义者被称为“贝叶斯主义者”,因为他们遵守贝叶斯规则。根据贝叶斯规则,您对假设的最新置信度应根据两个因素来计算:在获得证据之前(稍后会详细介绍)您的置信度是什么样的,以及证据支持假设的程度。
在这里,值得记住贝叶斯主义者对绝对的厌恶。虽然当一个角色了解到一条改变他们整个世界观的信息时,这会成为一部精彩的戏剧,但大多数生活并不是这样的。我们获得的每一条新信息都只会改变我们的一些观点,并且会逐渐改变它们——让我们对特定事件的发生稍微更有信心或稍微不那么有信心。这是因为证据支持也是有程度的:一个证据可能弱地支持某些假设,而另一些则强烈支持;或者一个证据可能比另一个证据更好地支持特定的假设。
要衡量证据支持某个假设的强度,请询问该假设成为证据的可能性有多大。假设一天晚上您下班很晚才回家,走进去发现家里所有的灯都亮着。你想知道家里还有谁——你的丈夫?你的儿子?好吧,你的丈夫总是抱怨电费,并且在房子里走来走去,一直关灯。但你十几岁的儿子几乎没有注意到周围的环境,离开房间时也没有想到他是如何离开的。如果你的儿子在家里,你发现的证据很有可能,而如果你的丈夫在家,那么可能性就小得多。因此,证据强烈支持你儿子的存在,而你丈夫的存在很少或根本不存在。
贝叶斯规则说,一旦你衡量了新证据在多大程度上支持各种假设,你就应该将信心转向更受支持的假设。无论你在进门之前多么确信你的丈夫或儿子在家,你在里面发现的东西都会增加你对你儿子在家的信心,并降低你对你丈夫在家的信心。增加和减少多少是合理的?这一切都是通过贝叶斯法则的具体数学来解决的。我试图在这里保持简单并避免方程式,但最后一节中的来源可以填写详细信息。
留意你的所有证据
贝叶斯思维的一个一贯主题是,在信心的阴影下工作可能比绝对的思考变得更加复杂和微妙。确凿、可靠的证据的一大优点是它不能被任何东西推翻。如果数学家证明了某个定理,那么随后学到的任何东西都无法撤销该证明,或者使我们有理由不相信其结论。
贝叶斯主义旨在理解增量证据,接受我们每天面临的各种不确定的信息。此类证据的一个重要特征是它总是可以被推翻。这就是曲折悬疑小说的命脉:目击者称凶手左手拿着枪——但事实证明她是在照镜子——但尸检显示受害者在被枪杀前就中毒了……
因为证据的重要性在很大程度上取决于背景,而且因为潜在的失败者可能总是潜伏着,所以重要的是不要对自己所知道的事情感到自满,并对相关的新信息保持开放的态度。但彻底、仔细地思考已有的信息也很重要。鲁道夫·卡尔纳普提出了“全面证据原则”,该原则要求你对某个问题的信念能够纳入并反映你拥有的与该问题相关的所有证据。
这是我们经常忽视的一种相关证据:除了拥有有关某个主题的信息之外,我们通常还知道如何获得该信息。现在,这并不总是正确的:我知道亚伯拉罕·林肯出生在一个小木屋里,但我不知道我从哪里得知这个花絮。但通常情况下,特别是在当今不确定的媒体环境中,跟踪信息来源并评估您收到的信息是否是以有偏见的方式为您选择的,是值得的。
阿瑟·爱丁顿爵士举了一个例子,你从湖里画了一大群鱼,它们的长度都超过六英寸。通常来说,这就是有力的证据,证明湖里的所有鱼都至少有那么长。但如果你知道你是用六英寸孔的网来拉鱼的,那么你就无法从你的样本中得出合理的结论。
关注证据的选择方式可能会对现实生活产生重要的影响。在《如何不犯错误》 (2014)中,乔丹·埃伦伯格讲述了二战期间的一个故事:美国军方向统计学家亚伯拉罕·沃尔德展示的数据表明,从混战中返回的飞机机身上的弹孔比发动机上的弹孔还要多。军方正在考虑将装甲从发动机转移到机身,以更好地保护飞行员。沃尔德的建议恰恰相反,理由是返航的飞机机身上有洞;那些没有返回的人的引擎有洞,所以这就是额外装甲应该去的地方。
不要忘记您之前的意见
你仔细思考你刚刚收到的证据。你会小心翼翼地把这一切都考虑在内,考虑上下文,并记住它来自哪里。考虑到所有这些,您就会找到使该证据最有可能的假设,即该证据最有力支持的假设。这是你现在最有信心的假设,对吗?
错误的。贝叶斯法则说,通过增加对使该证据最有可能的假设的信心来应对新证据。但是,增加后的结果取决于证据出现之前您的信心程度。
改编自推理冠军朱莉娅·加莱夫(Julia Galef)的一个例子,假设你正在穿过大学校园,并随机拦住一名本科生问路。这位本科生的眼神里有一种心不在焉、疏远的神情;穿着人们永远不会想到将熨斗拿到身边的衣服;甚至在一天中的这个时候还醒着,似乎有点惊讶。你应该更相信你的对话者是哲学专业还是商科专业?
简单的答案:这种外观比商科专业更典型的哲学专业,所以你应该更有信心应对前者。乍一看,这个答案似乎得到了我所描述的贝叶斯思想的支持。只是为了挑选一些数字(对哲学家来说有点不公平),让我们假设三分之一的哲学专业学生符合这种描述,但只有二十分之一的商业专业学生符合这种描述(也许是宽客?)停下来寻求指导是哲学专业的,你的证据的概率是三分之一。假设你停止了商科专业,概率是二十分之一。因此,从这个学生的外表来看,你的证据更有力地支持了他们学习哲学的观点。
但现在考虑一下以下情况:在我的校园里,目前只有不到 250 个哲学专业的本科生和大约 3,600 个商业专业的本科生。如果上一段中的分数是正确的,我们预计校园里大约有 80 名与周围环境脱节的哲学系学生,以及大约 180 名商业专业的学生。所以,如果你随机选择一个本科生,你获得一个心烦意乱的商科专业的可能性至少是一个心烦意乱的哲学家的两倍。
这里的关键是要记住,在你评估这个学生的外表之前,他们从事商业的可能性比哲学要大得多。你从与他们互动中获得的证据应该会增加你对他们是哲学家的信心,但增加少量的证据仍然会使其变得很小!
贝叶斯规则要求您在了解一些证据后对假设的更新信心结合了两个因素:您先前对假设的信心以及新证据支持该假设的强度。忘记前者而只关注后者,被称为基本利率谬误。不幸的是,这种谬论经常被专业人士犯下,甚至是那些处理改变生活的数据的人。
假设针对一种罕见疾病开发了一种新的医学测试——只有千分之一的人患有这种疾病。该检测非常准确:患有这种疾病的人90 % 的情况下检测呈阳性,而未患病的人只有10 % 的情况下检测呈阳性。您随机选择一个人,进行测试并获得阳性结果。您应该对他们患有这种疾病有多大信心?
大多数人——包括训练有素的医疗专业人员! – 假设您应该有80%或90 % 的信心认为此人患有该疾病。根据贝叶斯法则,正确答案是低于1 %。实际情况是,大多数受访者对测试的准确性(其产生的证据的强度)感到不知所措,以至于他们忽视了这种疾病在人群中的罕见程度。
但让我们快速计算一下:假设您将此测试应用于 10,000 名随机选择的个体。其中大约有 10 人患有这种疾病,因此其中 9 人的检测结果呈阳性。另一方面,您选择的个体中约有 9,990 人不会患有这种疾病。由于该测试在10 % 的情况下为健康个体提供阳性结果,因此这 9,990 名健康个体将产生大约 999 次假阳性测试。因此,对 10,000 人进行检测后,总共会得到 1,008 例阳性结果,其中只有 9 例(略低于1 %)是真正患有这种疾病的人。
同样,在处理极端概率的情况时,考虑可能性会有所帮助。强有力地支持某个假设的证据(如刚才描述的可靠的医学测试)可能会将该假设的可能性乘以 10 倍,甚至 100 倍。但是,如果可能性一开始就足够小,那么将它们乘以 10 就可以了。从千分之一到百分之一。
子组并不总是反映整体
贝叶斯学派大量研究条件概率。当您考虑某些特征在人口子群体中的常见程度,而不是考虑整个人口时,就会出现条件概率。如果你随机挑选一个美国人,他们不太可能喜欢用未发酵的外壳制成的披萨,上面铺上普罗维尔奶酪,然后切成方块。但假设他们在圣路易斯长大,他们享受这种怪物的可能性要高得多。
条件概率的表现可能非常违反直觉。人们认为应该显而易见的简单原则可能会以惊人的方式失败。最明显的例子是辛普森悖论。
希望我们所有人在生活中都学会了不要从单个例子中得出广泛的概括,或者假设一小群人可以代表整体。一个外国人如果只通过访问圣路易斯来判断美国人对披萨的偏好,那将被严重误导。由于粗心或纯粹的运气不好,我们可能会偶然发现一个与其他人群不同的亚人群,因此具有一般人群无法反映出来的特征。
但辛普森悖论证明了比这更奇怪的事情:有时一个群体的每个亚群都有一个特定的特征,但该特征仍然没有在整个群体中表现出来。
2016-17 NBA 赛季,詹姆斯·哈登(当时效力于休斯敦火箭队)的两分球命中率高于德玛尔·德罗赞(效力于多伦多猛龙队)的两分球命中率。哈登的三分命中率也高于德罗赞。然而,德罗赞的总体投篮命中率(他投中的两分球和三分球的总命中率)高于哈登。哈登在两分球和三分球方面都做得更好,而这些是唯一影响投篮命中率的投篮方式,但德罗赞的整体表现更好。这怎么可能?
职业篮球爱好者都知道,对于任何球员来说,两分球都比三分球更容易命中,但哈登却执意为难自己。 2016-17赛季,他尝试的每种投篮次数几乎相同(777次三分球和756次两分球),而德罗赞的两分球尝试次数是三分球次数的10倍多。尽管哈登在各种投篮方面都更出色,但德罗赞做出的战略决定是高命中率投篮次数比低命中率投篮次数要多得多。因此,他的成功率总体较高。
20 世纪 70 年代,加州大学伯克利分校研究生院接受性别偏见调查时,也出现了同样的现象。 1973年, 44 %的男性申请者被伯克利研究生院录取,而只有35 %的女性申请者成功。然而,一项统计研究发现,个别院系(实际上做出招生决定)录取男性和女性的比例大致相等,甚至更频繁地录取女性。问题在于,某些院系比其他院系更难进入(对于所有申请者而言!),而且女性申请的领域更具选择性。
当然,这并不能消除所有偏见的可能性;一项研究发现,女性正在申请更拥挤的领域,因为她们没有获得本科数学背景来学习资金更充足的科目(因此可以招收更多学生)。但关于条件概率的更广泛的观点是:你不能假设总体总体反映了其子总体的趋势,即使这些趋势发生在所有子总体中。您还必须考虑特征在亚群体中的分布。
原文: https://psyche.co/guides/how-to-think-like-a-bayesian-and-make-better-decisions