1.
我们都想做出正确的决定。但这很难,因为我们不确定会发生什么。
例如,假设您想知道二氧化碳排放量是否会在 10 年内上升。我们最好的想法之一是让人们下注。例如,我可能会赌我的 4 美元排放量会上升,而你的 1 美元会下降。如果很多人在一个市场下注,最终的价格结合了每个人的智慧和信息。如果赌注稳定在 4:1 的比率,这表明排放量上升的几率是排放量下降的几率的 4 倍,即
P[排放量上升] ≈ 0.80
P[排放量下降] ≈ 0.20。
但是当你要做出决定时,你往往需要更多的信息。假设有人提出了一项减少二氧化碳排放的条约。如果你想知道条约是否有效,你可以让人们进行有条件的赌注。例如,我可能会按照以下规则用我的 9 美元对你的 1 美元下注:
- 10 年后,我们检查 (A) 条约是否成为法律,以及 (B) 排放量是否增加。
- 如果条约成为法律并且排放量增加,你付给我 1 美元。
- 如果条约成为法律并且排放量下降,我付给你 9 美元。
- 如果条约没有成为法律,我们俩都会拿回赌注。
如果很多人在市场上下注,并且价格以 9:1 的比率结算,这表明签署条约的世界 90% 的排放量都会增加,即
你可以经营第二个市场来增加排放的几率,条件是没有条约。
所以这是我们的问题:假设你这样做了,市场认为排放量更有可能随着条约而不是不条约而增加。也就是说,假设 P[排放量上升 |条约]大于P[排放量上升|无条约]。这是否意味着市场认为签署该条约会导致排放量上升?
2.
人们出于多种原因担心预测市场。也许有人会出于政治原因操纵价格。也许费用会扭曲价格。也许你会去 Dr. Evil 打赌排放量会上升,然后排放出大量的二氧化碳以确保你获胜。有效的担忧,但让我们忽略它们并假设市场输出“真实”概率。
现在,有什么可以解释有条约的排放量比没有条约的高?显而易见的解释是市场认为该条约将导致排放量上升:
条约成为法律
↓
排放量上升
完全合理。但也许市场有别的想法。也许条约什么都不做,但选民认为它做了一些事情,所以排放量上升会导致条约签署:
排放量上升
↓
气候做可怕的事情
↓
人们吓坏了
↓
人民要求条约
↓
条约成为法律
在这一系列事件中,该条约充当了一种“排放量上升”的奖励。尽管签署该条约对排放没有影响,但它成为法律的事实增加了排放增加的可能性。你仍然可以获得与条约导致排放增加的世界相同的概率。
3.
这是一个实际存在的市场(尽管有互联网积分而不是金钱):“以北约在乌克兰任何地方宣布禁飞区为条件,2022 年是否会在战斗中发射核武器?”
这个市场目前说
P[发射|声明] = 18%,
P[发射|不申报] = 5.4%。
从技术上讲,P[launch | 没有市场。 don’t declare] 但您可以使用 (1) P[launch]市场 (2) P[declare]市场和 (3) ᴘᴏᴡᴇʀ ᴏꜰ ᴍᴀᴛʜ 找到隐含价格。
目前市场给出 P[launch]=0.06 和 P[declare]=0.05。我们知道
P[发射,宣布]
= P[声明] × P[启动 |宣布]
= .05 × .18
= 0.009。
所以我们有这个具有已知行和列总和的概率表:
宣布 | 不申报 | ||
---|---|---|---|
发射 | 0.009 | ??? | 0.06 |
没有发射 | ??? | ??? | 0.94 |
0.05 | 0.95 |
使用已知的行/列总和,我们可以填写缺失的条目:
宣布 | 不申报 | ||
---|---|---|---|
发射 | 0.009 | .051 | 0.06 |
没有发射 | 0.041 | 0.899 | 0.94 |
0.05 | 0.95 |
所以我们明白了
P[发射|不要声明]
= P[启动,不声明] / P[不声明]
= 0.051 / 0.95
= 0.0537
因此,在声明的情况下启动的可能性比在不声明的情况下高 3.3 倍。看待这个问题的明显方式是,北约宣布禁飞区会增加核发射的几率:
北约宣布禁飞区
↓
北约和俄罗斯飞机在乌克兰发生冲突
↓
冲突升级
↓
核武器发射
这大概是正确的解释。但不一定。例如,我们真的了解北约领导人的勇气吗?可能是宣布禁飞区对发射几率没有直接影响,但北约宣布禁飞区这一事实表明北约领导人具有攻击性,因此更有可能采取其他攻击性行动(注意第一个箭头指出):
北约宣布禁飞区
↑
北约领导人咄咄逼人
↓
北约向乌克兰派遣北约坦克
↓
北约和俄罗斯坦克在乌克兰发生冲突
↓
核武器发射
这也可以解释当前的概率。
4.
这听起来是不是很熟悉?如果我们有一个市场,我相信投资者会为“迷人和好看”分配一个更高的价格,当你以阅读 dynomight 为条件时,而不是在你以不阅读 dynomight 为条件时。
那是因为阅读dynomight让你更迷人和好看吗?可悲的是,不——这是因为这些人更有可能重视一流的自学成才。
这是否让您想起概率和统计中的另一个问题?比如说,问题 über alles ?
问题是:
- 相关性并不意味着因果关系。
- 条件概率也不意味着因果关系。
- 条件预测市场为您提供条件概率。
5.
斯科特亚历山大建议使用预测市场来预测是否应该恢复被禁止的评论者。这个想法是,如果你被禁止,你可以写一个论据,说你会很好,然后投资者会押注斯科特如果读了你的理由就会恢复你的可能性,即
P[恢复|理由阅读]。
这可能行不通。假设 Scott 目前支付了一名助理来预先筛选理由。如果助理认为某人至少有 80% 的可能性会被恢复,他们会转发他们的理由以供阅读,而其余的则被忽略。 (助手给出了经过良好校准的预测。)
这扭曲了市场。假设人们都知道这个助手,市场会给出至少 80% 的恢复概率,不管它有多糟糕。 (随着时间的推移,你可以通过盲目地接受任何赔率低于 80% 的赌注来保证赚钱。所以人们总是会出价高达 80% 或更高的赔率。)
什么地方出了错?问题在于,理由的质量会影响它是否被阅读:
理由好
↓ ↘
恢复←理由阅读
几乎所有基于理由质量的选择都会发生同样的概率扭曲,尽管我无法弄清楚如何在没有一些蹩脚的计算的情况下做出一般情况。
但这里有一个例子:假设 Scott 只关注预测市场高于 25% 的情况。这也会向上扭曲概率。假设市场目前为 30%,但您认为真实概率为 20%。考虑两种情况:
- 你错了,市场太高了。然后市场可能会保持在 25% 以上,这意味着赌注将被激活。
- 你说得对,市场太高了。然后市场可能最终会下跌接近 20%,然后赌注就不会激活。
这似乎不公平,不是吗?在您正确的情况下,投注可能会被取消。所以你会注意到这一点而不是下注。当认为概率低的人退出市场时,概率会向上扭曲。
对此的解决方案是阅读随机选择的理由,而不考虑理由的质量或市场价格。这打破了从理由到被阅读事件的链接:
理由好
↓
恢复←理由阅读
看看那个:为了让事情顺利进行,我们需要做的就是向我们的条件预测市场承诺我们将随机进行条件预测。
6.
我们在哪?让我们来复习。这是典型的相关性并不意味着因果关系:
- 您可以使用观察性研究来获得行动 A 和结果 B 之间的相关性。
- 但仅仅因为 A 与 B 相关并不意味着做A 会使 B 更有可能。
- 要做到这一点,您需要对正在研究的变量有一个特定的因果结构。 (没有从 B 到 A 的因果路径,没有变量 C 具有到 A 和 B 的因果路径)
- 您可以通过随机选择 A 来保证正确的因果结构。如果您这样做,那么相关性确实意味着因果关系。
到目前为止,这篇文章已经提出了这个论点:
- 您可以使用条件预测市场来获得给定不同动作 A 的结果 B 的概率。
- 但仅仅因为改变 A 的值会改变 B 的条件概率,并不意味着做A 会改变 B 的概率。
- 要做到这一点,您需要对正在研究的变量有一个特定的因果结构。 (没有从 B 到 A 的因果路径,没有变量 C 具有到 A 和 B 的因果路径)
- 您可以通过随机选择 A 来保证正确的因果结构。如果您这样做,那么条件预测市场价格确实暗示了因果关系。
基本上:如果你运行一个预测市场来预测相关性,你就会得到相关性。如果你运行一个预测市场来预测随机试验的结果,你就会得到因果关系。但要激励人们预测随机试验的结果,你必须实际进行随机试验,而且成本很高。
7.
所以这就是问题所在。我们对于它可以做些什么呢?有几种选择。
让箭头正确
一种选择是仔细考虑您正在研究的系统。如果因果结构没问题(没有反向因果关系,没有混杂因素),那么你没问题,条件预测市场会给你想要的东西。但要小心,因为如果你错了,你会得到毫无意义的结果。
这里有一个有趣的问题,我想你真正需要的只是市场上的人们认为因果结构是好的。不过,试图利用这一点似乎很危险。
致力于随机化
我们通过承诺随机选择行动解决了被禁止评论者的问题。此选项始终有效。但有一个残酷的讽刺:预测市场的全部意义在于做出正确的决定。如果您必须随机行事才能获得良好的预测,那么我们甚至在这里做什么?
幸运的是,有一个很好的(并且众所周知的)替代方案,即有时随机化决策。你告诉人们:“我会掷一个 20 面骰子。如果出现 1-19,每个人都会拿回他们的钱,我会做我想做的事。如果达到 20,则下注激活,我决定使用硬币翻转做什么。”
这样做的好处是,当 1-19 出现时,您可以做任何您想做的事情,包括使用市场价格做出决定。但有时你必须随机做出决定,因为如果赌注永远不会激活,没有人会浪费时间在你的市场下注。
这是优雅的。哦,顺便说一下,你是美国国家科学基金会、美国国防高级研究计划局、美国国立卫生研究院还是一个想要花很多钱并吹嘘你如何比所有其他不知道高的蹩脚亿万富翁更能提高人类知识水平的亿万富翁如果它击中他们的脸,投资回报率?那么这个怎么样:
-
收集一百个 RCT 的提案,每一个都非常昂贵,但也非常棒。 (例如,您可以调查 SALT → MORTALITY 或 ALCOHOL → MORTALITY 或 UBI → HUMAN FLOURISHING。)
- 为高流动性市场提供资金,以预测这些 RCT 中的每一个的结果,条件是它们得到资助。
- 如果您对监狱有疑问,您可能想在此之前与CFTC聊天。
-
随机挑选 5% 的拟建项目,按书面规定为它们提供资金,并支付正确预测会发生什么的投资者。
- 拿走其他 95% 的拟议项目,将投资者的钱退还给投资者,并使用 SWEET PREDICTIVE KNOWLEDGE 挑选另外 10% 的 RCT 来资助惊人的科学进步和最大的状态提升。
不过,我真的希望北约不要随意决定禁飞区。
投注重新加权
再次考虑人们可以押注评论者被恢复的几率的情况。最好使用市场进行过滤,即只阅读概率高于 25% 的理由。但我们看到这会扭曲市场。
有一种替代投注结构可以主要解决这个问题。这个想法是,如果最终市场概率高于阈值,您总是会阅读理由。如果最终市场概率低于某个阈值,您只会在一小部分时间内阅读理由,但您会相应地加大赌注。例如,我们可能同意以下规则:
- 如果市场最终超过 25%,则说明理由。如果这个人被恢复了,你付给我 1 美元。如果这个人没有恢复,我付给你 4 美元。
- 如果市场最终低于 25%,则掷一个 10 面骰子。如果骰子出现 1-9,则取消投注。如果骰子是 10,则读取理由。如果这个人被恢复了,你付给我 10 美元。如果这个人没有恢复,我付给你 40 美元。
无论市场是高于还是低于 25%,在预期中,如果我是正确的,我将赢得 1 美元,如果你是正确的,你将赢得 4 美元。所以这个市场仍然会激励人们下注他们的真实信仰。
自然实验
想象一个以谁赢得总统选举为条件的战争几率预测市场。你无法解释这个因果关系。例如,也许候选人 X 不太可能引发战争,但如果看起来战争已经迫在眉睫,那么人们可能会投票给候选人 Y。
但我们不能随意挑选总统。 (这会干扰我们的选举,这真的很好,而且完全不像随机选择获胜者那么糟糕。)
罗宾汉森提出了一个只有在选票非常接近偶数时才会激活的市场,因此结果几乎是随机的。
这并不完美,因为临近的选举可能会影响其他变量。例如,假设候选人 Y 喜欢破坏选举的合法性。如果有明确的结果,那并不重要,但如果 X 以微弱优势获胜,就会引发骚乱,全球对手可能会利用混乱发动战争。在这种情况下,“近距离”预测市场可能会使 X 看起来更有可能引发战争,即使 X 在大多数情况下更好。
尽管如此,这是一个好主意——假设这样的事情不会发生并不是那么牵强。您可能可以使用相同的“如果发生自然实验就激活赌注”的原则来发明其他市场。
时间之箭
罗宾汉森还建议“解雇首席执行官”预测市场,人们押注公司的未来价格,条件是首席执行官被解雇(或不被解雇)。如果这样的市场表明如果 CEO 被解雇,价格更有可能下跌,那并不一定意味着 CEO 是好的,因为你可能会想象会发生这样的事情:
经济衰退
↓
公司赔钱
↓
股价下跌
↓
公司解雇CEO
解决这个问题的一个明显方法是利用时间:押注 2 年后的股价,条件是 CEO 在下个月被解雇。
这仍然不能保证,因为它只消除了反向因果关系,而不是隐藏的混杂因素。也许每个人都知道 CEO 很糟糕,但很难被解雇。但该公司刚刚被某位亿万富翁收购,有一些奇怪的传言称这位亿万富翁讨厌 CEO,想要解雇他们,然后出于恶意将公司推倒在地:
公司解雇CEO
↑
亿万富翁讨厌CEO
↓
亿万富翁摧毁公司
↓
股价下跌
如果你得知 CEO 很快就会被解雇,你就不得不得出结论,这位亿万富翁真的很讨厌他们,并计划继续摧毁公司。因此,即使 CEO 很糟糕,你也会有条件概率使 CEO 看起来不错。时间不是灵丹妙药。
受控条件预测市场
最后,可以将控制变量添加到预测市场。假设您想知道是否应该解雇 CEO,但您担心经济衰退会影响事情的发展。然后,您可以运行四个预测市场,以根据 CEO 被解雇(或未被解雇)和经济衰退(或不存在)的每种组合来判断股票上涨的几率。如果首席执行官真的是垃圾,你会期望
P[备货|首席执行官被解雇,经济衰退]
会大于
P[备货|没有CEO被解雇,经济衰退]
然后
P[备货| CEO被解雇,没有衰退]
会大于
P[备货|没有 CEO 被解雇,没有经济衰退]。
我不喜欢这个主意。但这主要是因为人们普遍反对在观察性研究中控制变量的想法:这完全取决于你如何编码“衰退”,你需要控制股票上涨和 CEO 被解雇的上游的所有变量,但没有下游。这通常很难,有时实际上是不可能的。
尽管如此,大多数社会科学都是建立在对事物的控制之上的,而且许多人似乎都相信它。所以不要这样做,但如果你这样做,请以我的名字命名。