一年前,我开始玩拼图风暴。这是一个简短的游戏,您可以尝试在几分钟内快速解决尽可能多的国际象棋谜题。
现在,我不玩——甚至不喜欢——真正的国际象棋。这感觉太像生死搏斗了,通过做数学和(假设地)为宇宙做出贡献,我得到了类似的奖励感觉。
但是当我需要在工作中休息时,我发现拼图风暴是一种理想的消遣方式:它很有趣,但也很短暂而且有点令人沮丧,所以我很少会尝试玩多于几款游戏。
我刚开始的时候分数很低,但进步很快。几周后——受 Scott Alexander对 WordTwist 的实验的启发——我认为随着时间的推移,关于技能习得或认知表现的波动可能需要学习一些东西,所以我开始将所有分数记录在一个大文件中,如下所示:
oct 2 930 10 933 13 1521 13 1525 10 oct 5 1620 11 1624 8 1933 12 ...
那是一年前的事了。从那以后我玩了 358 场比赛,总共浪费了大约 18 个小时。
只是为了解决这个问题:我不擅长拼图风暴。即使过了一年,我的最高分也是有点尴尬的19。真正优秀的人看起来像这样。
假设1:随着时间的推移我变得更好
这是我在所有游戏中的得分,添加了一点点抖动。为了使趋势更容易看到,我添加了 15 场比赛的移动平均线。
这个假设不被支持。
假设 2:我打得越多越好
我的比赛非常不规律。如果我们使用每个游戏的日期和时间会怎样?因为当您进行不规则采样时移动平均线很奇怪,所以我在这里使用了平滑(黄土)曲线。
看起来我一开始确实进步了,但是当我停止玩 5 个月时,我退步得很厉害,当我停止玩一个月后,我退步了一点。所以我认为这个假设是正确的。
假设 #3:我的大脑没问题
关于上面的图表,我可能还应该提到其他一些事情:
从身体上讲,Covid 对我来说并不算太糟糕,但我就是想不通——我会进行对话,并对从我嘴里吐出的胡言乱语感到惊讶。 (回想起来,这是我决定世界迫切需要了解关于乙烯的一切的时候。)
所以这是关于人类脆弱性的一个教训。康复后,我似乎慢慢恢复了思考的能力。但我有点神经质:如果我没有恢复到满负荷状态,我会注意到吗?我想要衡量这一点的愿望促使我再次开始玩拼图风暴。
我很确定我很好,但无论哪种方式,这些数据都不是很确定。我在空档期间变得更糟是因为 Covid,还是仅仅因为我的技能下降了?我后来是否因为技能上限而停滞不前,是因为我玩得少了,还是因为 Covid 煮熟了我的大脑?很难确定。我真希望我能一直保持稳定的节奏。
假设 4:我早上更聪明
我们还可以查看一天中不同时间的平均值。以下是我一天中每一小时玩了多少游戏:(上午 8 点的 bin 显示了上午 8 点到上午 9 点之间的游戏数量。)
这是我每次的平均表现。
橙色线显示 90% 的置信区间,只是为了将其与 95% 区间的黑手党联系起来。
所以:零证据表明我在一天中的任何不同时间都更聪明或更愚蠢。
但是,有两个主要警告:
- 每当我喜欢并有时间时,我都会玩拼图风暴。这不是随机的。主观上,我不喜欢在累了的时候玩,而当我处于最佳状态时,我也不会那么分心。有可能我在一天中的不同时间更聪明/更笨,但是这种选择效应会扼杀信号。
- 我不确定这个游戏对智力的衡量程度。这对于下棋的人来说可能是显而易见的,但令我惊讶的是,我几乎所有的进步似乎都来自于无意识的模式识别,而不是“思考”。玩了一段时间后,你大多会开始“感觉到”有希望的动作。尽管如此,还是有一些有意识的处理来过滤无意识思维所暗示的动作。
假设 #5:我在一周中的某些日子更聪明
以下是我每天玩的游戏总数:
这是我在每个方面的平均表现:
我miiigghhtt在一周中会稍微好一点。但没有确凿的证据。
即使这是真的,也可能是“最近的练习效果”:因为我在周中玩得更多,那几天我有更多的练习。
讨论
总结一下:
- 我不擅长解谜风暴。
- 在我开始追踪之前的前几周,我进步了很多,但在接下来的一年里进步不大。
- 练习似乎有帮助,但随着时间的推移,技能会迅速衰减。
- 没有证据表明我在一周中的任何时候或任何一天都更聪明,尽管很难确定这种数据。
回想起来,我不确定拼图风暴是否适合这个目的。有很多运气:有些谜题比其他谜题更容易,而游戏为您提供更多时间来获得正确答案的方式使这种效果更加复杂。我也有很多错误点击的麻烦。所有这些差异使得很难检测到真正的信号。
如果我要再做一次,我会选择一个不那么随机的游戏。那里有很多认知测试,但它们并不有趣,这对我来说是行不通的。
真正需要的是定期玩游戏。理想的游戏是:
- 短的
- 有趣(这会取消 WordTwist 的资格)
- 但不太有趣(不会上瘾)
- 提供高分辨率输出(不仅仅是赢/输)
- 有技能成分
- 具有一般认知表现成分
- 低方差
这样的游戏存在吗?