Quanta 杂志的 James Round
介绍
Wordle 已迅速成为数百万人播放的现代经典。作为一个谜题爱好者,我对它的兴奋就像天文学家看到一颗可见的超新星一样激动。在此之前,我只有两次感受到和看到如此广泛的对拼图的兴奋:第一次是在我生命的早期,当我遇到拼字游戏和填字游戏时,然后是在 1980 年代的魔方热潮中。今天我们将探索这个拼图世界的现代超新星。
Wordle 是一个简单的游戏,您必须在六次猜测中找到一个五个字母的单词。每次猜测后,您都会获得有关您的单词与目标的接近程度的线索。 Wordle 类似于 1950 年代名为Jotto的纸笔游戏,也类似于使用彩色标记而不是文字的 Mastermind 游戏。但是让 Wordle 比它的前身更容易和更吸引人的地方在于,它会给你关于猜测中每个字母位置的视觉反馈:如果字母在正确的位置,则为绿色,如果它是正确单词的一部分但不合适,则为黄色,并且如果它不在单词中,则为灰色。
虽然它令人愉快的运气和直觉的结合是游戏吸引力的一部分,但它与信息论的联系也是如此。每个 Wordle 移动都提供了一个机会,可以找到一个或多个数学可计算的最佳选择,至少平均而言是这样。在 Patrick Honner 的Quantized Academy 专栏和 Grant Sanderson 的优秀YouTube 视频中,这种联系得到了很好的探索。正如数学家亚历克斯·塞尔比所解释的那样,从计算机分析的角度来看,Wordle 是一种比国际象棋或围棋容易得多的游戏,基本上已经解决了。所有可能的起始词都根据平均到达官方 Wordle 列表中的每个词所需的转数进行了排名。有了最好的起始词,计算机平均需要 3.41 到 3.42 轮来解决所有可能的词。
但人不是计算机。虽然计算机分析建议以“凝视”、“石板”或“起重机”等词开头,但我们中的许多人更喜欢首先关注单词的元音结构,以“再见”或“音频”开头。大多数人也无法计算每一种可能性,而是依靠直觉、一般原则和经验法则来做到最好。一些对计算机来说很容易的任务对人类来说却很困难,例如列出所有可能的优秀单词。这意味着信息论解决方案不能直接传递给人类。为了制定好的策略,我们需要考虑人类的心理、认知偏好和缺点。
在本专栏中,我提供了四个谜题和四个问题。这些谜题是尝试使用客观技术来解决 Wordle 的一些有趣方面。这些问题涉及 Wordle 的一些方面,这激起了我的好奇心。我希望这些没有明确答案的开放性问题能够进行良好的讨论。计算机搜索可能有助于解决一些问题,但您也可以只描述您认为找出问题的最佳方法。
起始词
据《纽约时报》的WordleBot 报道,“adieu”是迄今为止人们使用的最常用的起始词(大约 7%)。另外两个元音丰富的单词“audio”(4%)和“raise”(3%)排在前三名。诸如“凝视”、“起重机”和“石板”之类的计算机最爱不太受欢迎(2% 到 3%)。这可能是因为大多数人认为单词结构使用元音作为骨架。
假设我们想尽早关注元音,让我们尝试确定这三个元音丰富的起始词中哪个最好。下表给出了单词“adieu”、“audio”和“raise”中的八个字母在整个 2,309 个单词的 Wordle 答案列表中的每个位置出现的频率。
美林谢尔曼/广达杂志
介绍
谜题 1
根据此表,确定对于三个富含元音的起始词中的每一个:“adieu”、“audio”和“raise”,您可以期望在整个 Wordle 答案列表中获得多少绿色和黄色。这告诉您他们作为起始词的预期表现是什么?
问题 1
这就提出了一个问题,一个字母得到绿色和黄色结果的相对价值。我们人类喜欢绿色,因为它们为我们节省了大量的认知努力。得到五个果岭解决了这个难题,但得到五个黄色意味着必须尝试各种字谜。那么绿色值 1.5、2 或更多的黄色吗?你会如何量化这个?
谜题 2
A) 如果你在第一回合得到所有五个黄牌,假设最佳打法,找到答案的最大回合数是多少?
B) 是否曾经有过让某个位置的字母变黄比看到它变绿更有价值的情况?如果是这样,你能举个例子并解释为什么会这样吗?
虽然“adieu”实际上不是 Wordle 的答案,但您仍然可以将其用作猜测。除了 Wordle 当前的 2,309 个常用词的答案列表之外,您还可以猜出大约 15,000 个词中的任何一个,其中一些词非常晦涩难懂。例如,这些可能的猜测词中的前四个按字母顺序是“aalii”、“aapas”、“aargh”和“aarti”。这类词可能只有参加拼字游戏比赛的玩家才知道。
问题2
具有良好词汇量的晦涩拼字游戏单词的人在玩 Wordle 时有优势还是劣势?
不友好的竞争
Wordle 让您可以轻松地与朋友分享和比较您的分数。这有助于分数与高尔夫的几乎完美对应。优秀的人类玩家可以在四次尝试中解决大多数 Wordles,因此可以将四次视为标准杆。因此,三是小鸟,二是老鹰,而神奇的是一杆进洞。从长远来看,一个非常优秀的人类球员的平均水平会略低于标准杆,就像一个非常优秀的高尔夫球手一样。
这种易于分享的方式为团队带来了很好的乐趣,但也可能导致焦虑和嫉妒。在Solitaired对 Wordle 用户进行的一项调查中,大约 10% 的 Wordle 玩家承认作弊,他们中的大多数人每周都会有策略地这样做一到两次。作弊非常容易——互联网上的剧透比比皆是,你可以先在另一台设备上或在私人模式下解决当天的 Wordle。鉴于这一切,作弊的实际发生率很可能更高。
然而,疑似作弊的发生率可能甚至高于实际作弊的发生率。很难估计一个好球手多久能击败标准杆,当有人拿到一连串好成绩时,很容易产生怀疑。显然,如果有人不断打出一杆进洞,他们很可能在作弊,但对于小鸟和老鹰来说,情况就变得更加模糊了。在我们指责我们的朋友之前,让我们试着客观地弄清楚这一点。
谜题 3
进一步调查的传统科学标准是偶然发生的结果的概率(阿尔法值)是否小于 5% 或小于 1%,具体取决于研究人员的目标。然后认为结果在 5% 或 1% 的水平上具有统计学意义。既然怀疑人没有作弊是不好的,让我们在本次调查中选择更保守的 1% 水平。
假设您属于一个由 10 名玩家组成的 Wordle 组,他们每天都在互相分享结果,持续了 200 天。假设一个非常优秀的人类球员可以期望每 2.5 场比赛获得一只小鸟,每 40 场比赛获得一只老鹰,每 2000 场比赛获得一杆进洞(这是合理的现实估计)。
A) 在这段时间内,在你的小组中,在 1% 的水平上,连续抓到多少只小鸟是有意义的?
B) 一排有多少只老鹰?
C) 一排有多少个一杆进洞?
问题 3
完全有可能在你的小组中取得好成绩的频率明显高于偶然预测的频率,没有任何人作弊。你会怎么解释这个?
Wordle的终结
Wordle 是一款设计精美的游戏。对于个人解决者来说,它是快速和容易玩,奖励技巧和运气,推理和直觉。它不需要专门的词汇,因此大多数人可以经常轻松地获得良好的结果,并且具有出色的视觉反馈。在社交方面,这对每个人来说都是同一个谜题,很容易分享和联系。这解释了它的受欢迎程度。
然而,Wordle 的一个方面设计不佳,需要尽快进行更改以避免影响游戏。问题在于选择解决方案的方式。一个设计良好的系统会从列表中随机选择一个单词,在任何一天选择任何单词的概率都是相等的。然而,Wordle 答案来自以固定顺序设置的预定列表。目前的名单将在 2027 年 10 月的某个时候用完。
这意味着一个词一旦使用,五年内不会再出现!因此,当“主题”和“百里香”这两个词在几天之内出现时,在后来的 Wordle 中,刚刚缺少 TH_ME 中间字母的玩家就知道答案是什么了。而且,如果您跟踪使用了哪些词,那么潜在的未来解决方案列表将与日俱增。
谜题 4
考虑一个对过去的解决方案有完美记忆的人。对于这样的人,答案在 Wordle 的 2,309 个单词列表的最后一天就很明显了。在不进行实际计算的情况下,您能否快速估算出此人在整个列表期间期望获得多少一杆进洞?然后,如果可以,请尝试进行实际计算。
Wordle 的设计使得解决方案单词在您每天第一次连接到网站并下载代码以解决当天的难题时,就已经出现在您的设备上的“客户端”。使用预定列表的一个优点是 Wordle 的管理员不需要每天主动选择一个新的随机单词——解决方案会根据日期的变化在午夜自动更改为列表中的下一个单词。但这为黑客打开了寻找未来五年所有解决方案的大门。
问题 4
您将如何设计 Wordle 以使其保持客户端设计,确保每个人在给定的一天获得相同的解决方案词,但以合理的方式随机化答案,而不需要每天更改代码? (无需提供编码细节,只需概述可以使用哪些技术或算法。)
让我们希望《纽约时报》找到这个问题的解决方案(或使用你的答案),并在游戏快结束之前做出改变。
享受你的日常 Wordle。快乐的困惑!
编者注:在评论部分提交最有趣、最有创意或最有见地的解决方案(由专栏作家评判)的读者将获得Quanta 杂志T 恤或两本 Quanta书籍之一, Alice 和 Bob Meet the Wall of Fire或素数阴谋(获胜者的选择)。如果您想为未来的 Insights 专栏推荐一个最喜欢的谜题,请将其作为评论提交,并明确标记为“NEW PUZZLE SUGGESTION”。 (不会出现在网上,所以上面的谜题的解决方案应该单独提交。)
原文: https://www.quantamagazine.org/how-to-win-at-wordle-without-cheating-20221025/