桥牌冠军莎朗·奥斯伯格曾写道:“打桥牌就像经营一家企业。这是关于狩猎、追逐、细微差别、欺骗、奖励、危险、合作,以及在美好的一天,胜利。”
虽然国际象棋很久以前就落入了计算数字的超级计算机手中,这不足为奇,但您会期望人类在桥牌中保持更加无懈可击的优势,这是一种信息不完整、合作和狡猾交流的游戏。几千年来,我们的大脑已经进化到可以阅读微妙的面部表情和肢体语言。我们已经组建了庞大的社会,依赖于数百万人的竞争与合作。这些技能肯定是机器无法达到的吗?
目前,是的。但也许不是永远。近年来,最先进的人工智能已经开始侵占我们最引以为豪的一些领域。在信息有限的不确定世界中导航的能力,游戏是无限细微的,没有人能单独成功。
上周,法国初创公司NukkAI又迈出了一步,其 NooK 桥牌 AI 在巴黎举行的比赛中击败了八位桥牌世界冠军。
游戏被简化了,NooK 并没有与人类玩家完全正面交锋——更多内容见下文——但算法的表现在其他方面非常出色。值得注意的是,NooK 是一种混合算法,将符号(或基于规则的)人工智能与当今主流的深度学习方法相结合。此外,与纯粹的深度学习同行相比,NooK 更加透明并且可以解释其行为。
伦敦帝国理工学院机器学习教授斯蒂芬·马格尔顿告诉《卫报》:“我们所看到的代表了人工智能系统状态的根本性重要进步。 ”换句话说,对于一台冷酷的计算计算机来说还算不错。
黑盒、白盒
为了玩桥牌,这可能是 AI 解决的最具挑战性的纸牌或棋盘游戏,NukkAI 团队将深度强化学习与符号 AI 相结合,这是 90 年代 IBM 的深蓝在国际象棋中击败 Garry Kasparov 的著名方法。
深度强化学习算法由相互连接的人工神经元网络组成。为了学习一个游戏,一个算法自己玩了数十亿次,在每一轮之后评估它的性能,并通过调整和重新调整它的神经连接来逐步改进,直到它最终掌握游戏。
另一方面,符号人工智能是基于规则的。软件工程师对 AI 成功所需的规则进行硬编码。例如,主教可以在棋盘上沿对角线移动任意数量的方格,或者如果对手采用特定策略,则采用一些反策略会增加获胜的机会。这种方法对于有限的人来说很好,但是随着复杂游戏中所有可能移动的空间增加,它变得站不住脚。
这就是为什么 2016 年围棋世界冠军李世石被 DeepMind 的 AlphaGo 击败是一件大事。当时,专家们没想到人工智能会在十年内击败顶级围棋选手。与“老式人工智能”相比,AlphaGo 展示了深度学习的惊人力量。
但是深度学习有它的缺点。其中之一是它是一个“黑匣子”。神经网络中的数十亿个节点如何完成任何给定的任务是个谜。
AlphaGo 对李世石的第 37步是人类不会做出的选择——它计算出专业人士选择这一步的几率为万分之一——但它还是做出了这一步,并获胜了。尽管如此,该算法仍无法解释其训练中的哪些因素影响了它的信心。当赌注高于棋盘游戏时,这种不透明性是一个问题。要相信自动驾驶汽车或做出生死攸关的决定和诊断的医学算法,我们需要了解它们的基本原理。
由 NukkAI 等研究人员倡导的一种潜在解决方案将深度学习和符号 AI 结合在一起,在所谓的“神经符号”方法中利用各自的优势。
例如,NooK 首先学习游戏规则,然后通过玩来提高技能。这种组合改进了算法的概率“大脑”,Muggleton告诉《每日电讯报》 ,它超越了统计数据。 他说,NooK 使用“背景知识,就像我们利用书本和以往经验中的信息来增强我们自己的学习一样”。因此,该算法可以解释决策:它是一个“白盒”人工智能。
这就是为什么桥牌——一种抵抗人工智能征服的沟通和策略游戏——是对这种方法的一个很好的考验。 “在桥牌上,如果你不解释,你就不能玩,”NukkAI 联合创始人 Véronique Ventos 告诉卫报。
那里有打桥牌的算法,但它们与最优秀的人类相比是遥遥无期的。在一周多前的 NukkAI 的巴黎比赛中,情况似乎发生了变化。
娱乐和游戏
NukkAI 挑战赛让 NooK 与八位桥牌世界冠军展开较量。
每个冠军打了十盘十局,而 NooK 打了 80 盘十局,即 800 连发。人类和人工智能不是互相比赛,而是用相同的手对抗相同的对手,一对桥接机器人(不是 NukkAI 制造的),称为 Wbridge5。
桥牌游戏开始时,玩家竞标他们认为自己可以赢的技巧或回合数。出价最高的称为合约,谁定的就是庄家。庄家的搭档,或明手,将手朝上放在桌子上,然后退出游戏。庄家现在用双手对抗他们的对手,并试图赢得足够的墩数来满足他们的叫价。
NukkAI 挑战赛取消了叫牌以简化比赛,人类和 NooK 在每场比赛中都扮演了庄家的角色,桥牌机器人对作为对手(或防守者)。 NooK 的分数与每个人类玩家的分数之间的差异是在每组中平均的。 NooK 在 80 场比赛中以 67 场或 83% 的成绩击败了对手。
“这对人类来说非常绝望,”法国冠军托马斯贝西斯说。 “有时我们不明白为什么人工智能比我们玩得更好——但它确实如此。这非常令人沮丧。”
NooK 的胜利是一项令人印象深刻的壮举,但也有一些警告。跳过叫牌程序而只扮演庄家角色,消除了游戏中具有挑战性和细微差别的部分,在这些部分中,合作伙伴必须相互沟通并欺骗对手。此外,对于人类来说,保持专注于 100 只手是具有挑战性的,但对于计算机而言则不然。最后,NukkAI 的联合创始人 Jean-Baptiste Fantun 表示,他相信这台机器会赢得数千笔交易,但对它的前景并不乐观,超过 800 笔。换句话说,它玩得越多,获胜的几率就越大,因此,在这种情况下,连续玩很多手牌可能有助于 AI 将人类推到一边。
“所以就算是在桥上,还有其他的事情要解决。”范屯说道。 “我们面前还有一张路线图。”也就是说,说桥牌已经落入人工智能,就像国际象棋或围棋一样,太过分了。但人工智能在部分游戏中的得分超过了顶级人类玩家是 Fantun 地图上的一个关键里程碑。尽管像 OpenAI 的 GPT-3 等越来越大的 AI 算法继续给人留下深刻印象,但 NukkAI 在桥牌方面的表现可能会增加混合方法的论点。
接下来,他们必须证明 NooK 可以比赛并获胜——不需要免责声明。
寻找保持领先变化步伐的方法?重新考虑什么是可能的。加入一个由 80 名高管组成的高度策划的独家团队,参加 Singularity 的旗舰高管项目 (EP),这是一个为期五天、完全沉浸式的领导力转型项目,颠覆了现有的思维方式。发现致力于为世界快速变化寻找解决方案的未来学家的新思维方式、工具集和网络。 单击此处了解更多信息并立即申请!