婴儿是活泼、可爱、咯咯笑的快乐球。它们也是非常强大的学习机器。在三个月大的时候,他们已经对周围事物的行为有了直觉——没有人明确地教他们游戏规则。
这种被称为“直觉物理学”的能力在表面上似乎极其微不足道。如果我将玻璃杯装满水并将其放在桌子上,我就知道玻璃杯是一个物体——我可以用手包裹住它而不会融化到我的手掌中。它不会沉入桌子。如果它开始悬浮,我会盯着看,然后立即跑出门。
婴儿通过从外部环境中吸收数据来迅速发展这种能力,形成一种关于物理世界动态的“常识”。当事情没有按预期移动时——比如说,在物体消失的魔术中——他们会表现出惊讶。
对于人工智能来说,这是完全不同的事情。虽然最近的 AI 模型已经在玩游戏和解决几十年前的科学难题方面击败了人类,但他们仍然在努力培养对物理世界的直觉。
本月,谷歌旗下的 DeepMind 的研究人员从发展心理学中汲取灵感,构建了一个人工智能,可以通过观看视频自然地提取关于世界的简单规则。 Netflix 和 chill 无法单独运行。人工智能模型只有在给定对象的基本概念时才能学习我们物理世界的规则,例如它们的边界是什么、它们在哪里以及它们是如何移动的。与婴儿类似,当出现没有意义的神奇情况时,人工智能会表达“惊讶”,比如一个球滚上斜坡。
被称为 PLATO(通过自动编码和跟踪对象进行物理学习)的 AI 非常灵活。它只需要一组相对较少的例子来发展它的“直觉”。一旦了解到这一点,该软件就可以概括其对事物如何移动和与其他物体相互作用的预测,以及对以前从未遇到过的场景的预测。
在某种程度上,柏拉图达到了先天与后天之间的最佳平衡点。发育心理学家长期以来一直争论是否可以通过仅从经验中发现数据模式来实现婴儿的学习。 PLATO 认为答案是否定的,至少对于这项特定任务来说不是。内置的知识和经验对于完成整个学习故事都至关重要。
需要明确的是,PLATO 不是三个月大婴儿的数字复制品——而且从来没有被设计成这样。然而,它确实提供了我们自己的思想如何发展的一瞥。
“这项工作……正在突破日常经验在智力方面可以和不可以解释的界限,”博士评论道。西北大学和西悉尼大学的 Susan Hespos 和 Apoorva Shivaram 分别没有参与这项研究。它可能“告诉我们如何构建更好的计算机模型来模拟人类思维”。
常识难题
在三个月大的时候,大多数婴儿在玩具掉到地上时都不会眨眼。他们已经掌握了重力的概念。
这是如何发生的仍然令人费解,但有一些想法。在那个年龄,婴儿仍然难以蠕动、爬行或以其他方式四处移动。他们从外界获得的信息主要是通过观察获得的。这对 AI 来说是个好消息:这意味着与其制造机器人来物理探索他们的环境,不如通过视频将物理感灌输到 AI 中。
这是 Meta 的领先 AI 专家和首席 AI 科学家 Yann LeCun 博士认可的理论。在 2019 年的一次演讲中,他假设婴儿可能通过观察来学习。他们的大脑以这些数据为基础,形成了对现实的概念。相比之下,即使是最复杂的深度学习模型仍然难以建立对我们物理世界的认识,这限制了它们与世界的互动程度——使它们几乎成为云端的思想。
那么如何衡量婴儿对日常物理的理解呢? “对我们来说幸运的是,发展心理学家花了几十年的时间研究婴儿对物质世界的了解,”首席科学家 Luis Piloto 博士写道。一项特别强大的测试是违反预期 (VoE) 范式。向婴儿展示一个滚上山丘、随机消失或突然向相反方向移动的球,婴儿注视该异常的时间将比其正常预期时更长。有什么奇怪的事情发生了。
太空奇遇
在这项新研究中,该团队采用 VoE 来测试 AI。他们处理了五个不同的物理概念来构建 PLATO。其中包括坚固性——即两个物体不能相互穿过;和连续性——事物存在并且即使被另一个物体隐藏也不会消失的想法(“peek-a-boo”测试)。
为了构建 PLATO,该团队首先从 AI 中的标准方法开始,采用双管齐下的方法。其中一个组件是感知模型,它接收视觉数据来解析图像中的离散对象。接下来是动态预测器,它使用神经网络来考虑先前对象的历史并预测下一个对象的行为。换句话说,该模型构建了一种“物理引擎”,可以映射对象或场景并猜测某些事物在现实生活中的行为方式。这种设置让 PLATO 初步了解了物体的物理特性,例如它们的位置和移动速度。
接下来是训练。该团队向 PLATO 展示了 30 小时内来自开源数据集的合成视频。这些不是来自真实事件的视频。相反,想象一下老式任天堂式的块状动画,一个球从斜坡上滚下来,弹到另一个球上,或者突然消失。 PLATO 最终学会了预测单个对象在下一个视频帧中的移动方式,并更新了该对象的内存。通过训练,它对下一个“场景”的预测变得更加准确。
然后团队将扳手扔进辐条。他们向柏拉图展示了一个普通的场景和一个不可能的场景,比如一个球突然消失了。在测量实际事件与 PLATO 的预测之间的差异时,该团队可以衡量 AI 的“惊喜”程度——对于神奇的事件来说,惊喜程度达到了顶峰。
学习推广到其他移动物体。面对麻省理工学院开发的完全不同的数据集(其中包括兔子和保龄球瓶等)的挑战,PLATO 熟练地区分了不可能发生的事件和现实事件。柏拉图以前从未“见过”兔子,但在没有任何重新训练的情况下,当兔子违抗物理定律时,它表现出惊讶。与婴儿类似,PLATO 只需 28 小时的视频训练就能捕捉到其身体直觉。
对于 Hespos 和 Shivaram,“这些发现也与我们在婴儿研究中看到的特征相似。”
数字直觉
PLATO 并不是用于婴儿推理的 AI 模型。但它表明,利用我们蓬勃发展的婴儿大脑可以激发具有物理感的计算机,即使软件“大脑”实际上被困在一个盒子里。这不仅仅是建造人形机器人。从假肢到自动驾驶汽车,对物理世界的直观把握将 0 和 1 的无定形数字世界连接到日常的普通现实中。
这不是人工智能科学家第一次想用一点点幼儿的聪明才智来为机器大脑充电。 一个想法是赋予人工智能一种心理理论感——能够将自己与他人区分开来,并能够以他人的视角来描绘自己。对于四岁左右的孩子来说,这是一种自然而然的能力,如果嵌入到人工智能模型中,可以极大地帮助它理解社交互动。
这项新研究建立在我们生命的最初几个月的基础上,作为开发具有常识的人工智能的丰富资源。目前,该领域还处于起步阶段。作者正在为其他人发布他们的数据集,以建立和探索 AI 模型与更复杂的物理概念(包括来自现实世界的视频)交互的能力。目前,“这些研究可以作为人工智能和发展科学的协同机会,”Hespos 和 Shivaram 说。
原文: https://singularityhub.com/2022/07/19/deepmind-gave-an-ai-intuition-by-training-it-like-a-baby/