盘子里的神经元学会了在虚拟现实中打乒乓球

科学家们刚刚在一个盘子里教了数十万个神经元打乒乓球。使用一系列有策略的定时和放置的电击，神经元不仅在虚拟环境中学习游戏，而且随着时间的推移表现得更好——反弹时间更长，失误更少——显示出以前认为不可能的适应水平。

为什么？想象一下，取一块脑组织，将其消化成单个神经元和其他脑细胞，将它们（轻轻地）倒在盘子上，现在能够在活的宿主之外教它们做出反应并适应新任务单独使用电击。

这不仅仅是乐趣和游戏。生物神经网络加入了它的人工表亲 DeepMind 的深度学习算法，在不断增长的尝试解构、重建和掌握一种基于人类大脑的通用“智能”的尝试中。

据本月在Neuron上发表的一篇论文的作者称，澳大利亚公司Cortical Labs的创意，被称为DishBrain的整个设置是“第一个实时合成生物智能平台”。该装置比甜点盘小，非常时尚。它将孤立的神经元与芯片连接起来，这些芯片既可以记录细胞的电活动，又可以触发精确的电击来改变这些活动。与脑机接口类似，这些芯片由复杂的计算机程序控制，无需任何人工输入。

这些芯片充当神经元连接到虚拟世界的桥梁。作为神经活动的翻译器，他们可以将生物电数据与硅比特结合起来，让神经元对数字游戏世界做出反应。

DishBrain的设置是为了扩展到更多的游戏和测试。因为神经元可以感知和适应环境并将其结果输出到计算机，它们可以用作药物筛选测试的一部分。它们还可以帮助神经科学家更好地破译大脑如何组织其活动和学习，并激发新的机器学习方法。

但是，Cortical Labs 首席科学官 Brett Kagan 博士解释说，最终目标是帮助利用活神经元的固有智能，以实现其卓越的计算能力和低能耗。换句话说，与模仿神经计算的神经形态硬件相比，为什么不直接使用真实的东西呢？

“理论上，由于生物系统固有的效率和进化优势，广义 SBI [合成生物智能] 可能会在通用人工智能 (AGI) 之前出现，”作者在他们的论文中写道。

认识DishBrain

DishBrain项目始于一个简单的想法：神经元是非常智能且适应性强的计算机。最近的研究表明，每个神经元本身就是一台超级计算机，其分支曾经被认为是被动地充当独立的小型计算机。就像社区中的人一样，神经元也具有连接到不同神经网络的固有能力，这些神经网络会随着环境的变化而动态变化。

这种多并行、低能耗的计算水平长期以来一直是神经形态芯片和机器学习算法模仿大脑自然强大能力的灵感。虽然两者都取得了长足的进步，但没有一个能够重现生物神经网络的复杂性。

“从蠕虫到苍蝇再到人类，神经元是广义智能的起点。所以问题是，我们能否与神经元互动，以利用这种固有的智能？”卡根说。

输入DishBrain 。尽管它的名字，镀层的神经元和其他脑细胞来自一个真正的有意识的大脑。至于“智能”，作者将其定义为收集信息、整理数据和调整发射活动的能力——即神经元如何处理数据——以帮助适应目标的方式；例如，快速学习将手放在滚烫的平底锅的把手上，而不会在边缘灼伤。

设置从一个菜开始，正如它的名字一样。每一个的底部都覆盖着一个计算机芯片 HD-MEA，可以记录受激电信号。然后将细胞，无论是从小鼠胚胎的皮层中分离出来的，还是从人类细胞中提取的，都放在上面。这道菜浸泡在营养液中，让神经元生长和茁壮成长。随着它们的成熟，它们从摇摆不定的斑点长成细长的形状，带有巨大的蜿蜒交织的树枝网络。

在两周内，小鼠的神经元在它们的小房子里自我组织成网络，爆发出自发的活动。来自人类的神经元——皮肤细胞或其他脑细胞——需要更长的时间，大约一两个月就建立了网络。

然后是培训。每个芯片都由市售软件控制，并将其连接到计算机接口。用它来刺激神经元类似于提供感觉数据——比如当你专注于一个移动的球时来自你的眼睛的那些。记录他们的活动是结果——也就是说，神经元将如何反应（如果在体内）你移动你的手去击球。 DishBrain的设计使这两个部分实时集成：类似于人类打乒乓球，神经元理论上可以从过去的失误中学习并调整他们的行为以击中虚拟“球”。

Ready Player DishBrain

这是Pong的方式。一个球在屏幕上快速反弹，玩家可以上下滑动一个微小的垂直桨——看起来像一条粗线。在这里，“球”由基于其在屏幕上的位置的电击来表示。这实质上是将视觉信息转换为电子数据，供生物神经网络处理。

然后，作者为“感觉”和“运动”定义了芯片的不同区域。例如，一个区域捕获来自虚拟球运动的传入数据。然后，“运动区域”的一部分控制虚拟桨向上移动，而另一部分则使其向下移动。作者解释说，这些分配是任意的，这意味着其中的神经元需要调整它们的放电以在比赛中表现出色。

那么他们是如何学习的呢？如果神经元“击中”球——即显示相应类型的电活动——则团队每次以相同的频率在该位置击打它们。这有点像为神经元建立“习惯”。如果他们错过了球，那么他们就会被电噪声击中，从而破坏神经网络。

卡根解释说，该策略基于一种称为自由能原理的学习理论。基本上，它假设神经元对周围环境持有“信念”，并调整和重复它们的电活动，以便它们能够更好地预测环境，要么改变它们的“信念”，要么改变它们的行为。

理论成功了。在短短五分钟内，人类和老鼠的神经元都迅速改善了他们的游戏玩法，包括更好的反弹、更少的 A（其中桨没有一次击球就无法拦截球）以及连续击球超过 3 次的长时间游戏。令人惊讶的是，小鼠神经元的学习速度更快，尽管最终它们的表现优于人类。

这些刺激对他们的学习至关重要。在没有任何电反馈的情况下使用DishBrain进行的单独实验表现要差得多。

游戏开始

卡根说，这项研究证明了培养皿中的神经元可以成为复杂的学习机器，甚至表现出感知和智能的迹象。这并不是说他们是有意识的——相反，当他们“体现”到虚拟环境中时，他们有能力适应目标。

Cortical Labs 并不是第一个测试孤立神经元数据处理能力边界的公司。早在 2008 年，佐治亚理工学院的史蒂夫·波特博士及其团队发现，即使只有几十个电极，它们也可以刺激大鼠神经元在培养皿中表现出学习的迹象。

DishBrain在每个设置中都压缩了数千个电极，该公司希望利用其生物能力来帮助药物开发。该系统或其未来的衍生系统可能会充当测试神经药物或深入了解不同物种或大脑区域的神经计算能力的微型大脑替代品。

但长期愿景是“活的”生物硅计算机混合体。作者写道：“将神经元集成到数字系统中可能会实现仅使用硅无法实现的性能。”卡根设想开发“生物处理单元”，将两全其美的优点结合在一起，以实现更高效的计算——并在此过程中揭示我们自己大脑的内部运作。

“这是理解智能的新前沿的开始，”卡根说。 “它不仅涉及作为人类意味着什么的基本方面，还涉及到在一个不断变化的、充满活力的世界中，活着和聪明、处理信息和有知觉意味着什么。”

图片来源：法新社照片/皮质实验室

原文： https://singularityhub.com/2022/10/18/neurons-in-a-dish-learned-to-play-pong-in-virtual-reality/