DeepMind 定义通用人工智能并对当今领先的聊天机器人进行排名

人工智能人脸代码mesh.j

通用人工智能（AGI）已成为人工智能行业中经常被滥用的流行语。现在，谷歌 DeepMind 希望让这个想法有更坚实的基础。

AGI 一词的核心概念是人类智能的一个标志是其通用性。虽然专业计算机程序在挑选股票或将法语翻译成德语方面可能很容易胜过我们，但我们的超能力是我们可以学会这两件事。

在机器中重建这种灵活性是许多人工智能研究人员的圣杯，并且经常被认为是迈向人工超级智能的第一步。但人们对 AGI 的确切含义很少明确，而且这个想法经常用二进制术语来描述，其中 AGI 代表一个跨越了某些神话边界的软件，一旦到达另一边，它就与人类平起平坐。

谷歌 DeepMind 的研究人员现在正试图通过具体定义该术语来使讨论更加精确。至关重要的是，他们建议我们不应该将 AGI 作为最终目标，而应该考虑不同级别的 AGI，当今领先的聊天机器人代表了阶梯上的第一级。

该团队在arXiv上发布的预印本中写道：“我们认为，人工智能研究社区明确反思 AGI 的含义，并渴望量化人工智能系统的性能、通用性和自主性等属性至关重要。”

研究人员指出，他们从自动驾驶中获得了灵感，自动驾驶的功能分为六个级别的自主权，他们说这使得可以清晰地讨论该领域的进展。

为了弄清楚他们应该在自己的框架中包含哪些内容，他们研究了其他人提出的一些领先的 AGI 定义。通过研究这些定义中共享的一些核心思想，他们确定了任何 AGI 定义都需要遵守的六个原则。

首先，定义应该关注能力，而不是人工智能用来实现这些能力的具体机制。这消除了人工智能像人类一样思考或有意识地获得 AGI 资格的需要。

他们还认为，对于 AGI 来说，仅具有通用性是不够的，模型还需要在执行的任务中达到一定的性能阈值。他们说，这种性能不需要在现实世界中得到证明——只需证明模型有潜力在某项任务上超越人类就足够了。

虽然有些人认为，除非人工智能体现在物理机器人机械中，否则真正的通用人工智能是不可能实现的，但 DeepMind 团队表示，这并不是通用人工智能的先决条件。他们说，重点应该放在认知和元认知领域的任务上，例如学会学习。

另一个要求是进步的基准具有“生态有效性”，这意味着人工智能是根据人类重视的现实世界任务来衡量的。最后，研究人员表示，重点应该放在绘制 AGI 开发进展图上，而不是专注于单一终点。

基于这些原则，该团队提出了一个他们称之为“AGI 级别”的框架，该框架概述了一种根据算法的性能和通用性对算法进行分类的方法。级别范围从“新兴”（指相当于或略优于非熟练人类的模型）到“有能力”、“专家”、“艺术大师”和“超人”（指超越所有人类的模型）。这些级别可以应用于狭义或通用人工智能，这有助于区分高度专业化的程序和旨在解决广泛任务的程序。

研究人员表示，一些狭义的人工智能算法，例如 DeepMind 的蛋白质折叠算法 AlphaFold，已经达到了超人的水平。更具争议性的是，他们认为 OpenAI 的 ChatGPT 和 Google 的 Bard 等领先的人工智能聊天机器人是新兴 AGI 的例子。

纽约大学人工智能研究员 Julian Togelius 向《麻省理工科技评论》表示，区分性能和通用性是区分先前人工智能进步和通用人工智能进展的有效方法。更广泛地说，这项工作有助于使 AGI 讨论更加精确。 “这为这个主题提供了一些急需的清晰度，”他说。 “太多人在谈论 AGI 一词时并没有认真思考其含义。”

DeepMind 团队概述的框架不太可能赢得所有人的支持，并且对于不同模型应该如何排名肯定会存在分歧。但如果幸运的话，它将让人们更深入地思考该领域核心的关键概念。

图片来源：资源数据库/ Unsplash

原文： https://singularityhub.com/2023/11/26/deepmind-defines-artificial-general-intelligence-and-ranks-todays-leading-chatbots/