要了解未来会是什么样子,研究我们的历史通常很有帮助。这就是我将在本文中做的事情。我回顾计算机和人工智能的简史,看看我们对未来的期望。
我们是怎么来到这里的?
即使是最近的计算机技术对今天的我们来说也是如此古老,世界变化的速度变得多么迅速。 90 年代的手机是带有绿色小显示屏的大砖块。二十年前,计算机的主要存储设备是穿孔卡片。
在短时间内,计算机发展得如此之快,并成为我们日常生活中不可或缺的一部分,以至于很容易忘记这项技术有多新。如时间表所示,第一台数字计算机大约在八年前才发明。
从这段历史的早期开始,一些计算机科学家就一直在努力使机器像人类一样聪明。下一个时间表展示了一些著名的人工智能系统并描述了它们的能力。
我提到的第一个系统是忒修斯。它由克劳德·香农 (Claude Shannon) 于 1950 年制造,是一种遥控鼠标,能够在迷宫中找到出路并记住其路线。 1七十年来,人工智能的能力取得了长足的进步。
人工智能系统的语言和图像识别能力现已与人类相媲美
人工智能系统的语言和图像识别能力发展非常迅速。
该图表通过放大过去 20 年的 AI 发展展示了我们是如何走到这一步的。绘制的数据来自大量测试,这些测试在五个不同的领域评估了人类和人工智能的表现,从手写识别到语言理解。
在五个领域中的每一个领域中,AI 系统的初始性能都设置为 -100,而人类在这些测试中的表现被用作设置为零的基线。这意味着当模型的性能越过零线时,人工智能系统在相关测试中的得分高于在同一测试中进行的人类得分。 2个
就在 10 年前,没有机器能够可靠地提供人类水平的语言或图像识别。但是,如图表所示,人工智能系统的能力已经稳步提高,并且现在在所有这些领域的测试中都击败了人类。
在这些标准化测试之外,这些 AI 的性能参差不齐。在一些现实世界的案例中,这些系统的表现仍然比人类差得多。另一方面,此类 AI 系统的一些实现已经非常便宜,可以在你口袋里的手机上使用:图像识别对你的照片进行分类,语音识别转录你的口述。
从图像识别到图像生成
上图显示了人工智能感知能力的快速发展。人工智能系统也变得更有能力生成图像。
这一系列的九张图片展示了过去九年的发展。这些图像中的人都不存在;所有这些都是由人工智能系统生成的。
该系列从左上角的一张 2014 年的图像开始,这是一张黑白像素化面部的原始图像。正如第二行第一张图片所示,仅仅三年后,人工智能系统就已经能够生成难以与照片区分开来的图像。
近年来,人工智能系统的能力变得更加令人印象深刻。虽然早期系统专注于生成人脸图像,但这些较新的模型将其功能扩展到基于几乎任何提示的文本到图像生成。右下角的图片显示,即使是最具挑战性的提示,例如“一只博美犬正戴着王冠坐在国王的宝座上。两个虎兵站在宝座旁边” ——几秒钟内变成逼真的图像。 4个
语言识别和生产发展迅速
与图像生成 AI 的进步一样引人注目的是解析和响应人类语言的系统的快速发展。
图中显示的示例来自谷歌开发的名为 PaLM 的人工智能系统。在这六个例子中,系统被要求解释六个不同的笑话。我发现右下角的解释特别引人注目:AI 解释了一个反笑话,专门用来混淆听众。
在过去的几年里,产生语言的人工智能以多种方式进入了我们的世界。电子邮件自动完成,大量在线文本得到翻译,视频自动转录,学童使用语言模型做作业,报告自动生成,媒体机构发布AI 生成的新闻。
人工智能系统还不能生成长而连贯的文本。在未来,我们将看到最近的发展是否会放缓——甚至结束——或者我们是否有一天会读到一本人工智能写的畅销小说。
我们现在在哪里:人工智能就在这里
人工智能能力的这些快速进步使得在广泛的新领域中使用机器成为可能:
当你预订航班时,通常是人工智能而不是人类来决定你支付的费用。当你到达机场时,它是一个人工智能系统,可以监控你在机场的行为。一旦您登上飞机,人工智能系统就会协助飞行员将您送往目的地。
人工智能系统也越来越多地决定你是否获得贷款、是否有资格享受福利或是否被录用从事特定工作。他们越来越多地帮助决定谁可以出狱。
一些政府正在购买用于战争的自主武器系统,一些政府正在使用人工智能系统进行监视和镇压。
AI 系统有助于对您使用的软件进行编程并翻译您阅读的文本。在过去十年中,由语音识别操作的虚拟助手已进入许多家庭。现在自动驾驶汽车正在成为现实。
在过去的几年里,人工智能系统帮助在一些最棘手的科学问题 上取得了进展。
称为推荐系统的大型 AI 决定您在社交媒体上看到的内容、在线商店中向您展示的产品以及在 YouTube 上向您推荐的内容。他们越来越多地不仅仅是推荐我们消费的媒体,而且基于他们生成图像和文本的能力,他们也在创造我们消费的媒体。
人工智能不再是未来的技术; AI 就在这里,现在的许多现实在最近才看起来像科幻小说。这是一项已经对我们所有人产生影响的技术,上面的列表仅包括其众多应用中的一小部分。
广泛列出的应用程序清楚地表明,这是一种非常通用的技术,人们可以将其用于一些非常好的目标——也可以用于一些非常糟糕的目标。对于此类“两用技术”,重要的是我们所有人都了解正在发生的事情以及我们希望如何使用该技术。
就在二十年前,世界还很不一样。人工智能技术在未来能做什么?
接下来是什么?
我们刚刚考虑的人工智能系统是人工智能技术数十年来稳步发展的结果。
下面的大图表展示了过去八年的这段历史。它基于 Jaime Sevilla 及其同事制作的数据集。 7
此图表中的每个小圆圈代表一个 AI 系统。圆圈在水平轴上的位置表示 AI 系统的构建时间,它在垂直轴上的位置显示用于训练特定 AI 系统的计算量。
训练计算以浮点运算或简称 FLOP 衡量。一个 FLOP 相当于两个十进制数的一次加法、减法、乘法或除法。
所有依赖机器学习的人工智能系统都需要接受训练,在这些系统中,训练计算是驱动系统能力的三个基本因素之一。另外两个因素是用于训练的算法和输入数据。可视化显示,随着训练计算量的增加,人工智能系统变得越来越强大。
时间线可以追溯到 1940 年代,那是电子计算机的开端。第一个展示的 AI 系统是“Theseus”,这是我在开头提到的 Claude Shannon 1950 年的机器人鼠标。在时间线的另一端,您会发现像 DALL-E 和 PaLM 这样的人工智能系统,它们能够生成逼真的图像并解释和生成我们刚刚看到的语言。它们是迄今为止使用最大训练计算量的人工智能系统之一。
训练计算以对数标度绘制,因此从每条网格线到下一条网格线显示 100 倍的增长。从长远来看,这种情况会持续增加。在前六个十年中,训练计算量按照摩尔定律增长,大约每 20 个月翻一番。大约从 2010 年开始,这种指数式增长进一步加速,翻了一番,时间仅为 6 个月左右。这是一个惊人的快速增长速度。 8个
快速倍增时间已累积到大幅增加。 PaLM 的训练计算量为 25 亿 petaFLOP,比 AlexNet 大 500 万倍以上,AlexNet 是 10 年前训练计算量最大的 AI。 9
扩大规模已经呈指数级增长,并且在过去十年中大幅加速。对于 AI 的未来,我们可以从这一历史发展中学到什么?
研究长期趋势以预测人工智能的未来
人工智能研究人员研究这些长期趋势,以了解未来的可能性。 11
AI 研究人员 Ajeya Cotra 发表的这类研究也许是讨论最广泛的。她研究了训练计算量的增加,想知道在什么时间点,训练 AI 系统的计算量可以与人脑相媲美。这个想法是,在这一点上,人工智能系统将与人脑的能力相匹配。在她的最新更新中,Cotra 估计到 2040 年开发出这种“变革性人工智能”的可能性为 50%,距离现在不到二十年。 12
在一篇相关文章中,我讨论了变革性人工智能对世界意味着什么。简而言之,这个想法是这样一个人工智能系统将强大到足以将世界带入一个“质的不同的未来”。它可能导致人类历史上两个早期重大变革——农业和工业革命——规模的变化。这无疑代表了我们一生中最重要的全球变化。
Cotra 的工作在这方面尤为重要,因为她的预测基于我们刚刚研究的训练计算的历史长期趋势。但值得注意的是,其他基于不同考虑因素的预测者得出了大致相似的结论。正如我在关于 AI 时间线的文章中所展示的那样,许多 AI 专家认为,在未来几十年内,人类水平的人工智能确实有可能发展起来,有些人认为它会出现得更早。
建立公共资源以进行必要的公共对话
计算机和人工智能极大地改变了我们的世界,但我们仍处于这一历史的早期阶段。因为这项技术感觉如此熟悉,所以很容易忘记我们与之交互的所有这些技术都是最近的创新,而最深刻的变化尚未到来。
人工智能已经改变了我们所见、所知和所做的事情。尽管事实上这项技术只有很短的历史。
没有迹象表明这些趋势很快就会达到任何极限。相反,特别是在过去十年中,基本趋势在加速:对人工智能技术的投资迅速增加,训练计算量翻倍的时间缩短至仅六个月。
所有重大技术创新都会导致一系列积极和消极的后果。人工智能已经如此。随着这项技术变得越来越强大,我们应该预期它的影响会越来越大。
由于人工智能的重要性,我们都应该能够对这项技术的发展方向形成自己的看法,并了解这种发展如何改变我们的世界。为此,我们正在构建一个 AI 相关指标的存储库,您可以在OurWorldinData.org/artificial-intelligence上找到该存储库。
我们仍处于这段历史的早期阶段,许多可能发生的事情还没有到来。如此强大的技术发展应该成为我们关注的焦点。对于我们世界的未来——以及我们生活的未来——将如何发展,可能没有什么比这更重要了。
致谢:我要感谢我的同事 Natasha Ahuja、Daniel Bachler、Julia Broden、Charlie Giattino、Bastian Herre、Edouard Mathieu 和 Ike Saunders 对本文草稿的有益评论以及他们在准备可视化方面的贡献。