与 ChatGPT 等 AI 聊天机器人交互可能很有趣,有时甚至很有用,但日常 AI 的下一个层次不仅仅是回答问题:AI 代理为您执行任务。
包括OpenAI 、微软、谷歌和Salesforce在内的各大科技公司最近都发布或宣布了开发和发布AI代理的计划。他们声称这些创新将为医疗保健、机器人、游戏和其他业务中使用的底层系统的技术和管理流程带来新的效率。
可以教会简单的人工智能代理回复通过电子邮件发送的标准问题。更高级的人可以预订跨大陆商务旅行的机票和酒店机票。谷歌最近向记者展示了Project Mariner ,这是一款 Chrome 浏览器扩展,可以推理屏幕上的文本和图像。
在演示中,代理人通过将商品添加到杂货连锁店网站上的购物车中来帮助计划膳食,甚至在某些成分没有时寻找替代品。仍然需要有人参与才能完成购买,但可以指示代理商采取所有必要的步骤。
从某种意义上说,你是一个代理人。你每天在你的世界中采取行动来回应你所看到、听到和感觉到的事情。但人工智能代理到底是什么?作为一名计算机科学家,我提供这样的定义:人工智能代理是一种技术工具,可以了解给定环境的很多信息,然后通过人类的一些简单提示,在该环境中解决问题或执行特定任务。
规则和目标
智能恒温器是一个非常简单的代理的例子。它感知环境的能力仅限于告诉它温度的温度计。当房间温度低于一定水平时,智能恒温器会通过调高热量来做出响应。
当今人工智能代理的一个熟悉的前身是 Roomba。例如,机器人吸尘器可以学习铺有地毯的客厅的形状,以及地毯上有多少污垢。然后它根据该信息采取行动。几分钟后,地毯就干净了。
智能恒温器是人工智能研究人员所谓的简单反射代理的一个例子。它做出决策,但这些决策很简单,并且仅基于智能体当时的感知。扫地机器人是一个基于目标的代理,其目标只有一个:清洁它可以到达的所有地板。它做出的决定——何时转动、何时升高或降低刷子、何时返回充电底座——都是为了实现这一目标。
基于目标的代理只需通过任何所需的手段实现其目标即可取得成功。目标可以通过多种方式实现,然而,其中一些可能比其他方式更令人满意或更不令人满意。
当今的许多人工智能代理都是基于效用的,这意味着它们更多地考虑如何实现其目标。在决定如何进行之前,他们会权衡每种可能方法的风险和收益。他们还能够考虑相互冲突的目标,并决定实现哪个目标更重要。他们通过选择考虑用户独特偏好的操作来超越基于目标的代理。
做出决定,采取行动
当科技公司提到人工智能代理时,他们并不是在谈论聊天机器人或像 ChatGPT 这样的大型语言模型。尽管在网站上提供基本客户服务的聊天机器人从技术上讲是人工智能代理,但它们的感知和行动是有限的。聊天机器人代理可以感知用户输入的单词,但它们可以采取的唯一操作是回复文本,希望为用户提供正确或信息丰富的响应。
人工智能公司所指的人工智能代理比 ChatGPT 等大型语言模型有重大进步,因为它们能够代表使用它们的人和公司采取行动。
OpenAI 表示,代理很快就会成为人们或企业可以独立运行数天或数周的工具,无需检查其进度或结果。 OpenAI和Google DeepMind的研究人员表示,智能体是通向通用人工智能或“强”人工智能(即在许多领域和任务中超越人类能力的人工智能)的又一步。
人们今天使用的人工智能系统被认为是狭义人工智能或“弱”人工智能。一个系统可能擅长某个领域(也许是国际象棋),但如果投入西洋跳棋游戏中,同样的人工智能将不知道如何运作,因为它的技能无法转化。通用人工智能系统能够更好地将其技能从一个领域转移到另一个领域,即使它以前从未见过新领域。
值得冒险吗?
人工智能代理是否准备好彻底改变人类的工作方式?这将取决于科技公司是否能够证明智能体不仅能够执行分配给他们的任务,而且能够在出现新挑战和意外障碍时应对它们。
人工智能代理的采用还取决于人们是否愿意让他们访问潜在的敏感数据:根据您的代理的目的,它可能需要访问您的互联网浏览器、电子邮件、日历以及其他应用程序或系统与给定的作业相关。随着这些工具变得越来越普遍,人们将需要考虑他们想要与他们共享多少数据。
人工智能代理系统的破坏可能会导致有关您的生活和财务的私人信息落入坏人之手。如果这意味着代理可以为您节省一些工作,您愿意承担这些风险吗?
当人工智能代理做出错误的选择或用户不同意的选择时会发生什么?目前,人工智能代理的开发人员正在让人类了解情况,确保人们有机会在做出任何最终决定之前检查代理的工作。在 Project Mariner 示例中,Google 不会让代理商进行最终购买或接受该网站的服务条款协议。通过让您随时了解情况,系统让您有机会撤销代理做出的任何您不批准的选择。
与任何其他人工智能系统一样,人工智能代理也会受到偏见的影响。这些偏差可能来自代理最初训练的数据、算法本身或代理输出的使用方式。让人们参与进来是减少偏见的一种方法,方法是确保决策在执行之前经过人们的审查。
这些问题的答案可能会决定人工智能代理的受欢迎程度,并取决于一旦人们开始使用它们,人工智能公司可以在多大程度上改进它们的代理。
本文根据知识共享许可从The Conversation重新发布。阅读原文。
图片来源: Unsplash上的Ant Rozetsky