“这是一个真实的故事,讲述了 25 个电子游戏角色被选中住在一个小镇并录制他们的生活……以了解当计算机不再礼貌时会发生什么……并开始变得真实。”
谷歌和斯坦福大学的研究人员最近制作了一个新的真人秀节目——用人工智能代理而不是人。
使用 OpenAI 的病毒聊天机器人 ChatGPT 和一些自定义代码,他们生成了 25 个具有背景故事、个性、记忆和动机的 AI 角色。然后,研究人员将这些角色放入一个 16 位视频游戏小镇,让他们继续他们的生活。那么,当计算机开始变得真实时会发生什么?
“生成代理醒来,做早餐,然后去上班,”研究人员在 arXiv 上发布的一篇概述该项目的预印本论文中写道。 “艺术家作画,作者写作;他们形成意见,互相注意,并发起对话;他们在计划第二天时会记住并反思过去的日子。”
不完全是引人入胜的电视,但归根结底是一个巨大的机器学习算法……自言自语,令人惊讶地栩栩如生。
AI 小镇 Smallville 只是 AI 迷人时刻的最新发展。虽然 ChatGPT 的基本版本一次进行一次交互——编写提示,获得回复——但许多分支项目正在将 ChatGPT 与其他程序结合起来,以自动完成一系列任务。这些可能包括制作待办事项清单并逐一核对清单上的项目、谷歌搜索信息并总结结果、 编写和调试代码,甚至批评和纠正 ChatGPT 自己的输出。
正是这些级联的互动让《超人前传》也能运作起来。研究人员精心设计了一系列配套算法,这些算法共同为简单的人工智能代理提供支持,这些代理可以存储记忆,然后根据这些记忆进行反思、计划和行动。
第一步是创建角色。为此,研究人员以详细提示的形式编写基本记忆,描述该角色的个性、动机和情况。这是论文中的一个简短示例:“John Lin 是 Willow Market and Pharmacy 的一名药店店主,他喜欢帮助别人。他一直在寻找使客户更容易获得药物的方法。 John Lin 与大学教授妻子 Mei Lin 和正在学习音乐理论的儿子 Eddy Lin 住在一起。”
但表征还不够。每个角色也需要一段记忆。因此,该团队创建了一个名为“记忆流”的数据库,用日常语言记录代理人的经历。
当访问记忆流时,代理会显示最近的、重要的和相关的记忆。最“重要”的事件被记录为独立的记忆,研究人员称之为“反思”。最后,智能体使用一组越来越详细的提示来创建计划,这些提示将一天分成越来越小的时间增量——每个高级计划因此被分解成更小的步骤。这些计划也被添加到内存流中以供检索。
随着智能体开始一天的工作——将文本提示转化为行动以及与游戏中其他角色的对话——它利用其经验、思考和计划的记忆流来通知每个行动和对话。同时,新的体验反馈到信息流中。这个过程相当简单,但当通过 ChatGPT 接口与 OpenAI 的大型语言模型相结合时,输出却出奇地复杂,甚至是突发的。
在一次测试中,该团队促使一个角色伊莎贝拉计划一个情人节派对,并促使另一个角色玛丽亚暗恋第三个角色克劳斯。伊莎贝拉继续邀请朋友和顾客参加聚会,装饰咖啡馆,并招募她的朋友玛丽亚帮忙。玛丽亚向克劳斯提到了派对并邀请他和她一起去。五名特工参加了聚会——但同样是人——有几个人表现不佳或根本没有出现。
除了最初的种子——党的计划和迷恋——其余的都是自动出现的。作者写道:“传播信息、装饰、互相约见、到达派对以及在派对上相互交流等社交行为都是由代理架构发起的。”
值得注意的是,在大多数情况下,这可以通过简单地将 ChatGPT 拆分为多个功能部分和个性并相互发挥作用来实现。
视频游戏是这种可信、开放式交互的最明显应用,尤其是与高保真化身结合使用时。非玩家角色可以从脚本交互演变为与令人信服的人物对话。
研究人员警告说,人们可能会试图与现实人物建立关系——这种趋势已经存在——设计师应该注意添加内容护栏,并在角色是代理人时始终否认。其他风险包括一般适用于生成式 AI 的风险,例如错误信息的传播和对代理的过度依赖。
这种方法在主流视频游戏中可能还不够实用,但它确实表明这样的未来可能很快就会到来。
代理商的更大趋势也是如此。 尽管大肆宣传,但目前的实施仍然有限。但是连接多种算法——通过插件和互联网访问完成——可能会允许创建有能力的、类似助手的代理,这些代理可以在提示时执行多步任务。从长远来看,这种自动化人工智能可能非常有用,但也会带来算法失调导致大规模意外问题的风险。
目前,最明显的是生成式 AI 与开发人员和研究人员社区之间的舞蹈如何继续呈现出令人惊讶的新方向和新功能——一个目前还没有放缓迹象的反馈循环。
图片来源:“生成代理:人类行为的交互式模拟”,Joon Sung Park、Joseph C. O’Brien、Carrie J. Cai、Meredith Ringel Morris、Percy Liang、Michael S. Bernstein