在人们期望人工智能能够模仿的所有人类智力形式中,很少有人会把创造力放在首位。创造力是极其神秘的——而且转瞬即逝,令人沮丧。它将我们定义为人类,并且似乎违背了机器硅幕背后的冷酷逻辑。
然而,人工智能在创造性活动中的应用正在不断增长。
DALL-E 和 Midjourney 等新的人工智能工具越来越多地成为创意制作的一部分,有些工具已经开始因其创意输出而获奖。日益增长的社会和经济影响——仅举一个例子,人工智能产生新的创意内容的潜力是好莱坞编剧罢工背后的一个决定性的爆发点。
如果我们最近对人工智能惊人的原创性的研究有任何迹象的话,那么基于人工智能的创造力的出现——以及它的前景和危险的例子——很可能才刚刚开始。
新颖性与实用性的结合
当人们最具创造力时,他们会通过创造新的东西(以前不存在的产品或解决方案)来响应需求、目标或问题。
从这个意义上说,创造力是一种以有用或令人满意的新颖方式结合现有资源(想法、材料、知识)的行为。很多时候,创造性思维的结果也是令人惊讶的,导致了创造者没有——也许无法——预见到的事情。
它可能涉及一项发明、一个意想不到的笑话或突破性的物理学理论。它可能是音符、节奏、声音和歌词的独特排列,从而产生一首新歌。
因此,作为一名创造性思维的研究者,我立即注意到最新版本的人工智能(包括GPT-4)生成的内容有一些有趣的地方。
当提示需要创造性思维的任务时,GPT-4 输出的新颖性和实用性让我想起了我作为教师和企业家共事过的学生和同事所提交的创造性想法。
这些想法不同且令人惊讶,但又相关且有用。而且,当需要时,非常富有想象力。
考虑一下向 GPT-4 提供的以下提示:“假设所有孩子在一周中的某一天都变成了巨人。会发生什么?” GPT-4 产生的想法涉及文化、经济、心理学、政治、人际交往、交通、娱乐等等——就产生的新颖联系而言,许多想法令人惊讶和独特。
这种新颖性和实用性的结合很难实现,大多数科学家、艺术家、作家、音乐家、诗人、厨师、创始人、工程师和学者都可以证明这一点。
然而人工智能似乎正在做到这一点,而且做得很好。
测试人工智能
我与创造力和创业研究人员Christian Byrge和Christian Gilde一起,决定通过参加托伦斯创造性思维测试(TTCT)来测试人工智能的创造力。
TTCT 提示考生发挥现实生活任务所需的创造力:提出问题、如何变得更足智多谋或更有效率、猜测因果关系或改进产品。正如上面的例子所示,它可能会要求考生提出改进儿童玩具的建议或想象假设情况的后果。
这些测试并不是为了衡量历史创造力,一些研究人员用历史创造力来描述莫扎特和爱因斯坦等人物的变革性才华。相反,它评估个人的一般创造力,通常称为心理或个人创造力。
除了通过 GPT-4 运行 TTCT 八次之外,我们还对 24 名本科生进行了测试。
所有结果均由 Scholastic Examination Service 训练有素的评审员进行评估,该服务是一家为 TTCT 提供评分的私人测试公司。他们事先并不知道他们要评分的一些测试是由人工智能完成的。
由于学术考试服务是一家私营公司,因此它不会与公众分享其提示。这确保了 GPT-4 无法在互联网上抓取过去的提示及其响应。此外,该公司还拥有一个由大学生和成人完成的数千项测试的数据库,提供了一个大型的额外对照组来比较人工智能分数。
我们的结果?
GPT-4 因其想法的原创性而在考生中得分位于前 1%。根据我们的研究,我们相信这标志着人工智能达到或超过人类原创思维能力的首批例子之一。
简而言之,我们相信像 GPT-4 这样的人工智能模型能够产生人们认为意想不到的、新颖的和独特的想法。其他研究人员在人工智能和创造力的研究中也得出了类似的结论。
是的,创造力是可以评估的
人工智能新兴的创造力令人惊讶,原因有很多。
其一,研究界之外的许多人仍然认为创造力无法定义,更不用说评分了。然而,数千年来,人类新颖和独创性的产品一直受到珍视并被买卖。至少从 20 世纪 50 年代起,创造性工作就已经在心理学等领域得到了定义和评分。
研究员梅尔·罗兹 (Mel Rhodes) 在 1961 年提出了创造力的“人、产品、过程和媒体”模型,试图对迄今为止理解和评估创造力的无数方式进行分类。从那时起,人们对创造力的理解不断加深。
还有一些人对“创造力”一词可能适用于计算机等非人类实体感到惊讶。在这一点上,我们倾向于同意认知科学家玛格丽特·博登(Margaret Boden)的观点,她认为创造力一词是否应该应用于人工智能的问题是一个哲学问题,而不是科学问题。
人工智能的创始人预见到了它的创造能力
值得注意的是,我们在研究中仅研究了人工智能的输出。我们没有研究它的创作过程,这可能与人类的思维过程或产生想法的环境有很大不同。如果我们将创造力定义为需要人类,那么根据定义,我们就不得不得出结论,人工智能不可能具有创造力。
但无论创造力的定义和创作过程如何争论,最新版本的人工智能生成的产品都是新颖且有用的。我们相信这满足了目前在心理学和科学领域占主导地位的创造力的定义。
此外,人工智能当前迭代的创造力并不完全出乎意料。
在1956 年达特茅斯夏季人工智能研究项目的著名提案中,人工智能的创始人强调了他们模拟“学习的各个方面或智能的任何其他特征”的愿望——包括创造力。
在同一个提案中,计算机科学家纳撒尼尔·罗切斯特透露了他的动机:“我怎样才能制造出一台在解决问题时表现出独创性的机器?”
显然,人工智能的创始人相信创造力,包括想法的原创性,是机器可以模仿的人类智能的特定形式之一。
对我来说,GPT-4 和其他人工智能模型令人惊讶的创造力分数凸显了一个更紧迫的问题:在美国学校内,迄今为止,很少有专门针对人类创造力并培养其发展的官方项目和课程。
从这个意义上说,人工智能现在实现的创造力可能为教育工作者和其他有兴趣提高人类创造力的人提供一个“人造卫星时刻”,包括那些将创造力视为个人、社会和经济增长的基本条件的人。
本文根据知识共享许可从The Conversation重新发布。 阅读 原文。
图片来源: Google DeepMind / Unsplash
原文: https://singularityhub.com/2023/09/10/openais-gpt-4-scores-in-the-top-1-of-creative-thinking/