在都柏林最近一个潮湿而悲惨的早晨,我向 Alexa 询问了未来一天的预报。该设备对贝鲁特的天气做出了欢快的回应,那里的气温是温和的 30 ° C。Alexa 真的在嘲笑我吗?作为一名计算机科学家,我知道这个“昙花一现”有一个更普通的解释:自动语音识别作为一项技术仍然远非完美。但作为一名对幽默算法工作有浓厚兴趣的计算机科学家,我对 Alexa 的行为感到兴奋多于恼火。
尽管我们倾向于担心我们的设备(以及它们背后的公司)对我们了解太多,但如果这些设备能够足够了解我们,可以像值得信赖的朋友一样和我们开玩笑,那该多好?在通往真正诙谐机器的道路上,仍然存在与玫瑰一样多的地雷,因为即使是一次性的俏皮话也需要复杂的决策网络,并以关于人和世界的丰富知识为前提。尽管如此,我相信我们的设备不会真正配得上“智能”的标签,除非它们足够了解我们——作为人类和个人——偶尔会装傻。
但问题是:上一次电脑真的让你发笑是什么时候?我们的设备会引发一系列情绪反应,但欢乐肯定是最罕见的。这种赋予机器真正幽默感的奇思妙想在大多数技术愿望清单中排名很低,这并不奇怪,尤其是因为我们怀疑我们的机器已经如此低地对待我们。尽管如此,人工智能研究人员可以列举的不仅仅是尝试的明显原因,而且将机器幽默视为不可笑的事情。
首先,计算模型要求我们把所有的牌都放在桌子上。我的书架上堆满了专业喜剧作家的富有洞察力的“如何做”书籍,尽管他们的大部分最佳建议都以算法的形式出现,但总是缺少一些东西,这是只有我们人类才能提供的X 因素。当我们将这些算法转化为软件时,对于“第 3 步:做一些聪明的事情”的魔幻现实主义并没有明确的翻译。可悲的是,代码不能那样工作。因此,我们构建了我们的发条小丑,以更好地了解是什么让我们滴答作响。
幽默的机器必然与人类价值观相协调,并且对其用户有更多的社会意识
这给我们带来了尝试的第二个原因:笑话通过向我们展示我们已经知道的东西让我们感到惊讶,尽管是从一个全新的角度来看,事实证明我们知道的很多。幽默感是对 AI 了解多少以及使用它的能力和灵活性的严峻考验。因为笑话突出了传统思维的局限性,人工智能研究人员研究幽默,以便让我们的机器对创造性的不协调具有同样的容忍度。第三个原因同样实用:幽默的机器必然与人类价值观相协调,并且对其用户具有更多的社会意识。
话虽如此,通常更容易获得资金来研究幽默的更清醒的亲属,例如隐喻、类比、讽刺或更普遍的创造性语言,而不是正面解决笑话。我合作的一个以幽默为中心的欧洲项目遭到英国极右翼政党 UKIP 政客的严厉谴责,他们宣称这是浪费纳税人的钱,也是退出欧盟的另一个理由。我自己团队的大部分研究都集中在具有明确商业案例的幽默方面,例如在社交媒体和在线产品评论中发现讽刺和讽刺。当一台机器无法检测到我们幽默的不真诚时,它不仅没有正确解释:它对我们的感受进行了最糟糕的误解。可怜的机器试图在 Twitter 上评估疫苗的情绪,正如我们当前的项目旨在做的那样,并遇到类似“如果他接种了疫苗,肯尼迪今天仍然活着”这样的推文。只需考虑一下需要多少常识知识才能发现潜伏在这种亲疫苗谈话要点的模仿之下的反疫苗情绪。
无论我们开始掌握爸爸笑话的甜美,校园双关语的下流,尖刻讽刺的酸味还是温和讽刺的微妙,所有的玩笑都需要我们首先成为期望的主人。直觉他人在给定环境中的期望,以及他们最有可能得出的结论,是在大幅降低这些期望之前建立这些期望的关键。这就是为什么这么多笑话会变成陈词滥调和刻板印象。 (想想已故的伟大的诺姆麦克唐纳讲的著名的飞蛾笑话。)陈词滥调通常是两个熟悉的想法之间的最短路径,但笑话带我们走了很长的路。它们使预期再次显得新鲜,并通过告诉我们我们已经知道的事情让我们感到惊讶。喜剧演员低价购买这些商品以便高价出售,尽管有些曲折。他们依靠陈词滥调和刻板印象背后的统计规律来与观众玩数字游戏。但是我们的电脑也可以玩数字游戏。
为了掌握人们的思维方式,机器可以首先模拟我们的说话方式。对大型文本语料库(例如大量网络)的统计分析将显示,我们更喜欢“鱼和薯条”这个词,而不是“薯条和鱼”,即使我们“穿上鞋子和袜子”。实际上以相反的顺序放置它们。例如,萨莎·拜伦·科恩(Sacha Baron Cohen)的虚构角色波拉特(Borat)的喜剧吸引力的一部分是,他如何蔑视这些统计规范,以表现出一种和蔼可亲但陌生的无知的气氛。创造性的文字游戏以深思熟虑、透明和可恢复的方式背离规范,我们可以通过将统计语言模型调整到大型数据集来对这一过程进行建模。
说到自己写噱头,电脑还在操场上
拿一句俏皮话来说:“我从未结过婚,但我在夫人身边有过几个。”一个好的模型会预测最后一个位置的失误,并为Mrs分配一个非常小的概率。这是检测阶段。对于恢复,非常不可能的Mrs与非常可能的未命中的声音相似性允许机器撤消替换并恢复潜在的习语。为了恢复小丑的意图,机器还必须理解为什么流产的婚姻是令人向往的未遂事件。由于这需要对笑话中升华的感受有情感上的理解,因此统计模型目前在这一领域还不是那么稳妥。然而,幽默方面的进步将与阅读(和激发)情感以及更普遍的情感计算方面的新进展齐头并进。良好的幽默感——无论是在笑话中恢复我们的意义,还是嵌入它自己的意义——是对机器真正“理解”我们能力的终极考验。
一个统计的“语言模型”捕捉到语音的隐藏规律,使我们的机器能够做出预测并识别出与规范的巧妙背离。通过反向应用相同的逻辑,他们也可以产生自己的偏离。图片由作者提供
在编写自己的噱头时,计算机仍然在操场上。他们对双关语相当熟练——认识我们的,生产他们的——但他们离掌握这种双关语还很远,因为需要有很好的幽默感才能将事故与真实事物区分开来。弯曲表面形式(例如拼写和发音)也比弯曲含义需要更少的洞察力,因此计算机在玩弄想法时经常会出错。
互联网上的巨魔机器人比搞笑机器人多得多,因为攻击更容易产生,无论是有意还是无意。这也是为什么机器在过滤在线滥用方面仍然做得很差的原因,以及为什么我们仍然需要人们来监管公平言论和仇恨言论之间的界限。可悲的是,我自己的机器人已经造成了意外的冒犯。玩语言就像玩一个巨大的火柴盒:你认为你已经预料到所有可能的危险,然后机器的语言混搭出现了一个强奸笑话、一个大屠杀笑话,或者说“你和你一样情绪化”一个女人。’我们经常指责那些担心这些事情的人缺乏幽默感,但事实恰恰相反:我们需要幽默感才能知道在哪里划清界限。
那么机器成为单口喜剧的可能性有多大?如果我们提前喂它们台词,机器人已经可以扮演站立的角色。你可以在 Alexa 上看到这一点,因为她的开发人员给了她数百个“复活节彩蛋”让她去发现(试试“Alexa,你能说唱吗?”或“Alexa,给我做个三明治”)。但如果你让 Alexa 给你讲个笑话,你会发现她的罐头食品库存已经止不住了。像 Nao 这样的拟人化机器人,类似于闪亮的蹒跚学步的大个子,在舞台上开着同样的笑话表现得更好,因为它们在情感上吸引了我们。我们会让他们成功,就好像在看我们自己的孩子在耶稣诞生的游戏中一样。我自己的小组使用两个 Nao 机器人,分别称为 Kim 和 Bap,来表演他们自己创造的毛茸茸的狗故事。但是可爱的小泰克斯总是让我们陷入困境。
有一次,当他们对《星球大战》采取行动时,Kim-as-Luke 爱上了 Bap-as-Leia——然后 Bap 立即给他做了晚餐。尽管机器人对性别刻板印象一无所知,但它们的行为被贴上了性别歧视的标签。当他们后来对唐纳德特朗普和希拉里克林顿之间的美国总统竞选提出自己的看法时,金和巴普让特朗普向克林顿求婚。他们需要一个理由让她答应。由于特朗普富有而有权势,克林顿接受了机器人,发现他的优良品质在地面上变得稀薄。他们和我们随后被随后一篇论文的评论者指责为将女性描绘成淘金者。如果机器不应该说出它们不能完全理解的东西——人类也是如此——那么我们必须给它们提供从不同角度看世界的工具。也就是说,我们必须给他们一种真正的幽默感。
但我们真的需要能够站立的人工智能吗?我们已经有大量的人类类型的笑话写作机器,他们的工作不会去任何地方。就像你的同事总是准备好用诙谐的俏皮话对喜剧专业人士构成威胁一样,具有幽默感的 AI 将为我们与机器以及彼此之间的日常互动提供润滑(通过短信应用程序的巧妙插件)和电子邮件),但不会用他们的行为卖掉任何竞技场。相反,随着人口老龄化和我们越来越依赖家中的机器,我们将需要我们的家庭护理伙伴变得更加友善。幽默感不仅仅是流利的笑话。它让我们可以嘲笑别人的故事,并通过舒缓焦虑来缓解紧张情绪。它为另一个人的价值观打开了一扇窗户,并且是他们性格的真诚。我们不需要我们的智能机器人成为单口喜剧演员。我们需要他们成为站立的人。这是人工智能研究人员认真对待机器幽默的最佳理由。
原文: https://psyche.co/ideas/when-will-humorous-ais-press-our-buttons-with-their-jokes