自从深度学习在 2012 年成为主流以来,围绕人工智能研究的炒作往往超过了现实。不过在过去的一年里,一系列突破和重大里程碑表明该技术可能最终会兑现其承诺。
尽管深度学习具有明显的潜力,但在过去十年中,关于超级智能失控的危险和技术失业前景的定期警告因大多数人工智能系统专注于识别猫的图像或提供有问题的从英语到中国人。
然而,去年,在创意产业、 基础科学和计算机编程等不同领域,人工智能系统的能力发生了不可否认的阶梯式变化。更重要的是,这些人工智能系统及其输出对普通人来说变得越来越可见和容易获得。
没有什么地方的进步比在新兴的生成人工智能领域更明显了,生成人工智能是一个包罗万象的术语,指的是大量参与创造性任务的模型。
这主要归功于一种称为 transformer 的模型,该模型实际上于 2017 年由谷歌首次推出。事实上,今年成为头条新闻的许多 AI 系统都是其开发人员为某些人开发的模型的更新。时间,但他们在 2022 年产生的结果已经将之前的迭代推翻了。
其中最突出的是 ChatGPT,这是一款基于 OpenAI 最新版 GPT-3 大型语言模型的人工智能聊天机器人。该服务于 11 月底向公众发布,以其进行听起来自然的对话、回答复杂的技术问题,甚至产生令人信服的散文和诗歌的不可思议的能力,一直让人们惊叹不已。
今年早些时候,另一个名为 DALL-E 2 的 OpenAI 模型在互联网上风靡一时,它能够生成超逼真的图像以响应诸如“1990 年代在温布尔登打网球的浣熊”和“蜘蛛侠”之类的奇异提示。来自古罗马。” Meta 在 9 月更进一步,推出了一个可以根据文本提示生成短视频剪辑的系统,谷歌研究人员甚至设法创建了一个人工智能,可以按照播放的音频剪辑的风格生成音乐。
AI 创造力和流畅性的爆发所带来的影响现在很难衡量,但它们已经引发了人们的预测,即它可能会取代传统的搜索引擎, 扼杀大学论文,并导致艺术的消亡。
这既是由于这些模型的改进功能,也是由于它们的可访问性不断提高, ChatGPT 、DALL-E 2 和文本到图像生成器 Midjourney 等服务免费向所有人开放(至少目前是这样)。更进一步,独立的人工智能实验室S table Diffusion甚至开源了他们的文本到图像人工智能,允许任何拥有适度强大计算机的人自己运行它。
人工智能在过去一年中也在更多平淡无奇的任务中取得了进展。今年 1 月,Deepmind 推出了 AlphaCode,这是一款由人工智能驱动的代码生成器,该公司称其可以在编码竞赛中与普通程序员匹敌。同样,由 GitHub 和 OpenAI 开发的人工智能编码工具 GitHub Co-pilot 从原型转变为商业订阅服务。
该领域的另一个主要亮点是人工智能在基础科学中的作用越来越突出。 7 月,DeepMind 宣布其开创性的 AlphaFold AI 已经预测了科学界已知的几乎所有蛋白质的结构,从而在生命科学和药物发现领域掀起了一场潜在的革命。该公司还在 2 月份宣布,它已经训练了人工智能来控制实验聚变反应堆内的旋转等离子体。
虽然 AI 似乎越来越远离该领域在过去十年中所关注的那种玩具问题,但它也在 AI 研究的支柱之一:游戏方面取得了重大进展。
11 月, M eta 展示了一款在棋盘游戏 Diplomacy中排名前 10% 的 AI,该游戏需要将策略与自然语言谈判与其他玩家进行具有挑战性的结合。同月,Nvidia 的一个团队训练了一个 AI仅使用高级自然语言指令来玩复杂的 3D 视频游戏 Minecraft 。去年 12 月,DeepMind 破解了极其复杂的游戏 Stratego ,其中涉及长期规划、虚张声势和适度的不确定性。
不过,这并非一帆风顺。尽管像 ChatGPT 这样的生成式 AI 的输出表面上令人印象深刻,但许多人很快指出它们是非常有说服力的废话生成器。他们接受了互联网上大量质量参差不齐的文本的培训。最终他们所做的只是猜测提示后最有可能出现的文本是什么,没有能力判断其输出的真实性。这引起了人们的担忧,即互联网可能很快就会充斥着大量看似令人信服的废话。
随着 Meta 的 Galactica AI 的发布,这一点被曝光,它应该总结学术论文,解决数学问题,并为科学家编写计算机代码以帮助加快他们的研究。问题是它会产生听起来很有说服力的材料,但完全错误或有很大偏见,并且该服务仅在三天内就被取消了。
偏见是这种新型人工智能的一个重要问题,它是根据来自互联网的大量材料进行训练的,而不是以前模型所提供的更精心策划的数据集。 ChatGPT 也出现了类似的问题,尽管 OpenAI 设置了过滤器,但它可能会被欺骗说只有白人和亚裔男性才能成为优秀的科学家。流行的 AI 图像生成应用程序Lensa被要求对女性肖像进行性感化处理,尤其是亚洲人的肖像。
人工智能的其他领域也经历了不尽如人意的一年。最受吹捧的现实世界用例之一,自动驾驶汽车,经历了重大挫折,随着福特和大众支持的 Argo的关闭,特斯拉抵制了因其未能实现“完全自主驾驶” 而提出的欺诈指控。 riving”,越来越多的声音声称该行业陷入了陈规。
尽管已经取得了明显的进步,但也有一些人,例如 Gary Marcus,他说深度学习正在达到极限,因为它无法真正理解它所训练的任何材料,而只是简单地学习制作可以产生令人信服但往往有缺陷的结果的统计联系。
但对于今年一些最令人印象深刻的成果背后的人来说,2022 年只是对即将到来的事情的一种体验。许多人预测,下一个重大突破将来自多模态模型,这些模型结合了从文本到图像和音频的各种越来越强大的功能。该领域能否在 2023 年保持增长势头还有待观察,但无论哪种方式,今年都可能成为 AI 研究的分水岭。
原文: https://singularityhub.com/2022/12/30/2022-was-the-year-ai-finally-started-living-up-to-its-hype/