我的第一份工作是报童:
这项工作非常类似:一捆报纸会被送到我家,我会用橡皮筋(或下雨时用塑料袋)把它们包起来,装在帆布袋里,然后骑上我的自行车;每月一次,我的父母会开车带我到处收款。我几乎没有意识到我的角色对报纸的整体盈利能力有多么重要。
报纸喜欢认为他们赚钱是因为人们依赖他们来获取新闻,这些新闻是由他们无畏的记者和辛勤工作的编辑提供的。人们不仅直接向报纸付费,而且广告商也乐于为将他们的产品放在记者无与伦比的散文旁边的特权而付费。互联网揭示了这种世界观的致命缺陷:报纸所提供的是分发,这要归功于印刷机之类的基础设施以及您真正的基础设施。
一旦互联网将传播成本降低到零,三个事实就出现了:第一,“新闻”一旦发布,就没有经济价值。其次,报纸不再有地域垄断,而是与全球所有出版物竞争。第三,广告商不关心内容,而是关心吸引客户。
我在 2015 年的《打破出版泡沫》中阐明了这三个真理:
编辑和广告曾经是捆绑的;接下来,互联网将社论和广告分开,为两者提供了无数的选择;最后一步是将广告转移到可以直接访问用户的平台上,从而使报纸的影响力很大,无法通过它获利。
创意传播价值链
尽管报纸可能会怨恨互联网,但它们自己的商业模式——以及我的送纸工作——是基于一项我认为是互联网最终影响的唯一竞争对手的发明:印刷机。然而,这两项发明只是创意传播价值链的两个部分。该价值链有五个部分:
人类交流的发展一直是为了消除这个价值链中的任何瓶颈。在人类书写之前,信息只能通过口头传达;这意味着一个想法的创造、发声、传递和消费都是一回事。不过,写作是非捆绑式消费,增加了可以消费一个想法的人数。
现在新的瓶颈是重复:为了让更多的人接触到所写的任何东西,必须费力地手工复制,这极大地限制了记录和保存的想法。印刷机消除了这个瓶颈,大大增加了可以经济地分发的想法的数量:
新的瓶颈是分销,也就是说这是新的赚钱地方;因此,上述报纸的盈利能力。然而,这个瓶颈被互联网消除了,它使分发免费并且可供任何人使用。
剩下的是最后一个捆绑:一个想法的创造和证实。以我自己为例,我有很多想法,多亏了互联网,我有能力将它们分发到全球;然而,我仍然需要把它们写下来,就像艺术家需要创造形象,或者音乐家需要写歌一样。然而,越来越清楚的是,这也是一个即将被消除的瓶颈。
与本文中的前两个图像一样,此图像是由 AI(特别是Midjourney )创建的。就像那两个图像一样,不太正确:我想要“一扇稍微打开的门,光线从裂缝中射出”,但我最终得到了一扇门,中间有一道光裂缝和字面上的洪水;与此同时,我骑自行车的男孩少了几条肢体,他的自行车没有车把,而印刷机的复杂性则毫无意义。
不过,它们确实传达了我想要表达的想法:一个送报纸的男孩,作为基础设施的印刷机,以及被打开的门的另一边压倒的感觉——而且它们都是自由的。 1用这篇文章的话说,我有这个想法,但 AI 为我证实了它——想法传播价值链中的最后一个瓶颈正在被消除。
人工智能民主化
所有这些人工智能应用程序的显着之处在于它们回到了语言本身; Roon在Scale 博客上写到关于大型语言模型 (LLM) 的文章:
在机器学习范式的先前迭代中,研究人员痴迷于清理他们的数据集,并确保他们的模型看到的每个数据点都是原始的、黄金标准的,并且不会干扰数十亿参数的脆弱学习过程。模型空间。许多人开始意识到,在深度学习领域,数据规模胜过大多数其他优先事项。利用允许模型与数据复杂性同步扩展的通用方法是一种优越的方法。现在,在 LLM 时代,研究人员倾向于将整山的几乎没有过滤、大部分未经编辑的互联网碎片倾倒到一个饥饿模型的急切胃口中。
Roon 的重点是作为通用输入的文本和结缔组织。 2请注意这种洞察力如何适用于交流的整体发展:口头交流是写作和阅读的先决条件;普及识字是任何人能够在互联网上发表文章的先决条件;由零边际分布促成的文本和图像泛滥是模型的先决条件,这些模型将一个想法的创造和它的证实分开。
通过扩展,这暗示了一个更令人惊讶的结论:人工智能从根本上集中化的广泛假设——包括你的真实假设——可能是错误的。如果不只是数据,而且干净的数据被认为是先决条件,那么很明显,具有收集和清理数据资源的大规模中心化平台——谷歌、Facebook 等——将具有很大的优势。我承认,这也是我特别容易接受的一个结论,因为我专注于聚合理论及其对互联网如何与最初的假设相反的描述,导致集中化。
大型语言模型的最初推出似乎证实了这一观点:两个最突出的大型语言模型来自 OpenAI 和 Google;虽然两者都描述了它们的文本(分别为 GPT 和 GLaM)和图像(分别为 DALL-E 和 Imagen)生成模型是如何工作的,但您要么通过 OpenAI 的受控 API 访问它们,要么在谷歌的情况下根本不访问它们.但随后在今年夏天推出了上述 Midjourney,任何人都可以通过其 Discord 机器人免费使用。更大的惊喜是Stable Diffusion的发布,它不仅是免费的,而且是开源的——生成的模型可以在您自己的计算机上运行。
如您所料,质量有所不同。例如,Dall-E 有最逼真的“送报纸的男孩扔报纸”:
稳定的扩散在光谱的另一端:
然而,重要的是要注意每个项目路径的方向,而不是它们在旅程中的位置。在某种程度上,大型语言模型(我应该注意到,虽然我专注于图像生成,但也有很多公司也在研究文本输出)不依赖于精心策划的数据,而是依赖于互联网本身,是人工智能民主化的程度,无论好坏。
对创作者的影响
更糟糕的情况很容易想象; Charle Warzel在一篇关于 Alex Jones 的帖子中使用 AI 图像作为插图发布了一个错误:
我告诉 Bors,我感觉最糟糕的是,我最终决定使用 Midjourney 是多么愚蠢。我忙于自己的工作和生活责任,并试图让我的时事通讯及时出版。我去了盖蒂,看到了亚历克斯·琼斯的几张照片,我知道他很喜欢他的照片到处都是。我不想再用同样的照片,我也不想用他的一模一样。我还自私地希望这篇文章看起来与那天发表的关于亚历克斯琼斯和桑迪胡克诽谤审判的 30 篇文章不同。所有这些都在潜意识中压倒了我非常了解的围绕人工智能艺术的所有复杂伦理问题。
我对我的场景感到担心的是,Midjourney 是如此易于使用,如此易于访问,并且它解决了一个问题(以视觉上吸引人的方式抽象出琼斯的图像),我没有太多时间或动力停下来思考它通过。我可以很容易地看到其他人像我一样陷入这种情况。
由于这些原因,我认为我不会使用 Midjourney 或任何类似的工具来说明我的时事通讯未来(如果我在以后撰写有关该技术并想展示示例的情况除外)。即使这项工作不会交给一个不同的、值得的、人类艺术家,我认为光学很糟糕,而且我确实担心在帮助在这个方向开创任何先例方面发挥任何作用。和其他人一样,我也对用于训练这些艺术工具的语料库以及他们使用来自知名艺术家和鲜为人知的艺术家的大量艺术作品而没有向这些艺术家进行任何补偿或披露的可能性存有疑问。 (我联系了 Midjourney 询问了一些关于他们如何选择数据语料库来训练工具的澄清问题,但他们没有回应。)
我理解 Warzel 的观点,并希望向担心 AI 生成的艺术对其生计影响的艺术家表示声援。在我看来,他们担心是对的:我打开这篇文章讨论了报纸的消亡,一旦复制和分发之间的联系被切断,它们的商业模式很快就会崩溃。如果想法创造和想法证实之间的联系被切断,那么假设所有随之而来的商业模式可能会遭受同样的命运似乎是合理的。
不过,有两个反驳:第一个是富足有其自身的回报。在这方面我有独特的偏见,看到我作为出版商如何在互联网上谋生,有效地与《纽约时报》竞争,但我认为不仅仅是数量,而且从绝对意义上来说,可用于内容的质量世界上的每一个人都比分配瓶颈消除之前的水平要高得多。很明显,消除想法中的证实瓶颈也会产生更多好的想法(同时,根据定义,不太好的想法会增加更多)。
与出版的类比也指出了受这些模型影响的任何职业的长期趋势:依赖于创意创造和证实的结构捆绑的相对无差异的创造者将减少为与零边际成本创造者竞争产生的注意力并由聚合器指导;然而,高度差异化的创作者,如果他们能够以自己的方式可持续地提供创作和证实,将更加有价值。例如,社交媒体对差异化的出版商来说是一个巨大的福音:它给读者一个扩音器,告诉每个人所说的出版商有多棒。这些人工智能工具将对高度差异化的创作者产生类似的影响,他们将利用基于文本的迭代来使自己比以往任何时候都更有生产力和原创性。
第二个反驳可能更严峻:无论如何这都会发生。 Warzel 可能愿意忽略使用 Midjourney 带来的便利性以及质量方面的明显改进,但很少有人会做出同样的选择。正如上图所示,人工智能生成的图像很快就会泛滥成灾,就像在互联网上发布很快就压倒了旧的报纸商业模式一样。
此外,正如原生互联网内容是用户生成的内容一样,人工智能生成内容的迭代和协作性质——既是已经创建的内容的副产品,也是每个输出都可以进一步迭代的事实被其他人所依赖——将被证明比专业组织所能生产的更有趣和更可扩展。 TikTok从其网络中提取内容以吸引用户,是用户生成内容的典范。元宇宙可能是人工智能生成内容的典范。