Google I/O 和即将到来的 AI 大战 – 搞英语 → 看世界

科技领域的一些事情令人震惊，但并不令人惊讶——想想一家陷入困境的公司的首席执行官失去了工作。当然，这个消息出乎意料，但仔细想想也是有道理的。不过，其他消息令人震惊和惊讶，谷歌 2 月份在巴黎的主题演讲——这似乎是对微软基于 GPT 的 Bing 公告的恐慌回应——两者兼而有之。

令人震惊的部分是演示文稿的糟糕程度：几乎没有新内容，幻灯片和扬声器不同步，当一位演示者开始演示时才意识到他们没有用于演示的电话。

令人惊讶的是，谷歌在 AI 方面会被掏腰包，这不仅仅是因为 AI 似乎是谷歌的最佳选择：事实上，谷歌多年来一直在谷歌 I/O 上特别谈论人工智能，而且我一直发现该公司的工作框架非常令人印象深刻。回到 2016 年，当时我摘录了 CEO Sundar Pichai 关于如何在其产品中使用机器学习的长篇大论并写道：

请注意特殊性——对于主题演讲来说似乎太过分了，但这绝对不是废话。毫不奇怪：Pichai 所说的一切正是谷歌创建的目的。这与鲍尔默惊呼他多么热爱 Windows 没有什么不同：这是微软使命的产品代表，这种观点或许让这位被免职的 CEO 对他无法继续前进感到一丝宽容。

接下来的 30 分钟非常棒：Google Now，尤其是 Now on Tap，令人印象深刻，Google Photos 看起来也很棒。而且，我可能会补充说，它有一个杀手级标语：Gmail for Photos。当你在做你想做的事，以及你是世界上最擅长的事情时，很容易清楚。

两年后，我称 Google I/O 无聊，我的意思是恭维：

这就是为什么我认为 Pichai 的“无聊”开场是一件了不起的事情。不，没有早期谷歌 I/O 的好战，坚持 Android 可以接管 iPhone。不，上周没有纳德拉的宏伟愿景，也没有苹果产品发布的兴奋。有一种确定感和近乎安慰的感觉：谷歌是关于组织世界信息的，鉴于皮查伊相信未来是关于人工智能的，特别是在数据上运行的机器学习变体，这意味着谷歌将在这方面取得成功新世界仅仅通过成为它自己。对于个人和公司而言，这是最好的地方。

那是谷歌发明转换器的一年，这项关键发明支撑了为 ChatGPT 提供动力的大型语言模型，该产品在过去六个月里似乎让谷歌非常慌乱。今年的谷歌 I/O 令人印象深刻的是，它成功地将谷歌最近几次 I/O 的引人注目之处——其清晰的人工智能能力和体现这些能力的产品——与你所需要的紧迫感和进取心结合起来。希望看到一家公司多年来第一次感到受到威胁。

谷歌的人工智能进化

我在上面提到过，Google 将 Google 相册介绍为用于照片的 Gmail； Pichai 的开场白中我最喜欢的两张幻灯片展示了这两款产品如何证明谷歌不断发展的人工智能能力。 Gmail 从“智能回复”演变为“智能撰写”再到“帮我写”：

谷歌的 Gmail AI 进展

Google 相册从“查找照片”演变为“魔术橡皮擦”再到“魔术编辑器”：

谷歌相册人工智能进展

这是一种非常聪明的方式来强化谷歌在人工智能领域已经有一段时间的想法，这是真的！这也提醒我们，谷歌的一大优势与微软相似：该公司拥有一系列面向用户的产品，这些产品以真正有用的方式展现 AI 功能。皮查伊指出，谷歌有 15 款产品拥有超过 5 亿用户：

谷歌拥有超过5亿用户的15款产品

以及拥有 20 亿用户的六款产品：

谷歌6大用户超20亿产品

不过，也许主题演讲中最引人注目的部分是皮查伊的开场白：

作为 AI-first 公司，我们的旅程已经七年了，我们正处于一个激动人心的转折点。我们有机会让 AI 对人类、企业、社区和每个人更有帮助。一段时间以来，我们一直在应用 AI 来让我们的产品变得更有帮助。借助生成式 AI，我们正在迈出下一步。通过大胆和负责任的方法，我们正在重新构想我们所有的核心产品，包括搜索。

值得注意的是，“负责任”之前是“大胆”；来自谷歌 I/O 的最重要信息是谷歌参与其中以赢得它，正如 Pichai 指出的那样，这包括搜索。

生成式人工智能和搜索

在谷歌 I/O 2019 之后——我也觉得这令人印象深刻——我提出了谷歌长期商业模式的问题：

更重要的是，尽管 Google Assistant 继续给人留下深刻印象——将所有内容都放在设备上有望在速度上取得重大突破，这是当今 Assistants 的主要限制因素——但谷歌的商业模式究竟是什么尚不清楚。很难想象有什么东西能像搜索广告一样有利可图，它不仅受益于精确定位——用户明确地说出他们想要什么！ – 还有一种拍卖形式，利用用户来挑选获胜者，并激励这些获胜者为与该用户建立持续关系的机会多付钱。

正如我所预料的那样，谷歌正在采取一种混合方法：大多数搜索都不是商业搜索，因此谷歌将把生成的文本放在顶部：

谷歌的生成式人工智能搜索结果

对于确实具有商业可能性的搜索，广告仍将获得最高收费：

Google 的生成式 AI 搜索结果，顶部有广告

这似乎是一种合理的方法，因为非商业搜索可能无论如何都更有可能从人工智能中受益；与微软将 Bing Chat 嫁接到传统搜索的方法相比，这也是一种看起来更引人注目，是的，更大胆的方法。

当然，微软实际上已经推出了其新的搜索体验，而萨蒂亚·纳德拉 (Satya Nadella) 对蚕食谷歌市场份额和利润率的渴望仍然是一个威胁：生成这些答案需要花钱，而且谷歌的模型在同类产品上可能仍落后于 GPT-4苹果基础。尽管如此，这个演示和今年的谷歌 I/O 总体上是对 Sam Altman 在Bing 发布后的 Stratechery 采访中告诉我的话的强烈回应：

我认为这对我们俩来说都很棒。我认为这里对我们俩都有很大的好处。我们将发现这些新模型可以做什么，但如果我坐在一个昏昏欲睡的搜索垄断上，并且不得不考虑一个世界，在这个世界上，这种工作和新广告的货币化方式将面临真正的挑战单位，甚至可能是暂时的下行压力，我不会对此感觉很好。

这些挑战依然存在，但至少“昏昏欲睡的搜索垄断”已经苏醒。

持续性和颠覆性创新

如果有一件事是每个人都确定的，那就是人工智能将具有非常大的破坏性；不过，在 1 月份的AI 和 Big Five中，我注意到 AI 似乎更有可能成为一项持续性创新：

2022年的故事是人工智能的出现，首先是图像生成模型，包括DALL-E、MidJourney和开源的Stable Diffusion，然后是ChatGPT，第一个文本生成模型取得重大突破。在我看来，这是技术的新纪元。

不过，要确定那个时代可能会如何发展，回顾 26 年前有史以来最著名的战略书籍之一是很有用的：克莱顿·克里斯滕森 (Clayton Christensen) 的《创新者的困境》(The Innovator’s Dilemma) ，尤其是这段关于不同类型创新的文章：

大多数新技术都促进了产品性能的提高。我称这些为持续性技术。一些持续性技术可能具有不连续性或激进性，而其他技术则具有渐进性。所有持续性技术的共同点是，它们根据主要市场的主流客户历来重视的性能维度，改进既定产品的性能。特定行业的大多数技术进步都具有持续性……

颠覆性技术为市场带来了与以往截然不同的价值主张。一般来说，颠覆性技术在主流市场上的表现不如成熟产品。但它们还有一些边缘（通常是新）客户看重的其他功能。基于颠覆性技术的产品通常更便宜、更简单、更小，而且通常使用起来更方便。

通过观察现有公司在创新进入市场后的表现，似乎很容易回顾并确定创新是持续性的还是破坏性的：如果创新是持续性的，那么现有公司会变得更强大；如果它具有破坏性，那么大概是初创公司获得了大部分价值。

我在那篇文章中的结论是，人工智能将成为苹果、亚马逊、Meta 和微软的持续创新；最大的问题是谷歌和搜索：

那篇文章假设 Google Assistant 将被用来区分谷歌手机作为独家产品；这最终是错误的，但潜在的分析仍然有效。在过去的七年里，谷歌的主要商业模式创新一直是将更多的广告塞进搜索中，这是一种在移动设备上特别有效的策略。而且，公平地说，谷歌最赚钱的搜索类型——旅游、保险等——可能无论如何都不太适合聊天界面。

不过，这只会增加谷歌管理层的担忧，即在特定的搜索环境中，生成人工智能可能代表一种颠覆性创新，而不是持续性创新。至少在开始时，颠覆性创新不如现有的创新；这就是为什么它很容易被管理者忽略的原因，他们可以通过（正确地！）告诉自己他们当前的产品更好来避免思考商业模式的挑战。当然，问题是颠覆性产品变得更好，即使现任产品变得越来越臃肿和难以使用——这听起来很像谷歌搜索当前的发展轨迹。

我不是在为谷歌打电话。我以前这样做过，但错得可笑。不过，犯错往往是时间问题：是的，谷歌拥有自己的云服务，而 YouTube 的主导地位似乎只是在增加，但即使多年来它一直在浪费现金和利润，搜索高峰的轮廓似乎也很清晰。

或者可能不是。我倾向于认为，颠覆性创新其实很少见，但当它们来临时，在位的公司基本上不可能做出回应：他们的商业模式、股东和最重要的客户让管理层无法做出回应。不过，如果这是真的，那么现任者的回应实际上证明了创新实际上不是破坏性的，而是持续性的。

为此，我将这次谷歌 I/O 大会作为证据，证明人工智能实际上是包括谷歌在内的所有大型科技公司的一项可持续技术。此外，如果真是这样，那么这就是对搜索公司不那么悲观的原因，因为期望他们拥有领导地位的所有理由——从能力到数据到基础设施再到过多的消费者接触点——保持。尽管如此，搜索目前所面临的挑战——尤其是它的广告模式——仍然存在。

革命或结盟

另一个我一直困惑的问题是，人工智能是否是 Carlota Perez 在《技术革命与金融资本》中记载的那种技术革命。

再一次，传统观点认为人工智能代表了一种全新的范式。不亚于比尔·盖茨 (Bill Gates) 所写的杰出人物：

人工智能的发展与微处理器、个人电脑、互联网和手机的发明一样重要。它将改变人们工作、学习、旅行、获得医疗保健以及相互交流的方式。整个行业将围绕它重新定位。企业将通过使用它的程度来区分自己……

我很幸运参与了个人电脑革命和互联网革命。我对这一刻同样兴奋。这项新技术可以帮助世界各地的人们改善生活。与此同时，世界需要制定道路规则，让人工智能的任何缺点都远远超过它的好处，让每个人都能享受这些好处，无论他们住在哪里，无论他们有多少钱。人工智能时代充满机遇和责任。

盖茨暗示个人电脑革命、互联网革命和人工智能革命是离散事件，但它们也可以被视为数字化的定义经济特征——零边际成本——对信息的三种应用：

PC 允许零边际信息重复；这就是文字处理器和电子表格以及盖茨专门研究的其他生产力应用程序等突破的基础。
互联网允许信息的零边际分布。这导致了基于丰富而非稀缺的市场，从而产生了像谷歌这样的聚合器。
人工智能是零边际信息生成（好吧，相对于人类而言，几乎为零）。正如我去年写的那样，生成模型将创意创造与创意证实分开，然后可以以零边际成本复制和分发。

此外，这三场革命必须按顺序进行：如果没有不同的计算机，互联网的概念就没有意义，而且这些人工智能模型是在互联网上训练的。

我还要指出，这种进展与我在 2020 年的《开端的终结》中提出的论点一致：我在那篇文章中的论点是，各种技术革命都是无处不在的连续计算趋势的全部表现；我在那篇文章中没有提到人工智能，但人工智能似乎是一种持续创新的事实支持了这样一种观点，即科技开端的大赢家将成为未来科技发展的基础。

就佩雷斯而言，她认为当前的革命仍处于安装阶段（我在本文中阐述了她的论点）；对她而言，缺少的要素是与政府的协调以及政府的协调。

巴德与欧盟

Google 的其他 I/O 公告之一是Bard 的广泛可用性，它是 ChatGPT 的竞争对手。更有趣的消息是它无法获得的地方；来自Android Authority ：

谷歌在其 I/O 开发者大会上宣布其 Bard 聊天机器人将在 180 个市场广泛使用。它标志着该平台的一次重大扩展，该平台最初的发布非常有限。不过，加拿大和欧洲不在受支持市场的名单中。现在，谷歌在对 Android Authority 查询的电子邮件回复中暗示了这些遗漏的可能原因。谷歌发言人指出以下几点：

Bard 将很快能够支持 40 种顶级语言，虽然我们尚未最终确定扩展计划的时间表，但我们将逐步并负责任地推出它，并在我们驾驭这些新语言时继续成为监管机构的乐于助人和积极参与的合作伙伴技术在一起。

该公司断言它是“监管机构的乐于助人且积极参与的合作伙伴”，这表明出于监管方面的考虑，巴德目前正在跳过欧盟和加拿大。

又一次出现了一种传统智慧：“哈哈愚蠢的欧洲及其法规意味着它将错过人工智能”，而且，就目前而言，这显然是正确的。不过，这似乎是一个安全的赌注，即谷歌、微软、Meta 和其他科技巨头确实将成为“监管机构的有益和参与的合作伙伴”，以实现他们的最终利益。毕竟，考虑一下这些法规可能是什么样子，从加拿大开始，以及同一篇文章中的这一点：

加拿大立法者最近出台了旨在规范人工智能的立法。人工智能和数据法案 (AIDA) 要求围绕人工智能系统进行评估、风险管理、监控、数据匿名化、透明度和记录保存。 AIDA 还将处以高达公司全球收入 3% 或 1000 万美元的罚款。

大量的繁文缛节肯定会让谷歌等人难以管理，但考虑到它们的规模和资源，它们也非常容易管理；欧盟拟议的人工智能法将带来更大的监管负担。

值得注意的是，我在上面追踪的技术弧线正在向更多的政府控制倾斜：个人电脑赋予个人难以置信的自由和能力，但互联网向聚合器中介网络的转变给政府带来了明显的瓶颈，可以在这些瓶颈上推动对分发的控制，无论是在中国是明确的，在西方大部分地区是隐含的。与此同时，人工智能在主要参与者中集中的程度意味着对实际信息生成有直接的控制点。

这证实了 Perez 的论点，即 IT 革命尚未实现政府的调整：它只是在结构上以前是不可能的。上述对齐是否真的像佩雷斯预测的那样意味着即将到来的“黄金时代”还有待观察。值得注意的是，这种协调变得具体非常符合谷歌的利益：阻止真正颠覆性技术的最佳方式是对它们进行监管。

人工智能彻底改革

欧盟法规的另一个方面似乎更加险恶。来自Technomancers.ai ：

一个大胆的举措是，欧盟修订后的人工智能法案将禁止 OpenAI、亚马逊、谷歌和 IBM 等美国公司提供对生成人工智能模型的 API 访问。如果未经许可的生成模型在欧洲可用，修正后的法案将于周四被委员会否决，将制裁美国的开源开发商和软件分销商，例如 GitHub。虽然该法案包括传统机器学习模型的开源例外，但它明确禁止开源生成系统的安全港条款。

在欧盟提供的任何型号，如果不首先通过广泛且昂贵的许可，将使公司面临 20,000,000 欧元或全球收入的 4% 的巨额罚款。开源开发人员和 GitHub 等托管服务作为进口商，将负责提供未经许可的模型。欧盟实质上是在命令美国大型科技公司让美国的小企业倒闭——并威胁要制裁美国科技生态系统的重要部分。

如果颁布，执法将不在欧盟成员国手中。根据人工智能法案，第三方可以起诉国家政府强制罚款。该法案具有域外管辖权。第三方可能会迫使欧洲政府与美国开发商和企业发生冲突。

这是一个非常具有爆炸性的指控，但作者 Delos Prime 引用了拟议的法律来支持它，我认为这是一个合理的解释。像这样的提议一样，没有明确的语言，比如禁止 API 访问；相反，Prime 的结论是，这是有效的结果，例如，API 提供商对其 API 的所有使用负责，就像开源作者和分发者将对其模型的所有使用负责一样。

美国将如何回应这样一项法律的问题显然是一个非常重要的问题：有理由认为，让美国公司对简单的开源模型负责是对主权的公然侵犯；我敢肯定，欧盟会争辩说，美国互联网公司有效地输出美国价值观（如言论自由）是一回事。

这是历史有趣的地方，尤其是我一直认为最类似于互联网的发明：印刷机。我在互联网和第三产业中写道：

在中世纪，欧洲的主要组织实体是天主教会。与此相关的是，天主教会实际上也垄断了信息的传播：大部分书籍都是拉丁文，由僧侣们费力地手工抄写。贵族的各个成员与他们土地上的平民之间存在某种程度的种族亲和力，但在天主教会的保护伞下主要是独立的城邦。

印刷机改变了这一切。突然间，马丁·路德（Martin Luther）对天主教会的批判与 100 年前的扬·胡斯（Jan Hus）惊人地相似，他不再局限于将自己的信仰传播到他所在的地区（胡斯就是布拉格），而是可以看到这些信仰传播到整个欧洲；贵族们乘机以符合当地利益的方式解释圣经，逐渐摆脱了天主教会的控制。

同时，印刷书籍的经济学与手工复制的经济学有着根本的不同。后者纯粹是一项运营费用：产出完全取决于劳动力的投入。不过，前者主要是一项资本支出：首先，建造印刷机，其次，为一本书排字。支付这些巨额前期费用的最佳方式是尽可能多地印制某本书的销量。

那么，如何才能最大限度地提高销量呢？答案是使用一种特定语言中使用最广泛的方言进行印刷，这反过来又会激励人们采用该方言，从而使整个欧洲的语言标准化。推而广之，这加深了具有共同语言的城邦之间的亲和力，尤其是在几十年的时间里，随着书籍和后来的报纸形成了一种共同的文化。这种合并以不同的速度发生——英国和法国比德国和意大利早几百年——但几乎在每一种情况下，第一等级都不是天主教会的神职人员，而是国家君主，即使君主将权力让给了一种新的君主以柏克为代表的贤能贵族。

这场动荡的高潮是威斯特伐利亚和平，威斯特伐利亚系统就是从那里得名的；引用维基百科：

威斯特伐利亚体系是国际法上每个国家对其领土拥有专属主权并垄断战争能力的政治秩序。该原则在 1648 年威斯特伐利亚和平之后在欧洲发展起来，其基础是让博丹的国家理论和雨果格劳秀斯的自然法学说。它是现代主权国家国际体系的基础，并载入《联合国宪章》，其中规定“任何……不得授权联合国干涉本质上属于任何国家国内管辖范围的事务。”

威斯特伐利亚体系面临着许多挑战，从全球化到人道主义干预再到互联网。欧盟监管人工智能的尝试就是一个很好的例子：鉴于互联网没有边界——无论如何，在防火墙之外^1——欧盟似乎准备让美国公司对在美国服务器上发布的模型负责；就谷歌而言，目前它发现单方面不为欧盟服务是明智的，以免面临与 OpenAI 相同的挑战。

从某种意义上说，这场斗争可以类比为欧洲的新教与天主教之战；在这种情况下，美国科技公司是通用互联网，而欧洲则寻求保护其主权。或者，也许您更喜欢相反的类比，其中欧洲正在寻求将其信仰出口到世界其他地区，并且考虑到在任何地方都拥有一种产品的经济激励，很可能会成功（参见 cookie 横幅）。

不过，开源部分是截然不同的：在本地运行的开源模型可能对 Apple 来说是一大福音，但对于谷歌和 OpenAI 等集中式公司来说，它们才是真正的破坏性威胁。换句话说，他们是不同于监管机构和中心化运营商的第三方力量；他们是激进的改革。

在阅读 Owen Cyclops 关于美国宗教的引人入胜的话题时，我想到了这个想法。很难找到一条推文来捕捉线索，但独眼巨人的观点是，印刷机导致了三个不同的宗教团体：天主教徒、新教徒，然后是一大群受到两者迫害的边缘团体，推而广之，在美国历史上发挥了重要作用。

有点像

美国不是新教国家。

美国是一个激进的改革国家。

– 欧文独眼巨人 (@owenbroadcast) 2023 年 4 月 23 日

按照这种观点，印刷机对现代欧洲形成的影响的应用是不完整的；你还必须考虑边缘地区，也就是美国。

而且，推而广之，如果从个人电脑到互联网再到人工智能的数字化转型对印刷机产生类似的影响，那么眼前的问题不仅仅是民族国家前进的性质，还有边缘的潜力。

诚然，这是一篇颇具推测性和影响深远的文章，特别是考虑到我是从 Google I/O 开始的。不过，我认为有意义的是，谷歌明确表示将人工智能视为一项持续创新，并打算在其业务（包括搜索）中全面实施生成人工智能。当然，这意味着在这种情况下会有战斗发生：我们从这些大型科技公司身上看到的进取心和竞争力是过去十年停滞不前的令人耳目一新的变化。

与此同时，所有 Big Tech 都参与其中，并且鉴于它们的超国家性质，将不可避免地被激励成为“对监管机构有帮助和积极参与的合作伙伴”，这表明真正的斗争将在中心化模式和开放模式之间展开资料来源：普世天主教会和国教新教徒有他们的冲突，但他们一致蔑视再洗礼派等。

从这个角度来看，这些拟议的欧盟法规只是数字时代的决定性战争中的第一轮齐射：中心化（因此可控）的实体会获胜，还是会在真正探索数字时代的开放模型的边缘开花结果？人工智能的潜力，无论好坏。

原文： https://stratechery.com/2023/google-i-o-and-the-coming-ai-battles/