因此,人工智能世界许多地方的共识是,当我的孩子高中毕业时,我们都将生活在豪华的全自动太空共产主义中。不仅某些任务会被自动化,整个工作也会被自动化,不仅仅是我们拥有的工作,而是我们能想到的每一项工作。 Anthropic 联合创始人达里奥·阿莫迪 (Dario Amodei) 表示:“整个数据中心都挤满了诺贝尔奖获得者。”
现在看,你可能不相信,大多数人不相信,毕竟这听起来有点疯狂。即使是大多数投资这个领域的投资者也不相信它,这一点从他们的投资中可以很容易地看出。没有人真正押注于员工变得几乎太便宜而无法计量,也没有人思考如果未来像今天一样但自动化程度更高会怎样。
免费订阅以接收新帖子并支持我的工作。
但你不需要相信整个事情一定会发生,无论是全有还是全无,你都会认为未来几年工作世界将会发生很大的变化。
如果你 相信这即将到来,或者即使它没有完全达到自动化“所有可以用计算机完成的工作”的标准,那么手工编写代码之类的事情肯定和人们过去手工计算弹道导弹弹道一样过时了。计算机曾经是一种工作,但现在它只是一台机器。
很快,我们就可以只要求一些东西,整个装置就会启动,东西就会被制造出来。事实上,自几年前 ChatGPT 推出以来,许多人一直在这样做。请求一段代码,将其复制粘贴到您最喜欢的 IDE 中,然后按运行。瞧,您拥有一个正在运行的 Python 脚本、一个网站或一个应用程序。
Andrej Karpathy 最近将这种要求模特做事并立即接受的现象称为“氛围编码”。正如所有奇幻小说告诉我们的那样,命名的力量非常强大,因此这个术语已经完全流行起来。当下,“氛围”无疑是本世纪的流行词。
大多数反对这样做的论点基本上都是不同版本的说法,说这样做他会被烧死,因为模型还不知道如何很好地做事。人们泄露了登录凭据并遭到嘲笑。
如果你想知道一旦这成为常态,世界会是什么样子,我们最近瞥见了。当Pieter创建了一个简单、非常简单的飞行游戏并大受欢迎时,它变得特别受欢迎。有多受欢迎?不到一个月,他就已经每月赚10万美元了。不仅仅是因为这款游戏真的很有趣,毕竟多年来虚拟狗斗游戏已经多如牛毛。但因为他几乎完全用氛围编码创建了它。只有他、克劳德和库瑟。
这让游戏开发者,尤其是专业游戏开发者非常愤怒。这是可以理解的,因为虽然他们必须非常非常努力地工作才能把东西做得好一千倍,但赚的钱却不是他赚的钱的一小部分。他公开开发了这款游戏,每个新功能都在同一天或第二天添加,这些功能很简单,比如“嘿,你现在可以驾驶一个三角形而不是飞机”,以及“你想在飞艇的侧面写下你的名字吗”。
现在 Pieter 需要足够聪明才能解决很多问题,但大概这个想法是很快他就根本不需要聪明了,或者至少不需要熟悉代码。
(我还认为这应该是我们经常看到的现有基准,以了解新模型在处理任意复杂的事情时表现如何。衡量标准是“非编码人员可以用它制作出多好的游戏”。)
非常熟悉代码的人会获得优势。有些人每天通过管理多个 Claude 代码代理编写数千行代码,每个代理(谁?) 都在处理一项特定功能,每个代理都会提交 PR 供作者审核,并有效地自动化大量软件开发。这不是明天,而是现在正在发生。今天。
是的,它仍然很慢、昂贵、容易出错和产生幻觉,有时会尝试更改测试以通过它,并且无法执行长代码库……但仍然如此。您可以输入您想要的内容或指向 JIRA 票证,然后砰!几乎可以工作的代码!
它仍然有很大的局限性。它无法在超大型代码库上工作,会产生幻觉或错误,有时它非常渴望通过测试,以至于它会尝试对答案进行硬编码或找到解决方案。但是,几年前,它几乎无法编写一个正确的 python 脚本……
无论您愿意与否,您都会从个人贡献者转变为经理。唯一的问题是你管理什么以及他们管理起来有多累。
这对工作来说意味着混乱。几乎每个人都会有“兼职人工智能培训师”作为他们的职位描述,这是肯定的。每家公司的人工智能员工数量都会超过人类员工。将会出现一种混乱,可以说这种混乱现在已经开始发生,PM、销售、营销和工程师的招聘已经减少。你猜怎么着。这基本上不会有太大影响,因为人类的数量已经超过了任何事物,我们只是发展组织或做更多的工作来弥补。
这也意味着个人生产力将取决于你能从模型中“吸收”多少推论。如果您想托管或培训它,就会有一个资本支出部分。但还有一个运营支出部分。当我搞乱 Claude 代码时,我每小时赚了 6-15 美元。我不是效率最高的工程师,因此实际值必须高于此值。如果您同时运行多个代理(您应该这样做),而且有些代理已经在运行,那么甚至更高。
自从我写这篇文章以来,史蒂夫·耶格(Steve Yegge)写了一篇很棒的文章,说了类似的话。
一次运行 N 个代理会将开发人员每日 10 美元的代理支出乘以 N,不计算云成本,仅计算代币消耗。如果您的开发人员平均每个人同时运行 5 个代理(这是一个非常保守的数字,因为代理将主要独立工作,让开发人员可以自由地做其他事情),那么这些开发人员现在每个人每小时花费 50 美元,或者每年大约 10 万美元。
这不再是真正的偷窃,而是抢劫。我们正在讨论的是,到 2025 年第四季度(考虑到提升时间),每个开发人员将逐渐将其生产力提高约 5 倍,而第一年的额外摊销成本可能仅为 5 万美元/年。谁不会接受这笔交易?
不幸的是,您几乎肯定没有将每位开发人员每年 5 万美元的 LLM 支出纳入 2026 年运营预算中。
一旦您拥有可以运行 Claude Code 编码代理的代理,情况就会更进一步。为了进行 PR 审查并检查它,他们正确地运行了单元测试,以及它是否有意义以及您最终会做的其他事情。这也不会是完美的,但会慢慢变得更好。当我说慢慢地时,我的意思是一周一周而不是一年一年。
这不仅适用于编码,也适用于相当大比例的白领工作。目前,编码恰好是模型的痴迷,主要是因为开发模型的人痴迷于编码。有点像硅谷无法停止创建新的 DevOps 初创公司。
任何有足够数据进行训练的工作(几乎所有工作都是如此),并且有正确的方法来判断某些事情是对还是错(这些工作数量也足够多),都将不可避免地发生转变。您能想象同样的原则应用于金融吗?文献综述?写报告? PRD?合同写?
已经开始了。每家具有前瞻性的科技公司都已经在这样做了。从 Stripe 到大型科技公司,再到 Linear,再到每家初创公司,尤其是 YC 集团,它绝对主导着每一个招聘决策。不仅仅是编码(尽管这是最主要的),还有营销、销售、运营和产品经理,还有律师和合规部门。
甚至是信息图表创建者。
这就是现在正在建设的未来。工作世界已经发生了变化。我们比三十年前富裕得多,程序员在自动化和过去时代坚定的决策残留物的帮助下完成了截然不同的任务。例如,今天的顾问在第一天所做的工作在 90 年代需要花费整整三个月的时间。然而,顾问作为一个行业已经发展起来。大多数工作都是这样的。
即使人工智能列车因某种原因戛然而止,这种趋势也只会放缓,不会停止。如果事情到此为止,工作世界将会发生转变。特别是如果你相信人工智能会变得更好,无论是 2 倍还是 200 倍,这似乎都是事实,做好它的唯一方法就是使用它。
感谢您阅读奇怪的循环佳能!免费订阅以接收新帖子并支持我的工作。
原文: https://www.strangeloopcanon.com/p/if-agi-is-the-future-vibe-coding