Google 计算机科学家一直在使用法学硕士来简化内部代码迁移,在某些情况下节省了高达 89% 的时间。研究结果发表在一篇题为“谷歌如何使用人工智能进行内部代码迁移?”的预印本论文中。 The Register 报道称:他们的重点是为特定产品领域开发的定制 AI 工具,例如广告、搜索、工作区和 YouTube,而不是提供广泛适用的服务(例如代码完成、代码审查和问答)的通用 AI 工具。 Google的代码迁移涉及:将Google Ads 500多万行代码库中的32位ID更改为64位ID;将其旧的 JUnit3 测试库转换为 JUnit4;并用 Java 的标准 java.time 包替换 Joda 时间库。 Google 员工解释说,从 int32 到 int64 的迁移并非易事,因为 ID 通常是通用定义的(C++ 中的 int32_t 或 Java 中的 Integer)并且不易搜索。它们存在于数千个文件的数万个代码位置中。必须跨多个团队跟踪更改,并且必须跨多个文件考虑对类接口的更改。 “如果手动完成,全部工作预计需要数百年的软件工程时间和复杂的跨团队协调,”作者解释道。对于基于 LLM 的工作流程,Google 的软件工程师实施了以下流程。 Ads 的工程师将使用代码搜索、Kythe 和自定义脚本的组合来识别需要迁移的 ID。然后,由本领域知识渊博的人员触发基于 LLM 的迁移工具包,运行以生成包含通过单元测试的代码的经过验证的更改。这些更改将由同一工程师手动检查并可能进行纠正。此后,代码更改将发送给负责受更改影响的代码库部分的多个审阅者。结果是,变更列表 (CL) 中 80% 的代码修改纯粹是 AI 的产物;其余的要么是人类创作的,要么是人类编辑的人工智能建议。 “我们发现,在大多数情况下,人类至少需要恢复模型所做的一些不正确或不必要的更改,”作者观察到。 “考虑到修改后的代码的复杂性和敏感性,必须花费精力仔细向用户推出每项更改。”基于此,Google进一步开展了LLM驱动的验证工作,以减少详细审查的需要。即使需要仔细检查法学硕士的工作,作者估计完成迁移所需的时间也减少了 50%。在LLM的协助下,仅用了三个月的时间就迁移了5,359个文件并修改了149,000行代码,完成了JUnit3-JUnit4的过渡。 AI 生成的代码中大约 87% 最终在没有任何更改的情况下提交。至于 Joda-Java 时间框架切换,作者估计与预计的手动更改时间相比可节省 89% 的时间,但没有提供任何具体信息来支持这一说法。
在 Slashdot 上阅读这个故事的更多内容。