谷歌报告在人工智能的帮助下将代码迁移时间减半

Google 计算机科学家一直在使用法学硕士来简化内部代码迁移，在某些情况下节省了高达 89% 的时间。研究结果发表在一篇题为“谷歌如何使用人工智能进行内部代码迁移？”的预印本论文中。 The Register 报道称：他们的重点是为特定产品领域开发的定制 AI 工具，例如广告、搜索、工作区和 YouTube，而不是提供广泛适用的服务（例如代码完成、代码审查和问答）的通用 AI 工具。 Google的代码迁移涉及：将Google Ads 500多万行代码库中的32位ID更改为64位ID；将其旧的 JUnit3 测试库转换为 JUnit4；并用 Java 的标准 java.time 包替换 Joda 时间库。 Google 员工解释说，从 int32 到 int64 的迁移并非易事，因为 ID 通常是通用定义的（C++ 中的 int32_t 或 Java 中的 Integer）并且不易搜索。它们存在于数千个文件的数万个代码位置中。必须跨多个团队跟踪更改，并且必须跨多个文件考虑对类接口的更改。 “如果手动完成，全部工作预计需要数百年的软件工程时间和复杂的跨团队协调，”作者解释道。对于基于 LLM 的工作流程，Google 的软件工程师实施了以下流程。 Ads 的工程师将使用代码搜索、Kythe 和自定义脚本的组合来识别需要迁移的 ID。然后，由本领域知识渊博的人员触发基于 LLM 的迁移工具包，运行以生成包含通过单元测试的代码的经过验证的更改。这些更改将由同一工程师手动检查并可能进行纠正。此后，代码更改将发送给负责受更改影响的代码库部分的多个审阅者。结果是，变更列表 (CL) 中 80% 的代码修改纯粹是 AI 的产物；其余的要么是人类创作的，要么是人类编辑的人工智能建议。 “我们发现，在大多数情况下，人类至少需要恢复模型所做的一些不正确或不必要的更改，”作者观察到。 “考虑到修改后的代码的复杂性和敏感性，必须花费精力仔细向用户推出每项更改。”基于此，Google进一步开展了LLM驱动的验证工作，以减少详细审查的需要。即使需要仔细检查法学硕士的工作，作者估计完成迁移所需的时间也减少了 50%。在LLM的协助下，仅用了三个月的时间就迁移了5,359个文件并修改了149,000行代码，完成了JUnit3-JUnit4的过渡。 AI 生成的代码中大约 87% 最终在没有任何更改的情况下提交。至于 Joda-Java 时间框架切换，作者估计与预计的手动更改时间相比可节省 89% 的时间，但没有提供任何具体信息来支持这一说法。

在 Slashdot 上阅读这个故事的更多内容。

原文： https://developers.slashdot.org/story/25/01/17/2156235/google-reports-halving-code-migration-time-with-ai-help?utm_source=rss1.0mainlinkanon&utm_medium=feed