从某种意义上说,克劳德可以用任何设施玩神奇宝贝,这令人印象深刻。在开发在围棋和 Dota 2 等游戏中寻找主导策略的人工智能系统时,工程师通常会从对游戏规则和/或基本策略的深入了解以及指导算法获得更好表现的奖励函数开始他们的算法。不过,对于 Claude Plays Pokémon,项目开发人员兼 Anthropic 员工 David Hershey 表示,他从未经修改的通用 Claude 模型开始,该模型没有经过专门训练或调整来以任何方式玩 Pokémon 游戏。
“这纯粹是[克劳德]所理解的关于世界的各种其他事情被用来指向电子游戏,”赫尔希告诉Ars。 “所以它有一种神奇宝贝的感觉。如果你去 claude.ai 询问神奇宝贝,它会根据所读取的内容知道神奇宝贝是什么……如果你问,它会告诉你有八个健身房徽章,它会告诉你第一个是布洛克……它知道大致的结构。”
这就是我所在的人工智能阵营。这是超人吗?显然不是在这个特定的例子中,但不可否认的是,大型语言模型能够达到它所能达到的水平,这仍然令人印象深刻。
原文: https://arstechnica.com/ai/2025/03/why-anthropics-claude-still-hasnt-beaten-pokemon/