TechCrunch 周二援引内部信件报道称,致力于改进 Google Gemini AI 的承包商正在将其答案与 Anthropic 竞争对手模型 Claude 产生的输出进行比较。报道摘自:当 TechCrunch 联系谷歌征求意见时,谷歌并未透露是否已获得使用 Claude 来测试 Gemini 的许可。随着科技公司竞相构建更好的人工智能模型,这些模型的性能通常会根据竞争对手进行评估,通常是通过行业基准运行自己的模型,而不是让承包商煞费苦心地评估竞争对手的人工智能响应。负责对模型输出的准确性进行评级的 Gemini 承包商必须根据多种标准(例如真实性和冗长性)对他们看到的每个响应进行评分。根据 TechCrunch 看到的信件,承包商每次收到提示时最多有 30 分钟的时间来确定 Gemini 的答案和 Claude 的答案谁更好。
在 Slashdot 上阅读这个故事的更多内容。