OpenAI发布了两款新的AI模型,它们在推理过程中可以“用图像思考”。 o3 和 o4-mini 模型代表了视觉感知的重大进步,使它们能够在分析过程中操作图像(裁剪、缩放和旋转)。与之前的模型不同,o3 和 o4-mini 可以代理使用 ChatGPT 的所有工具,包括网络搜索、Python 代码执行和图像生成。这使他们能够根据手头的任务选择合适的工具来解决多方面的问题。这些模型在多个领域设定了新的最先进的性能基准。在视觉任务上,o3 在 MathVista 上获得了 86.8% 的准确率,在 CharXiv-Reasoning 上获得了 78.6% 的准确率,而 o4-mini 在 AIME 2024 比赛中获得了 91.6% 的准确率。在专家评估中,o3 在复杂的现实任务中所犯的重大错误比其前身减少了 20%。从今天开始,ChatGPT Plus、Pro 和 Team 用户将在模型选择器中看到 o3、o4-mini 和 o4-mini-high,取代 o1、o3â’mini 和 o3â’miniâ’high。
在 Slashdot 上阅读这个故事的更多内容。