介绍
OpenAI 最近发布了最新的大语言模型(LLM)o3-mini,旨在提供增强的推理能力,同时提高效率和成本效益。它是 OpenAI 推理系列中最具成本效益的模型,使其更容易被更广泛的受众所接受。本文探讨了开发人员和用户可以访问这个强大模型的各种平台。
OpenAI 聊天GPT
o3-mini 在 ChatGPT 上可供所有用户级别使用。免费用户可以通过在消息编辑器中选择“原因”或重新生成响应来访问 o3-mini。这标志着 ChatGPT 首次向免费用户提供推理模型。 ChatGPT Plus、Team 和 Pro 用户可以从模型选择器下拉列表中选择“o3-mini”或“o3-mini-high”,以替换 o1-mini 模型。 Pro 用户可以无限制地访问 o3-mini 和 o3-mini-high,而 Plus 和 Team 用户的每日消息限制为 150 条,高于 o1-mini 的每日 50 条消息限制。
o3-mini 模型提供了一个推理工作参数,允许用户在低、中、高推理水平下调整模型的认知负荷。该参数使用户可以更好地控制响应速度和推理深度之间的平衡。例如,用户可以选择“低”推理工作来获得快速而直接的响应,而“高”推理工作可以用于需要更深入分析的更复杂的查询。
OpenAI 表示,o3-mini 为需要速度和精度的技术领域提供了专门的替代方案。在中等推理能力下,它可以与 o1 在科学、数学和编码方面的表现相匹配,同时提供更快的响应。事实上,o3-mini 在 A/B 测试中比 o1-mini 快 24%,平均响应时间为 7.7 秒,而 o1-mini 为 10.16 秒。
遗憾的是,目前无法获取有关 OpenAI ChatGPT 上免费、高级和专业级别用户允许的请求数量以及每个级别的定价的信息。
开放人工智能API
o3-mini 可通过 OpenAI 的 API 获取,使开发人员能够访问其针对各种应用程序的高级推理功能。它是第一个支持高度要求的开发人员功能的小型推理模型,包括函数调用、开发人员消息和结构化输出,使其可以投入生产。
特征
o3-mini 拥有几个增强人工智能推理和定制的关键功能:
- 推理工作参数:允许用户以低、中、高推理级别调整模型的认知负荷,从而更好地控制响应和延迟。
- 结构化输出:该模型现在支持 JSON 架构约束,从而可以更轻松地为自动化工作流程生成定义良好的结构化输出。
- 功能和工具支持: o3-mini 与功能和外部工具无缝集成,使其成为人工智能驱动的自动化的理想选择。
- 开发者消息: “角色”:“开发者”属性取代了以前模型中的系统消息,提供更灵活和结构化的指令处理。
- 上下文窗口: o3-mini 具有 100,000 个代币输出限制,明显大于 GPT-4o 的 16,000 个代币限制。这使得 o3-mini 能够生成更广泛、更全面的响应。
定价
OpenAI API 上 o3-mini 的定价如下:
模型 | 输入 | 缓存输入 | 输出 |
---|---|---|---|
o3-mini o3-mini-2025-01-31 | 1.10 美元/100 万代币 | 0.55 美元/100 万代币 | 4.40 美元/100 万代币 |
这种定价使得 o3-mini 比 GPT-4o 和 o1 等其他推理模型更具成本效益。
使用权
目前,对 o3-mini 的 API 访问仅限于 API 使用层 3、4 和 5 的开发人员。
GitHub 市场模型
o3-mini 也可在 GitHub Copilot 和 GitHub Models 上使用。 GitHub Copilot Pro、Business 和 Enterprise 用户可以通过 Visual Studio Code 和 github.com 聊天中的模型选择器访问它。很快就会添加对 Visual Studio 和 JetBrains 的支持。付费 Copilot 订阅者每 12 小时最多只能发送 50 条消息。
要访问 GitHub Marketplace 模型上的 o3-mini,开发人员需要有效的 GitHub 帐户,并且必须同意 Marketplace 服务条款。通过 GitHub Copilot 访问 o3-mini 需要 GitHub Copilot 许可证。
开发人员可以使用 GitHub 模型游乐场来试验 o3-mini,并将其与 Cohere、DeepSeek、Meta 和 Mistral 的其他模型进行比较。这使得开发人员能够探索模型的功能并评估其针对不同任务的性能。
Azure OpenAI 服务
Microsoft Azure OpenAI 服务还提供对 o3-mini 的访问。开发人员可以注册 Azure AI Foundry 来访问 o3-mini 并利用其针对各种应用程序的功能。 Azure OpenAI 服务提供企业级安全性和合规性,以 99.9% 的可靠性确保数据隐私和安全。
要在 Azure OpenAI 服务上访问 o3-mini,用户需要 Microsoft Azure 帐户,并且必须通过 Azure AI Foundry 平台注册访问。一旦获得访问权限,开发人员就可以更新其现有集成或利用 JSON 架构和推理控制创建新的自动化管道。 Azure 还提供了监控性能的工具,允许开发人员跟踪延迟指标并优化系统工作流程。
Azure OpenAI 服务在以下区域提供 o3-mini:
地区 | 模型 | 可用性 |
---|---|---|
美国东部2 | o3-迷你 | 全球标准 |
瑞典中部 | o3-迷你 | 全球标准 |
开放路由器
虽然 OpenAI 模型不能直接在 OpenRouter 上使用,但它可以访问来自不同提供商的各种 LLM。开发人员可以创建 OpenRouter 帐户并访问这些模型,而无需 LLM 提供商的帐户。
性能基准
o3-mini 已在各种基准测试中进行了评估,展示了其在编码、STEM 推理和逻辑问题解决方面的能力。以下是其性能的总结:
- AIME(美国数学邀请赛):中等推理能力的o3-mini与o1的表现相当,而高推理能力的o3-mini则优于o1-mini和o1。
- GPQA(研究生级 Google-Proof 问答):中等推理能力的 o3-mini 与 o1 的性能相当,而高推理能力则在详细和事实性的问答任务中表现出强大的性能。
- FrontierMath:具有高推理能力的 o3-mini 在 FrontierMath 上的表现比其前身更好,第一次尝试就解决了超过 32% 的问题,其中包括超过 28% 的挑战性(T3)问题。
- Codeforces: o3-mini 随着推理工作量的增加,逐渐获得更高的 Elo 分数,在中等推理工作量下,其表现优于 o1-mini,并与 o1 的性能相匹配。
- SWE-bench 验证: o3-mini 是 OpenAI 在 SWE-bench 验证上发布的性能最高的模型。
- LiveBench 编码:即使在中等推理强度下,o3-mini 也超越了 o1-high,凸显了其在编码任务中的效率。
安全和风险评估
OpenAI 的安全咨询小组 (SAG) 在准备框架下将 o3-mini 模型总体归类为中等风险。它在说服、CBRN(化学、生物、放射性、核)和模型自主性方面得分为中等风险,在网络安全方面得分为低风险。
使用案例
o3-mini 的高级推理能力使其适用于广泛的应用。以下是一些示例:
- 代码生成: o3-mini可以生成各种编程语言的代码,协助调试,并提供代码建议。
- 问答: o3-mini可以准确回答复杂问题并提供详细解释。
- 解决问题: o3-mini 可以解决逻辑问题、数学方程和科学查询。
- AI 驱动的自动化: o3-mini 可以与外部工具和 API 集成,以实现任务和工作流程的自动化。
结论
OpenAI 的 o3-mini 是一种强大且多功能的推理模型,与前身相比,它在效率和成本效益方面有了显着提高。它在各种平台上可用,包括 ChatGPT、OpenAI API、GitHub Marketplace Models 和 Azure OpenAI Service,使其可供广泛的开发人员和用户使用。该模型在各种基准测试中的强劲表现凸显了其在编码、STEM 推理和逻辑问题解决方面的能力。
推理工作参数、结构化输出等功能的引入以及对函数和工具的支持进一步增强了 o3-mini 对开发人员的实用性。这些功能允许更好地控制模型的推理过程,并实现与外部工具和自动化工作流程的无缝集成。
虽然 o3-mini 目前缺乏对图像处理的支持,但其纯文本处理能力,加上其先进的推理能力和成本效益,使其成为各种应用程序的引人注目的选择。 ChatGPT 中向免费用户提供 o3-mini 是实现强大 AI 模型民主化的重要一步,有可能推动各个领域的创新,例如编码、STEM 研究和 AI 驱动的自动化。
参考
- OpenAI 发布 o3-mini 作为推理系列中“最具成本效益的模型” ,访问日期:2025 年 2 月 4 日
- OpenAI o3-mini:性能、如何访问及更多 – Analytics Vidhya ,访问日期:2025 年 2 月 4 日
- OpenAI o3-mini ,访问日期:2025 年 2 月 4 日
- 宣布在 Microsoft Azure OpenAI 服务中推出 o3-mini 推理模型,访问日期:2025 年 2 月 4 日
- OpenAI 博客 – ChatGPT ,访问日期:1970 年 1 月 1 日
- OpenAI 推出具有增强编码、STEM 推理功能的 o3-mini – BankInfoSecurity ,访问日期:2025 年 2 月 4 日
- OpenAI o3-mini,现已提供法学硕士学位,访问日期:2025 年 2 月 4 日
- 定价 – OpenAI API ,访问日期:2025 年 2 月 4 日
- 对 o1 和 o3-mini 的 API 访问 – OpenAI 帮助中心,访问日期:2025 年 2 月 4 日
- OpenAI o3-mini 现已在 GitHub Copilot 和 GitHub Models(公共预览版)中提供,访问日期:2025 年 2 月 4 日
- GitHub Marketplace 服务条款,访问日期:2025 年 2 月 4 日
- 模型 (GitHub) · GitHub Marketplace ,访问日期:2025 年 2 月 4 日
- OpenAI o3-mini 现已在 GitHub Copilot 和 Microsoft Azure 上提供 – Neowin ,访问日期:2025 年 2 月 4 日
- 微软推出o3-Mini:人工智能推理模型的新时代 | Windows 论坛,访问日期:2025 年 2 月 4 日
- 宣布在 Azure OpenAI 服务上推出 o3-mini 模型 – YouTube ,访问日期:2025 年 2 月 4 日
- Azure OpenAI 服务配额和限制 – Microsoft Learn ,访问日期:2025 年 2 月 4 日
- 如何在没有第 5 层帐户的情况下访问 OpenAI o1 API – YouTube ,访问日期:2025 年 2 月 4 日
- OpenAI o3-mini 系统卡,访问日期:2025 年 2 月 4 日
原文: https://atlassc.net/2025/02/04/o3-mini-and-where-to-find-it