2025 年 4 月 17 日,OpenAI 宣布推出其迄今为止最强大的推理模型 o3 以及更小更高效的 o4-mini,引发广泛关注。这两款模型具备完整的工具链访问能力,能够自主调用 ChatGPT 中的网页搜索、Python 编程、图像分析与生成等功能,标志着 OpenAI 在多模态推理与自主任务执行能力上的重大突破。
图源:OpenAI
o3 模型在多个权威基准测试中取得领先成绩,包括 SWE-bench、Codeforces 和 MMMU,展现出在编程、数学、科学与视觉理解等方面的卓越推理能力。相比前代 o1,o3 在复杂现实任务中的重大错误率减少了 20%。o4-mini 虽然体积更小,但在 AIME 2024 与 2025 数学竞赛中表现出色,甚至在某些任务上超过了 o3,适用于高频率、低延迟的推理场景。
两款模型均具备“图像思维”能力,不仅能理解图像,还能在推理过程中对图像进行缩放、旋转等操作,支持用户上传白板照片、手绘草图等进行深入分析。这一能力被多家媒体称为视觉感知领域的“质变”。
与此同时,OpenAI 还同步发布了名为 Codex CLI 的开源终端工具,支持开发者将 AI 与本地代码库和计算任务集成,进一步拓展 AI 在软件开发流程中的实用性。该工具已开放源代码,并配套推出 100 万美元的 API 使用额度资助计划,以鼓励开发者社区的创新应用。
在定价方面,ChatGPT 订阅用户可以免费使用 o3 和 o4-mini。对于通过 API 集成这些模型的开发者,o3 的定价为每百万输入 tokens 10 美元,每百万输出 tokens 40 美元,缓存输入的折扣价为每百万 2.5 美元。这相较于 o1 每百万输入/输出 tokens 15/60 美元的定价结构有显著降低。更经济的 o4-mini 的定价为每百万输入 tokens 1.10 美元,每百万输出 tokens 4.40 美元,缓存输入的定价为每百万 0.275 美元,与 o3-mini 的定价结构保持一致。