OpenAI 发布 o3 与 o4-mini 模型,以及 Codex CLI 开源终端工具

IP归属:广东

2025 年 4 月 17 日,OpenAI 宣布推出其迄今为止最强大的推理模型 o3 以及更小更高效的 o4-mini,引发广泛关注。这两款模型具备完整的工具链访问能力,能够自主调用 ChatGPT 中的网页搜索、Python 编程、图像分析与生成等功能,标志着 OpenAI 在多模态推理与自主任务执行能力上的重大突破。

图源:OpenAI

o3 模型在多个权威基准测试中取得领先成绩,包括 SWE-bench、Codeforces 和 MMMU,展现出在编程、数学、科学与视觉理解等方面的卓越推理能力。相比前代 o1,o3 在复杂现实任务中的重大错误率减少了 20%。o4-mini 虽然体积更小,但在 AIME 2024 与 2025 数学竞赛中表现出色,甚至在某些任务上超过了 o3,适用于高频率、低延迟的推理场景。

两款模型均具备“图像思维”能力,不仅能理解图像,还能在推理过程中对图像进行缩放、旋转等操作,支持用户上传白板照片、手绘草图等进行深入分析。这一能力被多家媒体称为视觉感知领域的“质变”。

与此同时,OpenAI 还同步发布了名为 Codex CLI 的开源终端工具,支持开发者将 AI 与本地代码库和计算任务集成,进一步拓展 AI 在软件开发流程中的实用性。该工具已开放源代码,并配套推出 100 万美元的 API 使用额度资助计划,以鼓励开发者社区的创新应用。

在定价方面,ChatGPT 订阅用户可以免费使用 o3 和 o4-mini。对于通过 API 集成这些模型的开发者,o3 的定价为每百万输入 tokens 10 美元,每百万输出 tokens 40 美元,缓存输入的折扣价为每百万 2.5 美元。这相较于 o1 每百万输入/输出 tokens 15/60 美元的定价结构有显著降低。更经济的 o4-mini 的定价为每百万输入 tokens 1.10 美元,每百万输出 tokens 4.40 美元,缓存输入的定价为每百万 0.275 美元,与 o3-mini 的定价结构保持一致。

陀螺科技现已开放专栏入驻,详情请见入驻指南: https://www.tuoluo.cn/article/detail-27547.html

前方智能专栏: https://www.tuoluo.cn/columns/author1911845/

本文网址: https://www.tuoluo.cn/article/detail-10121416.html

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。

相关文章