OpenAI o3-pro 震撼发布，史上最强 AI 来袭，却暗藏这些 “槽点”？

山自·2025年06月11日 11:03

不知道Deepseek R2能不能快速跟上

在 AI 领域的激烈竞争中，OpenAI 再次投下重磅炸弹！近日，OpenAI 正式推出了全新 AI 模型 o3-pro，官方更是自信宣称这是其有史以来最强大的模型。消息一出，立刻在全球科技圈掀起轩然大波，无数目光聚焦于此，大家都迫切想知道：这个号称 “最强” 的 o3-pro，究竟有何过人之处？又会给我们的生活和工作带来怎样的改变？

全新升级，推理能力再突破

o3-pro 其实是 OpenAI 今年早些时候推出的推理模型 o3 的升级版。推理模型的核心优势在于能够像人类一样，一步一步地拆解和解决问题，这种 “思考” 方式打破了传统 AI 模型的局限。传统 AI 模型往往是基于大量数据的模式匹配来给出答案，而推理模型则更注重逻辑推导。以数学领域为例，当面对一道复杂的几何证明题时，o3-pro 会先分析题目给出的条件，再调用已有的几何定理，通过严谨的步骤推导，最终得出正确结论；在编程方面，它可以深入理解代码需求，从功能实现逻辑出发，逐步编写和优化代码，大幅减少代码中的错误和漏洞。这种独特的推理能力，让 o3-pro 在物理、数学和编程等对逻辑要求极高的领域，表现得比传统模型更加可靠和精准，也为其在专业领域的深度应用奠定了坚实基础。

逐步开放，定价引发热议

从 6 月 10 日（周二）起，ChatGPT Pro 和 Team 用户已经可以率先体验 o3-pro，它直接取代了之前的 o1-pro 模型。而 Enterprise 和 Edu 用户则需要再等一周才能使用。同时，o3-pro 也于当天下午在 OpenAI 的开发者 API 中上线。在 API 中，o3-pro 的定价为每百万输入 tokens 20 美元，每百万输出 tokens 80 美元。tokens 作为 AI 处理信息的基本单元，其数量与实际文本量紧密相关。一百万输入 tokens 大约相当于 750,000 个单词，比《战争与和平》的篇幅还要长一些。这样的定价策略，对于普通用户来说影响较小，但对于依赖 API 进行大规模数据处理和应用开发的企业和开发者而言，成本问题成为关注焦点。不少开发者开始重新评估项目预算，思考如何在享受 o3-pro 强大功能的同时，合理控制使用成本，这也在一定程度上引发了行业内关于 AI 服务定价模式的讨论。

性能卓越，亮点功能丰富

OpenAI 在更新日志中透露，在专家评估中，评审人员在所有测试类别中都一致更青睐 o3-pro，尤其是在科学、教育、编程、商业和写作辅助等关键领域。在科学研究方面，o3-pro 能够帮助科研人员快速分析大量实验数据，提出新的研究假设；教育领域中，它可以根据学生的学习情况，生成个性化的学习方案和习题解析；商业场景里，能为企业提供精准的市场分析和商业策略建议。而且，评审人员还认为 o3-pro 在表达清晰度、内容全面性、指令遵循度和回答准确性等方面都要优于以往的模型。

此外，o3-pro 还具备强大的工具调用能力，堪称 “全能助手”。它可以进行网页搜索，实时获取最新的信息和数据，为用户提供更全面的回答；能够分析各类文件，无论是文档、表格还是代码文件，都能准确提取关键信息并进行解读；支持处理视觉输入，比如对图片中的物体、场景进行分析和描述；熟练使用 Python 编程，满足开发者各种编程需求；甚至能利用记忆功能实现个性化回复，根据用户之前的提问和交互历史，提供更贴合用户需求的答案，大大提升了交互体验。

美中不足，存在发展局限

不过，o3-pro 并非十全十美。OpenAI 坦言，该模型的响应时间通常比 o1-pro 更长，也就是说，用户可能需要多等一会儿才能得到它的答案。这对于一些追求即时反馈的场景，如实时聊天、在线客服等，可能会造成一定的体验下降。此外，目前 ChatGPT 中与 o3-pro 的临时聊天功能因 “技术问题” 暂时禁用，这无疑限制了用户在日常交流场景中的使用。o3-pro 也无法生成图像，在当下图文结合的信息传播时代，这让它在一些创意设计、营销宣传等领域的应用受到阻碍。而且 OpenAI 的 AI 工作空间功能 Canvas 也不被 o3-pro 支持，对于依赖 Canvas 进行团队协作和项目管理的用户来说，不得不继续使用其他模型或工具。

实力强劲，基准测试成绩优异

尽管存在这些不足，o3-pro 在 AI 基准测试中的表现却十分亮眼。根据 OpenAI 的内部测试，在评估数学技能的 AIME 2024 测试中，o3-pro 的得分超过了谷歌表现最好的 AI 模型 Gemini 2.5 Pro；在测试博士级科学知识的 GPQA Diamond 测试中，o3-pro 也击败了 Anthropic 最近发布的 Claude 4 Opus。这些成绩不仅证明了 o3-pro 在专业知识处理上的卓越实力，也凸显了 OpenAI 在 AI 技术研发上的领先地位。这也让其他 AI 研发企业感受到了巨大的压力，促使整个行业加快技术创新的步伐，推动 AI 技术不断向前发展。

o3-pro 的发布，标志着 AI 技术又向前迈出了一大步。它既带来了更强大的功能和更精准的回答，也暴露出一些有待完善的地方。对于广大用户和开发者来说，o3-pro 既是一个充满机遇的新工具，也是一个需要进一步探索和适应的新挑战。从企业角度看，如何将 o3-pro 融入现有的业务流程，提升工作效率和服务质量，是接下来需要思考的问题；对于开发者而言，利用 o3-pro 的强大功能开发出更具创新性的应用，将成为在竞争中脱颖而出的关键。而对于普通用户，期待 o3-pro 在未来能够克服现有局限，为我们的生活带来更多便利和惊喜。未来，随着技术的不断迭代，o3-pro 能否克服现有局限，持续刷新我们对 AI 的认知？让我们拭目以待！

本文来自微信公众号“山自”，作者：Rayking629，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。