2025年6月11日,OpenAI发布了最强推理模型o3-pro。它是o3推理模型的加强版,专注于解决最复杂、最需要逻辑的问题,在写作、编程等方面表现得更准确。相关介绍如下:模型原理:o3-pro并非全新架构,而是o3在推理预算上的“升配版”。o3系列不仅依赖海量互联网文本预训练,还融入了大规模强化学习,通过“更多算力⇒更佳表现”的扩展定律,教会模型分步推理。o3-pro在此基础上,在每次请求中分配了更高的算力与更长的运算时间,让模型“思考”得更透彻、更细致。性能优势: 推理能力强:是目前OpenAI最强大的多模态推理模型,擅长分步思考,在编码、数学、科学、视觉感知等领域表现尤为出色,能够提供更可靠、更深入的推理能力。 上下文窗口大:拥有200K上下文窗口,可处理超长对话与大规模输入,输出令牌为100K,能满足绝大多数长文生成需求。 工具接入丰富:可使用文件搜索、图像生成功能、MCP多模态编程,还支持网页搜索、Code Interpreter、本地操作、ChatGPT画布功能等。测试表现: - 在OpenAI内部测试中,o3-pro在数学测试AIME 2024中,超过了谷歌的Gemini 2.5 Pro;在GPQA Diamond(博士级科学知识评测)中,胜过了Anthropic家的Claude 4 Opus;在编程测试Codeforces中,比前代模型有了不小的提升。 - 在写作、编程和数据分析等多项评测中,o3-pro均以明显优势超越了o3和早期的o系列模型。在分步拆解复杂任务,尤其是多步骤编码或业务逻辑推理时,o3-pro提供的计划和理由更加清晰详实,远胜GPT-4o或4.1。价格与限制:o3-pro输入价格为20美元/百万token,输出价格为80美元/百万token。其存在一些功能限制,如速度比前代慢,输出时间更长,不支持临时对话、图像生成和Canvas功能等。
|
|