2025年12月11日,OpenAI正式推出GPT-5.2系列模型,这是其迄今为止功能最强大的AI模型组合,专为专业知识型工作场景打造,在多领域基准测试中树立新标杆,标志着AI对复杂工作任务的支撑能力迈入新阶段。

GPT-5.2系列包含Instant、Thinking和Pro三个版本,分工各有侧重。其中,GPT-5.2 Thinking成为首个在覆盖44个职业的GDPval评测中达到人类专家级水平的模型,在70.9%的高难度知识型工作任务上表现优于或持平行业顶尖专家,完成速度约为人类专家的3倍,成本却仅为1%,尤其在电子表格制作、财务建模、演示文稿设计等场景表现突出。

openai
openai

性能测试显示,该系列模型在多项权威基准中大幅超越前代。在软件工程领域,GPT-5.2 Thinking在SWE-Bench Pro测试中得分55.6%,Verified版本更是高达80.0%;科学研究场景下,其在GPQA Diamond无工具测试中斩获92.4%的高分,CharXiv推理任务得分88.7%;数学能力同样亮眼,在2025年2月HMMT数学竞赛中正确率达99.4%,高等数学FrontierMath测试得分较前代提升近10个百分点。

落地层面,GPT-5.2系列已从当日起陆续向ChatGPT付费用户开放,API则同步对所有开发者开放。Box、Shopify、Zoom等企业已率先应用,反馈其在长时任务处理、多工具并行调用及海量文档理解方面表现稳定。值得注意的是,API端模型Token单价虽高于GPT-5.1,但仍低于同类前沿模型,兼顾性能与经济性。

OpenAI表示,GPT-5.2不仅延续了前代自然流畅的对话风格,更实现了通用智能、长上下文理解等核心能力的全面提升,将为编程、科研、金融等领域带来效率革命。后续将持续优化模型安全机制,推动技术在更多专业场景的合规落地。