OpenAI 于 2025 年 12 月 18 日宣布发布 GPT-5.2-Codex。该模型代表了复杂编程任务和防御安全工作流程的优化演变。新系统最初通过 Codex CLI 和 IDE 扩展等工具向 ChatGPT 付费用户开放。
GPT-5.2-Codex 基于 GPT-5.2 的功能构建,在长会话的上下文压缩方面进行了特定增强。它在 SWE-Bench Pro 和 Terminal-Bench 2.0 等基准测试中展示了卓越的性能。这些改进可以更有效地处理大型存储库和大量代码更改。
开发人员可以使用该模型来导航代码库、执行重构并自主创建拉取请求。与真实终端环境集成,使编译、模型训练和服务器配置变得更加容易。
- 长期任务的上下文压缩。
- 代码重构和迁移更加精确。
- 改进了对 Windows 环境的本机支持。
- 对图表和屏幕截图等视觉元素的高级解释。

代理编程的改进
GPT-5.2-Codex 在项目规模运营中脱颖而出。即使计划发生变化或初始尝试失败,它也会在长时间的迭代过程中保持上下文完整。此功能减少了复杂项目中手动干预的需要。
该模型从以前的版本(例如 GPT-5.1-Codex-Max)发展而来,在工具调用和事实准确性方面有所提高。它对代币的操作更加高效,优化了真实软件工程任务的推理。
防御性网络安全的进展
GPT-5.2-Codex 的网络安全能力超越了之前的 OpenAI 模型。它有助于漏洞分析、设置测试环境和对探测系统进行模糊测试。一个现实世界的例子涉及负责任地发现使用以前版本的 React Server 组件中的缺陷。
该模型在专业夺旗等评估中取得了高分。这些指标反映了模拟高级攻击和防御场景的技能。
尽管取得了进展,GPT-5.2-Codex 并未达到公司准备框架中的“高”级别。 OpenAI 实施增强的保障措施以减轻双重用途风险。
经过验证的专业人士可以通过邀请试点计划请求访问。该计划侧重于道德用途,例如漏洞研究和授权红队。
专业基准测试的性能
GPT-5.2-Codex 在 SWE-Bench Pro 中记录的准确度为 56.4%。这一结果使其在为实际工程问题生成补丁方面领先于其他模型。
在Terminal-Bench 2.0中,得分达到64%。该指标评估真实端点环境中的性能,包括配置和执行等任务。
- 大型重构的最新技术。
- 代码迁移的改进。
- 安全工作流程的效率。
- 编程视觉解释的准确性。
可用性和受控访问
ChatGPT 付费计划用户可以立即在 Codex 界面上访问模型。 OpenAI 计划在未来几周内启用 API 集成。
逐步推出优先考虑安全性。该公司与网络安全社区合作,以最大限度地提高防御效益。
对专业应用感兴趣的组织表达了对可信访问计划的兴趣。该渠道确保负责任地使用高级功能。
软件工程中的实际应用
开发人员使用 GPT-5.2-Codex 来加快开发周期。它处理大型存储库中的代码审查、错误检测和功能实现。
在本机 Windows 上运行的能力扩展了兼容性。之前在 GPT-5.1-Codex-Max 等版本中引入过,此功能得到了进一步的改进。
公司集成该模型以自动执行重复性任务。这包括代码优化以减少内存使用或提高响应时间。
GPT-5.2-Codex 在单个任务中连贯地处理数百万个令牌。这种本机压缩支持每小时的工作流程,而不会丢失上下文。
风险缓解措施
OpenAI 对双重用途功能采取谨慎的态度。保护措施包括针对恶意任务和代理沙箱的特定培训。
该模型仍低于关键的网络风险阈值。未来的计划将吸取此版本的经验教训以实现安全部署。
与外部研究人员的合作验证了研究结果。 React 中的漏洞等案例表明了负责任的应用程序。
与现有工具集成
GPT-5.2-Codex 适用于 Codex CLI、云和代码审查。开发人员为本地或远程任务选择模型。
定期更新使快照与进展保持一致。 OpenAI 尽早传达变更以避免中断。
该版本将 Codex 整合为协作工具。它作为发展的合作伙伴,了解背景并采取独立行动。
此次发布巩固了 OpenAI 在提高专业生产力的人工智能领域的地位。对实际工程和防御安全的关注满足了开发人员和安全团队的需求。