OpenAI 宣布推出GPT-5.2-法典随着代理编程和网络安全的进步。该公司立即向所有 Codex 平台上的付费 ChatGPT 用户提供该模板。通过 API 访问将在未来几周内进行。该模型代表了 GPT-5.2 的优化版本,专门用于 Codex 环境中的复杂编码任务。
GPT-5.2-Codex 在理解长上下文和本机压缩方面表现出色。这些功能允许在大型存储库上进行扩展会话,而不会降低效率。它在基准测试中的表现优于前辈,例如 SWE-Bench Pro(准确率 56.4%)和 Terminal-Bench 2.0(准确率达到 64%)。
OpenAI 为经过验证的防御性网络安全专业人员推出了邀请试点项目。该计划提供对更宽松的功能的访问,重点是负责任的使用。

长期任务的改进
GPT-5.2-Codex 结合了上下文压缩以保持扩展作业之间的一致性。开发人员以更高的可靠性执行大规模重构和代码迁移。该模型可以更好地处理迭代期间的计划变更。
它处理大型存储库,在数小时内保持上下文完整。需要多次尝试的任务受益于改进的持久性。
专业基准测试的性能
该模型记录了实际软件工程评估的重大进步。
- SWE-Bench Pro:准确率 56.4%,优于 GPT-5.2 55.6%。
- Terminal-Bench 2.0:准确度为 64%,高于 GPT-5.2 的 62.2%。
这些测试模拟真实的终端环境,包括代码编译和服务器配置。 GPT-5.2-Codex 在本机 Windows 场景中展示了更高的有效性。
视觉和原型设计方面的先进能力
GPT-5.2-Codex 准确地解释了共享的屏幕截图和技术图表。它可以快速将设计模型转换为工作原型。
开发人员反复协作,将原型发展为生产。此功能加速了界面项目中的可视化工作流程。
防御性网络安全的进展
该模型具有比任何以前版本的 OpenAI 更强大的网络功能。它有助于受控环境中的漏洞分析和模糊测试。
一位研究人员使用前身 GPT-5.1-Codex-Max 来识别最近披露的 React 缺陷。 GPT-5.2-Codex 提高了大规模防御任务的潜力。
OpenAI 实施双重用途风险保障措施。该模型未达到准备框架中的“高”级别。
周密的部署策略
该版本优先考虑可立即访问 Codex 的付费 ChatGPT 用户。随着安全测试的进行,API 的扩展逐渐发生。
邀请试点项目选择具有负责任披露历史的专业人士。专注于网络防御的组织获得了更多的访问权限。
这种方法平衡了创新与降低潜在风险。
与现有工具集成
通过 npm i -g @openai/codex 命令进行简单安装,可以轻松上手。该模板与 Codex CLI 集成,适用于本地和云工作流程。
开发人员在保持令牌效率的情况下维持延长的会话。工具调用在代理任务中变得更加可靠。
对专业软件工程的好处
GPT-5.2-Codex 是复杂的现实项目中的可靠合作伙伴。它减少了重构和功能开发的时间。
公司通过自主协助加速工程团队的发展。对事实准确性的关注可以最大限度地减少长上下文中的错误。
对负责任使用的看法
OpenAI 监控进度,以便在未来迭代中调整保障措施。防御能力加强了合法漏洞搜索。
合格的专业人士对独家试点提供反馈。这种合作完善了可访问性和安全性之间的平衡。
GPT-5.2-Codex 将自己定位为高级编码的重要工具。它将尖端性能与敏感领域的责任相结合。