News (CN)

OpenAI 推出 GPT-5.2-Codex，在代理编程和防御性网络安全方面取得进展

作者 Janderson Luiz

发布于 2025年12月19日

Open Ai Chat GPT - Foto: Ascannio / Shutterstock.com

OpenAI 于 2025 年 12 月 18 日宣布发布 GPT-5.2-Codex。该模型代表了复杂编程任务和防御安全工作流程的优化演变。新系统最初通过 Codex CLI 和 IDE 扩展等工具向 ChatGPT 付费用户开放。

GPT-5.2-Codex 基于 GPT-5.2 的功能构建，在长会话的上下文压缩方面进行了特定增强。它在 SWE-Bench Pro 和 Terminal-Bench 2.0 等基准测试中展示了卓越的性能。这些改进可以更有效地处理大型存储库和大量代码更改。

开发人员可以使用该模型来导航代码库、执行重构并自主创建拉取请求。与真实终端环境集成，使编译、模型训练和服务器配置变得更加容易。

代理编程的改进

GPT-5.2-Codex 在项目规模运营中脱颖而出。即使计划发生变化或初始尝试失败，它也会在长时间的迭代过程中保持上下文完整。此功能减少了复杂项目中手动干预的需要。

该模型从以前的版本（例如 GPT-5.1-Codex-Max）发展而来，在工具调用和事实准确性方面有所提高。它对代币的操作更加高效，优化了真实软件工程任务的推理。

GPT-5.2-Codex 的网络安全能力超越了之前的 OpenAI 模型。它有助于漏洞分析、设置测试环境和对探测系统进行模糊测试。一个现实世界的例子涉及负责任地发现使用以前版本的 React Server 组件中的缺陷。

该模型在专业夺旗等评估中取得了高分。这些指标反映了模拟高级攻击和防御场景的技能。

尽管取得了进展，GPT-5.2-Codex 并未达到公司准备框架中的“高”级别。 OpenAI 实施增强的保障措施以减轻双重用途风险。

经过验证的专业人士可以通过邀请试点计划请求访问。该计划侧重于道德用途，例如漏洞研究和授权红队。

GPT-5.2-Codex 在 SWE-Bench Pro 中记录的准确度为 56.4%。这一结果使其在为实际工程问题生成补丁方面领先于其他模型。

在Terminal-Bench 2.0中，得分达到64%。该指标评估真实端点环境中的性能，包括配置和执行等任务。

ChatGPT 付费计划用户可以立即在 Codex 界面上访问模型。 OpenAI 计划在未来几周内启用 API 集成。

逐步推出优先考虑安全性。该公司与网络安全社区合作，以最大限度地提高防御效益。

对专业应用感兴趣的组织表达了对可信访问计划的兴趣。该渠道确保负责任地使用高级功能。

开发人员使用 GPT-5.2-Codex 来加快开发周期。它处理大型存储库中的代码审查、错误检测和功能实现。

在本机 Windows 上运行的能力扩展了兼容性。之前在 GPT-5.1-Codex-Max 等版本中引入过，此功能得到了进一步的改进。

公司集成该模型以自动执行重复性任务。这包括代码优化以减少内存使用或提高响应时间。

GPT-5.2-Codex 在单个任务中连贯地处理数百万个令牌。这种本机压缩支持每小时的工作流程，而不会丢失上下文。

OpenAI 对双重用途功能采取谨慎的态度。保护措施包括针对恶意任务和代理沙箱的特定培训。

该模型仍低于关键的网络风险阈值。未来的计划将吸取此版本的经验教训以实现安全部署。

与外部研究人员的合作验证了研究结果。 React 中的漏洞等案例表明了负责任的应用程序。

GPT-5.2-Codex 适用于 Codex CLI、云和代码审查。开发人员为本地或远程任务选择模型。

定期更新使快照与进展保持一致。 OpenAI 尽早传达变更以避免中断。

该版本将 Codex 整合为协作工具。它作为发展的合作伙伴，了解背景并采取独立行动。

此次发布巩固了 OpenAI 在提高专业生产力的人工智能领域的地位。对实际工程和防御安全的关注满足了开发人员和安全团队的需求。