News (CN)

OpenAI 推出 GPT-5.2-Codex,在代理编程和防御性网络安全方面取得进展

Open Ai Chat GPT
Open Ai Chat GPT - Foto: Ascannio / Shutterstock.com

OpenAI 于 2025 年 12 月 18 日宣布发布 GPT-5.2-Codex。该模型代表了复杂编程任务和防御安全工作流程的优化演变。新系统最初通过 Codex CLI 和 IDE 扩展等工具向 ChatGPT 付费用户开放。

GPT-5.2-Codex 基于 GPT-5.2 的功能构建,在长会话的上下文压缩方面进行了特定增强。它在 SWE-Bench Pro 和 Terminal-Bench 2.0 等基准测试中展示了卓越的性能。这些改进可以更有效地处理大型存储库和大量代码更改。

开发人员可以使用该模型来导航代码库、执行重构并自主创建拉取请求。与真实终端环境集成,使编译、模型训练和服务器配置变得更加容易。

  • 长期任务的上下文压缩。
  • 代码重构和迁移更加精确。
  • 改进了对 Windows 环境的本机支持。
  • 对图表和屏幕截图等视觉元素的高级解释。
Chat GPT
GPT 聊天 – 照片:Erlin Diah / Shutterstock.com

代理编程的改进

GPT-5.2-Codex 在项目规模运营中脱颖而出。即使计划发生变化或初始尝试失败,它也会在长时间的迭代过程中保持上下文完整。此功能减少了复杂项目中手动干预的需要。

该模型从以前的版本(例如 GPT-5.1-Codex-Max)发展而来,在工具调用和事实准确性方面有所提高。它对代币的操作更加高效,优化了真实软件工程任务的推理。

防御性网络安全的进展

GPT-5.2-Codex 的网络安全能力超越了之前的 OpenAI 模型。它有助于漏洞分析、设置测试环境和对探测系统进行模糊测试。一个现实世界的例子涉及负责任地发现使用以前版本的 React Server 组件中的缺陷。

该模型在专业夺旗等评估中取得了高分。这些指标反映了模拟高级攻击和防御场景的技能。

尽管取得了进展,GPT-5.2-Codex 并未达到公司准备框架中的“高”级别。 OpenAI 实施增强的保障措施以减轻双重用途风险。

经过验证的专业人士可以通过邀请试点计划请求访问。该计划侧重于道德用途,例如漏洞研究和授权红队。

专业基准测试的性能

GPT-5.2-Codex 在 SWE-Bench Pro 中记录的准确度为 56.4%。这一结果使其在为实际工程问题生成补丁方面领先于其他模型。

在Terminal-Bench 2.0中,得分达到64%。该指标评估真实端点环境中的性能,包括配置和执行等任务。

  • 大型重构的最新技术。
  • 代码迁移的改进。
  • 安全工作流程的效率。
  • 编程视觉解释的准确性。

可用性和受控访问

ChatGPT 付费计划用户可以立即在 Codex 界面上访问模型。 OpenAI 计划在未来几周内启用 API 集成。

逐步推出优先考虑安全性。该公司与网络安全社区合作,以最大限度地提高防御效益。

对专业应用感兴趣的组织表达了对可信访问计划的兴趣。该渠道确保负责任地使用高级功能。

软件工程中的实际应用

开发人员使用 GPT-5.2-Codex 来加快开发周期。它处理大型存储库中的代码审查、错误检测和功能实现。

在本机 Windows 上运行的能力扩展了兼容性。之前在 GPT-5.1-Codex-Max 等版本中引入过,此功能得到了进一步的改进。

公司集成该模型以自动执行重复性任务。这包括代码优化以减少内存使用或提高响应时间。

GPT-5.2-Codex 在单个任务中连贯地处理数百万个令牌。这种本机压缩支持每小时的工作流程,而不会丢失上下文。

风险缓解措施

OpenAI 对双重用途功能采取谨慎的态度。保护措施包括针对恶意任务和代理沙箱的特定培训。

该模型仍低于关键的网络风险阈值。未来的计划将吸取此版本的经验教训以实现安全部署。

与外部研究人员的合作验证了研究结果。 React 中的漏洞等案例表明了负责任的应用程序。

与现有工具集成

GPT-5.2-Codex 适用于 Codex CLI、云和代码审查。开发人员为本地或远程任务选择模型。

定期更新使快照与进展保持一致。 OpenAI 尽早传达变更以避免中断。

该版本将 Codex 整合为协作工具。它作为发展的合作伙伴,了解背景并采取独立行动。

此次发布巩固了 OpenAI 在提高专业生产力的人工智能领域的地位。对实际工程和防御安全的关注满足了开发人员和安全团队的需求。

To Top