2025 年 12 月 18 日,OpenAI 推出了 GPT-5.2-Codex,这是针对复杂编程和防御性网络安全进行优化的新一代语言模型。该系统代表了应用人工智能的进步,旨在提高开发人员和数字安全团队的生产力,提供用于大规模创建、分析和保护代码的工具。最初,对 GPT-5.2-Codex 的访问仅限于付费 ChatGPT 用户,通过 Codex CLI 等界面和集成到开发环境 (IDE) 中的扩展来确保受控部署。
该模型基于 GPT-5.2 架构构建,在上下文压缩方面进行了重大改进,可在不丢失信息的情况下实现延长的工作会话。其优越的性能已在SWE-Bench Pro、Terminal-Bench 2.0等行业基准评估中得到证明。
开发人员现在可以探索有助于以下功能的功能:
– 通过庞大的代码库进行导航。
– 进行自动化重构。
– 自主创建拉取请求。
– 与真实终端环境直接集成。
增强的开发人员能力
GPT-5.2-Codex 擅长于需要整体和项目规模视图的操作,即使面对复杂的迭代或意外的变化也能保持上下文的一致性。这一特性对于减少大型软件工程项目中人为干预的需求至关重要。
与以前的版本(例如 GPT-5.1-Codex-Max)相比,其演变是显着的,在工具调用的执行和生成的响应的事实准确性方面有了显着的进步。这种优化可以更有效地使用代币。
该平台还为 Windows 环境提供增强的本机支持,这一功能显着扩展了其兼容性。对图表和屏幕截图等视觉元素的高级解释可以补充您的技能。
网络安全创新
与之前的 OpenAI 模型相比,GPT-5.2-Codex 的网络安全功能取得了相当大的进步。事实证明,它是协助漏洞分析和模糊测试技术应用的强大工具。
其有效性的一个实际例子包括通过模型的预览版本来负责任地发现 React Server 组件中的漏洞。这证明了系统主动采取行动的潜力。
该模型在专业评估中取得了高分,例如专业夺旗。这些指标证明了 GPT-5.2-Codex 在准确性和效率至关重要的领域中的稳健性。
尽管表现出色,OpenAI 强调 GPT-5.2-Codex 尚未达到公司准备框架中的“高”级别。因此,该组织实施严格的保障措施来降低双重用途风险。
技术评估表现
在行业基准测试中,GPT-5.2-Codex 在 SWE-Bench Pro 中记录的准确度为 56.4%。这使其处于生成补丁以解决现实世界软件工程问题的最前沿。
在Terminal-Bench 2.0中,系统性能得分达到了64%。该指标评估模型在真实终端环境中高效运行、执行复杂任务的能力。
逐步接入和部署
通过 Codex 界面立即向 ChatGPT 付费计划用户提供 GPT-5.2-Codex 代表了一种优先考虑安全性和早期反馈收集的启动策略。 OpenAI 计划在未来几周内扩大 API 集成。
逐步推出过程对于确保所有安全措施得到正确实施和测试至关重要。该公司与网络安全社区合作,最大限度地提高该模型的防御优势。
降低风险的行动
OpenAI 通过实施强有力的保障措施,对人工智能的双重用途能力采取谨慎的态度。其中包括用于防止恶意任务的特定模型训练、用于隔离操作的沙箱自主代理。该系统受到监控,以保持在关键网络风险阈值以下,并与外部研究人员合作验证研究结果并加强技术的负责任应用。
实际应用及未来
开发人员和软件工程团队可以集成 GPT-5.2-Codex,通过优化代码审查、错误检测和功能实现来显着加快开发周期。
