AI 检测到关键网络安全漏洞后,Anthropic 阻止公众使用 Claude Mythos

Anthropic

Anthropic - daily_creativity/Shutterstock.com

Anthropic 宣布限制推出 Claude Mythos Preview,这是一个专注于软件工程和逻辑推理的前沿人工智能模型。该工具在 SWE-bench Verified 基准测试中达到了 93.9% 的准确率,为检测复杂系统中的漏洞设立了新标准。该公司选择不向公众发布该技术,因为该技术利用缺陷的能力存在高风险。

在人工智能发现全球基础设施中存在大量零日漏洞后,我们决定对该系统进行操作保密。这些原始开发人员不知道的漏洞代表了大规模自动入侵的关键向量。该模型的无限制发布可能会为恶意行为者提供互联网历史上前所未有的网络武器库。

人择-Mehaniq/shutterstock.com

为了管理该工具的使用,我们与技术和关键基础设施领域的战略合作伙伴建立了联盟。该联盟的主要目标是利用人工智能的分析能力,在外部威胁开发出类似的攻击方法之前定位并纠正编程缺陷。

开源系统的历史性发现

在实验室测试的初始阶段,Claude Mythos 发现了 OpenBSD 操作系统中隐藏了近三十年的一个关键缺陷。数据处理能力使人工智能超越了人类专家几代人进行的人工审查。此事件表明,被认为高度安全的架构仍然隐藏着深层攻击向量。

该工具还发现了 FFmpeg 中的一个结构错误,FFmpeg 是在全球服务器上处理视频的基本软件,该错误已经存在了 16 年而没有得到纠正。另一个相关发现是在 FreeBSD 中检测到远程代码执行漏洞,该漏洞已正式列入国际安全注册表。这些结果证明了人工智能以工业速度扫描开源存储库的有效性。

检测操作故障的技术效率

在模拟环境中进行的安全评估突显了新版本与之前的人择模型之间的显着技术差异。在使用 Firefox 147 浏览器的压力测试中,Claude Mythos 成功利用了 181 个 shell 漏洞。相比之下,Claude Opus 4.6 模型在相同的受控条件下仅成功完成了两次入侵。

人工智能在入侵模拟过程中 29 次展示了控制关键系统进程的能力。这种复杂程度表明该算法理解操作核心的操作逻辑,而不仅仅是简单地识别开放端口。绕过隔离屏障的能力需要开发人员采取严格的遏制协议。

该系统的架构允许同时分析无数行代码,识别导致内存泄漏或堆栈溢出的模式。了解执行环境可以减少误报的发生率,使得人工智能制定的理论攻击高度准确。这种动态改变了当前防御性网络安全的范式。

基础设施防御战略实施

对 Claude Mythos 的治理是通过 Glasswing 项目进行的,该项目汇集了技术市场中 12 名重要的初始合作伙伴。 Amazon Web Services、Microsoft、Google、Apple 和 NVIDIA 等组织使用模型处理来审核自己的网络和硬件。此次合作旨在封闭支撑大多数全球在线服务的数字边界。

该保护网络覆盖40多个负责重要基础设施的实体,包括金融部门和电信公司。摩根大通和思科等机构属于接收结构性漏洞早期预警的组织之一。竞争对手之间共享机密信息说明了新技术检测到的威胁的严重性。

该项目的技术委员会包括Linux基金会和Broadcom的参与,负责监督安全修复程序的应用。人工智能生成的数据被转化为最终用户的实时更新。这种主动方法可以防止在分发补丁包之前缺陷被利用。

CrowdStrike 和 Palo Alto Networks 等专门从事网络安全的公司致力于将研究结果转化为商业保护签名。将模型智能集成到检测平台中可以创建一个数字盾牌,保护庞大的企业和个人设备网络。最终消费者无需直接与原始工具交互即可享受自动审核的好处。

防止攻击媒介扩散

Anthropic 董事会已发表声明警告称,这些先进分析能力的专有性的保质期很短。处理硬件的不断进步和训练技术的改进表明其他组织将在不久的将来开发具有类似火力的系统。目前的战略重点是利用这个有限的时间窗口来加强全球防御,促进向对自动检查本身具有弹性的软件架构的过渡。

主要危险在于自动检测零日漏洞有可能成为国际网络犯罪集团可利用的工具。当算法可以在几分钟内扫描整个存储库时,基于源代码保密的保护就会失去有效性。因此,项目合作伙伴优先考虑主动防御,确保在独立漏洞利用工具离开不受监管的实验室之前大规模实施安全修复。

严格的准入标准和持续监控

对 Claude Mythos Preview 的访问是在严格的指导原则下进行的,严格禁止导出原始数据或对故障查找算法进行逆向工程。参与安全联盟的每个公司都必须遵循记录在案的透明度协议,详细报告如何应用人工智能发现来减轻各自网络中的系统性风险。这种级别的操作控制在民用软件开发行业中是前所未有的,类似于规范军事应用的军民两用技术处理的国际条约。 Anthropic 将模型限制在与互联网隔离的环境中,技术上称为气隙,以确保人工智能本身无法在没有人类监管者明确且可审核的授权的情况下将敏感信息传输到外部服务器。对交互的持续监控可确保计算能力专门用于防御目的。

云计算环境中的高级安全性

将新的人工智能集成到主要云提供商的运营中提高了企业和政府数据存储的可靠性。预测攻击向量的能力使托管公司能够主动实施安全更新,在实际入侵尝试发生之前消除威胁。保护加密通信的隐私和金融交易的完整性直接取决于在最大安全协议下维护此模型。

旧软件和工业运营的维护

该工具分析遗留代码的能力为维护与过去几十年开发的系统一起运行的基础设施提供了技术解决方案。由于存在运行不稳定的风险,电网和工业控制系统通常会避免升级。该模型允许您精确审核这些旧基地,提出修改建议以增强安全性,而不会中断基本服务的提供。

专注于开源的实体的参与确保了自由软件生态系统以结构化的方式获得自动化审计的好处。纠正为大多数互联网服务器供电的组件中的缺陷,以统一的方式加强数字基础设施。对发现过程的严格控制可以防止技术被转化为数字破坏的工具。

另见