最新新闻 (CN)

由于网络攻击的高风险,Anthropic 决定限制对 Claude Mythos 的访问

Anthropic
照片: Anthropic - daily_creativity/Shutterstock.com

科技公司Anthropic正式推出了其最新的前沿人工智能模型,名为Claude Mythos Preview,此举令全球市场感到惊讶。该公告于 2026 年 4 月 7 日星期二发布,详细说明该工具在编码和逻辑推理测试方面达到了前所未有的性能水平。然而,由于其能力具有潜在的破坏性,该组织决定不向公众提供该系统,并将其使用仅限于选定的一组战略合作伙伴。

该新模型在SWE-bench Verified(全球软件工程效率的主要指标之一)中创下了93.9%的历史记录。对该技术进行操作保密的决定是基于发现了数千个零日漏洞,这些漏洞甚至对于原始系统开发人员来说也是未知的。 Anthropic 强调,Claude Mythos 识别和利用漏洞的能力非常先进,其无限制发布可能会损害整个互联网的安全。

  • 该模型发现了市场领先的操作系统和浏览器中的缺陷。
  • 在开源中检测到了超过 27 年没有纠正的错误。
  • 复杂探索的成功率远远超过克劳德家族之前的版本。
  • 访问将通过技术巨头之间的协调防御计划来控制。

对这种人工智能使用的治理将由 Project Glasswing 进行管理,该联盟旨在加强数字基础设施以应对未来的威胁。获准使用 Mythos Preview 的组织包括关键基础设施公司以及软件和硬件开发领域的领导者。其核心目标是在恶意行为者独立开发类似工具之前,利用人工智能的力量找到并修复安全缺陷。

开源系统和安全领域的历史性发现

Claude Mythos 展示了一种分析能力,挑战了当前对手动审查复杂编程代码的理解。在最初几周的密集测试中,人工智能能够找到 OpenBSD 中的一个关键漏洞,该漏洞近三十年来一直未被人类专家注意到。这一发现表明,即使是被认为最强大和最安全的系统也存在层层漏洞,只有大量数据处理才能准确检测到这些漏洞。

除了 OpenBSD 的案例之外,该模型还暴露了 FFmpeg 的严重缺陷,FFmpeg 是全球使用的视频处理的重要工具,其中包含一个隐藏了 16 年的错误。该工具的准确性还通过识别 FreeBSD 中的远程代码执行漏洞得到了证明,该漏洞现已编目为 CVE-2026-4747。这些结果强化了这样的论点:人工智能已经达到了以工业规模和几乎瞬时的速度进行软件错误检测的水平。

人择
人择-Mehaniq/shutterstock.com

前沿机型技术性能对比

在现代浏览器(例如 Firefox 147)的模拟环境中进行的测试揭示了 Claude Mythos 与其直接前身之间的巨大差异。虽然 Claude Opus 4.6 在数百次尝试中仅成功进行了两次 shell 攻击,但 Mythos Preview 在相同的压力条件下成功了 181 次。这种效率代表了一种进化的飞跃,使防御性网络安全与时间赛跑,以适应新的攻击现实。

在系统日志控制方面,新的AI能够在实验室安全评估过程中29次指挥关键流程。这些数据对系统工程师来说是令人震惊的,因为它表明人工智能不仅找到了网关,而且了解如何操纵操作核心。 Anthropic 强调,该模型的复杂性需要严格的遏制协议,以防止源代码被国际网络犯罪集团复制。

数字防御glasswing项目的战略实施

Glasswing 项目的出现是解决拥有强大工具但无法广泛分发这一困境的制度性解决方案。该计划有 12 家发布合作伙伴参与,包括 Amazon Web Services、微软、谷歌、苹果和 NVIDIA 等。这些公司使用 Claude Mythos 处理技术对自己的云和硬件系统进行审计,试图封闭以前被认为难以渗透的边界。

保护网络扩展到 40 多个关心重要基础设施的组织,例如以摩根大通为代表的银行系统和思科连接网络。 Linux 基金会和 Broadcom 还在技术咨询委员会任职,负责监督人工智能生成的警报如何转化为实时安全修复。这些市场竞争对手之间的合作表明了情况的严重性以及统一战线的必要性,以应对自动攻击升级的可能性。

警告未来攻击工具的民主化

人类领导层对该技术的不久的将来发出了直言不讳的警告,预测这些功能的排他性将是暂时的。随着硬件和模型训练技术的快速发展,道德承诺较少的实体很可能很快就会开发类似的系统。该公司认为,在高度危险的模型变得普遍之前,应该利用当前的时间窗口来加强全球防御。

风险在于,一旦能够找到数千个零日漏洞,基于代码保密的保护将​​不复存在。因此,Glasswing 项目的重点是促进向对自动化 AI 检查具有内在弹性的软件架构的过渡。当前的策略优先考虑主动防御,确保安全“补丁”在漏洞利用工具离开受控实验室之前到达最终用户。

限制访问标准和活动监控

对 Claude Mythos Preview 的访问受到严格的规则监控,以防止原始数据的导出或故障查找算法的内部运作。每个参与组织必须遵循透明度协议,报告如何应用人工智能研究结果来减轻系统性风险。这种控制水平在软件行业中是前所未有的,类似于控制军民两用技术的国际条约。

CrowdStrike 和 Palo Alto Networks 等网络安全机构在将 Mythos 生成的数据转化为客户的保护签名方面发挥着关键作用。通过将新模型智能集成到其检测和响应平台中,他们创建了一个数字盾牌,间接使数百万用户受益。我们的目标是,即使没有与 Claude Mythos 直接接触,普通消费者也能受到人工智能在幕后帮助制定的修正的保护。

创纪录的时间进行故障检测技术操作

Claude Mythos 的架构使其能够同时分析数百万行代码,识别导致内存泄漏或堆栈溢出的逻辑模式。与传统的扫描工具不同,人工智能了解执行的上下文,这大大减少了误报的数量,并允许更准确的理论攻击。这种深度分析使得解决操作系统组件中的问题成为可能,而这些问题已经被几代程序员审查过。

该模型在 JavaScript 环境和命令 shell 中的有效性表明,现代网络是目前最脆弱的战场。 Mythos 轻松绕过浏览器中的沙箱保护表明当前的隔离屏障需要从头开始重新设计。 Anthropic 继续在隔离环境(即“气隙”)中完善模型,以确保人工智能本身在没有监管者明确授权的情况下无法与外界进行通信。

云安全和大规模数据保护

随着 Claude Mythos 集成到 Amazon Web Services 和 Microsoft Azure 运营中,云计算安全性应该达到新的可靠性水平。这些平台托管着全球大部分政府和企业数据,使其成为间谍和破坏活动的主要目标。使用人工智能来预测攻击向量可以主动实施安全更新,通常是在现实生活中尝试攻击之前。

保护个人和财务数据是支持将模型置于严格数字密钥之下的决定的支柱。如果 Claude Mythos 被用于非法目的,银行交易的完整性和加密通信的隐私可能会在几天内受到严重破坏。 Anthropic 在此次发布中所承担的企业责任为 21 世纪高影响力的生成人工智能的发展树立了新的道德标准。

对遗留软件和关键系统维护的影响

人工智能分析旧软件(称为遗留软件)的能力为维护仍然依赖 20 世纪 90 年代和 2000 年代代码的基础设施带来了新的希望。许多工业控制系统和电网的运行基础都很少接受更新,因为担心不稳定。 Claude Mythos 提供了一种安全的方式来审核这些系统,并提出修改建议,以提高安全性,同时又不会影响向人们提供的基本服务的连续性。

Linux 基金会通过参与该项目,确保自由软件生态系统也能受益于这项先进技术。由于 Linux 为大多数互联网服务器提供动力,纠正 Mythos 发现的结构缺陷可以以民主的方式增强网络,尽管发现过程仍然受到控制。这种平衡的方法旨在保护共同利益,同时防止发现工具成为独裁政府或数字民兵手中的武器。

人工智能助力安全发展的未来

Claude Mythos 的推出所表明的趋势表明,在未来,如果没有专门从事安全的人工智能模型的持续监督,就不会编写任何软件。现在,人类编程将通过算法进行实时验证,这些算法不仅可以验证功能,还可以验证针对复杂漏洞的恢复能力。这应该会提高全球软件的平均质量,减少网络犯罪的机会并增加用户的数字信任。

Anthropic 重申,克劳德神话预览只是迈向安全超级智能的复杂旅程的第一步。挑战仍然是如何平衡科学进步与保护公民社会免受其自身发明的副作用的影响。只要 Glasswing 项目合作伙伴的访问权限仍然受到限制,世界就会见证一个人工智能成为主要守护者的时代的诞生,同时也成为对技术知识最终前沿的最大威胁。