最新新聞 (TW)

Claude Mythos Preview 在有限時間內登陸 Vertex AI,並加強網路安全測試

Claude
Foto: Claude - Melinda Nagy/ Shutterstock.com

Anthropic 發布了《克勞德神話》預覽版的限量預覽版。此版本現已在 Google Cloud 的 Vertex AI 上供特定使用者群組使用。該模型因其在網路安全任務中的表現而脫穎而出。

該公告於本週發布。由於該模型可能用於攻擊,Anthropic 選擇不廣泛發布該模型。相反,該公司創建了 Project Glasswing,該計劃將大型科技公司聚集在一起,並應用該模型來防禦系統。

Vertex AI 的發布詳細信息

Claude Mythos 預覽版出現在 Google Cloud 部落格。選擇 Vertex AI 客戶可以獲得受控存取權限。該平台允許合作夥伴在真實的程式碼分析場景中測試模型的功能。

Anthropic 於 2026 年 4 月 7 日發布了一份技術報告。在報告中,研究人員描述了該模型如何識別開源和專有專案中的漏洞。重點是在許多情況下仍未修補的高嚴重性故障。

該模型不僅僅依賴已知模式。它分析程式碼結構,理解開發者的意圖,並結合邏輯缺陷形成探索路徑。這種方法不同於傳統的模糊測試工具,傳統的模糊測試工具會發送大量隨機資料。

  • Claude Mythos 預覽版發現了數千個高風險漏洞。
  • 報告稱,其中99%以上尚未修正。
  • 該模型在多個測試中自主創建了有效的漏洞。
  • 人類專家驗證了 89% 的嚴重程度評級,結果完全一致。

發現漏洞的具體案例

OpenBSD 就是一個例子。此模型定位了 TCP SACK 處理中存在 27 年之久的缺陷。此漏洞允許透過序號比較中的整數溢位進行遠端拒絕服務攻擊。

另一個發現發生在 FFmpeg 中。 H.264 編解碼器中已有 16 年歷史的缺陷允許寫入超出記憶體限制。這個問題是在傳統模糊測試工具通常不會重現的特定切片數條件下出現的。

在 FreeBSD 上,該模型識別出 CVE-2026-4747。這是 NFS 伺服器中已有 17 年歷史的漏洞,允許遠端執行程式碼並在未經身份驗證的情況下升級到 root 權限。建置的漏洞將操作分為多個 RPC 請求。

這些發現出現在 Anthropic 的技術報告中。補丁已經在某些情況下應用,例如 OpenBSD 和 FFmpeg。該公司遵循協調的揭露流程,並規定維護人員在完整細節公開之前糾正缺陷的最後期限。

克洛德
克勞德 – Azulblue / Shutterstock.com

與先前型號的比較

Claude Mythos Preview 的效能超越了 Claude 系列之前的版本。在內部測試中,該模型在建立針對 Firefox JavaScript 等機制的漏洞利用方面取得了重大飛躍。報告顯示,成功利用漏洞的數量顯著增加。

Anthropic 尚未發布通用模型。透過 Project Glasswing 的合作夥伴進行存取。亞馬遜、蘋果、微軟和谷歌等公司參與了加強關鍵軟體和開源專案安全性的倡議。

Google Cloud 提到 Vertex AI 整合是向合格客戶提供前沿模式的一種方式。可用性受到限制,旨在用於防禦用途。

開發人員和安全團隊發生了什麼變化

開發人員可以使用類似的工具更深入地審查程式碼。該模型有助於識別程式碼應該執行的操作與實際實現的操作之間的差異。此功能可加快修復人類或自動掃描器緩慢發現的問題的速度。

Anthropic 強化了其對負責任揭露的承諾。該公司與合作夥伴合作報告漏洞並留出時間進行修復。報告強調,最大的好處是在防守方面。

安全團隊現在擁有一種可以快速處理大型程式碼庫的工具。該過程包括邏輯分析和攻擊場景建構。在採取具體行動之前,結果要經過人工驗證。

Vertex AI 的限時發布允許進行受控測試。授權使用者在監督環境中探索功能。 Anthropic 計劃利用所學到的知識來指導未來模型的開發,並採取適當的保障措施。

技術表和當前可用性

所選組的預覽在 Vertex AI 中處於活動狀態。有關存取要求的完整詳細資訊顯示在 Google Cloud 文件和 Anthropic 頻道中。

此模型適合先進的網路能力評估。基準測試顯示了涉及閱讀原始程式碼、推理故障和生成概念證明的任務的高效能。

該舉措反映了人工智慧公司尋求的平衡。強大的能力受限於減少濫用風險,同時最大限度地提高集體安全的潛力。

Anthropic 持續監控 Glasswing 專案中的使用情況。合作夥伴關係包括支持開源專案的贈款和信貸。重點仍然是保護關鍵基礎設施。