最新新聞 (TW)

由於網路攻擊的高風險,Anthropic 決定限制對 Claude Mythos 的訪問

Anthropic
Foto: Anthropic - daily_creativity/Shutterstock.com

科技公司Anthropic正式推出了最新的前沿人工智慧模型,名為Claude Mythos Preview,此舉令全球市場感到驚訝。該公告於 2026 年 4 月 7 日星期二發布,詳細說明該工具在編碼和邏輯推理測試方面達到了前所未有的性能水平。然而,由於其能力具有潛在的破壞性,該組織決定不向公眾提供該系統,並將其使用僅限於選定的一組策略合作夥伴。

該新模型在SWE-bench Verified(全球軟體工程效率的主要指標之一)中創下了93.9%的歷史記錄。對該技術進行操作保密的決定是基於發現了數千個零日漏洞,這些漏洞甚至對於原始系統開發人員來說也是未知的。 Anthropic 強調,Claude Mythos 識別和利用漏洞的能力非常先進,其無限制發布可能會損害整個網路的安全。

  • 該模型發現了市場領先的作業系統和瀏覽器中的缺陷。
  • 在開源中偵測到了超過 27 年沒有修正的錯誤。
  • 複雜探索的成功率遠遠超過克勞德家族先前的版本。
  • 訪問將透過技術巨頭之間的協調防禦計劃來控制。

對這種人工智慧使用的治理將由 Project Glasswing 進行管理,該聯盟旨在加強數位基礎設施以應對未來的威脅。獲準使用 Mythos Preview 的組織包括關鍵基礎設施公司以及軟體和硬體開發的領導者。其核心目標是在惡意行為者獨立開發類似工具之前,利用人工智慧的力量來找到並修復安全缺陷。

開源系統和安全領域的歷史性發現

Claude Mythos 展示了一種分析能力,挑戰了目前對手動審查複雜程式碼的理解。在最初幾週的密集測試中,人工智慧能夠找到 OpenBSD 中的一個關鍵漏洞,該漏洞近三十年來一直未被人類專家注意到。這項發現表明,即使是被認為最強大和最安全的系統也存在層層漏洞,只有大量資料處理才能準確檢測這些漏洞。

除了 OpenBSD 的案例之外,該模型還暴露了 FFmpeg 的嚴重缺陷,FFmpeg 是全球使用的視訊處理的重要工具,其中包含一個隱藏了 16 年的錯誤。該工具的準確性也透過識別 FreeBSD 中的遠端程式碼執行漏洞得到了證明,該漏洞現已編目為 CVE-2026-4747。這些結果強化了這樣的論點:人工智慧已經達到了以工業規模和幾乎瞬時的速度進行軟體錯誤檢測的水平。

人擇
人擇-Mehaniq/shutterstock.com

前沿機型技術性能對比

在現代瀏覽器(例如​​ Firefox 147)的模擬環境中進行的測試揭示了 Claude Mythos 與其直接前身之間的巨大差異。雖然 Claude Opus 4.6 在數百次嘗試中僅成功進行了兩次 shell 攻擊,但 Mythos Preview 在相同的壓力條件下成功了 181 次。這種效率代表了一種進化的飛躍,使防禦性網路安全與時間賽跑,以適應新的攻擊現實。

在系統日誌控制方面,新的AI能夠在實驗室安全評估過程中29次指揮關鍵流程。這些數據對系統工程師來說是令人震驚的,因為它表明人工智慧不僅找到了網關,而且了解如何操縱操作核心。 Anthropic 強調,該模型的複雜性需要嚴格的遏制協議,以防止原始程式碼被國際網路犯罪集團複製。

數位防禦glasswing專案的策略實施

Glasswing 計畫的出現是解決擁有強大工具但無法廣泛分發這一困境的製度性解決方案。該計劃有 12 家發布合作夥伴參與,包括 Amazon Web Services、微軟、Google、蘋果和 NVIDIA 等。這些公司使用 Claude Mythos 處理技術對自己的雲端和硬體系統進行審計,試圖封閉以前被認為難以滲透的邊界。

保護網路擴展到 40 多個負責重要基礎設施的組織,例如以摩根大通和思科連接網路為代表的銀行系統。 Linux 基金會和 Broadcom 也曾在技術諮詢委員會任職,負責監督人工智慧產生的警報如何轉化為即時安全修復。這些市場競爭對手之間的合作表明了情況的嚴重性以及統一戰線的必要性,以應對自動攻擊升級的可能性。

警告未來攻擊工具的民主化

人類領導層對該技術的不久的將來發出了直言不諱的警告,預測這些功能的排他性將是暫時的。隨著硬體和模型訓練技術的快速發展,道德承諾較少的實體很可能很快就會發展出類似的系統。該公司認為,在高度危險的模型變得普遍之前,應該利用目前的時間窗口來加強全球防禦。

風險在於,一旦能夠找到數千個零日漏洞,基於程式碼保密的保護將不復存在。因此,Glasswing 專案的重點是促進向對自動化 AI 檢查具有內在彈性的軟體架構的過渡。目前的策略優先考慮主動防禦,確保安全「修補程式」在漏洞利用工具離開受控實驗室之前到達最終用戶。

限制存取標準和活動監控

對 Claude Mythos Preview 的存取受到嚴格的規則監控,以防止原始資料的匯出或故障查找演算法的內部運作。每個參與組織必須遵循透明度協議,報告如何應用人工智慧研究結果來減輕系統性風險。這種控制水準在軟體產業中是前所未有的,類似於控制軍民兩用技術的國際條約。

CrowdStrike 和 Palo Alto Networks 等網路安全機構在將 Mythos 產生的資料轉化為客戶的保護簽章方面發揮關鍵作用。透過將新模型智慧整合到其檢測和回應平台中,他們創建了一個數位盾牌,間接使數百萬用戶受益。我們的目標是,即使沒有與 Claude Mythos 直接接觸,普通消費者也能受到人工智慧在幕後幫助制定的修正的保護。

創紀錄的時間進行故障檢測技術操作

Claude Mythos 的架構使其能夠同時分析數百萬行程式碼,識別導致記憶體洩漏或堆疊溢出的邏輯模式。與傳統的掃描工具不同,人工智慧了解執行的上下文,這大大減少了誤報的數量,並允許更準確的理論攻擊。這種深度分析使得解決作業系統元件中的問題成為可能,而這些問題已經被幾代程式設計師審查過。

該模型在 JavaScript 環境和命令 shell 中的有效性表明,現代網路是目前最脆弱的戰場。 Mythos 輕鬆繞過瀏覽器中的沙箱保護表明當前的隔離屏障需要從頭開始重新設計。 Anthropic 繼續在隔離環境(即「氣隙」)中完善模型,以確保人工智慧本身在沒有監管者明確授權的情況下無法與外界進行通訊。

雲端安全和大規模資料保護

隨著 Claude Mythos 整合到 Amazon Web Services 和 Microsoft Azure 營運中,雲端運算安全性應該會達到新的可靠性等級。這些平台託管著全球大部分政府和企業數據,使其成為間諜和破壞活動的主要目標。使用人工智慧來預測攻擊向量可以主動實施安全性更新,通常是在現實生活中嘗試攻擊之前。

保護個人和財務數據是支持將模型置於嚴格數字密鑰之下的決定的支柱。如果 Claude Mythos 被用於非法目的,銀行交易的完整性和加密通訊的隱私可能會在幾天內受到嚴重破壞。 Anthropic 在此次發布中所承擔的企業責任為 21 世紀高影響力的生成人工智慧的發展樹立了新的道德標準。

對遺留軟體和關鍵系統維護的影響

人工智慧分析舊軟體(稱為遺留軟體)的能力為維護仍然依賴 20 世紀 90 年代和 2000 年代程式碼的基礎設施帶來了新的希望。許多工業控制系統和電網的運作基礎都很少接受更新,因為擔心不穩定。 Claude Mythos 提供了一種安全的方式來審查這些系統,並提出修改建議,以提高安全性,同時又不會影響向人們提供的基本服務的連續性。

Linux 基金會透過參與此項目,確保自由軟體生態系統也能受益於這項先進技術。由於 Linux 為大多數互聯網伺服器提供動力,糾正 Mythos 發現的結構缺陷可以以民主的方式增強網絡,儘管發現過程仍然受到控制。這種平衡的方法旨在保護共同利益,同時防止發現工具成為獨裁政府或數位民兵手中的武器。

人工智慧助力安全發展的未來

Claude Mythos 的推出所表明的趨勢表明,在未來,如果沒有專門從事安全的人工智慧模型的持續監督,就不會編寫任何軟體。現在,人類程式設計將透過演算法進行即時驗證,這些演算法不僅可以驗證功能,還可以驗證針對複雜漏洞的復原能力。這應該會提高全球軟體的平均質量,減少網路犯罪的機會並增加用戶的數位信任。

Anthropic 重申,克勞德神話預覽只是邁向安全超級智慧的複雜旅程的第一步。挑戰仍然是如何平衡科學進步與保護公民社會免受其自身發明的副作用的影響。只要 Glasswing 專案合作夥伴的存取權限仍然受到限制,世界就會見證一個人工智慧成為主要守護者的時代的誕生,同時也成為對技術知識最終前沿的最大威脅。