Seneste Nyheder (DA)

Anthropic blokerer offentlig brug af Claude Mythos, efter AI har opdaget kritiske websikkerhedsfejl

Anthropic
Foto: Anthropic - daily_creativity/Shutterstock.com

Anthropic annoncerede den begrænsede lancering af Claude Mythos Preview, en grænseoverskridende kunstig intelligens-model med fokus på softwareudvikling og logisk inferens. Værktøjet opnåede 93,9 % nøjagtighed på SWE-bench Verified benchmark, hvilket satte en ny standard for detektering af sårbarheder i komplekse systemer. Virksomheden valgte ikke at frigive teknologien til offentligheden på grund af den høje risiko forbundet med dets evne til at udnytte fejl.

Beslutningen om at holde systemet under operationel hemmeligholdelse kommer efter, at kunstig intelligens har identificeret et massivt antal nul-dages sårbarheder i globale infrastrukturer. Essas Smuthuller, ukendt for de oprindelige udviklere, repræsenterer en kritisk vektor for automatiserede indtrængen i stor skala. Ubegrænset frigivelse af modellen kunne give ondsindede aktører et cyberarsenal uden fortilfælde i internettets historie.

Antropisk
Antropisk – Mehaniq/shutterstock.com

For at styre brugen af ​​værktøjet blev der etableret en koalition med strategiske partnere fra teknologi- og kritisk infrastruktursektoren. Hovedformålet med denne alliance er at udnytte AI’s analytiske evner til at lokalisere og rette programmeringsfejl, før eksterne trusler udvikler lignende angrebsmetoder.

Historiske opdagelser i Open Source-systemer

I løbet af den indledende fase af laboratorietestning fandt Claude Mythos en kritisk fejl i OpenBSD-operativsystemet, som havde været skjult i næsten tre årtier. Databehandlingsegenskaber har gjort det muligt for kunstig intelligens at overgå manuel gennemgang udført af menneskelige eksperter gennem generationer. Begivenheden Esse viser, at arkitekturer, der anses for at være meget sikre, stadig rummer dybe angrebsvektorer.

Værktøjet identificerede også en strukturel fejl i FFmpeg, essentiel software til behandling af video på globale servere, som havde eksisteret i 16 år uden rettelse. Outro Et relevant fund var påvisningen af ​​sårbarheden til fjernudførelse af kode i FreeBSD, formelt katalogiseret i internationale sikkerhedsregistre. Esses resultater beviser effektiviteten af ​​AI til at scanne open source-lagre i industriel hastighed.

Teknisk effektivitet til at opdage driftsfejl

Sikkerhedsvurderinger udført i simulerede miljøer fremhævede en væsentlig teknisk forskel mellem den nye version og tidligere modeller af Anthropic. I stresstests med Firefox 147 browseren lykkedes det Claude Mythos med 181 shell-udnyttelser. I modsætning hertil formåede model Claude Opus 4.6 kun at gennemføre to invasioner under de samme kontrollerede forhold.

Kunstig intelligens demonstrerede evnen til at tage kontrol over kritiske systemprocesser 29 gange under indtrængningssimuleringer. Esse niveau af sofistikering indikerer, at algoritmen forstår logikken i at manipulere den operationelle kerne, der går ud over den simple identifikation af åbne porte. Evnen til at omgå isolationsbarrierer kræver strenge indeslutningsprotokoller fra udviklernes side.

Systemets arkitektur tillader samtidig analyse af utallige linjer kode og identificerer mønstre, der forårsager hukommelseslækager eller stak-overløb. Forståelse af eksekveringsmiljøet reducerer forekomsten af ​​falske positiver, hvilket gør teoretiske angreb formuleret af AI meget nøjagtige. Essa Dynamics ændrer nuværende defensive cybersikkerhedsparadigmer.

Strategisk implementering for infrastrukturforsvar

Governance over Claude Mythos udføres gennem Projeto Glasswing, et initiativ, der samler tolv vigtige indledende partnere på teknologimarkedet. Organizações såsom Amazon Web Services, Microsoft, Google, Apple og NVIDIA bruger modelbehandling til at auditere deres egne netværk og hardware. Samarbejdet har til formål at forsegle digitale perimeter, der understøtter de fleste globale onlinetjenester.

Beskyttelsesnetværket dækker mere end 40 enheder med ansvar for vital infrastruktur, herunder finanssektoren og teleselskaber. Instituições samt JPMorgan Chase og Cisco er en del af gruppen, der modtager tidlige advarsler om strukturelle sårbarheder. Deling af fortrolige oplysninger mellem konkurrenter illustrerer alvoren af ​​de trusler, der opdages af den nye teknologi.

Projektets tekniske råd har deltagelse af Linux Foundation og Broadcom, der er ansvarlige for at føre tilsyn med anvendelsen af ​​sikkerhedsrettelser. Data genereret af kunstig intelligens omdannes til realtidsopdateringer for slutbrugere. Essa Proaktiv tilgang forhindrer fejl i at blive udnyttet, før patchpakker distribueres.

Virksomheder med speciale i cybersikkerhed, såsom CrowdStrike og Palo Alto Networks, arbejder på at omsætte resultater til kommercielle beskyttelsessignaturer. Integrering af modelintelligens i detektionsplatforme skaber et digitalt skjold, der beskytter et stort netværk af virksomheds- og personlige enheder. Slutforbrugeren får fordelene ved automatiseret revision uden at skulle interagere direkte med det originale værktøj.

Forebyggelse mod spredning af angrebsvektorer

Bestyrelsen for Anthropic udsendte erklæringer, der advarede om, at eksklusiviteten på disse avancerede analysefunktioner har en kort udløbsdato. Den fortsatte fremgang inden for behandlingshardware og forbedring af træningsteknikker indikerer, at andre organisationer vil udvikle systemer med lignende ildkraft i den nærmeste fremtid. Den nuværende strategi fokuserer på at bruge dette begrænsede tidsvindue til at styrke det globale forsvar og fremme en overgang til softwarearkitekturer, der er naturligt modstandsdygtige over for automatiserede inspektioner.

Den centrale fare ligger i muligheden for, at automatiseret opdagelse af nul-dages sårbarheder bliver et tilgængeligt værktøj for internationale cyberkriminelle grupper. Beskyttelse baseret på kildekodehemmelighed mister sin effektivitet, når algoritmer kan scanne hele arkiver i løbet af få minutter. Af denne grund prioriterer projektpartnere aktivt forsvar og sikrer, at sikkerhedsrettelser implementeres i stor skala, før uafhængige udnyttelsesværktøjer forlader uregulerede laboratorier.

Strenge adgangskriterier og løbende overvågning

Adgang til Claude Mythos Preview sker under strenge retningslinjer, der strengt forbyder eksport af rådata eller omvendt konstruktion af fejlfindingsalgoritmerne. Cada-selskab, der deltager i sikkerhedskonsortiet, er forpligtet til at følge dokumenterede gennemsigtighedsprotokoller og rapportere i detaljer, hvordan kunstig intelligens-opdagelser anvendes for at mindske systemiske risici i deres respektive netværk. Esse niveauet af operationel kontrol er hidtil uset i den civile softwareudviklingsindustri, der ligner internationale traktater, der regulerer håndteringen af ​​dual-use teknologier med militære applikationer. Anthropic holder modellen indespærret i miljøer, der er isoleret fra internettet, teknisk kendt som air-gapped, for at sikre, at den kunstige intelligens i sig selv ikke kan overføre følsomme oplysninger til eksterne servere uden udtrykkelig og auditerbar tilladelse fra menneskelige supervisorer. Konstant overvågning af interaktioner sikrer, at beregningskraft udelukkende er rettet mod defensive formål.

Avanceret sikkerhed i cloud computing-miljøer

Integrationen af ​​ny kunstig intelligens i driften af ​​store cloud-udbydere øger pålideligheden af ​​virksomheds- og regeringsdatalagring. Evnen til at forudsige angrebsvektorer giver hostingvirksomheder mulighed for proaktivt at implementere sikkerhedsopdateringer, der neutraliserer trusler, før der sker faktiske indtrængningsforsøg. Beskyttelse af privatlivets fred for krypteret kommunikation og integriteten af ​​finansielle transaktioner afhænger direkte af at opretholde denne model under maksimale sikkerhedsprotokoller.

Vedligeholdelse af gammel software og industriel drift

Værktøjets evne til at analysere ældre koder tilbyder en teknisk løsning til vedligeholdelse af infrastrukturer, der fungerer med systemer udviklet i de seneste årtier. Redes Strøm- og industrikontrolsystemer undgår ofte opgraderinger på grund af risikoen for driftsstabilitet. Modellen giver dig mulighed for at auditere disse gamle baser med præcision, og foreslår ændringer, der styrker sikkerheden uden at afbryde leveringen af ​​væsentlige tjenester.

Deltagelsen af ​​enheder med fokus på open source sikrer, at det frie software-økosystem modtager fordelene ved automatiseret revision på en struktureret måde. Korrigering af fejl i komponenter, der driver de fleste internetservere, styrker den digitale infrastruktur på en ensartet måde. Streng kontrol over opdagelsesprocessen forhindrer teknologi i at blive konverteret til et instrument for digital sabotage.