De Amerikaanse startup Anthropic kondigde de implementatie aan van beveiligingsmaatregelen om cybersecurity-gerelateerde verzoeken te beperken in zijn model dat aanvankelijk in april alleen beschikbaar was voor een beperkte groep partners.
Anthropic begon een beperkte, consumentgerichte versie van Mythos aan te bieden, het kunstmatige-intelligentiemodel waarvan de toegang werd gecontroleerd vanwege de sterke cyberaanvalmogelijkheden. De nieuwe optie, genaamd “Claude Fable 5”, vertegenwoordigt “een model van het Mythos-type, maar dat we veilig hebben gemaakt voor algemeen gebruik”, liet het bedrijf dat verantwoordelijk is voor de Claude-assistent dinsdag 9 juni in een blogpost weten.
“Zonder beveiligingsmaatregelen zouden de cyberbeveiligingsfuncties van Fable 5 kunnen worden misbruikt en ernstige schade kunnen veroorzaken”, benadrukt Anthropic. “Dus hebben we besloten om het publiekelijk vrij te geven met waarborgen die vragen over bepaalde onderwerpen omleiden naar ons volgende krachtigste model, Claude Opus 4.8.”
Deze beperking geldt voor gebruikersvragen over cybersecurity, maar ook over biologie en chemie, aldus Anthropic, dat een risico ziet dat de modellen de creatie van biologische wapens vergemakkelijken. Het bedrijf noemde ook ‘destillatie’, een techniek waarbij een kleiner model een groter model raadpleegt om het te kopiëren – een praktijk die volgens het bedrijf door Chinese agenten zou zijn gebruikt. Wanneer een verzoek op deze gebieden wordt gedetecteerd, moet Fable 5 de vraag weigeren en doorsturen naar Opus 4.8.