Anthropic lancia Claude Fable 5, versione sicura e pubblica del potente modello Mythos

Claude Mythos by Anthropic

Claude Mythos by Anthropic - Primakov / Shutterstock.com

La startup americana Anthropic ha annunciato l’implementazione di misure di sicurezza per limitare le richieste legate alla sicurezza informatica nel suo modello inizialmente reso disponibile ad aprile solo a un gruppo limitato di partner.

Anthropic ha iniziato a offrire una versione limitata e orientata al consumatore di Mythos, il suo modello di intelligenza artificiale il cui accesso era controllato a causa delle sue forti capacità di attacco informatico. Denominata “Claude Fable 5”, la nuova opzione rappresenta “un modello tipo Mythos, ma che abbiamo reso sicuro per l’uso generale”, ha informato la società responsabile dell’assistente Claude in un post sul blog questo martedì 9 giugno.

“Senza misure di sicurezza, le funzionalità di sicurezza informatica di Fable 5 potrebbero essere utilizzate in modo improprio e causare gravi danni”, ha sottolineato Anthropic. “Così abbiamo deciso di rilasciarlo pubblicamente con misure di sicurezza che reindirizzano le domande su determinati argomenti al nostro prossimo modello più potente, Claude Opus 4.8.”

Questa limitazione si applica alle richieste degli utenti in materia di sicurezza informatica, ma anche di biologia e chimica, secondo Anthropic, che vede il rischio che i modelli facilitino la creazione di armi biologiche. L’azienda ha anche citato la “distillazione”, una tecnica in cui un modello più piccolo ne consulta uno più grande per copiarlo, una pratica che, secondo l’azienda, sarebbe stata utilizzata dagli agenti cinesi. Quando rileva una richiesta in queste aree, Fable 5 dovrebbe rifiutare e inoltrare la query a Opus 4.8.

Vedi anche