La startup américaine Anthropic a annoncé la mise en place de mesures de sécurité pour restreindre les demandes liées à la cybersécurité dans son modèle initialement proposé en avril à un groupe restreint de partenaires.
Anthropic a commencé à proposer une version limitée et orientée consommateur de Mythos, son modèle d’intelligence artificielle dont l’accès était contrôlé en raison de ses fortes capacités de cyberattaque. Baptisée « Claude Fable 5 », la nouvelle option représente « un modèle de type Mythos, mais que nous avons sécurisé pour un usage général », a fait savoir la société responsable de l’assistant Claude dans un article de blog ce mardi 9 juin.
« Sans mesures de sécurité, les fonctionnalités de cybersécurité de Fable 5 pourraient être utilisées à mauvais escient et causer de graves dommages », a souligné Anthropic. “Nous avons donc décidé de le rendre public avec des garanties qui redirigent les requêtes sur certains sujets vers notre prochain modèle le plus puissant, Claude Opus 4.8.”
Cette limitation s’applique aux demandes des utilisateurs en matière de cybersécurité, mais aussi en matière de biologie et de chimie, selon Anthropic, qui voit le risque que les modèles facilitent la création d’armes biologiques. The company also cited “distillation”, a technique in which a smaller model consults a larger one to copy it — a practice that, according to the company, would have been used by Chinese agents. Lors de la détection d’une requête dans ces zones, Fable 5 doit refuser et transmettre la requête à l’Opus 4.8.

