Американский стартап Anthropic объявил о внедрении мер безопасности для ограничения запросов, связанных с кибербезопасностью, в своей модели, первоначально доступной в апреле только ограниченной группе партнеров.
Anthropic начала предлагать ограниченную, ориентированную на потребителя версию Mythos, своей модели искусственного интеллекта, доступ к которой контролировался из-за ее сильных возможностей кибератак. Новая опция под названием «Claude Fable 5» представляет собой «модель типа Mythos, но которую мы сделали безопасной для общего использования», — сообщила компания, ответственная за помощника Claude, в своем блоге во вторник, 9 июня.
«Без мер безопасности функции кибербезопасности Fable 5 могут быть использованы не по назначению и нанести серьезный ущерб», — подчеркнул Anthropic. «Поэтому мы решили опубликовать его публично с защитой, которая перенаправляет запросы по определенным темам на нашу следующую самую мощную модель, Claude Opus 4.8».
Это ограничение распространяется на запросы пользователей о кибербезопасности, а также о биологии и химии, согласно Anthropic, которая видит риск того, что модели будут способствовать созданию биологического оружия. Компания также упомянула «дистилляцию» — метод, при котором меньшая модель обращается к более крупной, чтобы скопировать ее — практика, которая, по мнению компании, могла бы быть использована китайскими агентами. При обнаружении запроса в этих областях Fable 5 должна отклонить его и перенаправить запрос в Opus 4.8.