Anthropic meluncurkan Claude Fable 5, versi publik dan aman dari model Mythos yang kuat

Claude Mythos by Anthropic

Claude Mythos by Anthropic - Primakov / Shutterstock.com

Startup Amerika, Anthropic, mengumumkan penerapan langkah-langkah keamanan untuk membatasi permintaan terkait keamanan siber dalam modelnya yang awalnya tersedia pada bulan April hanya untuk sekelompok mitra terbatas.

Anthropic mulai menawarkan versi Mythos yang terbatas dan berorientasi konsumen, model kecerdasan buatan yang aksesnya dikontrol karena kemampuan serangan sibernya yang kuat. Disebut “Claude Fable 5”, opsi baru ini mewakili “model tipe Mythos, tetapi kami telah membuatnya aman untuk penggunaan umum”, perusahaan yang bertanggung jawab atas asisten Claude diberitahu dalam sebuah posting blog Selasa ini, 9 Juni.

“Tanpa langkah-langkah keamanan, fitur keamanan siber Fable 5 dapat disalahgunakan dan menyebabkan kerusakan serius,” tegas Anthropic. “Jadi kami memutuskan untuk merilisnya secara publik dengan perlindungan yang mengalihkan pertanyaan tentang topik tertentu ke model kami yang paling canggih berikutnya, Claude Opus 4.8.”

This limitation applies to user requests about cybersecurity, but also about biology and chemistry, according to Anthropic, which sees a risk that the models facilitate the creation of biological weapons. Perusahaan tersebut juga mengutip “distilasi”, sebuah teknik di mana model yang lebih kecil berkonsultasi dengan model yang lebih besar untuk menirunya – sebuah praktik yang, menurut perusahaan, akan digunakan oleh agen-agen Tiongkok. Saat mendeteksi permintaan di area ini, Fable 5 harus menolak dan meneruskan kueri ke Opus 4.8.

Lihat Juga