Telset.id – Anthropic resmi memulihkan akses global ke model AI Claude Fable 5, sehari setelah Departemen Perdagangan Amerika Serikat (AS) mencabut kontrol ekspor yang diberlakukan pada 12 Juni lalu. Pemulihan ini mengakhiri kebuntuan selama 18 hari yang sempat membuat model tersebut tidak dapat diakses di seluruh dunia.
Keputusan untuk menarik akses global Fable 5 diambil setelah pemerintah AS, melalui Departemen Perdagangan, mengeluarkan arahan yang melarang warga negara asing, termasuk staf non-warga negara Anthropic sendiri, untuk menggunakan model tersebut. Karena tidak memiliki cara untuk memverifikasi kewarganegaraan penggunanya, Anthropic memilih menarik kedua model, termasuk Mythos 5 yang lebih canggih, dari akses global.
Pemicu utama dari larangan ini adalah sebuah teknik jailbreak yang ditemukan oleh peneliti Amazon. Mereka berhasil memicu Fable 5 untuk mengidentifikasi kerentanan perangkat lunak dan, dalam satu kasus, menulis kode yang menunjukkan bagaimana kerentanan tersebut dapat dieksploitasi.

Untuk mengatasi masalah ini, Anthropic melatih sebuah classifier baru yang mampu memblokir teknik spesifik tersebut dalam lebih dari 99% kasus. Ketika sebuah permintaan terdeteksi mengandung teknik yang dilarang, classifier akan mengarahkannya kembali ke model lama, Opus 4.8. Sebagai efek samping, perubahan ini juga menangkap lebih banyak permintaan debugging dan coding yang tidak berbahaya.
Penting untuk dicatat bahwa classifier ini menargetkan prompt yang dilaporkan, bukan kemampuan model itu sendiri. Fable 5 masih dapat mengidentifikasi kerentanan yang disebutkan dalam laporan Amazon; filter hanya mendeteksi permintaan dan mengarahkannya kembali, bukan menghilangkan kemampuan dari model.
Anthropic mengakui bahwa tidak ada model yang dapat sepenuhnya kebal terhadap jailbreak dan mereka memperkirakan akan lebih banyak lagi teknik serupa yang muncul di masa depan. Tinjauan yang dilakukan Anthropic bersama pemerintah dan Amazon menemukan bahwa Opus 4.8, GPT-5.5 milik OpenAI, dan Kimi K2.7 dari China juga dapat mengidentifikasi kerentanan yang sama.
Detail Pemulihan dan Perubahan Kebijakan
Fable 5 kini kembali tersedia di berbagai platform, termasuk Claude.ai, Claude Platform, Claude Code, dan Claude Cowork. Akses melalui AWS, Google Cloud, dan Microsoft Foundry akan menyusul kemudian. Pemulihan akses ini terjadi setelah Pusat Standar dan Inovasi AI (CAISI) milik Departemen Perdagangan meninjau ulang pengamanan yang diterapkan Anthropic.
Dengan kembalinya Fable 5, model ini berhasil merebut kembali posisi tolok ukur yang sempat dipegang oleh GLM-5.2 milik laboratorium China, Z.ai, selama Fable tidak aktif. Posisi tersebut termasuk skor tertinggi yang dapat diakses pada tes tugas multi-minggu AA-Briefcase.
Sementara itu, Mythos 5, yang membawa lebih sedikit guardrail dan tetap terbatas pada mitra Project Glasswing, telah kembali diakses oleh sekelompok organisasi AS pada 26 Juni. Anthropic juga membuka program HackerOne bagi para peneliti untuk melaporkan jailbreak baru pada Fable 5.
Baca Juga:
Sebagai komitmen jangka panjang, Anthropic berjanji akan memberikan akses lebih awal kepada mitra pemerintah yang ditunjuk untuk menguji model frontier masa depan sebelum dirilis. Langkah ini diambil untuk mencegah terulangnya insiden serupa di kemudian hari.
Bagi pengguna paket Pro, Max, Team, dan paket Enterprise tertentu, penggunaan Fable 5 akan dihitung hingga 50% dari batas penggunaan mingguan hingga 7 Juli. Setelah tanggal tersebut, penggunaannya akan beralih ke sistem kredit penggunaan.
Kembalinya akses global ini menandai babak baru dalam pengaturan keamanan AI, di mana pengamanan berbasis deteksi menjadi andalan. Namun, tantangan tetap ada karena classifier yang disetel untuk satu teknik yang diketahui tidak akan berguna untuk teknik yang belum ditemukan. Anthropic sendiri mengakui bahwa kerentanan baru kemungkinan akan terus muncul.
Insiden ini juga memicu diskusi lebih luas tentang kapabilitas siber kelas Mythos yang dinilai terlalu dibesar-besarkan. Setiap model yang diuji dalam tinjauan Anthropic, termasuk Haiku 4.5, Sonnet 4.6, dan beberapa versi Opus, ternyata mampu mereproduksi demonstrasi eksploitasi tunggal yang sama, memperkuat argumen bahwa klaim kapabilitas tersebut berlebihan.
Untuk informasi lebih lanjut tentang perkembangan AI Anthropic, Anda dapat membaca artikel tentang Riset Ilmiah dan Harga Terbaru model-model mereka.





Komentar
Belum ada komentar.