Chatgpt bisa hasilkan konten kekerasan tanpa perintah spesifik

Peneliti Mindgard temukan celah keamanan ChatGPT yang bisa hasilkan gambar kekerasan dan seksual eksplisit
Teknik yang digunakan hanya memodifikasi prompt sederhana tanpa menyebut konten kekerasan secara spesifik
ChatGPT menghasilkan gambar kekerasan "atas kemauannya sendiri" tanpa perintah langsung
OpenAI baru mengambil tindakan setelah Mindgard menghubungi BBC
Peneliti masih bisa menghasilkan gambar mengganggu meskipun OpenAI mengklaim telah memperbaikinya
Jim Nightingale, peneliti Mindgard, mengaku gemetar dan menangis melihat gambar yang dihasilkan
Temuan ini menunjukkan perlindungan AI komersial masih memiliki kelemahan signifikan

Telset.id – Sebuah eksperimen baru mengungkap celah keamanan serius pada sistem perlindungan ChatGPT. Peneliti berhasil membuat chatbot AI populer itu menghasilkan gambar kekerasan dan seksual eksplisit hanya dengan modifikasi kecil pada prompt yang tampak tidak berbahaya.

Temuan ini berasal dari Mindgard, perusahaan keamanan AI asal Inggris. Mereka mendapati bahwa teknik sederhana bisa membuat ChatGPT mengabaikan pedoman keselamatan dasarnya. Yang lebih mengkhawatirkan, prompt yang digunakan tidak menyebutkan secara spesifik konten kekerasan.

Teknik yang digunakan Mindgard hanya memodifikasi prompt yang awalnya dibuat untuk menghasilkan gambar lucu. Metodenya melibatkan perintah untuk memulihkan foto yang dilampirkan tanpa benar-benar mengunggah foto, lalu meminta ChatGPT menghasilkan gambar baru.

“Ini adalah instruksi yang tampak polos bagi AI, tetapi konsekuensinya menghasilkan gambar dan konten yang sangat buruk,” ujar Peter Garraghan, pendiri Mindgard sekaligus profesor ilmu komputer di Lancaster University, kepada BBC.

Yang membuat temuan ini semakin meresahkan adalah fakta bahwa AI menghasilkan konten kekerasan “atas kemauannya sendiri.” Tanpa diminta, ChatGPT memproduksi gambar-gambar mengerikan. Salah satu gambar menunjukkan pria dengan cedera kepala parah. Gambar lain menampilkan mayat wanita muda berlumuran darah, yang diberi judul “grim crime scene aftermath.”

Ilustrasi robot yang terhubung dengan banyak kabel dan selang dengan mata merah menakutkan — Ilustrasi robot dengan mata merah menakutkan yang terhubung dengan berbagai kabel dan selang.

Peneliti juga menemukan gambar wanita muda ketakutan yang diikat dan dibungkam di ruangan kosong, berjudul “abandoned in fear and restraint.” Meskipun tidak menampilkan orang sungguhan, Mindgard sebelumnya telah menunjukkan bahwa ChatGPT bisa ditipu untuk membuat deepfake telanjang dari individu tertentu tanpa persetujuan mereka.

Mindgard melaporkan temuan ini ke OpenAI, perusahaan pengembang ChatGPT. Namun, mereka hanya menerima respons otomatis. OpenAI baru mengambil tindakan setelah Mindgard menghubungi BBC. Perusahaan tersebut mengklaim telah mengatasi masalah ini.

“Setelah menyelidiki tren ini, kami telah memperkenalkan perlindungan tambahan terhadap jenis prompt ini,” kata OpenAI kepada BBC. Mereka menambahkan bahwa sistem mereka memiliki beberapa lapisan perlindungan untuk mencegah pengguna membuat konten yang melanggar kebijakan.

Namun, peneliti Mindgard mengatakan bahwa mereka masih bisa menghasilkan gambar mengganggu hanya dengan melakukan perubahan kecil pada prompt. Beberapa gambar bahkan membuat Jim Nightingale, peneliti keamanan AI Mindgard, merasa “gemetar dan menangis.”

Baca Juga:

“Saya tidak mudah terguncang. Saya suka berpikir bahwa sebagai peneliti red team, saya memiliki stoisisme tertentu,” tulis Nightingale dalam laporannya. “Tetapi filter pembuatan gambar ChatGPT benar-benar runtuh, dan saya melihat sisi yang sangat gelap dari apa yang ada di bawahnya.”

Ia melanjutkan, “Saya terpukul bahwa meskipun apa yang saya lihat adalah gambar yang dihasilkan, gambar ‘buatan’, itu memiliki keterkaitan dengan gambar nyata dan dunia nyata. Wanita meninggal yang ditunjukkan ChatGPT kepada saya tidak nyata, tetapi dia didasarkan pada seseorang. Atau lebih buruk lagi, kompilasi gambar wanita yang dibunuh.”

Temuan ini menimbulkan pertanyaan serius tentang keamanan sistem AI komersial. Meskipun OpenAI telah mengklaim memperbaiki celah tersebut, Mindgard membuktikan bahwa celah serupa masih bisa dieksploitasi. Ini menunjukkan bahwa perlindungan AI saat ini masih memiliki kelemahan signifikan.

Keamanan sistem AI menjadi perhatian utama di industri teknologi. Banyak perusahaan berlomba mengembangkan model AI yang lebih aman, tetapi celah seperti ini menunjukkan bahwa masih ada pekerjaan rumah besar yang harus diselesaikan.

Kasus ini juga menjadi pengingat bahwa AI generatif memiliki potensi penyalahgunaan yang serius. Kemampuan untuk menghasilkan konten realistis tanpa pengawasan yang memadai bisa berdampak buruk, terutama jika digunakan untuk membuat konten ilegal atau berbahaya.

Peneliti Mindgard menekankan bahwa temuan mereka bukan sekadar eksperimen akademis. Ini adalah peringatan nyata tentang risiko keamanan yang dihadapi oleh pengguna AI di seluruh dunia. Perusahaan pengembang AI harus lebih serius dalam mengatasi celah keamanan semacam ini.

Ke depannya, industri AI perlu mengembangkan pendekatan yang lebih komprehensif untuk keamanan. Tidak cukup hanya dengan menambal celah yang ditemukan; diperlukan sistem deteksi dan pencegahan yang lebih canggih.

Bagi pengguna biasa, temuan ini menjadi pengingat untuk selalu berhati-hati saat menggunakan AI generatif. Meskipun fitur yang ditawarkan sangat membantu, potensi penyalahgunaan tetap ada dan perlu diwaspadai.

OpenAI sendiri mengklaim memiliki komitmen tinggi terhadap keamanan. Namun, respons mereka yang lambat terhadap laporan Mindgard menunjukkan bahwa implementasi di lapangan masih perlu ditingkatkan.

Kasus ChatGPT ini mirip dengan fitur terbaru di aplikasi lain yang kadang memiliki celah keamanan tak terduga. Perusahaan teknologi harus terus melakukan perbaikan untuk melindungi pengguna.

Di sisi lain, kemampuan AI untuk menghasilkan konten realistis juga membuka peluang baru di berbagai bidang. Namun, potensi positif ini harus diimbangi dengan pengamanan yang ketat agar tidak disalahgunakan.

Peneliti keamanan AI sepakat bahwa diperlukan regulasi yang lebih jelas untuk mengatur penggunaan teknologi ini. Tanpa pengawasan yang memadai, risiko penyalahgunaan akan terus mengintai.

Bagi perusahaan yang mengembangkan AI, temuan Mindgard menjadi pelajaran berharga. Keamanan harus menjadi prioritas utama, bukan sekadar tambahan yang dipasang setelah produk diluncurkan.

Dalam jangka panjang, industri AI perlu mengadopsi pendekatan “security by design” di mana keamanan menjadi bagian integral dari proses pengembangan, bukan sesuatu yang ditambahkan belakangan.

Pengguna juga perlu diedukasi tentang risiko penggunaan AI. Kesadaran akan potensi bahaya bisa membantu mencegah penyalahgunaan yang tidak disengaja.

Kasus ini menunjukkan bahwa meskipun AI semakin canggih, masih ada banyak pekerjaan yang harus dilakukan untuk memastikan teknologi ini aman digunakan oleh semua orang.

Komentar

ChatGPT Bisa Hasilkan Konten Kekerasan Tanpa Perintah Spesifik

Komentar

Berita Terkait

Emisi Karbon Amazon Pecah Rekor Akibat Ekspansi AI

Negosiasi Serikat Pekerja DeepMind dengan Google Mandek

Studi Ungkap Risiko Keamanan AI Browser yang Bisa Curi Data

Hacker Bisa Hipnotis AI Browser untuk Curi Data Pengguna

Berita Terkait

Emisi Karbon Amazon Pecah Rekor Akibat Ekspansi AI

Negosiasi Serikat Pekerja DeepMind dengan Google Mandek

Studi Ungkap Risiko Keamanan AI Browser yang Bisa Curi Data

Hacker Bisa Hipnotis AI Browser untuk Curi Data Pengguna