Telset.id – Sekelompok peneliti kecerdasan buatan (AI) meluncurkan situs web crowdsourced bernama Flaw Reporting for AI (FLARE-AI) yang dirancang untuk melaporkan dan melacak bahaya yang ditimbulkan oleh sistem AI. Platform ini memungkinkan pengguna untuk membunyikan alarm jika, misalnya, chatbot menghasilkan malware atau resep bom, membocorkan informasi pribadi, atau memicu pemikiran delusional pada pengguna.
Inisiatif ini hadir di tengah meningkatnya kekhawatiran tentang kurangnya sistem pelaporan yang terpusat dan dapat dipertanggungjawabkan untuk masalah yang berkaitan dengan AI. “Saat ini, tidak ada cara yang terpusat dan dapat dipertanggungjawabkan untuk melaporkan cacat pada sistem AI,” ujar Avijit Ghosh, seorang peneliti kebijakan AI di HuggingFace yang ikut memimpin pengembangan FLARE-AI bersama ilmuwan komputer Elaine Zhu dan Shayne Longpre.
Kode sumber terbuka di balik sistem ini memungkinkan pihak lain untuk memverifikasi suatu masalah dan meneruskan laporan kepada pembuat model, serta organisasi seperti MITRE, sebuah organisasi nirlaba yang melacak masalah pada sistem teknis. Cara kerja FLARE-AI ini mirip dengan Downdetector, yang mengumpulkan laporan pengguna secara langsung untuk gangguan layanan global yang memengaruhi aplikasi dan situs web.
Baca Juga:
Sistem peringatan ini dikembangkan dengan kolaborasi 49 pakar AI dari 32 organisasi berbeda. Dalam sebuah makalah yang menguraikan pekerjaan mereka, para peneliti berpendapat bahwa inisiatif mereka bisa menjadi sangat penting seiring dengan semakin luasnya adopsi AI dan semakin besarnya kekuatan sistem agen.
Kurangnya cara yang konsisten untuk melaporkan cacat AI dianggap sebagai masalah yang signifikan. “Saya pikir ini adalah inisiatif yang sangat bagus,” kata Jessica Ji, seorang peneliti di lembaga think tank Center for Security and Emerging Technology. Ji mengatakan para peneliti benar dalam mencatat bahwa mekanisme pelaporan yang ada saat ini terfragmentasi dan model AI adalah kotak hitam. “Saya mendukung apa pun yang membuat AI lebih transparan,” tambahnya.
Meskipun bug dan masalah keamanan siber mendapat banyak perhatian, Ghosh menjelaskan bahwa masalah dengan sistem AI mencakup topik-topik seperti bahaya psikologis, diskriminasi atau bias, dan misinformasi. Ia menambahkan bahwa perusahaan yang berbeda memiliki standar yang berbeda pula mengenai masalah-masalah tersebut, yang berarti beberapa masalah tidak dikenali.
“Dengan tidak adanya sistem pengungkapan yang terkoordinasi, tidak ada mekanisme eksternal untuk menegakkan transparansi,” kata Ghosh. Rangkaian insiden terkini yang melibatkan alat AI populer menunjukkan betapa mudahnya teknologi ini menjadi bermasalah.
Pekan ini, sebuah perusahaan bernama LayerX mengungkapkan cara untuk menipu peramban web yang diperkaya AI, termasuk Atlas milik OpenAI dan Comet milik Perplexity, untuk melompati batasan keamanan mereka. Meyakinkan model AI di balik peramban bahwa ia sedang bermain game, misalnya, dapat menyebabkan peramban menjadi liar dan mencoba meretas sebuah situs web. (Perusahaan yang bertanggung jawab atas peramban yang terpengaruh telah memperbaiki masalah tersebut, menurut LayerX.)
Pada bulan April lalu, Johann Rehberger, seorang peneliti keamanan, menemukan cara untuk menipu Claude agar membocorkan data pribadi menggunakan gambar yang dihasilkan oleh ChatGPT. AI juga memperkenalkan jenis masalah aneh baru. Tahun lalu, OpenAI terpaksa memperbarui modelnya setelah menemukan bahwa model tersebut terlalu bersikap menjilat, yang terkadang tampaknya mendorong pemikiran delusional.
Rumman Chowdhury, CEO dan pendiri Humane Intelligence PBC, mengatakan FLARE-AI bisa menjadi cara yang berguna bagi banyak pengembang AI untuk menerapkan cara melaporkan masalah dengan alat mereka. Namun, ia menambahkan bahwa inisiatif semacam itu sering kali datang dengan tantangan serius. Salah satunya adalah mengelola banjir laporan yang masuk, banyak di antaranya mungkin tidak serius. Tantangan lainnya adalah memastikan skema pelaporan didukung oleh organisasi yang kredibel dan berwenang.
Rancangan undang-undang kongres bulan lalu dapat memberikan bobot pemerintah AS di belakang upaya seperti FLARE-AI. Undang-undang tersebut, yang diperkenalkan oleh Perwakilan Deborah Ross, Jeff Hurd, dan Don Beyer, akan mewajibkan National Institute of Standards and Technology untuk mengembangkan standar seputar pelaporan cacat AI dan memelihara basis data pelaporan cacat AI yang terpusat.
Ghosh dan rekan-rekannya mengatakan hal ini akan mendorong pengembang AI untuk mengatasi masalah dalam sistem mereka dan memungkinkan pengguna untuk memeriksa keamanan berbagai sistem untuk kasus penggunaan yang berbeda. Kebutuhan akan cara baru untuk melaporkan bahaya AI tampaknya hanya akan tumbuh. Sistem agen seperti OpenClaw memiliki potensi lebih besar untuk menimbulkan bahaya, begitu pula model yang lebih mampu menyelidiki dan meretas sistem komputer.





Komentar
Belum ada komentar.