Bagaimana Para Ilmuwan Akhirnya Mengungkap Pemikiran Tersembunyi AI


Para ilmuwan telah mengembangkan metode inovatif untuk mengungkap seberapa dalam jaringan saraf “berpikir”, yang akhirnya menjelaskan proses pengambilan keputusan mereka.
Dengan memvisualisasikan bagaimana AI mengatur data ke dalam beberapa kategori, metode ini memastikan AI yang lebih aman dan andal untuk aplikasi dunia nyata seperti layanan kesehatan dan mobil tanpa pengemudi, membawa kita selangkah lebih dekat untuk benar-benar memahami kecerdasan buatan.
Memahami Lapisan Pemrosesan AI
Jaringan saraf dalam adalah jenis kecerdasan buatan (AI) yang dirancang untuk meniru cara otak manusia memproses informasi. Namun, memahami bagaimana jaringan ini mengambil keputusan telah lama menjadi tantangan yang sulit. Para peneliti di Universitas Kyushu telah mengembangkan metode baru untuk lebih memahami seberapa dalam jaringan saraf menafsirkan data dan mengaturnya ke dalam kategori. Temuan mereka, dipublikasikan di Transaksi IEEE pada Jaringan Syaraf Tiruan dan Sistem Pembelajaranbertujuan untuk meningkatkan AI ketepatankeandalan, dan keamanan.
Mirip dengan cara manusia memecahkan teka-teki langkah demi langkah, jaringan saraf dalam memproses informasi melalui banyak lapisan. Lapisan pertama, disebut lapisan masukan, mengumpulkan data mentah. Lapisan berikutnya, yang disebut lapisan tersembunyi, menganalisis data secara bertahap. Lapisan tersembunyi awal mendeteksi fitur sederhana seperti tepi atau tekstur — mirip dengan mengidentifikasi potongan puzzle individual. Lapisan yang lebih dalam menggabungkan fitur-fitur ini untuk mengenali pola yang lebih kompleks, seperti membedakan antara kucing dan anjing, seperti menyusun potongan puzzle untuk membentuk gambar yang lengkap.
Transparansi dalam Pengambilan Keputusan AI
“Namun, lapisan tersembunyi ini seperti kotak hitam yang terkunci: kita melihat input dan output, namun apa yang terjadi di dalamnya tidak jelas,” kata Danilo Vasconcellos Vargas, Associate Professor dari Fakultas Ilmu Informasi dan Teknik Elektro di Universitas Kyushu. “Kurangnya transparansi ini menjadi masalah serius ketika AI melakukan kesalahan, yang terkadang dipicu oleh hal kecil seperti perubahan satu piksel. AI mungkin tampak cerdas, namun memahami cara mengambil keputusan adalah kunci untuk memastikan AI dapat dipercaya.”

Keterbatasan Metode Visualisasi Saat Ini
Saat ini, metode untuk memvisualisasikan bagaimana AI mengatur informasi bergantung pada penyederhanaan data berdimensi tinggi menjadi representasi 2D atau 3D. Metode ini memungkinkan peneliti mengamati cara AI mengkategorikan titik data—misalnya, mengelompokkan gambar kucing di dekat kucing lain sambil memisahkannya dari anjing. Namun, penyederhanaan ini mempunyai keterbatasan kritis.
“Saat kita menyederhanakan informasi berdimensi tinggi ke dalam dimensi yang lebih kecil, hal ini seperti meratakan objek 3D menjadi 2D—kita kehilangan detail penting dan gagal melihat gambaran keseluruhan. Selain itu, metode memvisualisasikan pengelompokan data ini menyulitkan perbandingan antara jaringan saraf atau kelas data yang berbeda,” jelas Vargas.
Memperkenalkan Metode Distribusi k*
Dalam studi ini, para peneliti mengembangkan metode baru, yang disebut metode distribusi k*, yang memvisualisasikan dan menilai dengan lebih jelas seberapa baik jaringan saraf dalam mengkategorikan item terkait.
Model bekerja dengan menetapkan “nilai k*” pada setiap titik data yang dimasukkan yang menunjukkan jarak ke titik data terdekat yang tidak terkait. Nilai k* yang tinggi berarti titik data terpisah dengan baik (misalnya, kucing jauh dari anjing mana pun), sedangkan nilai k* yang rendah menunjukkan potensi tumpang tindih (misalnya, anjing lebih dekat ke kucing dibandingkan kucing lainnya). Saat melihat semua titik data dalam suatu kelas, seperti kucing, pendekatan ini menghasilkan distribusi nilai k* yang memberikan gambaran detail tentang bagaimana data disusun.
“Metode kami mempertahankan ruang berdimensi lebih tinggi, sehingga tidak ada informasi yang hilang. Ini adalah model pertama dan satu-satunya yang dapat memberikan gambaran akurat tentang 'lingkungan lokal' di sekitar setiap titik data,” tegas Vargas.
Dampak dan Penerapan Metode Baru
Dengan menggunakan metode mereka, para peneliti mengungkapkan bahwa jaringan saraf dalam mengurutkan data ke dalam susunan yang terkelompok, terpecah, atau tumpang tindih. Dalam susunan cluster, item-item yang serupa (misalnya kucing) dikelompokkan secara berdekatan, sedangkan item-item yang tidak berkaitan (misalnya anjing) dipisahkan dengan jelas, yang berarti AI mampu mengurutkan data dengan baik. Namun, susunan yang retak menunjukkan bahwa barang-barang serupa tersebar di ruang yang luas, sedangkan distribusi yang tumpang tindih terjadi ketika barang-barang yang tidak terkait berada di ruang yang sama, sehingga kedua susunan tersebut membuat kesalahan klasifikasi lebih mungkin terjadi.
Vargas membandingkan hal ini dengan sistem gudang: “Dalam gudang yang terorganisir dengan baik, barang-barang serupa disimpan bersama, sehingga pengambilan menjadi mudah dan efisien. Jika barang-barang tercampur, barang-barang tersebut menjadi lebih sulit ditemukan, sehingga meningkatkan risiko memilih barang yang salah.”
AI dalam Sistem Kritis dan Masa Depan
AI semakin banyak digunakan dalam sistem penting seperti kendaraan otonom dan diagnostik medis, yang mengutamakan akurasi dan keandalan. Metode distribusi k* membantu peneliti, dan bahkan anggota parlemen, mengevaluasi cara AI mengatur dan mengklasifikasikan informasi, menunjukkan dengan tepat potensi kelemahan atau kesalahan. Hal ini tidak hanya mendukung proses legalisasi yang diperlukan untuk mengintegrasikan AI dengan aman ke dalam kehidupan sehari-hari, namun juga menawarkan wawasan berharga tentang cara AI “berpikir”. Dengan mengidentifikasi akar penyebab kesalahan, peneliti dapat menyempurnakan sistem AI agar tidak hanya akurat namun juga kuat—mampu menangani data yang buram atau tidak lengkap dan beradaptasi dengan kondisi yang tidak terduga.
“Tujuan utama kami adalah menciptakan sistem AI yang menjaga presisi dan keandalan, bahkan ketika dihadapkan pada tantangan skenario dunia nyata,” Vargas menyimpulkan.
Referensi: “Distribusi k*: Mengevaluasi Ruang Laten Jaringan Neural Dalam Menggunakan Analisis Lingkungan Lokal” oleh Shashank Kotyan, Tatsuya Ueda dan Danilo Vasconcellos Vargas, 16 September 2024, Transaksi IEEE pada Jaringan Syaraf Tiruan dan Sistem Pembelajaran.
DOI: 10.1109/TNNLS.2024.3446509