Sains & Teknologi

Trik Suara Hebat: Apakah Ini AI atau Nyata?

Penelitian baru mengungkap bahwa sementara orang kesulitan membedakan antara suara manusia dan suara yang dihasilkan AI, respons otak mereka berbeda secara signifikan.

Orang menganggap suara gembira adalah suara yang nyata dan suara 'netral' adalah AI.

Penelitian menunjukkan bahwa manusia kesulitan mengidentifikasi AI dari suara manusia, namun aktivitas otak mereka berbeda-beda, sehingga menunjukkan respons unik terhadap setiap jenis suara, yang berdampak signifikan terhadap teknologi dan etika.

Pengenalan Suara AI

Orang-orang tidak pandai membedakan antara suara manusia dan suara yang dihasilkan oleh kecerdasan buatan (AI), tetapi otak kita merespons suara manusia dan AI secara berbeda. Hal ini berdasarkan penelitian yang akan dipresentasikan pada tanggal 25 Juni di Discussion board Federasi Masyarakat Neurosains Eropa (FENS) 2024.[1]

Penelitian ini akan dipresentasikan oleh peneliti doktoral Christine Skjegstad, dan dilakukan oleh Ibu Skjegstad dan Profesor Sascha Frühholz, keduanya dari Departemen Psikologi di Universitas Oslo (UiO), Norwegia.

Spektogram Suara Manusia dan AI

Spektogram untuk menunjukkan kesamaan antara suara manusia dan AI. Kredit: Discussion board FENS / Christine Skjegstad

Kemajuan dan Tantangan dalam Teknologi Suara AI

Ibu Skjegstad berkata: “Kita sudah tahu bahwa suara yang dihasilkan AI telah menjadi sangat canggih sehingga hampir tidak dapat dibedakan dari suara manusia yang sebenarnya. Sekarang dimungkinkan untuk mengkloning suara seseorang hanya dari rekaman beberapa detik, dan penipu telah menggunakan teknologi ini untuk meniru orang yang dicintai yang sedang dalam kesulitan dan menipu korban agar mentransfer uang. Sementara pembelajaran mesin para ahli telah mengembangkan solusi teknologi untuk mendeteksi suara-suara AI, apalagi yang diketahui tentang respons otak manusia terhadap suara-suara ini.”

Penelitian ini melibatkan 43 orang yang diminta untuk mendengarkan suara manusia dan AI yang mengekspresikan lima emosi berbeda: netral, marah, takut, senang, senang.[2] Mereka diminta untuk mengidentifikasi suara-suara itu sebagai suara sintetis atau alami, sementara otak mereka dipelajari menggunakan pencitraan resonansi magnetik fungsional (MRI (Foto: Radioterapi)). fMRI digunakan untuk mendeteksi perubahan aliran darah di dalam otak, yang menunjukkan bagian otak mana yang aktif. Para peserta juga diminta untuk menilai karakteristik suara yang mereka dengar dalam hal kealamian, kepercayaan, dan keaslian.

Christine Skjegstad

Peneliti Christine Skjegstad. Kredit: Discussion board FENS / Christine Skjegstad

Kinerja Peserta dalam Identifikasi Suara

Peserta hanya mampu mengidentifikasi suara manusia sebanyak 56% dan suara AI sebanyak 50,5%, yang berarti mereka sama buruknya dalam mengidentifikasi kedua jenis suara tersebut.

Orang-orang cenderung mengidentifikasi suara AI yang 'netral' sebagai AI dengan benar (75% dibandingkan dengan 23% yang dapat mengidentifikasi suara manusia yang netral dengan benar sebagai manusia), yang menunjukkan bahwa orang-orang menganggap suara netral lebih mirip AI. Suara netral AI perempuan lebih sering diidentifikasi dengan benar daripada suara netral AI laki-laki. Untuk suara manusia yang bahagia, tingkat identifikasi yang benar adalah 78%, dibandingkan dengan hanya 32% untuk suara AI yang bahagia, yang menunjukkan bahwa orang-orang mengasosiasikan kebahagiaan sebagai sesuatu yang lebih mirip manusia.

Baik AI maupun suara netral manusia dianggap paling tidak alami, dapat dipercaya, dan autentik, sedangkan suara gembira manusia dianggap paling alami, dapat dipercaya, dan autentik.

Perbedaan Respon Otak terhadap Suara Manusia dan AI

Namun, dengan melihat pencitraan otak, para peneliti menemukan bahwa suara manusia menimbulkan respons yang lebih kuat di space otak yang berhubungan dengan memori (hipokampus kanan) dan empati (girus frontal inferior kanan). Suara AI menghasilkan respons yang lebih kuat di bidang yang terkait dengan deteksi kesalahan (korteks cingulate tengah anterior kanan) dan pengaturan perhatian (korteks prefrontal dorsolateral kanan).

Ibu Skjegstad berkata: “Penelitian saya menunjukkan bahwa kami tidak terlalu akurat dalam mengidentifikasi apakah suara itu suara manusia atau suara buatan AI. Para peserta juga sering mengungkapkan betapa sulitnya bagi mereka untuk membedakan suara-suara tersebut. Hal ini menunjukkan bahwa teknologi suara AI saat ini dapat meniru suara manusia hingga sulit bagi orang untuk membedakannya dengan tepat.

“Hasilnya juga menunjukkan adanya bias dalam persepsi di mana suara-suara netral lebih cenderung diidentifikasi sebagai suara yang dihasilkan oleh AI, dan suara-suara gembira lebih cenderung diidentifikasi sebagai suara yang lebih manusiawi, terlepas dari apakah suara tersebut benar-benar berasal dari AI. Hal ini terutama terjadi pada suara AI wanita yang netral, mungkin karena kita sudah acquainted dengan asisten suara wanita seperti Siri dan Alexa.

“Meskipun kami tidak pandai mengidentifikasi suara manusia melalui AI, tampaknya ada perbedaan dalam respons otak. Suara AI dapat meningkatkan kewaspadaan, sementara suara manusia dapat menimbulkan rasa keterhubungan.”

Para peneliti sekarang berencana untuk mempelajari apakah ciri-ciri kepribadian, misalnya ekstraversi atau empati, membuat orang lebih atau kurang peka dalam memperhatikan perbedaan antara suara manusia dan AI.

Pendapat Ahli dan Implikasi yang Lebih Luas

Profesor Richard Roche adalah ketua komite komunikasi Discussion board FENS dan Wakil Kepala Departemen Psikologi di Universitas Maynooth, Maynooth, County Kildare, Irlandia, dan tidak terlibat dalam penelitian ini. Dia berkata: “Menyelidiki respons otak terhadap suara AI sangat penting seiring dengan kemajuan teknologi ini. Penelitian ini akan membantu kita memahami potensi implikasi kognitif dan sosial dari teknologi suara AI, yang mungkin mendukung kebijakan dan pedoman etika.

“Risiko penggunaan teknologi ini untuk menipu dan membodohi orang sudah jelas. Namun, ada juga potensi manfaatnya, seperti memberikan pengganti suara bagi orang-orang yang kehilangan suara aslinya. Suara AI juga dapat digunakan dalam terapi untuk beberapa kondisi kesehatan psychological.”

Catatan

  1. PS07-29AM-602, “Dinamika saraf dalam memproses vokalisasi emosi alami dan digital” oleh Christine Skjegstad, Sesi Poster 07 – Late-Breaking Abstracts, Sabtu, 29 Juni, 09:30-13:00, Space poster, https://fens2024.abstractserver.com/program/#/particulars/displays/4774
  2. Sejak menyerahkan abstrak mereka, para peneliti telah memasukkan knowledge tambahan dalam analisis mereka.

Pendanaan: Departemen Psikologi di Universitas Oslo (UiO)

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button