AI Kecepatan Cahaya: Prosesor Fotonik Ultracepat MIT Memberikan Efisiensi Ekstrim
Sebuah chip fotonik baru yang dirancang oleh MIT ilmuwan melakukan semua komputasi jaringan saraf dalam secara optik, menyelesaikan tugas dalam waktu kurang dari nanodetik dengan lebih dari 92% ketepatan.
Hal ini dapat merevolusi aplikasi komputasi dengan permintaan tinggi, membuka pintu bagi prosesor berkecepatan tinggi yang dapat belajar secara real-time.
Pembelajaran Mesin Fotonik
Jaringan saraf dalam (deep neural network), kekuatan pendorong di balik aplikasi pembelajaran mesin tercanggih saat ini, telah menjadi begitu besar dan kompleks sehingga melampaui batas-batas perangkat keras komputasi elektronik tradisional.
Perangkat keras fotonik, yang menggunakan cahaya alih-alih listrik untuk melakukan penghitungan pembelajaran mesin, menawarkan solusi yang lebih cepat dan hemat energi. Namun, operasi jaringan saraf tertentu sulit dicapai dengan perangkat fotonik, sehingga memaksa ketergantungan pada elektronik eksternal yang memperlambat pemrosesan dan mengurangi efisiensi.
Terobosan dalam Teknologi Chip Fotonik
Setelah melakukan penelitian selama satu dekade, para ilmuwan dari MIT dan institusi yang berkolaborasi telah mengembangkan terobosan chip fotonik yang mengatasi tantangan ini. Mereka mendemonstrasikan prosesor fotonik terintegrasi penuh yang mampu melakukan semua komputasi jaringan saraf dalam yang penting sepenuhnya dengan cahaya, sehingga menghilangkan kebutuhan pemrosesan eksternal.
Perangkat optik ini mampu menyelesaikan penghitungan utama untuk tugas klasifikasi pembelajaran mesin dalam waktu kurang dari setengah nanodetik sekaligus mencapai akurasi lebih dari 92 persen — kinerja yang setara dengan perangkat keras tradisional.
Jaringan Syaraf Fotonik dan Implikasinya
Chip tersebut, terdiri dari modul-modul yang saling berhubungan yang membentuk jaringan saraf optik, dibuat menggunakan proses pengecoran komersial, yang memungkinkan penskalaan teknologi dan integrasinya ke dalam elektronik.
Dalam jangka panjang, prosesor fotonik dapat menghasilkan pembelajaran mendalam yang lebih cepat dan hemat energi untuk aplikasi yang menuntut komputasi seperti lidarpenelitian ilmiah di bidang astronomi dan fisika partikel, atau telekomunikasi berkecepatan tinggi.
Tim Peneliti dan Prospek Masa Depan
“Ada banyak kasus di mana seberapa baik performa model bukanlah satu-satunya hal yang penting, namun juga seberapa cepat Anda bisa mendapatkan jawaban. Sekarang kita memiliki sistem end-to-end yang dapat menjalankan jaringan saraf optik, pada skala waktu nanodetik, kita dapat mulai berpikir pada tingkat yang lebih tinggi tentang aplikasi dan algoritma,” kata Saumil Bandyopadhyay '17, MEng '18, PhD '23, ilmuwan tamu di Quantum Photonics and AI Group di Research Laboratory of Electronics (RLE) dan postdoc di NTT Research, Inc., yang merupakan penulis utama makalah tentang chip baru.
Bandyopadhyay bergabung dalam makalah ini dengan Alexander Sludds '18, MEng '19, PhD '23; Nicholas Harris PhD '17; Darius Bunandar PhD '19; Stefan Krastanov, mantan ilmuwan peneliti RLE yang kini menjadi asisten profesor di Universitas Massachusetts di Amherst; Ryan Hamerly, ilmuwan tamu di RLE dan ilmuwan senior di NTT Research; Matthew Streshinsky, mantan pimpinan fotonik silikon di Nokia yang kini menjadi salah satu pendiri dan CEO Enosemi; Michael Hochberg, presiden Periplous, LLC; dan Dirk Englund, seorang profesor di Departemen Teknik Elektro dan Ilmu Komputer, peneliti utama di Quantum Photonics and Artificial Intelligence Group dan RLE, serta penulis senior makalah ini. Penelitian ini dipublikasikan pada 2 Desember di Fotonik Alam.
Pembelajaran Mesin dengan Cahaya
Jaringan saraf dalam terdiri dari banyak lapisan node, atau neuron, yang saling berhubungan yang beroperasi pada data masukan untuk menghasilkan keluaran. Salah satu operasi utama dalam jaringan neural dalam melibatkan penggunaan aljabar linier untuk melakukan perkalian matriks, yang mengubah data saat diteruskan dari lapisan ke lapisan.
Namun selain operasi linier ini, jaringan neural dalam juga melakukan operasi nonlinier yang membantu model mempelajari pola yang lebih rumit. Operasi nonlinier, seperti fungsi aktivasi, memberikan jaringan saraf dalam kekuatan untuk memecahkan masalah yang kompleks.
Pada tahun 2017, kelompok Englund, bersama dengan para peneliti di laboratorium Marin Soljacic, Profesor Fisika Cecil dan Ida Green, mendemonstrasikan jaringan saraf optik pada chip fotonik tunggal yang dapat melakukan perkalian matriks dengan cahaya.
Namun pada saat itu, perangkat tersebut tidak dapat melakukan operasi nonlinier pada chip tersebut. Data optik harus diubah menjadi sinyal listrik dan dikirim ke prosesor digital untuk melakukan operasi nonlinier.
“Nonlinieritas dalam optik cukup menantang karena foton tidak mudah berinteraksi satu sama lain. Hal ini membuatnya sangat memakan daya untuk memicu nonlinier optik, sehingga menjadi tantangan untuk membangun sistem yang dapat melakukannya dengan cara yang terukur,” jelas Bandyopadhyay.
Mereka mengatasi tantangan tersebut dengan merancang perangkat yang disebut unit fungsi optik nonlinier (NOFUs), yang menggabungkan elektronik dan optik untuk menerapkan operasi nonlinier pada chip.
Para peneliti membangun jaringan saraf dalam optik pada chip fotonik menggunakan tiga lapisan perangkat yang melakukan operasi linier dan nonlinier.
Jaringan yang Terintegrasi Sepenuhnya
Pada awalnya, sistem mereka mengkodekan parameter jaringan saraf dalam menjadi cahaya. Kemudian, serangkaian beamsplitter yang dapat diprogram, seperti yang didemonstrasikan pada makalah tahun 2017, melakukan perkalian matriks pada input tersebut.
Data tersebut kemudian diteruskan ke NOFU yang dapat diprogram, yang mengimplementasikan fungsi nonlinier dengan menyedot sejumlah kecil cahaya ke fotodioda yang mengubah sinyal optik menjadi arus listrik. Proses ini, yang menghilangkan kebutuhan akan amplifier eksternal, hanya mengkonsumsi sedikit energi.
“Kami tetap berada dalam domain optik sepanjang waktu, hingga akhir ketika kami ingin membacakan jawabannya. Hal ini memungkinkan kami mencapai latensi yang sangat rendah,” kata Bandyopadhyay.
Pencapaian latensi rendah memungkinkan mereka melatih jaringan saraf dalam pada chip secara efisien, sebuah proses yang dikenal sebagai pelatihan in situ yang biasanya menghabiskan banyak energi pada perangkat keras digital.
“Ini sangat berguna untuk sistem di mana Anda melakukan pemrosesan sinyal optik dalam domain, seperti navigasi atau telekomunikasi, tetapi juga dalam sistem yang ingin Anda pelajari secara real time,” katanya.
Sistem fotonik mencapai akurasi lebih dari 96 persen selama tes pelatihan dan akurasi lebih dari 92 persen selama inferensi, sebanding dengan perangkat keras tradisional. Selain itu, chip tersebut melakukan komputasi penting dalam waktu kurang dari setengah nanodetik.
“Pekerjaan ini menunjukkan bahwa komputasi – pada intinya, pemetaan masukan ke keluaran – dapat dikompilasi ke dalam arsitektur fisika linier dan nonlinier baru yang memungkinkan hukum penskalaan komputasi versus upaya yang diperlukan secara fundamental berbeda,” kata Englund.
Seluruh rangkaian dibuat menggunakan infrastruktur dan proses pengecoran yang sama yang menghasilkan chip komputer CMOS. Hal ini memungkinkan chip diproduksi dalam skala besar, menggunakan teknik yang telah teruji dan menghasilkan sedikit kesalahan dalam proses fabrikasi.
Meningkatkan perangkat mereka dan mengintegrasikannya dengan perangkat elektronik dunia nyata seperti kamera atau sistem telekomunikasi akan menjadi fokus utama pekerjaan di masa depan, kata Bandyopadhyay. Selain itu, para peneliti ingin mengeksplorasi algoritma yang dapat memanfaatkan keunggulan optik untuk melatih sistem lebih cepat dan dengan efisiensi energi yang lebih baik.
Referensi: “Jaringan saraf dalam fotonik chip tunggal dengan pelatihan hanya maju” oleh Saumil Bandyopadhyay, Alexander Sludds, Stefan Krastanov, Ryan Hamerly, Nicholas Harris, Darius Bunandar, Matthew Streshinsky, Michael Hochberg dan Dirk Englund, 2 Desember 2024, Fotonik Alam.
DOI: 10.1038/s41566-024-01567-z
Penelitian ini sebagian didanai oleh US National Science Foundation, US Air Force Office of Scientific Research, dan NTT Research.