Menangkap Apa yang Dilewatkan Dokter: AI Mengatasi Penyakit Sistemik
BiomedParse, alat AI baru yang dikembangkan oleh Sheng Wang dan rekannya, memfasilitasi diagnosis penyakit sistemik dengan memproses beragam gambar medis dan mendukung pertanyaan sederhana dalam bahasa Inggris.
Kecerdasan buatan membuat kemajuan pesat dalam kemampuannya membaca gambar medis. Dalam tes yang dilakukan baru-baru ini oleh Layanan Kesehatan Nasional Inggris, alat AI menganalisis mammogram lebih dari 10.000 wanita dan dengan tepat mengidentifikasi pasien mana yang ditemukan mengidap kanker serta 11 kasus yang terlewatkan oleh dokter. Namun, penyakit sistemik seperti lupus dan diabetes menimbulkan tantangan yang lebih besar bagi sistem ini, karena diagnosis penyakit tersebut sering kali memerlukan analisis berbagai jenis gambar medis, mulai dari MRI hingga CT scan.
Kini, tim ilmuwan telah mengembangkan BiomedParse, model analisis citra medis AI yang bekerja pada sembilan jenis citra medis untuk memprediksi penyakit sistemik dengan lebih baik. Profesional medis dapat memuat gambar ke dalam sistem dan menanyakan pertanyaan sistem AI dalam bahasa Inggris.
Tim yang terdiri dari Sheng Wang, a Universitas Washington asisten profesor di Sekolah Ilmu & Teknik Komputer Paul G. Allen, serta rekan penulis di Microsoft Research and Providence Genetics and Genomics, menerbitkan temuannya pada 18 November di Metode Alam.
UW News berbicara dengan Wang tentang alat ini dan tentang etika serta potensi AI dalam layanan kesehatan.
Apa yang dipelajari laboratorium Anda?
Sheng Wang: Kami fokus pada AI generatif multimodal, yang berarti kami berupaya memproses berbagai jenis gambar medis. Penelitian sebelumnya hanya mempertimbangkan satu jenis gambar dalam satu waktu, misalnya gambar patologi dalam penelitian kanker. Pendekatan baru kami adalah dengan mempertimbangkan semua jenis gambar untuk memprediksi penyakit sistemik. Penyakit seperti diabetes dapat muncul di seluruh tubuh – di mata, gigi, ginjal, dan sebagainya. Jika Anda hanya memiliki model yang dapat melihat gambar mata, model tersebut dapat melewatkan hal-hal tentang penyakit sistemik.
Anda baru saja menerbitkan makalah dengan peneliti dari Microsoft dan Providence Genomics yang dapat memproses sembilan jenis gambar medis dan menerjemahkan antara teks dan gambar. Perusahaan seperti OpenAI dan organisasi sejenisnya Institut Allen untuk Kecerdasan Buatan akhir-akhir ini telah merilis model AI yang dapat berpindah antara teks dan gambar. Apa perbedaan gambar medis?
SW: Saat ChatGPT atau Google Gemini memodelkan gambar kucing, misalnya, gambar tersebut berukuran sangat kecil — katakanlah lebarnya 256 piksel. Namun gambar medis jauh lebih besar, mungkin berukuran 100.000 piksel. Jika Anda mencetak kedua gambar tersebut, perbedaan ukurannya adalah perbedaan antara bola tenis dan lapangan tenis. Jadi metode yang sama tidak bisa diterapkan pada gambar medis.
Namun ChatGPT sangat baik dalam memahami dan merangkum dokumen yang panjang. Jadi kami menggunakan teknik yang sama di sini untuk merangkum gambaran patologi yang sangat besar. Kami memecahnya menjadi banyak gambar kecil, masing-masing berukuran 256 kali 256. Gambar kecil ini membentuk sesuatu seperti “kalimat” dari gambar kecil, namun di sini elemen dasarnya bukanlah kata atau karakter — melainkan gambar kecil. Kemudian AI generatif dapat merangkum kumpulan gambar kecil ini dengan sangat akurat. Pada bulan Mei, kami mengumumkan GigaPath, sebuah model yang memproses gambar patologi menggunakan metode ini.
Dalam makalah terbaru kami, kami menggabungkan alat untuk membangun BiomedParse, yang bekerja di sembilan modalitas, memungkinkan kami menggabungkan model yang mencakup CT scan, MRI, sinar-X, dan sebagainya.
Kami menemukan bahwa sangat sulit untuk membangun satu model yang dapat mempertimbangkan semua modalitas karena masyarakat mungkin tidak bersedia membagikan semua data tersebut. Sebagai gantinya, kami membuat satu model untuk setiap jenis gambar. Ada yang dibuat oleh kami, ada pula yang dibuat oleh pakar lain di Harvard dan Microsoft, lalu kami memproyeksikan semuanya ke dalam ruang bersama.
Kami terinspirasi oleh Esperanto, sebuah bahasa buatan yang diciptakan agar penutur dari berbagai negara dapat berkomunikasi — serupa dengan fungsi bahasa Inggris di seluruh Eropa saat ini. Ide utama dari makalah BiomedParse kami adalah menggunakan bahasa manusia sebagai bahasa Esperanto untuk modalitas pencitraan medis yang berbeda. CT scan sangat berbeda dengan MRI, namun setiap gambar medis memiliki laporan klinis. Jadi kami memproyeksikan semuanya ke ruang teks. Maka dua gambar akan serupa bukan karena keduanya merupakan hasil CT scan, misalnya, tetapi karena keduanya membicarakan pasien yang serupa.
Apa saja potensi penerapan alat ini? Apakah hal ini memungkinkan dokter umum untuk memiliki pemahaman yang lebih baik tentang banyak jenis gambar yang berbeda?
SW: Ya, ini seperti mesin pencari gambar medis. Hal ini memungkinkan non-spesialis untuk berbicara dengan model tentang gambar medis yang sangat terspesialisasi yang memerlukan keahlian domain. Hal ini memungkinkan dokter untuk memahami gambar dengan lebih baik karena, misalnya, membaca gambar patologi seringkali memerlukan keahlian yang tinggi.
Bahkan dokter yang sangat berpengalaman pun dapat menggunakan model kami untuk menganalisis gambar dengan lebih cepat dan menemukan variasi yang halus. Misalnya, mereka tidak perlu melihat setiap gambar piksel demi piksel. Model kami pertama-tama dapat memberikan beberapa hasil, dan kemudian dokter dapat fokus pada wilayah-wilayah penting tersebut. Jadi hal ini dapat membuat mereka bekerja lebih efisien, karena kami memberikan hasil yang sangat konsisten secara otomatis — lebih dari 90% ketepatan dibandingkan dengan anotasi manusia ahli — hanya dalam 0,2 detik. Karena ini adalah alat yang mendeteksi lokasi objek biomedis dan menghitung jumlah sel, akurasi 90% sering kali dapat ditoleransi bagi kita untuk mendeteksi objek dengan benar dan memprediksi penyakit di bagian hilir. Namun bimbingan dokter tetap diperlukan untuk memastikan alat AI ini digunakan dengan benar. Ini adalah cara untuk meningkatkan keterampilan mereka, bukan menggantikannya.
Apakah ini akan tersedia untuk dokter?
SW: Kami telah merilis demo. Selanjutnya, kami berharap dapat bermitra dengan UW Medicine untuk mengembangkan lebih lanjut model tersebut dan kemudian menerapkannya dengan persetujuan pasien dalam sistem UW Medicine. Ini adalah upaya yang sangat besar di seluruh UW. Kami telah mengumpulkan banyak data yang mencakup berbagai wilayah tubuh manusia, modalitas berbeda, dan penyakit berbeda. Jadi kami berharap kami dapat memajukan deteksi penyakit sistemik.
Tentunya sistem AI generatif memiliki berbagai masalah. Model teks berhalusinasi informasi, memberikan jawaban yang salah, dan mengarang fakta. Generator gambar mendistorsi banyak hal. Apakah ada kekhawatiran mengenai penerapan data ini pada sesuatu yang sensitif seperti pencitraan medis?
SW: Kami sebenarnya memiliki makalah lain yang secara khusus menargetkan masalah etika untuk AI generatif dalam kedokteran. Salah satu masalahnya adalah halusinasi. Misalnya, Anda dapat memberikan gambar CT dada ke beberapa model AI dan menanyakan apa masalah giginya. Pertanyaan ini tidak masuk akal, karena kita tidak bisa membedakan masalah gigi dari CT scan, namun beberapa model AI yang ada sebenarnya akan menjawab pertanyaan ini, dan jelas itu adalah jawaban yang salah.
Masalah lainnya adalah etika. Kita dapat memberikan gambar gigi pada AI generatif dan bertanya, “Berapa jenis kelamin dan usia pasien ini?” Itu adalah informasi pribadi. Atau Anda dapat memintanya untuk merekonstruksi wajah orang tersebut. Jadi kami berupaya mendeteksi pertanyaan tidak etis tersebut dan memastikan bahwa model akan menolak menjawab.
Apa penerapan AI generatif pada pengobatan yang membuat Anda tertarik?
SW: Saya dulu melakukan penelitian penemuan obat dan genomik dengan AI, namun menurut saya hal tersebut merupakan bidang yang terbatas, karena pengembangan obat dapat memakan waktu 5 atau 10 tahun, dan bagian yang paling memakan waktu adalah pengujian obat — uji coba pada tikus, uji coba pada manusia, dan sebagainya. Saya pindah ke bidang kedokteran karena saya merasa AI sangat ampuh untuk menganalisis data gambar dan gambar beserta teks.
Saya juga sedang melakukan penggunaan kembali narkoba. Artinya, misalnya, obat yang digunakan untuk mengobati penyakit retina, tanpa dirancang untuk tujuan lain, juga dapat mengobati gagal jantung. Jadi jika obat ini sudah digunakan untuk penyakit retina dan dirasa efektif untuk gagal jantung, kita bisa segera mengaplikasikannya, karena kita tahu aman. Inilah salah satu manfaat potensial mempelajari penyakit sistemik dengan AI. Jika kita menemukan dalam kombinasi gambar retina dengan gambar gagal jantung bahwa gambar retina dapat memprediksi gagal jantung, kita mungkin menemukan obat semacam itu. Itu adalah tujuan jangka panjang di sini.
Referensi: “Model dasar untuk segmentasi gabungan, deteksi dan pengenalan objek biomedis di sembilan modalitas” oleh Theodore Zhao, Yu Gu, Jianwei Yang, Naoto Usuyama, Ho Hin Lee, Sid Kiblawi, Tristan Naumann, Jianfeng Gao, Angela Crabtree, Jacob Abel, Christine Moung-Wen, Brian Piening, Carlo Bifulco, Mu Wei, Hoifung Poon dan Sheng Wang, 18 November 2024, Metode Alam.
DOI: 10.1038/s41592-024-02499-w