Bagaimana AI Mengubah Rahasia DNA Menjadi Wawasan Medis yang Menyelamatkan Nyawa
Model AI baru memanfaatkan pembelajaran mendalam untuk memahami pengikatan faktor transkripsi DNAdengan fokus pada proses respirasi DNA.
Pendekatan inovatif ini telah menghasilkan peningkatan sebesar 9,6% dalam memprediksi ikatan faktor transkripsi, menawarkan wawasan yang dapat merevolusi pengembangan obat dan penelitian genom.
Model AI Revolusioner untuk Penelitian Penyakit
Untuk lebih memahami peran DNA dalam penyakit, para ilmuwan di Laboratorium Nasional Los Alamos telah mengembangkan EPBDxDNABERT-2, sebuah model pembelajaran mendalam multimodal perintis. Model ini dirancang untuk secara tepat mengidentifikasi interaksi antara faktor transkripsi—protein yang mengatur aktivitas gen—dan DNA. EPBDxDNABERT-2 menggunakan proses yang dikenal sebagai “pernapasan DNA,” di mana heliks ganda DNA membuka dan menutup secara spontan, sehingga model dapat menangkap dinamika halus ini. Kemampuan ini berpotensi meningkatkan desain obat untuk penyakit yang berakar pada aktivitas gen.
“Ada banyak jenis faktor transkripsi, dan genom manusia sangatlah besar,” jelas Anowarul Kabir, peneliti di Los Alamos dan penulis utama studi tersebut. “Jadi, penting untuk mengetahui faktor transkripsi mana yang berikatan dengan lokasi tertentu pada struktur DNA yang sangat panjang. Kami mencoba menyelesaikan masalah itu dengan kecerdasan buatankhususnya algoritma pembelajaran mendalam.”
Meningkatkan Pengembangan Obat Dengan Dinamika DNA
DNA, yang terdiri dari sekitar 3 miliar huruf Inggris di setiap sel manusia, bertindak sebagai cetak biru pertumbuhan dan fungsi. Faktor transkripsi berikatan dengan wilayah DNA, mengatur ekspresi gen—bagaimana gen memandu perkembangan dan fungsi sel. Peraturan ini berperan dalam penyakit, seperti kanker, sehingga memprediksi lokasi pengikatan faktor transkripsi secara akurat dapat berdampak signifikan pada pengembangan obat.
Model dasar yang digunakan oleh tim peneliti dilatih berdasarkan urutan DNA. Tim membangun program simulasi DNA yang menangkap banyak dinamika DNA dan mengintegrasikannya dengan model dasar genom, sehingga menghasilkan EPBDxDNABERT-2, yang mampu memproses urutan genom di seluruh kromosom dan menggabungkan dinamika DNA yang sesuai sebagai masukan. Salah satu masukan tersebut, pernapasan DNA, atau pembukaan dan penutupan struktur heliks ganda DNA secara lokal dan spontan, berkorelasi dengan aktivitas transkripsi, seperti pengikatan faktor transkripsi.
“Integrasi fitur pernapasan DNA dengan model dasar DNABERT-2 sangat meningkatkan prediksi pengikatan faktor transkripsi,” kata peneliti Los Alamos, Manish Bhattarai. “Kami memberikan bagian kode DNA sebagai masukan ke model dan menanyakan model apakah model tersebut berikatan dengan faktor transkripsi, atau tidak, di banyak lini sel. Hasilnya meningkatkan kemungkinan prediksi pengikatan lokasi gen tertentu dengan banyak faktor transkripsi.”
Memanfaatkan Superkomputer untuk Analisis Genomik
Tim menjalankan model pembelajaran mendalam pada superkomputer terbaru Laboratorium, Venado, yang menggabungkan unit pemrosesan pusat dengan unit pemrosesan grafis untuk mendorong kemampuan kecerdasan buatan. Model pembelajaran mendalam bekerja dengan cara yang mirip dengan jaringan saraf otak, menggabungkan gambar dan teks serta mengungkap pola kompleks untuk menghasilkan prediksi dan wawasan.
Untuk melatih model tersebut, tim menggunakan data pengurutan gen dari 690 hasil eksperimen, yang mencakup 161 faktor transkripsi berbeda dan 91 jenis sel manusia. Mereka menemukan bahwa EPBDxDNABERT-2 meningkatkan secara signifikan — sebesar 9,6% dalam satu metrik utama — prediksi pengikatan lebih dari 660 faktor transkripsi. Eksperimen lebih lanjut tentang secara in vitro kumpulan data, yang diambil dari eksperimen dalam lingkungan terkendali, melengkapi di alam kumpulan data, atau data yang diambil langsung dari penelitian dengan organisme hidup, seperti tikus.
Janji Genomik Komputasi Multimodal
Tim menemukan bahwa meskipun pernapasan DNA saja dapat memperkirakan aktivitas transkripsional dengan hampir akurat, model multimodal dapat mengekstraksi motif pengikatan, rangkaian DNA spesifik yang mengikat faktor transkripsi – sebuah elemen penting untuk menjelaskan proses transkripsi.
“Seperti yang ditunjukkan oleh kinerjanya di berbagai kumpulan data yang beragam, model dasar multimoda kami menunjukkan keserbagunaan, ketahanan, dan kemanjuran,” kata Bhattarai. “Model ini menandakan kemajuan besar dalam komputasi genomik, menyediakan alat canggih untuk menganalisis mekanisme biologis yang kompleks.”
Referensi: “Integrasi pernapasan DNA dengan model dasar pembelajaran mendalam memajukan prediksi pengikatan faktor transkripsi manusia di seluruh genom” oleh Anowarul Kabir, Manish Bhattarai, Selma Peterson, Yonatan Najman-Licht, Kim Ø Rasmussen, Amarda Shehu, Alan R Bishop, Boian Alexandrov dan Anny Usheva, 13 September 2024, Penelitian Asam Nukleat.
DOI: 10.1093/nar/gkae783
Pekerjaan ini didukung oleh Institut Kesehatan Nasional dan Yayasan Sains Nasional.