Kemajuan teknologi pengurutan gen dan daya komputasi telah meningkatkan ketersediaan data bioinformatik dan kemampuan pemrosesan secara signifikan. Konvergensi ini memberikan peluang ideal bagi kecerdasan buatan (AI) untuk mengembangkan metode guna mengendalikan perilaku seluler.
Dalam sebuah studi baru, para peneliti Universitas Northwestern telah memetik manfaat dari hubungan ini dengan mengembangkan pendekatan pembelajaran transfer bertenaga AI yang menggunakan kembali data yang tersedia untuk umum untuk memprediksi kombinasi gangguan gen yang dapat mengubah jenis sel atau memulihkan kesehatan sel yang sakit.
Studi ini baru-baru ini dipublikasikan di Prosiding Akademi Ilmu Pengetahuan Nasional.
Sejak selesainya proyek genom manusia 20 tahun lalu, para ilmuwan telah mengetahui manusia itu DNA terdiri lebih dari 20.000 gen. Namun, masih menjadi misteri bagaimana gen-gen ini bekerja sama untuk mengatur ratusan jenis sel berbeda di tubuh kita.
Yang mengejutkan, pada dasarnya melalui trial-and-error yang dipandu, para peneliti telah menunjukkan bahwa “memprogram ulang” jenis sel dapat dilakukan dengan memanipulasi hanya segelintir gen. Proyek genom manusia juga memfasilitasi kemajuan dalam teknologi pengurutan, menjadikannya lebih murah tidak hanya untuk membaca kode genetik, tetapi juga untuk mengukur ekspresi gen, yang mengkuantifikasi prekursor protein yang menjalankan fungsi sel. Peningkatan keterjangkauan ini telah menyebabkan akumulasi sejumlah besar data bioinformatik yang tersedia untuk umum, sehingga meningkatkan kemungkinan sintesis data tersebut untuk merancang manipulasi gen secara rasional yang dapat menghasilkan perilaku sel yang diinginkan.
Kemampuan untuk mengontrol perilaku sel, dan transisi antar tipe sel, dapat diterapkan untuk menumbuhkan kembali jaringan yang terluka atau untuk mengubah sel kanker kembali menjadi sel normal.
Cedera jaringan akibat stroke, arthritis dan multiple sclerosis mempengaruhi 2,9 juta orang setiap tahun di Amerika Serikat, dan menyebabkan kerugian sebesar $400 juta per tahun. Sementara itu, kanker bertanggung jawab atas sekitar 10 juta kematian setiap tahunnya di seluruh dunia dengan kerugian ekonomi mencapai triliunan dolar. Karena standar perawatan yang ada saat ini tidak dapat meregenerasi jaringan dan/atau memiliki kemanjuran yang terbatas, terdapat kebutuhan penting untuk mengembangkan pengobatan yang lebih efektif dan dapat diterapkan secara luas, yang pada gilirannya memerlukan identifikasi intervensi molekuler yang dapat disimpulkan dari data dengan hasil yang tinggi.
Dalam studi baru ini, para peneliti melatih AI mereka untuk mempelajari bagaimana ekspresi gen meningkatkan perilaku sel menggunakan data ekspresi gen yang tersedia untuk umum. Model prediktif yang dihasilkan oleh proses pembelajaran ini ditransfer ke aplikasi pemrograman ulang sel tertentu. Dalam setiap penerapan, pendekatan ini menemukan kombinasi manipulasi gen yang paling mungkin mendorong transisi tipe sel yang diinginkan.
“Pekerjaan kami menonjol dari pendekatan sebelumnya dalam merancang strategi secara rasional untuk memanipulasi perilaku sel,” kata Thomas Wytock, penulis utama makalah ini dan anggota Center for Network Dynamics di Universitas Barat Laut. “Pendekatan ini sebagian besar terbagi dalam dua kategori: satu di mana gen diorganisasikan ke dalam jaringan berdasarkan interaksi atau sifat umumnya; dan satu lagi yang membandingkan ekspresi gen dari sel yang sehat dan yang sakit untuk memilih gen yang menunjukkan perbedaan terbesar.”
Pada kategori pertama, terdapat trade-off antara realisme dan skala. Beberapa model jaringan terdiri dari banyak gen tetapi hanya menyatakan apakah suatu hubungan ada atau tidak. Model-model lain bersifat kuantitatif dan tervalidasi secara eksperimental tetapi harus melibatkan sejumlah kecil gen dan hubungan. Karya baru Northwestern mempertahankan kekuatan kedua jenis model: model ini mencakup seluruh gen dalam sel dan bersifat kuantitatif dalam merepresentasikan ekspresi gen-gen tersebut. Hal ini dicapai dengan mengurangi ekspresi hampir 20.000 gen individu menjadi tidak lebih dari 10 kombinasi linier gen tersebut, yang merupakan rata-rata tertimbang yang disebut sebagai eigengenes.
“Eigengenes pada dasarnya menunjukkan bagaimana gen beroperasi secara bersamaan, sehingga memungkinkan untuk menyederhanakan dinamika jaringan dinamis yang besar menjadi beberapa bagian yang bergerak saja,” kata Adilson Motter, Profesor Fisika Charles E. dan Emma H. Morrison di Weinberg College Seni dan Sains, direktur Pusat Dinamika Jaringan di Universitas Northwestern dan penulis senior studi tersebut. “Setiap eigengene dapat dianggap sebagai jalur umum yang tidak bergantung satu sama lain. Jadi, eigengenes mengambil korelasi dan independensi yang relevan dalam jaringan regulasi gen.”
Pendekatan dalam kategori kedua dapat menemukan gen individu yang terkait dengan perubahan perilaku sel namun gagal menentukan bagaimana gen bekerja sama untuk memungkinkan perubahan ini. Pendekatan baru ini mengatasi tantangan ini dengan menyadari bahwa gen mengubah ekspresi mereka secara bersamaan. Penghitungan kuantitatif sifat ini dalam kaitannya dengan eigengenes memungkinkan untuk menggabungkan respons mereka terhadap gangguan gen yang berbeda secara aditif dengan menskalakannya secara sesuai. Gabungan respons tersebut kemudian dapat dimasukkan ke dalam model AI untuk menentukan gangguan mana yang menimbulkan perilaku sel yang diinginkan.
Dilengkapi dengan model AI ini, para peneliti mengumpulkan data yang tersedia untuk umum untuk mengidentifikasi bagaimana ekspresi gen berubah ketika satu gen terganggu dengan menaikkan atau menurunkan ekspresinya secara eksogen. Mereka kemudian mengembangkan algoritma untuk memecahkan masalah kebalikannya, yaitu memprediksi kombinasi gen yang paling mungkin menginduksi transisi pemrograman ulang yang diinginkan, seperti menyebabkan sel yang sakit berperilaku seperti sel yang sehat. Pendekatan yang dihasilkan dari pengintegrasian data dan algoritme menghindari ledakan kombinatorial yang dihasilkan dari pengujian semua kombinasi untuk mengidentifikasi kombinasi yang efektif. Hal ini penting karena eksperimen hanya dapat menguji sejumlah kasus terbatas, dan algoritme menyediakan cara untuk mengidentifikasi kasus yang paling menjanjikan untuk diuji.
“Pendekatan ini unggul dalam kemampuannya untuk menguji berbagai kombinasi secara komputasional,” kata Wytock. “Misalnya, kombinasi berpasangan dari 200 gangguan menghasilkan 20.000 kasus, tiga kali lipat menghasilkan lebih dari 1,3 juta kasus, dan jumlah ini terus bertambah secara eksponensial. Karena algoritme ini menggunakan pengoptimalan, pendekatan ini dapat membandingkan prediksi dalam jumlah kombinasi yang berpotensi tak terbatas melalui keajaiban kalkulus.”
Tantangan lain yang dapat diatasi dengan pendekatan ini adalah bahwa gangguan gen dapat digabungkan secara non-aditif. Misalnya, pertimbangkan dampak gangguan gen terhadap laju pertumbuhan sel dan bayangkan gangguan tersebut mengurangi separuh laju pertumbuhan bila diterapkan secara terpisah. Dampak dari dua gangguan tersebut digabungkan secara non-aditif jika keduanya mengurangi pertumbuhan menjadi lebih besar atau kurang dari setengah (atau seperempat). Meskipun terdapat banyak penelitian yang mengkarakterisasi interaksi non-aditif antar gen, pendekatan baru ini efektif bahkan tanpa harus memperhitungkan penyimpangan dari aditif tersebut.
“Ini adalah kasus di mana keseluruhan dapat didekati dengan baik melalui jumlah bagian-bagiannya,” kata Motter.
“Sifat intervensi yang diperlukan untuk mendorong transisi antar tipe sel ini berlawanan dengan intuisi karena tipe sel itu sendiri muncul dari interaksi kolektif antar gen.”
Karena pendekatan ini mengatasi tantangan utama dalam mengendalikan perilaku sel, pendekatan ini dapat diterapkan pada berbagai kondisi biomedis, termasuk kondisi yang akan mendapat manfaat dari data masa depan.
Fakta bahwa respons terhadap gangguan gen digabungkan secara aditif memfasilitasi generalisasi antar tipe sel. Misalnya, jika suatu gen terganggu pada sel kulit, dampak yang dihasilkan pada ekspresi gen akan sama pada sel hati.
Oleh karena itu, pendekatan yang didukung AI dapat dianggap sebagai platform di mana data mengenai penyakit tertentu pada pasien tertentu dapat dimasukkan. Pendekatan ini dapat diterapkan ketika penyembuhan penyakit dapat dianggap sebagai masalah pemrograman ulang, seperti dalam kasus kanker, diabetes, dan penyakit autoimun, yang semuanya disebabkan oleh disfungsi sel.
Keserbagunaan pendekatan ini memungkinkan ekspresi gen dalam satu penelitian untuk dikontekstualisasikan dengan cepat di seluruh data yang tersedia di Arsip Baca Sequencing Pusat Informasi Bioteknologi Nasional, yang merupakan gudang terbesar yang tersedia untuk umum untuk data ekspresi gen. Arsip ini telah berkembang 100 kali lipat dari 10 terabyte menjadi 1.000 terabyte antara tahun 2012 dan 2022 dan terus tumbuh secara eksponensial seiring dengan menurunnya biaya pengurutan. Penelitian ini memberikan alat penting untuk menerjemahkan kekayaan data ini menjadi prediksi spesifik tentang bagaimana gen bekerja sama untuk mengendalikan perilaku sel normal dan sel yang sakit.
Referensi: “Desain pemrograman ulang sel dengan pembelajaran transfer jaringan transkripsi fungsional” oleh Thomas P. Wytock dan Adilson E. Motter, 4 Maret 2024, Prosiding Akademi Ilmu Pengetahuan Nasional.
DOI: 10.1073/pnas.2312942121
Penelitian ini didukung oleh Kantor Penelitian Angkatan Darat, Institut Kesehatan NasionalNational Science Foundation dan Institut Tumor Otak Malnati Universitas Northwestern.
RisalahPos.com Network