Doğan T. (Yürütücü)
TÜBİTAK Projesi, 2021 - 2024
Büyük ölçekli biyomedikal verinin sistemik analizi, biyolojik mekanizmaları anlamak ve hastalıklara karşı kişiselleştirilmiş tıp temelli yeni ve etkili tedavi yaklaşımları geliştirmek için kritik öneme sahiptir. Son yıllarda erişilebilir hale gelen teknolojiler sayesinde biyolojik verinin farklı katmanları yüksek çıktılı şekilde üretilebilmektedir. Öte yandan, kapsamlı ve bütünleştirici analizler üzerinden klinik uygulamalar geliştirilmesini büyük ölçüde engelleyen iki kritik problem mevcuttur. Bunların ilki, sistem biyolojisi bazlı yaklaşımların temelinde yatan biyolojik/biyomedikal bileşenler arası ilişkilerin (örn. protein-fonksiyon, gen-hastalık ilişkileri vb.) önemli bir kısmının halen bilinmemesidir. Diğer problem ise, farklı tiplerdeki biyolojik özellikleri/ilişkileri ortaya çıkaran deneysel teknolojilerin ve çıktı olarak alınan verinin yapılarının ve depolanma şekillerinin farklı olmasından dolayı entegre bir kaynağın var olmamasıdır. Kişiselleştirilmiş tıp yaklaşımları çerçevesinde biyolojik/biyomedikal büyük verinin kapsamlı analizinin sağlanması ve klinikte kullanılabilecek başarıya sahip modelleme yaklaşımlarının geliştirilebilmesi için bu iki sorunu biyoenformatik temelinde çözecek yeni hesaplamalı yöntemlere ihtiyaç duyulmaktadır. Önerilen projede, bahsi geçen problemlerin bilgisayarlı görü ve doğal dil işleme gibi alanlarda çığır açıcı sonuçlara yol açan yapay zekâ bazlı modern yaklaşımların biyolojik/biyomedikal veriye uygulanmasıyla çözülmesi mümkün müdür sorusuna yanıt aranmaktadır.
Bu çalışmanın amaç ve hedeflerinin başında geniş çaplı ve heterojen biyolojik/biyomedikal veriyi farklı kaynaklardan entegre ederek çizge yapısına sahip bilgi grafikleri şeklinde ifade edecek ve derin çizge sinir ağları kullanılarak bileşenler arasındaki kompleks ilişkileri yüksek başarımla tahmin edecek kapsamlı bir hesaplamalı sistemin geliştirilmesi gelmektedir. Biyolojik ilişki tahmini problemi, oluşturulacak heterojen bilgi grafikleri üzerindeki biyolojik bileşenler (düğümler) arası bağlantıların (kenarlar) tahmini şeklinde modellenecektir. Bu kapsamda, ağ analizi bazlı yöntemlerle öznitelik bazlı yaklaşımların avantajları birleştirilerek çok modlu çizgeler üzerinden derin öğrenme sağlanacaktır. Geliştirilecek yöntemin 3 ayrı uygulaması olarak, (i) gen/protein fonksiyonları, (ii) gen/protein-hastalık ilişkileri ve (iii) ilaç-hastalık eşleşmelerini tahmin eden modeller eğitilecek ve tüm gen/protein, fonksiyon, hastalık ve ilaçlar için uygulanarak geniş çaplı bağlantı tahminleri üretilecektir. Daha sonra bu tahminlerin literatür bazlı doğrulaması yapılacak ve sonuçlar tartışılacaktır. Çalışmanın son hedefi, entegre biyolojik/biyomedikal veriyi, bilgi grafiklerini, tahmin modelini ve sonuçlarını içeren çevrim içi çalışan bir ağ servisinin kurulması ve açık erişimli olarak araştırma dünyasının kullanımına sunulmasıdır.
Çalışmanın yaygın etkisinin, bilinen ilişkileri ve derin öğrenme bazlı tahminleri içerecek şekilde biyomoleküller ve fonksiyonları, mutasyonlar, gen ifadeleri, hastalıklar, fenotipler, dokular, hücreler, hastalar ve biyolojik mekanizmalar arasındaki kompleks sistemik ilişkilerin gözlenmesi açısından yaşam bilimleri araştırmacılarına hipotez oluşturma/test etme konularında katkıda bulunmak olacağı düşünülmektedir. Amacı, hedefleri ve bunlara ulaşmak için geliştirilecek hesaplamalı sistemde kullanılacak yaklaşımlar açısından önerilen proje son derece özgün bir değere sahiptir. Projenin, adayın akademik kariyerine yapay zekâ/derin öğrenme bazlı yöntem geliştirme ve uygulama, kompleks verinin entegrasyonu ve modern yaklaşımlar kullanılarak temsili, veri tabanı ve ağ servisi geliştirme ve sistem biyolojisi odaklı analizler konularında önemli bilimsel katkıları olacaktır. Ayrıca, yakın gelecekte bu çalışmanın devamı niteliğinde yeni projeler oluşturmak için moleküler biyoloji, hücre biyolojisi, ilaç geliştirme, hassas tıp ve kompleks hastalıklar gibi farklı disiplinlerden araştırmacılar ile ortaklıklar kurulmasına olanak sağlayacaktır.