Bioinformatika

Voditelji: prof.dr.sc. Antonio Starčević and dr.sc. Tomislav Šmuc

Ciljevi, ideja i značaj

Danas, kada nam mnoštvo “-omika” daje dosada nedostignut uvid u morske resurse koje možemo istražiti, opisati pa čak i modelirati kako bismo ekstrapolirali bitne spoznaje o prisutnim interakcijama između morskih organizama, okoliša (mora) i na koncu čovjeka. Ovaj uvid međutim, nosi kao posljedicu lavinu podataka u vidu epigenetičkih studija, DNA/RNA čipova, sekvencija DNA i proteina i sl. koje ne samo da je teško analizirati već se suočavamo s problemom kako ih uopće skladištiti. Pri tom, gotovo da nismo niti zagrebli ispod površine kada su u pitanju “nevidljivi” stanovnici mora, mikroorganizmi koji čine većinu svjetske biomase. Da stvar bude gora, većina tih mikroorganizama nije kultivabilna, tako da smo limitirani u svojim nastojanjima da ih istražimo, a očito je da vrše ogromnu ulogu u čitavom ekosustavu. Soga se okrećemo metagenomici i metaproteomici kao alatima koji nam omogućavaju da prevaziđemo ova ograničenja i steknemo uvid u ogromnu mikrobnu raznolikost Jadranskog mora. Uvid koji bismo tako stekli mogao bi rezultirati novim terapijskim spojevima i biomaterijalima ali i boljim razumijevanjem kako funkcionira nama nevidljiv svijet u morima.

Znanstvena osnova

Morski beskralješnjaci i drugi ciljni organizmi često su domaćinima vrlo raznolikim mikrobnim populacijama. Upravo ove mikrobne populacije u suživotu sa domaćinom proizvode cijelu paletu potencijalno interesantnih kemijskih spojeva. Ronilačkim ekspedicijama pribavljeni uzorci organizama uzgajati će se in situ i ex situ. Relevantne analize nad uzorcima biti će podijeljene u dvije etape. Prva etapa ima za cilj mapirati bioraznolikost kako organizama tako i spojeva dok druga predstavlja ciljanu metagenomičku i metaproteomsku analizu. Upravo je ova druga etapa generator glavnine podataka u ovoj fazi projekta i biti će zaslužna za oslobađanje punog potencijala zasada skrivenog u enormnoj količini genomskih i proteomskih podataka. Da bi do toga došlo, biti će potrebno razviti bioinformatičku platformu  za otkriće i analizu novih sekundarnih metabolita zapisanih u genskim nakupinama mikroorganizama. Sveobuhvatna, cjelovita platforma za analizu “-omičkih” podataka iz morskih okoliša, nešto je potpuno novo, tako da će biti pravi izazov konstruirati ovakovu platformu. Vjerujemo da bioinformatička grupa unutar ovog konzorcija posjeduje potrebna znanja i vještina, a novi računalni alati koji će biti konstruirani za potrebe ovog centra rezultirati će cjelovitim računalnim resursom za istraživanje i razvoj “morskih” bioaktivnih supstanci. Takav resurs ima mogućnost uspostaviti most između akademskog istraživanja i industrijske potrebe za novim bioaktivnim spojevima. Znanstveni rezultat platform razvijene u okviru ove faze biti će funkcionalno obogaćeni profile gena koji će se koristiti u čitavom nizu aplikacija koje se bave izučavanjem mikrobioma. U kontekstu BioProCro-a, ovi će se profili koristiti za pronalazak novih  metabolita na način da se bolje spoznaju interakcije između genoma i fenotipa. U konačnici, ovo  će rezultirati boljom pretragom za bioraznolikošću baziranom na “-omikama”, ali će i povećati šanse za otkriće i dizajn novih bioaktivnih supstancija putem proteinskog inženjrestva. Još jedan znanstveni aspekt kojim ova faza doprinosi jest ekspertiza u prediktivnim modelima namijenjenim mehanizmima i aktivnostima  kemijskih spojeva. Ova će se ekspertiza primijeniti u vidu izrade i primjene takovih modela na problematiku pretrage bioaktivnih spojeva iz Jadrana. To će se činiti u interakciji sa Fazom 5. Ne smijemo zanemariti niti postojeće izvore informacija kao npr. javno dostupne baze Antibase, SuperNatural II, ili Dictionary of Natural Products. Poznavanje postojećih bioaktivnih spojeva ključno je za procjenu potencijala novo- otkrivenih, a kako već postoji cca. 200,000 poznatih spojeva, to je važan resurs koji će se koristiti za optimizaciju čitavog poduhvata traženja i izolacije bioaktivnih supstancija iz Jadrana. Jedan od načina da se smanje rizici, uvijek prisutni u projektima ovakvog obima jest to da se fokusiramo na nove još neistražene vrste i organizme i da iskoristimo postojeća saznanja kako bismo process selekcije obećavajućih spojeva učinili što je moguće boljim.

Istraživačke kompetencije

Unutar dvaju bioinformatičkih grupa u planiranom centru postoji dovoljno kompetencija za izvršenje svih planiranih istraživanja. Prethodni radovi mogu poslužiti kao reference za rad sa morskim organizmima primjerice      baza                                             podataka                   sekvencioniranog            koralja: http://bioserv7.bioinfo.pbf.hr/Zoophyte/registration/login.jsp opisana u radu WC Dunlap et al. “KEGG orthology-based annotation of the predicted proteome of Acropora digitifera: ZoophyteBase – an open access and searchable database of a coral genome”. Sva potrebna računalna oprema i prateća infrastruktura već postoji i nadogradiva je, tako da ne očekujemo probleme po tom pitanju. Kabinet za bioinformatiku na PBF- u trenutno ima tri aktivna istraživača (doc. dr. Antonio Starčević, doc. dr. Jurica Žučko, dr. sc. Janko  Diminić i profesor) kao i istraživača u fazi izbora za emeritusa prof. dr. Daslava Hranueli. U 2010. ova su četiri istraživača osnovala spin-off SemGen d.o.o. sa ciljem sudjelovanja na EU projektima. Kao SemGen sudjelovali su na FP7 projektu “Amylomics”. Unutar ovog FP7 konzorcija njihova uloga je bila upravljanje metagenomskim podacima.

Drugo područje ekspertize jesu bakterijski sekundarni metaboliti. Ovi su spojevi među najznačajnijim izvorima kemijske raznolikosti i već se godinama komercijalno ekspoatiraju u nizu farmaceutskih pripravaka. Kabinet za bioinformatika pokušao je originalnim pristupom dati svoj doprinos području kroz sustave za “in silico” dizajn i otkriće lijekova baziranih na ovoj grupi sekundarnih metabolita mikroorganizama. Dva nova sustava proizašla iz ovog rada nazivaju se “ClustScan” i “CompGen” i poslužili su kao generator podataka za dvije nove baze. Bazu sekundarnih metabolita CSDB – “ClustScan generated database” kao i bazu rekombinantnih metabolita r-CSDB – “recombinant ClustScan database”. Kao primjer neiskorištenog potencijala ove grupe spojeva navodimo da CSDB trenutačno sadrži 170 spojeva dok r-CSDB sadrži čak 11,796 potpuno novih kemijskih entiteta baziranih na postojećim. Stoga vjerujemo da postoji ogroman neistraženi potencijal koji će istraživanje morskih mikroorganizama podići na jedan potpuno novi nivo. Modeli predikcije razvijeni za potrebe omogućavaju da iz genomičkih i proteomičkih podataka  iščitamo strukturne predloške za ovu neizmjerno važnu grupu spojeva. SemGen kao i kabinet za bioinformatiku bili su projekt partneri na “RapidCell” – IPA2007/HR/16IPO/001-0404503, RBI IPA projektu koji ima za cilj brzu identifikaciju mikroorganizama u klinici. Također nešto što bi bilo iznimno korisno upotrijebiti u svrhu mapiranja mikrobne raznolikosti Jadrana. Također, kabinet je pod vodstvom doc. dr. Jurice Žučko uspješno svršio HRZZ projekt “Rizici zagađenja Jadranskog mora naftom”, gdje je stekao uvid u mikrobni potencijal Jadrana Korlević, M., J. Zucko, M. Blažina, M. Najdek Dragić, E. Pustijanac, T. Vojvoda Zeljko, R. Gacesa, D. Baranasic, A. Starcevic, J. Diminic, P.F. Long, J. Cullum, D. Hranueli & S. Orlić. Bacterial diversity of polluted surface sediments in the northern Adriatic Sea. Syst. Appl. Microbiol., 38, 184-188, 2015. Grupa za računalnu biologiju i bioinformatiku sa Instituta Ruđer Bošković vođena od strane dr Tomislava Šmuca ima komplementarna znanja i vještine, prvenstveno iz polja mašinskog učenja i rudarenja podataka sa naglaskom na molekularnu biologiju. Kombinacija naprednih analitičkih metoda kao i računalnih aplikacija prilagođenih metodologijama prisutnim u relevantnim problemima iz područja  biologije u medicinske biokemije rezultirali su brojem visoko citiranih znanstvenih članaka. Neki od računalnih alata koje je grupa razvila kao npr. REVIGO i GORBI, široko su prihvaćeni od strane sire znanstvene zajednice. Nedavna dostignuća grupe relevantna ciljevima ovog centra uključuju konstrukciju sveobuhvatne genomske baze podataka svih sekvencionoiranih prokariota sa naglaskom na predikciju gena sa dosada neutvrđenim funkcijama. Ova platforma za više-parametarsku klasifikaciju bazirana na vrhunskim algortimima iz područja mašinskog učenja napravljena je u sklopu projekta FP7 FET MAESTRA koji je još u tijeku.

Metode i njihove poveznice sa specifičnim ciljevima

Glavna tehnička komponenta planirane bioinformatičke platforme biti će centralni distribucijski sustav koji povezuje različite komponente same platforme i pruža pristup bazama koje sadrže podatke o spojevima, metabolomu, sekvencijama, transkriptomu, proteomu itd. Integracija komponenti biti će provedena intuitivno s naglaskom na lakoću korištenja, a u cjelini će pružati mogućnost krajnjem korisniku da identificira i označi poznate metaboličke puteve i regulatorne mreže u organizmima producentima kao i da omogući bolje predikcije novih do sada nepoznatih. Prema krajnjem korisniki, platforma će biti predstavljena kao web portal. Ovo je potpunosti u skladu sa ciljevima ove faze, a to su upravljanje podatcima, uspostava suradnji, vidljivost samog centra kao i konačni cilj, održivo, brzo i učinkovito otkriće novih morskih biomolekula i biomaterijala sa komercijalnim potencijalom.

Očekivani rezultati i njihovi krajnji korisnici

Pored znanstvenih radova u ISI Web of Knowledge indeksiranim časopisima, planirano je i održavanje radionica kao i jedna međunarodna konferencija sa temom bioraznolikosti u Jadranskom moru. Također, planira se i evaluacija modela održive eksploatacije bioraznolikosti u vidu konzultantskih usluga (namijenjenih npr. Farmaceutskoj industriji), preko licenciranja obrađenih podataka. Očekivani korsinici dolaze iz farmaceutske, biotehnološke, prehrambene industrije, akademskog sektora, pa do raznih agencija i instituta.