Veštačka inteligencija (AI) je korišćena za otkrivanje detalja o raznolikoj i fundamentalnoj grani života koja živi pod našim nogama iu svakom uglu sveta.
Ukupno 161.979 novih vrsta RNK virusa otkriveno je pomoću alata za mašinsko učenje za koji istraživači veruju da će značajno poboljšati mapiranje života na Zemlji i pomoći u identifikaciji još mnogo miliona virusa koji tek treba da budu okarakterisani.
Objavljena u Cell i koju je sproveo međunarodni tim istraživača, studija je najveći dokument o otkrivanju vrsta virusa ikada objavljen.
„Ponuđen nam je prozor u inače skriveni deo života na zemlji, otkrivajući izuzetan biodiverzitet“, rekao je stariji autor profesor Edvards Holms sa Fakulteta medicinskih nauka na Fakultetu medicine i zdravlja Univerziteta u Sidneju.
„Ovo je najveći broj novih vrsta virusa otkrivenih u jednoj studiji, masovno proširujući naše znanje o virusima koji žive među nama“, rekao je profesor Holms.
„Pronaći ovoliko novih virusa u jednom potezu je zapanjujuće, i samo zagrebe površinu, otvarajući svet otkrića. Ima još milione koje treba otkriti, i možemo primeniti isti pristup u identifikaciji bakterija i parazita .“
Iako se RNK virusi obično povezuju sa ljudskim bolestima, oni se takođe nalaze u ekstremnim sredinama širom sveta i čak mogu igrati ključnu ulogu u globalnim ekosistemima. U ovoj studiji pronađeni su da žive u atmosferi, toplim izvorima i hidrotermalnim otvorima.
„To što ekstremna okruženja nose toliko vrsta virusa je samo još jedan primer njihove fenomenalne raznolikosti i upornosti da žive u najsurovijim okruženjima, što nam potencijalno daje naznake o tome kako su virusi i drugi elementarni oblici života nastali“, rekao je profesor Holms.
Istraživači su izgradili algoritam dubokog učenja, LucaProt, za izračunavanje ogromnih količina podataka o genetskoj sekvenci, uključujući dugačke virusne genome do 47.250 nukleotida i genomski složene informacije kako bi otkrili više od 160.000 virusa.
„Velika većina ovih virusa je već bila sekvencionirana i nalazila se u javnim bazama podataka, ali su se toliko razlikovali da niko nije znao šta su“, rekao je profesor Holms. „One se sastoje od onoga što se često naziva sekvenca ‘tamne materije’. Naš AI metod je bio u stanju da organizuje i kategorizuje sve ove različite informacije, bacajući svetlo na značenje ove tamne materije po prvi put.“
Alat AI je obučen da izračuna tamnu materiju i identifikuje viruse na osnovu sekvenci i sekundarnih struktura proteina koje svi RNK virusi koriste za replikaciju.
Bio je u stanju da značajno ubrza otkrivanje virusa, što bi, ako se koristi tradicionalnim metodama, zahtevalo dosta vremena.
Koautor sa Univerziteta Sun Jat-sen, institucionalni vođa studije, profesor Mang Ši je rekao: „Nekada smo se oslanjali na dosadne bioinformatičke cevovode za otkrivanje virusa, što je ograničavalo raznolikost koju smo mogli da istražimo. Sada imamo mnogo efikasniju veštačku inteligenciju zasnovan na modelu koji nudi izuzetnu osetljivost i specifičnost, a istovremeno nam omogućava da uđemo mnogo dublje u virusnu raznolikost. Planiramo da primenimo ovaj model u različitim aplikacijama.
Koautor dr Zhao-Rong Li, koji istražuje u Apsara laboratoriji Alibaba Cloud Intelligence, rekao je: „LucaProt predstavlja značajnu integraciju najsavremenije AI tehnologije i virologije, pokazujući da AI može efikasno da obavlja zadatke u biološkom istraživanju.
„Ova integracija pruža dragocene uvide i podsticaj za dalje dekodiranje bioloških sekvenci i dekonstrukciju bioloških sistema iz nove perspektive. Takođe ćemo nastaviti naše istraživanje u oblasti veštačke inteligencije za virologiju.“
Profesor Holms je rekao: „Očigledni sledeći korak je da obučimo našu metodu da pronađemo još više ove neverovatne raznolikosti, i ko zna koja dodatna iznenađenja se spremaju.“