Kako veštačka inteligencija može poboljšati detekciju proteina

Kako veštačka inteligencija može poboljšati detekciju proteina

Mali proteini igraju ključnu ulogu u regulaciji imunološkog odgovora, upale i neurodegenerativnih bolesti. Da bi ih bolje otkrili i proučili, naučnici Maks Plank instituta za nauku o svetlosti kombinovali su jednu od najefikasnijih mikroskopskih metoda, nazvanu iSCAT, sa veštačkom inteligencijom.

Biološki molekuli kao što su proteini su centralni sastojci svih živih sistema i diktiraju sve fiziološke reakcije u zdravstvenim i bolesnim stanjima. Konkretno, mnogi mali proteini igraju kritičnu ulogu u regulaciji imunološkog odgovora, upale i neurodegenerativnih bolesti. Brze i neinvazivne metode detekcije proteina nam stoga mogu pomoći da napravimo poboljšanja u oblastima dijagnoze bolesti i razvoja lekova.

Tradicionalne metode detekcije proteina uključuju obeležavanje proteina fluorescentnom ili radioaktivnom oznakom, kako bi se pratili i detektovali. Međutim, pokazalo se da su ove metode prilično skupe i dugotrajne. Još problematičnija je činjenica da ove oznake mogu promeniti funkciju proučavanog proteina, čineći sve prikupljene podatke nepouzdanim. Kako se poslednjih godina povećao naučni interes za funkcije proteina, tako je poraslo i interesovanje za metode detekcije bez oznaka. Jedna takva metoda, koja se danas široko smatra jednom najefikasnijom i najosetljivijom tehnikom detekcije proteina bez oznaka i u realnom vremenu, je interferometrijska mikroskopija rasejanja (iSCAT).

iSCAT se zasniva na osetljivoj detekciji svetlosti raspršene pojedinačnim proteinima kroz interferometriju. Dok se pojedinačni proteini talože iz pufera na pokrivno staklo, sićušna senka proteina bačena na kameru daje informacije o njegovoj veličini i masi. Stoga je metoda poznata i kao masovna fotometrija. Međutim, kombinacija izvora tehničke buke i pozadinskih fluktuacija sličnih tačkicama je ranije ograničila osetljivost iSCAT detekcije na proteine veće od oko 40 KDa.

Da bi još više pogurao osetljivost iSCAT-a, tim iz MPL-a oko generalnog direktora Vahida Sandogdara, sastavljen od inženjera elektrotehnike Mahiara Dahmardeha, kompjuterskog naučnika Houmana Mirzaaliana i fizičkog hemičara Hišama Mazala, sarađivao je sa Haraldom Kostlerom sa Univerziteta Friedrich-Alekander Erlangenzit. Nirnberg (FAU) da koristi dve tehnike mašinskog učenja za otkrivanje proteina od samo 10 kDa ili manje.

U radu objavljenom u Nature Methods, oni su pokazali kako mogu da koriste iForest algoritam u kombinaciji sa FastDVDnet tehnikom da bi postigli ovaj rezultat. Obe su takozvane tehnike mašinskog učenja bez nadzora, što znači da ne moraju prvo da budu obučene na označenom skupu podataka. Mašinsko učenje bez nadzora je veoma poželjno u mikroskopiji jer omogućava identifikaciju obrazaca i odnosa u velikim skupovima podataka bez poznavanja osnovnog modela snimanja. Ovo je posebno važno kada je granica detekcije na ivici nivoa buke i postoji nedostatak označenih podataka za obuku mreže.

FastDVDnet je napredna tehnika uklanjanja šuma sa slike koja uklanja šum sa mikroskopskih slika koristeći duboke neuronske mreže. Optimizovan je za paralelnu obradu, omogućavajući mu da obrađuje veoma velike skupove podataka za relativno kratko vreme. U ovom slučaju, istraživači su koristili FastDVDnet da identifikuju iSCAT slike proteina iz snimljenih video sekvenci. Prostorno-vremenske karakteristike koje je izdvojio FastDVDnet je zatim koristio iForest za grupisanje iSCAT podataka.

Algoritam nenadgledanog mašinskog učenja izolacione šume (iForest) se obično koristi za zadatke otkrivanja anomalija. Posebno je pogodan za mikroskopiju jer može da obrađuje visokodimenzionalne podatke sa velikim brojem karakteristika, što rezultira preciznijim i sveobuhvatnijim rezultatima. Ovo je posebno korisno kada se analiziraju mikroskopski podaci, gde identifikacija retkih ili abnormalnih karakteristika postaje važna. Na primer, iForest detekcija anomalija se može koristiti za otkrivanje prisustva retkih struktura unutar biološkog tkiva ili za identifikaciju ćelija neobične morfologije. Ovaj algoritam može pomoći u identifikaciji retkih ili neobičnih karakteristika koje bi tradicionalne metode analize mogle vrlo lako prevideti.

Profesor Vahid Sandogdar se priseća napornog rada svog tima, ali se takođe raduje sledećem izazovu: „Prešli smo dug put od našeg prvog izveštaja o detekciji malih proteina bez etiketa u Nature Communications 2014. Mi smo odlučni da dalje pomerimo granicu detekcije kako poboljšanjem metoda fizičkog merenja tako i razvojem sofisticiranijih algoritama mašinskog učenja. Zaista ne postoji fundamentalni razlog zašto ne bismo mogli da otkrijemo molekule ispod 1 kDa, približavajući se težini čak i jedne molekul lipida.“