Naučnici koriste mašinsko učenje za dekodiranje regulacije gena u ljudskom mozgu u razvoju

Naučnici koriste mašinsko učenje za dekodiranje regulacije gena u ljudskom mozgu u razvoju

U naučnom podvigu koji proširuje naše znanje o genetskim promenama koje oblikuju razvoj mozga ili dovode do psihijatrijskih poremećaja, tim istraživača je kombinovao eksperimente visoke propusnosti i mašinsko učenje kako bi analizirao više od 100.000 sekvenci u ljudskim moždanim ćelijama – i identifikovao preko 150 varijanti koje verovatno izazvati bolest.

Studija naučnika sa Instituta Gledston i Univerziteta Kalifornije u San Francisku (UCSF) uspostavlja sveobuhvatan katalog genetskih sekvenci uključenih u razvoj mozga i otvara vrata novoj dijagnostici ili tretmanima neuroloških stanja kao što su šizofrenija i poremećaj autističnog spektra. Rad, „Masivno paralelna karakterizacija regulatornih elemenata u ljudskom korteksu u razvoju“, pojavljuje se u časopisu Nauka.

„Prikupili smo ogromnu količinu podataka iz sekvenci u nekodirajućim regionima DNK za koje se već sumnjalo da igraju veliku ulogu u razvoju mozga ili bolesti“, kaže viši istraživač dr Kejti Polard, koja je i direktorka Gledstonova. Institut za nauku o podacima i biotehnologiju.

„Uspeli smo da funkcionalno testiramo više od 100.000 njih da bismo saznali da li utiču na aktivnost gena, a zatim da odredimo promene sekvence koje bi mogle da promene njihovu aktivnost u bolesti.“

Polard je zajedno sa dr Nadavom Ahituvom, profesorom na Odseku za bioinženjering i terapeutske nauke na UCSF-u i direktorom UCSF instituta za ljudsku genetiku, vodio sveobuhvatnu studiju. Veliki deo eksperimentalnog rada na moždanom tkivu vodio je dr Tomaš Novakovski, vanredni profesor neurološke hirurgije na Odeljenju za medicinu UCSF.

Sve u svemu, tim je pronašao 164 varijante povezane sa psihijatrijskim poremećajima i 46.802 sekvence sa pojačivačem aktivnosti u razvoju neurona, što znači da kontrolišu funkciju datog gena.

Ovi „pojačivači“ bi se mogli iskoristiti za lečenje psihijatrijskih bolesti u kojima jedna kopija gena nije u potpunosti funkcionalna, kaže Ahituv: „Stotine bolesti su rezultat toga što jedan gen ne radi kako treba, i možda je moguće iskoristiti prednosti ovih pojačivača za naterati ih da urade više.“

Osim identifikacije pojačivača i sekvenci povezanih sa bolešću, studija ima značaj u dve druge ključne oblasti.

Prvo, naučnici su ponovili delove svog eksperimenta koristeći organoid mozga razvijen od ljudskih matičnih ćelija i otkrili da je organoid efikasan zamenik za pravu stvar. Značajno je da se većina genetskih varijanti otkrivenih u ljudskom moždanom tkivu replicira u cerebralnom organoidu.

„Naš organoid se veoma dobro upoređuje sa ljudskim mozgom“, kaže Ahituv. „Kako proširujemo naš rad da testiramo više sekvenci za druge neurorazvojne bolesti, sada znamo da je organoid dobar model za razumevanje regulatorne aktivnosti gena.“

Drugo, unoseći ogromne količine podataka o sekvenci DNK i regulatornu aktivnost gena u model mašinskog učenja, tim je bio u mogućnosti da obuči računar da uspešno predvidi aktivnost date sekvence. Ova vrsta programa može omogućiti eksperimente „in-silico“ koji omogućavaju istraživačima da predvide rezultate eksperimenata pre nego što ih urade u laboratoriji. Ova strategija omogućava naučnicima da brže otkrivaju dok koriste manje resursa, posebno kada su uključene velike količine bioloških podataka.

Šon Vejlen, doktor nauka, viši naučnik u Polard laboratoriji u Gledstonu i koautor studije, kaže da je tim testirao model mašinskog učenja koristeći sekvence koje se održavaju tokom obuke modela da bi video da li može da predvidi već prikupljeni rezultati o ekspresiji gena.

„Model nikada ranije nije video ove podatke i bio je u stanju da napravi predviđanja sa velikom tačnošću, pokazujući da je naučio opšte principe o tome kako na gene utiču nekodirajući regioni DNK u ćelijama mozga u razvoju“, kaže Vhalen. „Možete zamisliti kako bi ovo moglo otvoriti mnogo novih mogućnosti u istraživanju, čak i predviđajući kako bi kombinacije varijanti mogle funkcionisati zajedno.“

Studija je završena kao deo konzorcijuma PsichENCODE, koji okuplja multidisciplinarne timove kako bi generisali ekspresiju gena velikih razmera i regulatorne podatke iz ljudskog mozga kroz nekoliko glavnih psihijatrijskih poremećaja i faza razvoja mozga.

Kroz objavljivanje više studija konzorcijuma, on nastoji da baci svetlo na slabo shvaćena psihijatrijska stanja, od autizma do bipolarnog poremećaja, i na kraju da pokrene nove pristupe lečenju.

„Naša studija doprinosi ovom rastućem obimu znanja, pokazujući korisnost upotrebe ljudskih ćelija, organoida, funkcionalnih metoda skrininga i dubokog učenja za istraživanje regulatornih elemenata i varijanti uključenih u razvoj ljudskog mozga“, kaže Chengiu Deng, dr. postdoktorski istraživač na UCSF-u i koautor studije.