Tim predvođen istraživačima u UT Southvestern Medical Center razvio je modele dubokog učenja kako bi identifikovao jednostavan skup pravila koja regulišu aktivnost promotera – regiona DNK koji pokreću proces kojim geni proizvode proteine.
Njihovi nalazi, objavljeni u časopisu Nauka, mogli bi dovesti do boljeg razumevanja kako promoteri doprinose regulaciji gena u zdravlju i bolestima.
„Iako su promoteri neophodni za funkciju svakog gena, naše razumevanje kako ovi genetski elementi funkcionišu je nepotpuno uprkos decenijama studija koje su definisale mnoge njihove karakteristike. Naše istraživanje baca novo svetlo na to kako ove sekvence funkcionišu kod ljudi i drugih sisara, “ rekao je dr Jian Zhou, docent na odseku za bioinformatiku Lida Hill na UT Southvestern.
Dr Džou je vodio studiju zajedno sa prvom autorkom Ksenijom Dudnik, diplomiranim studentom u laboratoriji Džou, i Jian Ksu, doktorom nauka, bivšim istraživačem na Institutu za istraživanje dečijeg medicinskog centra na UT Southvestern.
Stvaranje proteina koje ćelije koriste za obavljanje svojih aktivnosti počinje procesom poznatim kao transkripcija. Tada se protein RNK polimeraze zakači za lanac DNK i kopira – ili transkribuje – kodiranu informaciju u molekul RNK. Region gde se RNK polimeraza vezuje za početak transkripcije naziva se promotor.
Kod ljudi, promoteri se obično sastoje od stotina parova baza, jedinica koje čine DNK. Iako su istraživači identifikovali zajedničke sekvence baznih parova koje se dele među nekim regionima DNK koji su promoteri, ove sekvence su često odsutne u ljudskim promoterima, ostavljajući pravila o tome kako sekvenca DNK usmerava proces transkripcije nejasna.
Da bi bolje definisali promotere kod ljudi i kako oni rade, istraživači su razvili program mašinskog učenja koji su nazvali Puffin. Nakon analize podataka desetina hiljada priznatih humanih promotera, program je utvrdio da su oni napravljeni od tri tipa uzoraka sekvenci: motivi, inicijatori i trinukleotidi.
Puffin je pokazao da u zavisnosti od toga kako su ovi elementi raspoređeni, oni mogu aktivirati ili potisnuti transkripciju gena. Puffin takođe može predvideti kako raspored ovih elemenata može usmeriti RNK polimerazu da preferencijalno transkribuje jedan lanac DNK ili transkribuje oba lanca istovremeno u suprotnim smerovima. Ova dvosmerna transkripcija je uobičajena u ljudskim genima.
Program je dalje pokazao da miševi i drugi sisari dele slične skupove pravila za upravljanje radom promotera. Pored toga, Puffin je dozvolio istraživačima da predvide da li će i kako doći do transkripcije ako mutiraju promotere, nalazi koji su se usko poklapali sa onima iz eksperimenata.
Autori studije sugerišu da bi Puffin mogao da im pomogne da shvate kako promoteri rade u zdravim ćelijama, kao i kako promene u promotorima povezane sa bolestima mogu dovesti do promena u transkripciji gena.
Ovaj program je dostupan na besplatnom veb serveru (tss.zhoulab.io) tako da drugi istraživači mogu testirati bilo koju sekvencu promotera od interesa. Dodali su da bi korišćenje sličnog pristupa mašinskom učenju moglo da pruži uvid u druge aspekte genoma koji još uvek nisu dobro shvaćeni.