Razumevanje kako genetika utiče na zdravlje je suštinski prvi korak ka lečenju i prevenciji niza bolesti. Nova saznanja često potiču iz studija asocijacija na nivou genoma koje identifikuju varijacije u genetskom kodu povezane sa stanjima kao što su rak i autoimuna bolest. Što se više DNK i zdravstvene istorije ljudi ispita u takvim istraživanjima, to će se verovatnije steći genetski i biološki uvidi.
Međutim, cena može biti velika prepreka: sveobuhvatno sekvencioniranje genoma jedne osobe košta oko 500 do 1000 dolara, što je cena koja je često neizvodljiva kada se primeni na nekoliko desetina hiljada učesnika studije. Umesto toga, istraživači se generalno fokusiraju na ključne tačke gde genetski kod ima tendenciju da varira među različitim pojedincima, kroz genotipizaciju, koja košta oko 100 dolara po učesniku. Statistička metoda koja se zove imputacija genotipa onda im pomaže da popune genetske praznine na osnovu postojećih referentnih panela potpuno sekvenciranih genoma.
Nova studija Keck School of Medicine USC koja se pojavljuje u American Journal of Human Genetics identifikuje nejednakost u tome koliko dobro imputacija funkcioniše za različite populacije.
Istraživači su otkrili da se tehnika dobro drži za dobro zastupljene grupe sa evropskim poreklom, kao i za Afroamerikance i Latinoamerikance, koji su bili predmet nedavnih, usklađenih napora da se poveća zastupljenost u sekvencioniranju referentnih panela. Međutim, istraživači su otkrili da je imputacija daleko manje pouzdana za druge grupe, generalno lošije za stanovništvo udaljenije od Evrope, osim u Africi i Latinskoj Americi.
„Ove globalne populacije se takođe ne imputiraju, što znači da imamo mnogo više grešaka u popunjavanju nedostajućih delova genoma“, rekao je dopisni autor dr Čarlston Čang, vanredni profesor nauka o populaciji i javnom zdravlju i saradnik. direktora Centra za genetsku epidemiologiju Medicinskog fakulteta Keck. „To znači da analiza koja koristi ove imputirane podatke ne funkcioniše tako dobro. I pošto istraživači filtriraju na osnovu pouzdanosti imputacije, na kraju imamo podatke za različite populacije sa više grešaka i više rupa, što dovodi do manje efikasnih dizajna studija.“
Čang napominje da jedinstvenost ove studije leži u širini studije, gde je tim procenio preko stotinu globalnih populacija za probleme sa imputacijom. Ovo ranije nije pokazano zbog opšteg nedostatka raznolikosti dostupnih kohorti, kao i u referentnim panelima potpuno sekvenciranih genoma. Ovo je predstavljalo prepreku za razumevanje koliko dobro različite grupe prolaze sa imputacijom u studijama genetske epidemiologije.
Stoga je istraživački tim zauzeo jedinstven pristup, pozajmivši genetske skupove podataka iz populacione genetike, srodne oblasti fokusirane na razumevanje istorije i evolucije širokog spektra populacija, sa manje fokusa na bolesti.
Sve u svemu, naučnici su kombinovali podatke o genomskom sekvenciranju iz 23 studije uključujući više od 43.000 ljudi iz 123 različite globalne populacije. Oni su uparili svaku populaciju sa kontrolnom grupom evropskog porekla i koristili standardnu metriku koja ne zahteva pune genomske sekvence — što je uobičajeno slučaj u studijama asocijacija na nivou genoma — da bi uporedili pouzdanost imputacije.
Imputacija za populacije sa sedištem u mestima kao što su Papua Nova Gvineja, Tajland, Vijetnam i Saudijska Arabija bila je znatno manje tačna nego za populacije evropskog porekla. Čang i njegove kolege su takođe nacrtali relativnu pouzdanost imputacije za različite grupe na mapi sveta koja je dostupna na internetu. Imputacija za populacije sa sedištem u Aziji, Australiji, Novom Zelandu i Pacifičkim ostrvima generalno je pokazala manje tačnosti.
Tim je takođe uporedio glavnu metriku za pouzdanost imputacije koja se koristi da bi se došlo do ovih nalaza sa boljom metrikom koja funkcioniše samo kada su dostupni puni podaci o sekvenciranju. Otkrili su da je glavna metrika pristrasna tako da precenjuje tačnost imputacije za populacije koje nisu ljudi evropskog porekla. Ovo sugeriše da su nedostaci u imputaciji još ozbiljniji nego što pokazuju rezultati istraživača.
Rešenje za disparitet istaknut u studiji je jednostavno, ali daleko od jednostavnog za postizanje.
„Moramo više da sekvenciramo i da budemo inkluzivniji u pojedincima koji učestvuju u studijama“, rekao je Čang, koji takođe ima sastanak iz kvantitativne i računarske biologije na USC Dornsife koledžu i član je Sveobuhvatnog centra za rak USC Norris.
Jedan obećavajući znak je da je genomsko sekvenciranje postalo pristupačnije poslednjih godina i da se očekuje da će to i dalje činiti. Ali trošak nije jedini problem koji se mora rešiti. Neophodni su napori da se zadobije poverenje različitih zajednica, tako da one ne oklevaju da učestvuju.
U nekim slučajevima, veća raznolikost može zakomplikovati studije asocijacija na nivou genoma, posebno u manjim studijama, čak i zbuniti njihove nalaze ako raznolikost nije pravilno objašnjena ili okarakterisana. Ovo stvara pritisak na naučnike da isključe manji podskup populacija u svojim podacima i biraju između grupa sa više članova.
Čang se zalaže za neku vrstu ravnoteže.
„Kako studije postaju sve veće i veće, način na koji naučnici posmatraju i analiziraju ove podatke treba da evoluira ka posmatranju genetskog porekla kao kontinuuma“, rekao je on. „Ako možemo da počnemo da posmatramo sve kao povezane i grananje istog genetskog stabla na različitim mestima, prema njihovoj istoriji, možemo da uključimo više ljudi i više raznolikosti.
„Naravno, postoje vredni razlozi za proučavanje diskretnih populacija“, nastavio je on. „Grupni identitet može biti koristan za održavanje, na primer, kada se proučavaju društvene determinante zdravlja koje utiču na ono što ljudi doživljavaju u svakodnevnom životu. Moramo da nastavimo da proučavamo određene populacije u izolaciji, ali dugoročno, moramo biti u mogućnosti da pomirenje između dva pristupa“.
Prvi autor studije, student USC Džordan Kahun, nada se da će rad tima uticati na buduća rešenja, počevši da kvantifikuje disparitete unesene u studije asocijacija na nivou genoma.
„Važno je razumeti slabosti u ovoj oblasti u smislu pravičnosti i pravičnosti“, rekao je Cahoon, diplomirani apsolvent računarstva na USC Viterbi School of Engineering. „Nadam se da će ova studija biti dobar resurs za naučnike, tako da mogu da vide koliko dobro rade populacije koje sekvenciraju u poređenju sa drugima.“