Decenijama je Y hromozom — jedan od dva ljudska seksualna hromozoma — bio ozloglašen izazov za genomsku zajednicu da sekvencira zbog složenosti njegove strukture.
Sada je ova neuhvatljiva oblast genoma u potpunosti sekvencionirana, podvig koji konačno upotpunjuje skup ljudskih hromozoma od kraja do kraja i dodaje 30 miliona novih baza referenci ljudskog genoma, uglavnom iz satelitske DNK izazovne sekvence. Ove baze otkrivaju 41 dodatni gen koji kodiraju proteine i pružaju ključni uvid za one koji proučavaju važna pitanja vezana za reprodukciju, evoluciju i promenu populacije.
Istraživači iz konzorcijuma Telomere-to-Telomere (T2T), koji vodi Univerzitet Kalifornije, docent za biomolekularni inženjering u Santa Kruzu Karen Miga, objavili su ovo dostignuće u radu objavljenom u časopisu Nature. Kompletna, označena referenca Y hromozoma dostupna je za upotrebu u UCSC Genome pretraživaču i može joj se pristupiti preko Github-a.
„Pre samo nekoliko godina, polovina ljudskog Y hromozoma je nedostajala [iz reference] – izazovna, složena satelitska područja“, rekla je Monika Čehova, vodeći autor rada i postdoktorski naučnik iz biomolekularnog inženjerstva na UCSC. „Tada nismo ni znali da li se to može sekvencirati, bilo je tako zbunjujuće. Ovo je zaista ogroman pomak u onome što je moguće.“
Kada naučnici i kliničari proučavaju genom pojedinca, oni upoređuju DNK pojedinca sa onom standardne reference kako bi utvrdili gde postoje varijacije. Do sada je deo I hromozoma ljudskog genoma sadržavao velike praznine koje su otežavale razumevanje varijacija i povezanih bolesti.
Struktura Y hromozoma je bila izazovna za dekodiranje jer je deo DNK organizovan u palindrome – dugačke sekvence koje su iste napred i nazad – koje obuhvataju više od milion parova baza. Štaviše, veoma veliki deo Y hromozoma koji je nedostajao u prethodnoj verziji Y reference je satelitska DNK — veliki, veoma repetitivni regioni DNK koji ne kodira proteine. Na Y hromozomu, dva satelita su međusobno povezana, što dodatno komplikuje proces sekvenciranja.
Istraživači su uspeli da postignu očitavanje Y hromozoma bez praznina zahvaljujući napretku u tehnologiji sekvenciranja dugog čitanja i novim, inovativnim metodama računarskog sastavljanja koje bi mogle da se bave ponavljajućim sekvencama i transformišu sirove podatke iz sekvenciranja u upotrebljiv resurs.
Ovi novi skupovi metoda omogućili su timu da se pozabavi nekim od posebno izazovnih aspekata Y hromozoma, kao što je precizno određivanje gde se inverzija dešava u palindromskom nizu – tehnika koja se može koristiti za pronalaženje drugih inverzija. Metode utvrđene u radu će omogućiti naučnicima da završe više čitanja ljudskih Y hromozoma od kraja do kraja kako bi bolje razumeli kako ovaj genetski materijal utiče na raznoliku ljudsku populaciju.
„Upravo je Y hromozomu nedostajalo najviše sekvenci iz prethodnog referentnog genoma“, rekao je Arang Rhie, naučnik u Nacionalnom institutu za istraživanje ljudskog genoma i glavni autor rada. „Uvek je bilo iritantno znati da nam nedostaje polovina Y kad god smo pokušali da uradimo bilo kakvu analizu zasnovanu na referenci. Bio sam zaista uzbuđen što sam kurirao prvi kompletan I, da vidim šta nam zapravo nedostaje i šta sada možemo da uradimo.“
Godine 2018, Miga i njene kolege objavile su prvu kompletnu mapu ljudske centromere na Y hromozomu. Ovo prvo zatvaranje jaza je zaslužno za pristup ultra dugim podacima, koji se zasniva na tehnologiji sekvenciranja nanopora koja ima svoje poreklo ovde u UCSC. U tom trenutku je bilo jasno da nova tehnologija i skupovi podataka koji se dugo čitaju sa velikom pokrivenošću imaju potencijal da kompletiraju čitave hromozome od kraja do kraja, što je dovelo do pokretanja T2T konzorcijuma, koji su zajedno predvodili Filipi i Miga.
Sada, samo pet godina kasnije, T2T konzorcijum je popunio 30 miliona dodatnih parova baza, pored prvog potpuno sekvencioniranog ljudskog genoma (svi autozomi i X hromozom) koji je objavljen 2022.
I hromozom se najčešće povezuje sa pojedincima kojima je pri rođenju dodeljen muški, ali se može naći i kod drugih, kao što su interseksualne osobe. Polne karakteristike regulisane DNK na Y hromozomu takođe nisu ekvivalentne rodnom identitetu pojedinca. Iako postoji relativno malo gena na Y hromozomu, oni koji su prisutni su složeni i dinamični i kodiraju važne funkcije kao što je spermatogeneza, proizvodnja sperme.
Kompletna referenca Y hromozoma omogućiće naučnicima da bolje prouče bezbroj karakteristika ovog dela ljudskog genoma na način koji nikada ranije nije bio moguć.
Kompleksna struktura Y hromozoma omogućila je brzu evoluciju unutar njegovih genskih porodica. U stvari, Y hromozom je ljudski hromozom koji se najbrže menja, pa čak i hromozom koji se najbrže menja među velikim majmunima. To znači da Y hromozomi dve zdrave osobe mogu izgledati veoma različito – na primer, jedna osoba može imati 40 kopija jednog gena, dok druga osoba ima 19 kopija.
Ova evolucija se sada može bolje proučavati korišćenjem nove reference i utvrđenih metoda za sekvenciranje I hromozoma. Ovo bi mogao biti budući fokus klinika za vantelesnu oplodnju ili drugih istraživanja o reprodukciji i neplodnosti.
Sekvenca Y hromozoma od kraja do kraja je izuzetno važan resurs za one koji proučavaju evoluciju i kretanje ljudske populacije. To je zato što se Y hromozom nasleđuje iz generacije u generaciju u jednoj grupi genetskog materijala, sa vrlo malo rekombinacije van te grupe, za razliku od autozoma i gena na ljudskom Ks hromozomu koji često rekombinuju i dele genetski materijal jedni sa drugima. Imajući jasniju sliku Y hromozoma, lakše je pratiti gene kroz generacije nasleđa i naučiti kako su se lokacija i sadržaj gena menjali tokom vremena.
30 miliona novih baza dodatih referenci Y hromozoma takođe će biti presudno za proučavanje evolucije genoma. Sada će biti moguće proučavati specifične i jedinstvene obrasce sekvence Y hromozoma, kao što su struktura dva satelita i lokacija i broj kopija gena.
Čak i unutar Y hromozoma, geni su podeljeni na nekoliko regiona, koji se međusobno veoma razlikuju po sadržaju, strukturi i evolucionoj istoriji. Razumevanje stopa promena na Y hromozomu i kako tumačiti ovu promenu su intrigantna pitanja koja će sada biti moguće proučavati korišćenjem tehnika razvijenih u ovom radu za potpuno sekvenciranje ljudskih Y hromozoma.
Bogatija referenca koja uključuje punu sekvencu satelitske DNK Y hromozoma takođe će omogućiti naučnicima da bolje razumeju evolucioni odnos ovih sekvenci sa satelitskom DNK koja se nalazi na drugim mestima u genomu.
„Uzbudljivo je biti u mogućnosti da konačno vidimo ove sekvence u heterohromatskim [gusto upakovanim] regionima po prvi put. Konačno, možemo da dizajniramo eksperimente da testiramo uticaj i funkciju ovih ranije neistraženih delova Y hromozoma“, rekao je Miga.
Pokazalo se da ljudi sa Y hromozomima mogu da izgube deo ili ceo genetski materijal kako stare, ali naučnici nikada nisu u potpunosti razumeli zašto se to dešava i kakve posledice može imati. Kompletna referenca Y hromozoma može pomoći da se rasvetli ova misterija. Takođe će biti lakše proučavati stanja i poremećaje koji su povezani sa Y hromozomom, kao što je nedostatak proizvodnje sperme što dovodi do neplodnosti.
Neočekivani nalaz iz ovog rada bio je da je DNK Y hromozoma više puta pogrešno smatrana bakterijskom DNK u prošlim studijama zbog nepotpunog uklanjanja ljudske kontaminacije u bakterijskoj DNK. Ovo otkriće obećava da će poboljšati proučavanje genoma bakterijskih vrsta.
Ljudska DNK se može pojaviti kao zagađivač u genomskim uzorcima bakterijskih vrsta jer se bakterijska DNK često uzima sa ljudske kože. Naučnici koriste trenutnu referencu ljudskog genoma da identifikuju koje sekvence potiču od kontaminacije ljudi i uklone ih, ostavljajući samo bakterijsku DNK za njihovo proučavanje. Ali, pošto su veliki delovi ljudskog Y hromozoma nedostajali u prošloj ljudskoj referenci, naučnici nisu mogli da ih identifikuju kao ljude i na taj način su ih pogrešno shvatili da su deo DNK vrste koju su proučavali.
Ovaj rad pronalazi dokaze da oko 5.000 bakterijskih genoma u zajedničkoj bazi podataka verovatno sadrži kontaminaciju koja odgovara ljudskim Y sekvencama. Grupe koje proučavaju ove bakterijske vrste mogu da koriste ažuriranu Y referencu da ispravno uklone svu ljudsku kontaminaciju iz svojih referentnih genoma i da jasnije razumeju bakterijski genom.
„To je bila iznenađujuća stvar“, rekao je Rhie. „Ljudi su to nagađali, ali niko do sada nije mogao da dokaže da se to dešava.
Dok će kompletan ljudski Y hromozom otvoriti vrata mnogim novim otkrićima, istraživači planiraju da dodatno poboljšaju proučavanje ovog regiona uključivanjem Y hromozoma u buduće verzije ljudskog pangenoma.
Pangenom je nova referenca za genomiku koja kombinuje genomske informacije više ljudi iz različitih pozadina predaka kako bi na kraju omogućila pravednija istraživanja i klinička otkrića kao što je pomoć u dijagnostici bolesti, predviđanju medicinskih ishoda i vođenju tretmana.
U saradnji sa Referentnim konzorcijumom za humani pangenom, istraživači planiraju da ugrade kompletne sekvence Y hromozoma u pojedinačne genome koji čine pangenom. Ovo će pomoći naučnicima da shvate kako Y hromozom varira među ljudima različitog porekla i obezbediće bolju referentnu tačku za razumevanje Y u različitosti ljudske populacije.
Istraživači se nadaju da će moći da sarađuju sa naučnicima širom sveta kako bi omogućili drugima da završe sekvenciranje Y hromozoma.
„Cilj nam je da ove podatke učinimo široko dostupnim“, rekao je Miga. „Kreiranjem i deljenjem ovih važnih kataloga genetskih razlika na Y hromozomu, možemo proširiti genetske studije ljudskih bolesti i pružiti nove uvide u osnovnu biologiju.