Zašto neki ljudi imaju teži tok bolesti COVID-19 od drugih? Baza podataka o sekvenci genoma kreirana od strane međunarodne saradnje istraživača, uključujući mnoge sa Univerziteta u Torontu i partnerskih bolnica, može sadržati odgovore na ovo pitanje – i mnoga druga.
Poreklo kanadske banke podataka sekvenciranja genoma ljudskog domaćina COVID-19, poznate kao CGEn HostSek, može se pratiti do najranijih dana pandemije.
Lisa Strug, viši naučnik u Bolnici za bolesnu decu (SickKids) i akademski direktor Instituta za nauke o podacima U of T, jedne od nekoliko institucionalnih strateških inicijativa U of T, kaže da su genetski podaci bili najvažniji za nju i druge istraživače krajem 2019. i početkom 2020. godine kada su se iz Kine, a zatim i sa drugih lokacija širom sveta, pojavili izveštaji o novom obliku koronavirusa.
„U svom istraživanju koristim tehnike nauke o podacima za mapiranje gena odgovornih za složene osobine“, kaže Strug, koji je profesor na odsjecima za statističke nauke i računarstvo Univerziteta u T na Fakultetu umjetnosti i nauke i na odjelu za biostatistiku. škole javnog zdravlja Dalla Lana.
„Znali smo da su geni faktor u ozbiljnosti prethodnih SARS infekcija, tako da je bilo logično da COVID-19, koji je uzrokovan blisko povezanim virusom, takođe ima genetsku komponentu.
„Veoma rano sam počeo da dobijam poruke od nekoliko naučnika koji su želeli da postave različite studije koje bi nam pomogle da pronađemo te gene.
Tokom narednih nekoliko meseci, Strug — koji je i pomoćnik direktora SickKidsovog centra za primenjenu genomiku, jedne od tri lokacije širom Kanade koje čine CGEn, kanadsku nacionalnu platformu za infrastrukturu sekvenciranja genoma za istraživanje — sarađivao je sa skoro 100 istraživača iz celog U. T i partnerskih bolnica i institucija, kao i drugih istraživača iz cele Kanade da upišu pojedince sa COVID-19 i sekvenciraju njihove genome.
Neki od ključnih članova tima iz zajednice u Torontu bili su: Stephen Scherer, šef istraživanja na SickKids Research Institute i univerzitetski profesor na Medicinskom fakultetu Univerziteta u T’s Temerti, kao i direktor U of T McLaughlin centra; Raijean Hung, pomoćnik direktora za zdravlje stanovništva na Istraživačkom institutu Lunenfeld-Tanenbaum, Sinai Health, i profesor na U of T’s Dalla Lana School of Public Health; Angela Cheung, kliničar-naučnik na Univerzitetskoj zdravstvenoj mreži, viši naučnik na Institutu za istraživanje opšte bolnice u Torontu i profesor na Medicinskom fakultetu U of T’s Temerti; i Upton Allen, šef odeljenja za infektivne bolesti u SickKids-u i profesor na Medicinskom fakultetu U of T’s Temerti.
Identifikovanje povezanosti između pojedinačnih gena i složenih osobina obično zahteva hiljade genoma – i od onih sa osobinom i onih bez njih. Iako nije nedostajalo slučajeva za izbor, bilo je ključno prikupiti i sekvencionirati DNK — a zatim organizovati podatke na način koji bi bio etički, efikasan i koristan za istraživače sada i u budućnosti.
„Jedan od naših ključnih mandata u Institutu za nauku o podacima je razvoj tehnika i programa koji obezbeđuju da podaci ostanu otvoreni, dostupni i što je moguće reproducibilniji“, kaže Strug.
„Ta vizija je ostvarena dok smo sastavljali infrastrukturu podataka za ovaj projekat – na primer, osiguravajući da obrasci saglasnosti budu što je moguće širi kako bi ovi podaci mogli biti povezani sa drugim izvorima, od elektronskih medicinskih kartona do drugih zdravstvenih baza podataka.
„Želeli smo da budemo sigurni da čak i nakon što se pandemija COVID-19 završi, ovo bi mogao da bude nacionalni resurs za sekvencioniranje celog genoma za postavljanje svih vrsta pitanja o zdravlju i našim genima. Razvoj baze podataka i njena otvorena priroda takođe su omogućili Kanadi da efikasno sarađuju sa sličnim projektima u drugim zemljama“.
Na kraju, projekat je okupio više od 11.000 kompletnih sekvenci genoma iz cele Kanade, predstavljajući pacijente sa širokim spektrom zdravstvenih ishoda. Rezultati su objavljeni u BMC Genomic Data. Ti podaci su zatim kombinovani sa još više sekvenci pacijenata iz drugih zemalja u okviru onoga što je nazvano Inicijativa za genetiku domaćina COVID-19.
Nije trebalo dugo da se obrasci počnu pojavljivati. Rad objavljen u časopisu Nature 2021. identifikovao je 13 značajnih lokusa za čitav genom koji su povezani sa infekcijom SARS-CoV-2 ili teškim manifestacijama COVID-19.
Od tada je dodato još više podataka, a naknadna analiza je potvrdila značaj postojećih lokusa i identifikovala nove. Najnovije ažuriranje projekta, objavljeno u časopisu Nature ranije ove godine, dovodi ukupan broj različitih značajnih lokusa za čitav genom na 51.
„Identifikacija ovih lokusa može pomoći da se predvidi ko bi mogao biti skloniji teškom toku bolesti COVID-19“, kaže Strug.
„Kada identifikujete lokus povezan sa osobinama, takođe možete otkriti mehanizam kojim ovaj genetski region doprinosi bolesti COVID-19. Ovo potencijalno identifikuje terapijske ciljeve i pristupe oko kojih bi se budući lek mogao osmisliti.“
Iako će biti potrebno još mnogo godina da se u potpunosti razotkriju efekti različitih lokusa koji su identifikovani, Strug kaže da baza podataka već pokazuje svoju vrednost na druge načine.
„Može biti teško pronaći skupove podataka sa čitavom sekvencom genoma i odobrene za povezivanje sa drugim zdravstvenim informacijama koje su ovako velike, i želimo da ljudi znaju da su otvoreni i dostupni za sve vrste istraživanja daleko izvan COVID-a kroz potpuno nezavisne podatke. pristupni odbor“, kaže ona.
„Na primer, nekolicini istraživača iz cele Kanade je odobreno da koriste ove podatke, a mi smo čak obezbedili sredstva za polaznike kako bismo ih ohrabrili da razviju nove metodologije nauke o podacima ili postavljaju nova zdravstvena pitanja koristeći podatke CGen HostSek.
„Ovo je bio ogroman napor, gde su se istraživači iz cele Kanade okupili tokom pandemije COVID-19 da regrutuju, dobiju i sekvenciraju DNK od više od 11.000 Kanađana na sistematičan, kooperativan, usklađen način da se stvori napravljena u Kanadi resurs podataka koji će, nadamo se, biti koristan u godinama koje dolaze. Mislim da je to bilo zaista čudesno.“