Resurs otvorenog pristupa pojednostavljuje klasifikaciju podtipova raka za istraživače

Resurs otvorenog pristupa pojednostavljuje klasifikaciju podtipova raka za istraživače

Multiinstitucionalni tim naučnika razvio je besplatan, javno dostupan resurs za pomoć u klasifikaciji uzoraka tumora pacijenata na osnovu različitih molekularnih karakteristika identifikovanih od strane The Cancer Genome Atlas (TCGA) mreže.

Resurs se sastoji od modela klasifikatora koji mogu ubrzati dizajn testnih kompleta specifičnih za podtip raka za upotrebu u kliničkim ispitivanjima i dijagnostici raka. Ovo je važan napredak jer tumori koji pripadaju različitim podtipovima mogu varirati u svom odgovoru na terapije raka.

Resurs je prvi te vrste koji premošćuje jaz između ogromne biblioteke podataka TCGA i kliničke implementacije.

Rad koji opisuje alate objavljene danas na mreži u Cancer Cell.

„TCGA je definisala molekularne podtipove za svaki glavni tip raka. Sa ovim resursom, želeli smo da pružimo kliničkoj i naučnoj zajednici alate za dodeljivanje novodijagnostikovanog tumora jednom od ovih utvrđenih podtipova“, rekao je dr Peter V. Laird. D., Katedra za epigenetiku Peter i Emajean Cook na Institutu Van Andel i glavni autor studije.

„Naš novi resurs će biti moćna prednost za kreiranje kliničkih testova zasnovanih na različitim molekularnim varijacijama između karcinoma.“

TCGA je bio decenijski napor koji je vodio Nacionalni institut za rak da stvori detaljne molekularne mape 33 tipa raka. Za razliku od tradicionalnih pristupa koji definišu rak na osnovu organa ili tkiva u kome nastaju, TCGA je identifikovao nijansirane genomske, epigenomske, proteomske i transkriptomske karakteristike koje preciznije opisuju podtipove raka.

Dr Andrev D. Cherniack sa Instituta Broad of MIT i Harvard i Kile Ellrott, Ph.D, sa Instituta za rak Knight na Univerzitetu za zdravlje i nauku Oregon takođe su korespondentni autori rada, koji predstavlja saradnju napor između naučnika iz više od deset istraživačkih organizacija.

„Pošto su mnogi TCGA molekularni podtipovi generisani korišćenjem stotina ili hiljada karakteristika iz više tipova podataka, naučnici i lekari su nas zamolili za pomoć u podtipovanju njihovih uzoraka“, rekao je Cherniack. „Naš resurs u velikoj meri pojednostavljuje ovaj proces.

Tim je kreirao novi resurs koristeći podatke iz 8.791 TCGA uzorka raka koji su predstavljali 26 kohorti raka i 106 podtipova raka. Zatim su koristili postojeće alate za mašinsko učenje da bi razvili i testirali skoro pola miliona modela u šest kategorija – ekspresija gena, metilacija DNK, miRNA, broj kopija, pozivi za mutaciju i multi-omika – i odabrali one koji su se najbolje pokazali za uključivanje u onlajn resurs .

Ukupno, resurs sadrži 737 modela spremnih za upotrebu, koji predstavljaju najbolje modele iz svake od 26 kohorti raka, pet algoritama za obuku i šest tipova podataka.

„Glavni element ovog napora bio je da se osigura da ove modele mogu da primene druge grupe na nove skupove podataka“, rekao je Elrot. „Suviše često je ovu vrstu rada teško ponoviti ili primeniti na nove uzorke.“