Model mašinskog učenja pronalazi genetske faktore za srčane bolesti

Model mašinskog učenja pronalazi genetske faktore za srčane bolesti

Da bi dobili iznutrašnji pogled na srce, kardiolozi često koriste elektrokardiograme (EKG) da prate njegovu električnu aktivnost i slike magnetne rezonance (MRI) da mapiraju njegovu strukturu. Pošto ove dve vrste podataka otkrivaju različite detalje o srcu, lekari ih obično proučavaju odvojeno da bi dijagnostikovali srčana stanja.

Sada, u radu objavljenom u Nature Communications, naučnici u Centru Eric i Vendi Schmidt na Institutu Broad MIT-a i Harvarda razvili su pristup mašinskom učenju koji može istovremeno naučiti obrasce iz EKG-a i MRI-a i na osnovu tih obrazaca predviđati karakteristike pacijentovog srca. Takav alat, uz dalji razvoj, mogao bi jednog dana pomoći lekarima da bolje otkriju i dijagnostikuju srčana stanja na osnovu rutinskih testova kao što su EKG.

Istraživači su takođe pokazali da mogu analizirati EKG snimke, koje je lako i jeftino nabaviti, i generisati MRI filmove istog srca, koji su mnogo skuplji za snimanje. A njihova metoda bi se čak mogla koristiti za pronalaženje novih genetskih markera srčanih bolesti koje bi postojeći pristupi koji gledaju na pojedinačne modalitete podataka mogli propustiti.

Sve u svemu, tim je rekao da je njihova tehnologija holističkiji način proučavanja srca i njegovih bolesti. „Jasno je da ova dva pogleda, EKG i MRI, treba da budu integrisana jer daju različite perspektive o stanju srca“, rekla je Caroline Uhler, ko-stara autorka studije, članica glavnog instituta Broad, ko- direktor Šmit centra u Broad-u, i profesor na Odseku za elektrotehniku i računarstvo, kao i na Institutu za podatke, sisteme i društvo na MIT-u.

„Kao polje, kardiologija ima sreću da ima mnogo dijagnostičkih modaliteta, od kojih svaki pruža drugačiji pogled na srčanu fiziologiju u zdravlju i bolestima. Izazov sa kojim se suočavamo je taj što nam nedostaju sistematski alati za integraciju ovih modaliteta u jedinstvenu, koherentnu sliku“, rekao je Entoni Filipakis, viši koautor studije i glavni službenik za podatke u Broad-u i ko-direktor Šmit centra. „Ova studija predstavlja prvi korak ka izgradnji takve multimodalne karakterizacije.“

Da bi razvili svoj model, istraživači su koristili algoritam mašinskog učenja nazvan autoenkoder, koji automatski integriše ogromne količine podataka u sažetu reprezentaciju – jednostavniji oblik podataka. Tim je zatim koristio ovu reprezentaciju kao ulaz za druge modele mašinskog učenja koji daju specifična predviđanja.

U svojoj studiji, tim je prvo obučio svoj autoenkoder koristeći EKG i MRI srca od učesnika u UK Biobank. Oni su hranili desetine hiljada EKG-a, svaki uparen sa MRI slikama iste osobe. Algoritam je zatim kreirao zajedničke reprezentacije koje su uhvatile ključne detalje iz oba tipa podataka.

„Kada imate ove reprezentacije, možete ih koristiti za mnoge različite aplikacije“, rekao je Aditianaraianan Radhakrishnan, koautor studije, saradnik Eric i Vendi Schmidt Centra u Broad-u i diplomirani student na MIT-u u Uhlerovoj laboratoriji. . Sem Fridman, viši naučnik za mašinsko učenje u platformi za nauke o podacima na Broad-u, je drugi koautor.

Jedna od tih aplikacija je predviđanje osobina povezanih sa srcem. Istraživači su koristili reprezentacije koje su kreirali njihovi autoenkoderi da bi izgradili model koji bi mogao da predvidi niz osobina, uključujući karakteristike srca kao što je težina leve komore, druge karakteristike pacijenata koje se odnose na funkciju srca kao što je starost, pa čak i srčani poremećaji. Štaviše, njihov model je nadmašio više standardnih pristupa mašinskom učenju, kao i algoritme autokodera koji su obučeni samo na jednom od modaliteta snimanja.

„Ovde smo pokazali da dobijate bolju tačnost predviđanja ako uključite više vrsta podataka“, rekao je Uler.

Radhakrishnan je objasnio da je njihov model napravio preciznija predviđanja jer je koristio reprezentacije koje su bile obučene na mnogo većem skupu podataka. Automatskim koderima nisu potrebni podaci koje su obeležili ljudi, tako da bi tim mogao da nahrani svoj autoenkoder sa oko 39.000 neobeleženih parova EKG i MRI slika, umesto samo sa oko 5.000 obeleženih parova.

Istraživači su demonstrirali još jednu primenu svog autoenkodera: generisanje novih MRI filmova. Unošenjem EKG snimka pojedinca u model—bez uparenog MRI snimanja—model je proizveo predviđeni MRI film za istu osobu.

Uz više posla, naučnici predviđaju da bi takva tehnologija potencijalno mogla da omogući lekarima da saznaju više o zdravlju srca pacijenta samo iz EKG snimaka, koji se rutinski prikupljaju u ordinacijama.

Sa svojim reprezentacijama autoenkodera, tim je shvatio da ih takođe mogu koristiti za traženje genetskih varijanti povezanih sa srčanim oboljenjima. Tradicionalna metoda pronalaženja genetskih varijanti za bolest, nazvana studija asocijacije širom genoma (GVAS), zahteva genetske podatke od pojedinaca koji su označeni bolešću od interesa.

Ali pošto timski okvir autoenkodera ne zahteva označene podatke, bili su u mogućnosti da generišu reprezentacije koje odražavaju ukupno stanje srca pacijenta. Koristeći ove reprezentacije i genetske podatke o istim pacijentima iz UK Biobank, istraživači su kreirali model koji je tražio genetske varijante koje utiču na stanje srca na opštije načine. Model je proizveo listu varijanti uključujući mnoge poznate varijante u vezi sa srčanim oboljenjima i neke nove koje se sada mogu dalje istraživati.

Radhakrishnan je rekao da bi genetsko otkriće moglo biti oblast u kojoj bi okvir autoenkodera, sa više podataka i razvoja, mogao imati najveći uticaj – ne samo za srčane bolesti, već i za bilo koju bolest. Istraživački tim već radi na primeni svog okvira autoenkodera za proučavanje neuroloških bolesti.

Uhler je rekao da je ovaj projekat dobar primer kako se pojavljuju inovacije u analizi biomedicinskih podataka kada istraživači mašinskog učenja sarađuju sa biolozima i lekarima. „Uzbuđujući aspekt zainteresovanja istraživača mašinskog učenja za biomedicinska pitanja je to što bi mogli da smisle potpuno novi način gledanja na problem.“