Nova studija pokazuje da je moguće koristiti mašinsko učenje i statistiku za rešavanje problema koji je dugo ometao polje metabolomike: velike varijacije u podacima prikupljenim na različitim lokacijama.
„Ne znamo uvek izvor varijacije“, rekao je Danijel Rafteri, profesor anesteziologije i medicine bola na Medicinskom fakultetu Univerziteta Vašington u Sijetlu. „To može biti zato što su subjekti različiti sa različitom genetikom, ishranom i izloženošću životnoj sredini. Ili bi to mogao biti način na koji su uzorci prikupljeni i obrađeni.“
Rafteri i njegove kolege u istraživanju želeli su da vide da li mašinsko učenje — oblik veštačke inteligencije koji koristi kompjuterske algoritme za obradu velikih količina istorijskih podataka i identifikaciju obrazaca podataka — može da smanji ovu varijaciju između podataka sa različitih lokacija bez prikrivanja važnih razlika.
„Želeli smo da spojimo ove neusklađene skupove podataka kako bi se nalazi različitih studija mogli uporediti ili kombinovati za dalju analizu“, rekao je Rafteri.
On je vodio projekat sa Dabao Zhangom i Min Zhang, ranije na Univerzitetu Purdue, a sada profesorima epidemiologije i biostatistike na Univerzitetu Kalifornije, Irvine Public Health. Danni Liu, Ph.D. student na Purdue, bio je vodeći autor rada, koji se pojavljuje u Proceedings of the National Academi of Sciences.
Rafteri je istraživač u Centru za mitohondrije i metabolizam UV, sa sedištem u UV Medicine South Lake Union u Sijetlu.
Termin metabolomika se odnosi na metabolizam, reč koja opisuje hemijske reakcije koje naše ćelije izvode da bi održale život. To uključuje reakcije koje razgrađuju hranu da bi prikupile energiju i dobile sirovine koje su ćelije potrebne za rast i popravku, reakcije koje uključuju sastavljanje ćelijskih komponenti potrebnih za život, i reakcije uključene u rastavljanje oštećenih ili nepotrebnih komponenti kako bi se mogle reciklirati. , odbačen ili korišćen kao gorivo.
Male hemikalije proizvedene ovim metaboličkim procesima nazivaju se metaboliti. Nivoi metabolita otkrivaju koje se hemijske reakcije dešavaju unutar ćelije, tkiva, organa ili organizma u datom trenutku i kako se te reakcije mogu promeniti tokom vremena.
Metabolomika je proučavanje metabolita i procesa koji ih proizvode.
Ove informacije pomažu medicinskim naučnicima da bolje razumeju ne samo kako ćelije održavaju normalnu funkciju, već i šta može da krene naopako kada se ljudi razbole. Ovo znanje bi moglo dovesti do novih načina za dijagnosticiranje, prevenciju i liječenje bolesti, rekao je Rafteri.
U novoj studiji, istraživači su izgradili modele mašinskog učenja kako bi identifikovali faktore koji su pokretali razlike između skupova podataka. Modeli su uzeli u obzir demografske razlike u ispitivanim populacijama, kao što su starost i pol, i koristili su informacije sadržane u drugim metabolitima da objasne uočene razlike.
Istraživači su otkrili da je njihov pristup smanjio varijacije između skupova podataka za više od 95% bez prikrivanja značajnih razlika, poput onih koje se prirodno javljaju između muškaraca i žena.
„Pokazali smo da naš pristup ima potencijal da smanji neželjenu varijansu koja se vidi u metabolomskim podacima dok zadržava metabolomske signale od interesa“, rekao je Rafteri.
Grupa planira da proširi svoje studije sa ciljem da pruži dublje razumevanje normalnog metabolizma i identifikuje biomarkere abnormalnog metabolizma koji mogu biti znak bolesti.