Istraživači sa UCLA razvili su „sve-u-jednom“ statistički simulator sledeće generacije koji je sposoban da asimiluje širok spektar informacija kako bi generisao realistične sintetičke podatke i obezbedio alatku za benchmarking za medicinske i biološke istraživače koji koriste napredne tehnologije za proučavanje bolesti i potencijala. terapije. Konkretno, novi sistem kompjuterskog modeliranja — ili „in silico“ — može pomoći istraživačima da procene i validiraju računarske metode.
Jednoćelijsko RNK sekvenciranje, nazvano jednoćelijska transkriptomika, je osnova za analizu genetskog sastava (nivoa ekspresije gena na nivou genoma) ćelija. Uvođenje dodatne „omike“ ponudilo je detalje o nizu molekularnih karakteristika, a poslednjih godina, prostorne transkriptomske tehnologije su omogućile profilisanje nivoa ekspresije gena sa informacijama o prostornoj lokaciji ćelijskih „susedstava“, pokazujući precizne lokacije i kretanja ćelija unutar tkiva.
„Razvijene su hiljade računarskih metoda za analizu podataka o jednoćelijskoj i prostornoj omici za različite zadatke, čineći benčmarking metodom hitnim izazovom za programere i upotrebu metoda“, rekla je Jingii Jessica Li, dr, istraživač UCLA i profesor statistike, biostatistike, računarske medicine i ljudske genetike. Li je takođe povezan sa istraživačkim područjem za regulaciju gena u UCLA Jonsson Comprehensive Cancer Center. Li vodi istraživačku grupu pod nazivom Spoj statistike i biologije.
„Iako su simulatori evoluirali i postali moćniji, postoje brojna ograničenja. Malo njih može da generiše realistične podatke sekvenciranja jednoćelijske RNK iz neprekidnih ćelijskih putanja oponašajući stvarne podatke, a većini nedostaje mogućnost simulacije podataka multi-omike i prostorne transkriptomike. Uveli smo scDesign3, za koji verujemo da je najrealističniji i najsvestraniji simulator do sada, da popunimo jaz između potreba istraživača za benchmarking i ograničenja postojećih alata“, rekao je Li, stariji autor studije objavljene 11. maja u Nature Biotechnologi.
Istraživači sa UCLA kažu da veruju da scDesign3 „nudi prvi verovatnoćasti model koji objedinjuje generisanje i zaključivanje za jednoćelijske i prostorne omike podataka. Opremljen interpretabilnim parametrima i verovatnoćom modela, scDesign3 je izvan svestranog simulatora i ima jedinstvene prednosti za generisanje prilagođenih podataka. in silico podaci, koji mogu poslužiti kao negativna i pozitivna kontrola za kompjutersku analizu i za procenu usklađenosti pretpostavljenih klastera ćelija, trajektorija i prostornih lokacija na način bez nadzora.“ Prilagodljivost je mera koliko se statistički model uklapa u skup posmatranja.
Prema autorima, „transparentno modeliranje i interpretabilni parametri sistema mogu pomoći korisnicima da istražuju, menjaju i simuliraju podatke. Sve u svemu, scDesign3 je multifunkcionalni paket za benchmarking računarskih metoda i tumačenje podataka o jednoćelijskoj i prostornoj omici.“