Novi algoritam testiran na NASA-inom Perseverance Roveru na Marsu može dovesti do boljeg predviđanja uragana, šumskih požara i drugih ekstremnih vremenskih događaja koji utiču na milione ljudi širom sveta.
Georgia Tech Ph.D. student Ostin P. Rajt je prvi autor rada koji predstavlja Nested Fusion. Novi algoritam poboljšava sposobnost naučnika da tragaju za prošlim znacima života na površini Marsa.
Ova inovacija podržava NASA-inu misiju Mars 2020. Pored toga, naučnici iz drugih oblasti koji rade sa velikim skupovima podataka koji se preklapaju mogu koristiti metode Nested Fusion za svoja istraživanja.
Rajt je predstavio Nested Fusion na Međunarodnoj konferenciji o otkrivanju znanja i rudarenju podataka 2024. (KDD 2024) gde je bio drugoplasirani za nagradu za najbolji rad. Rad je objavljen u časopisu Proceedings of the 30th ACM SIGKDD Conference on Knovledge Discoveri and Data Mining.
„Nested Fusion je zaista koristan za istraživače u mnogim različitim domenima, ne samo za NASA naučnike“, rekao je Rajt. „Metoda vizuelizuje složene skupove podataka o kojima može biti teško dobiti ukupan uvid tokom početnih istraživačkih faza analize.“
Nested Fusion kombinuje skupove podataka sa različitim rezolucijama da bi proizveo jednu vizuelnu distribuciju visoke rezolucije. Koristeći ovu metodu, NASA naučnici mogu lakše analizirati više skupova podataka iz različitih izvora u isto vreme. Ovo može dovesti do bržih proučavanja Marsovog površinskog sastava kako bi se pronašli tragovi prethodnog života.
Algoritam pokazuje kako nauka o podacima utiče na tradicionalna naučna polja kao što su hemija, biologija i geologija.
Čak dalje, Rajt razvija aplikacije Nested Fusion za modeliranje promenljivih klimatskih obrazaca, biljnog i životinjskog sveta i drugih koncepata u naukama o Zemlji. Isti metod može kombinovati skupove podataka koji se preklapaju sa satelitskih snimaka, biomarkera i klimatskih podataka.
„Korisnici su proširili Nested Fusion i slične algoritme ka kontekstu nauke o Zemlji, što smo dobili veoma pozitivne povratne informacije“, rekao je Rajt, koji proučava mašinsko učenje (ML) na Georgia Tech.
„Unakrsna korelaciona analiza zahteva mnogo vremena i ne radi se u početnim fazama istraživanja kada se pojavljuju obrasci i formiraju nove hipoteze. Nested Fusion omogućava ljudima da otkriju ove obrasce mnogo ranije.“
Rajt je vođa nauke o podacima i ML za PIKSLISE, softver koji NASA JPL naučnici koriste za proučavanje podataka sa Mars Perseverance Rovera.
Perseverance koristi svoj planetarni instrument za rendgensku litohemiju (PIKSL) za prikupljanje podataka o mineralnom sastavu Marsove površine. PIKSL-ova dva glavna alata koja ovo postižu su rendgenski fluorescentni (KSRF) spektrometar i višekontekstna kamera (MCC).
Kada PIKSL skenira ciljnu oblast, kreira dva ko-usklađena skupa podataka od komponenti. KSRF prikuplja fini elementarni sastav uzorka. MCC proizvodi slike uzorka kako bi prikupio vizuelne i fizičke detalje poput veličine i oblika.
Jedan KSRF spektar odgovara približno 100 MCC piksela slike za svaku tačku skeniranja. Jedinstvena rezolucija svakog alata čini mapiranje između slojeva podataka koji se preklapaju izazovnim. Međutim, Rajt i njegovi saradnici su dizajnirali Nested Fusion da prevaziđu ovu prepreku.
Pored napredovanja nauke o podacima, Nested Fusion poboljšava radni tok NASA naučnika. Koristeći ovu metodu, jedan naučnik može da napravi početnu procenu mineralnog sastava uzorka za nekoliko sati. Pre Nested Fusion-a, isti zadatak je zahtevao dane saradnje između timova stručnjaka na svakom različitom instrumentu.
„Mislim da je jedna od najvećih lekcija koje sam izvukao iz ovog rada ta da je dragoceno uvek zasnivati svoje probleme sa učenjem jezika i naukom o podacima u stvarnim, konkretnim slučajevima korišćenja naših saradnika“, rekao je Rajt.
„Od saradnika učim koji su delovi analize podataka važni za njih i izazove sa kojima se suočavaju. Razumevanjem ovih pitanja možemo otkriti nove načine formalizovanja i uokvirivanja problema u nauci o podacima.“
Nested Fusion je osvojio drugo mesto za najbolji rad u oblasti nauke o primenjenim podacima. Stotine drugih radova predstavljeno je na istraživačkoj stazi konferencije, radionicama i tutorijalima.
Rajtovi mentori, Skot Davidof i Polo Čau, bili su koautori Nested Fusion rada. Davidoff je glavni istraživač u NASA Laboratoriji za mlazni pogon. Čau je profesor na Tehničkoj školi za računarske nauke i inženjerstvo Džordžije (CSE).
„Izuzetno sam bio srećan što je ovaj rad nagrađen nagradom za drugo mesto za najbolji rad“, rekao je Rajt. „Ova vrsta primenjenog rada ponekad može biti teško pronaći pravi akademski dom, tako da je pronalaženje zajednica koje cene ovaj rad veoma ohrabrujuće.“