Duboko učenje je u osnovi skupa geografskih podataka koji se koristi u odgovoru na uragan

Duboko učenje je u osnovi skupa geografskih podataka koji se koristi u odgovoru na uragan

Kako je uragan Fiona 18. septembra 2022. pogodio Portoriko kao oluja 1. kategorije, neke oblasti ostrva bile su poplavljene sa skoro 30 inča kiše, a stotine hiljada domova je nestalo struje. Samo 10 dana kasnije, uragan Ian, oluja kategorije 4 i jedna od najjačih i najštetnijih oluja do sada, sletio je u okrug Li, na Floridi, sravnivši sa zemljom kuće i poplavio gradove pre nego što se pomerio uz obalu i ponovo došao do kopna kao oluja kategorije 1 u Južnoj Karolini.

Ekstremne vremenske prilike i prirodne katastrofe se sve češće dešavaju širom Sjedinjenih Država i njihovih teritorija. Tačne i detaljne mape su kritične u hitnom reagovanju i oporavku.

Čak i pre nego što su uragani stigli na kopno, Federalna agencija za upravljanje vanrednim situacijama radila je sa istraživačem Lekie Iang i njenim timom u Nacionalnoj laboratoriji Oak Ridge Ministarstva energetike na predviđanju potencijalne štete i ubrzavanju odgovora na terenu koristeći US Structures, ogroman skup podataka obrisi zgrada i atributi koji pokrivaju više od 125 miliona struktura.

Tokom proteklih sedam godina, istraživači u ORNL-ovom Odeljenju za geoprostornu nauku i ljudsku bezbednost mapirali su i karakterisali sve strukture unutar Sjedinjenih Država i njihovih teritorija kako bi pomogli FEMA-i u njenom odgovoru na katastrofe. Ovaj skup podataka obezbeđuje dosledno, nacionalno računovodstvo zgrada u kojima ljudi borave i rade.

Agencija je zatražila dva nova atributa za podatke istog dana kada je Fiona stigla na kopno: vrste zauzetosti i adrese, kritične informacije u ubrzavanju federalnih sredstava za hitne slučajeve domaćinstvima i preduzećima.

„Naišli smo na neke jezičke barijere kada smo dodavali nove podatke: ograničene informacije koje su nam bile dostupne bile su na španskom. Pored toga, postoji mnogo različitih načina dokumentovanja adresa Portorika. Morali smo da objedinimo te podatke i potvrdimo informacije o atribuciji je bio jedinstven izazov za nas“, rekao je Jang.

Čak i sa tim izazovom, Jangov tim je uspeo da prevede, potvrdi i spoji nove atribute sa podacima američkih struktura za oko 50 sati. Ovo je rezultat postojanja skalabilnog cevovoda informacija i baze podataka izgrađene godinama truda. FEMA je počela da planira svoj odgovor koristeći osnovne mape američkih struktura područja koja će verovatno biti pogođena. Osoblje FEMA-e dodavalo je slojeve podataka kako su se katastrofe odvijale, omogućavajući agenciji da odredi prioritet odgovora na područja koja su najviše pogođena.

„FEMA ima analitičare GIS-a [geografskih informacionih sistema] koji uzimaju naše podatke i integrišu ih sa satelitskim snimcima nakon katastrofe, snimcima iz vazduha i informacijama koje prve osobe prikupljaju na terenu“, rekao je Karter Kristofer iz ORNL-a, šef odeljenja za Human Dinamics u Odsek za geoprostorne nauke i ljudsku bezbednost.

Postojeći skup podataka, uparen sa informacijama o uticaju u realnom vremenu, može ubrzati oporavak podržavajući procene štete koje su vlasnicima imovine potrebne da bi dobili sredstva za obnovu u danima, a ne nedeljama ili mesecima.

„Naš tim je izuzetno ponosan što je deo ovog projekta“, rekao je Jang. „Vidimo kako naše tehničke mogućnosti i znanje mogu da transformišu skup podataka koji koriste FEMA i lokalni akteri.

Američke strukture su započele 2015. godine, kada su bivši istraživači ORNL-a Mark Tuttle i Melanie Laverdiere radili na projektu FEMA za mapiranje parkova mobilnih kućica u SAD-u. -strukture rizika.

Tim je koristio duboko učenje, podskup mašinskog učenja, za obradu slika i sastavljanje podataka. Mašinsko učenje koristi računare da otkrije obrasce u ogromnim količinama podataka, a zatim pravi predviđanja na osnovu onoga što računar uči iz tih obrazaca. U dubokom učenju, računarski sistem stvara sopstvene algoritme umesto da koristi algoritme koje je razvio i uneo čovek.

Nakon što je sastavljena baza podataka nacionalnih parkova mobilnih kućica, FEMA je zatražila sveobuhvatniju bazu podataka o strukturama.

Proces je započeo nizom slika visoke rezolucije od komercijalnog provajdera satelitskih snimaka i određenom prethodnom obradom. Neobrađene slike je trebalo uskladiti sa stvarnim varijacijama terena – proces koji se naziva ortorektifikacija – i izoštriti da bi se poboljšala rezolucija. Taj proces je preuzeo sliku sa prostorne rezolucije od 2 do 3 metra na 0,3 metra potrebnih za ekstrakciju karakteristika.

Prostorna rezolucija je slična onoj na Google mapama; predmeti veličine nekoliko metara su prepoznatljivi ljudskom oku. Kada su pripremljene, slike su ušle u cevovod za ekstrakciju karakteristika koji hostuje GPU klaster u okviru ORNL-ovog Compute and Data Environment for Science, ili CADES, koji nudi usluge podataka visokih performansi za istraživače u celoj laboratoriji.

Da bi pokrenuli model dubokog učenja, naučnici su sistemu dali niz označenih slika ili podataka o obuci za proučavanje. Radeći kao duboka neuronska mreža, model mašinskog učenja se obučio da analizira slične ulaze.

Do danas je više od 59.000 primera obuke koji predstavljaju širok i raznolik spektar geografskih karakteristika ugrađeno u model američkih struktura. Kako je tim počeo da radi na novoj državi, pripremili su set za obuku sa novim primerima specifičnim za region pored kumulativnih podataka o obuci za države koje su bile pre njega.

Dobitak u proizvodnji u poslednjih nekoliko godina proizašao je iz ORNL-ovog stalno unapređivanog hardvera i računarske snage, napretka u dubokom učenju i sve većeg obima podataka o obuci koji informišu model zasnovan na veštačkoj inteligenciji. Kako je projekat napredovao, mape su postajale preciznije, zahtevale su manje ljudske intervencije, a vreme koje je bilo potrebno za obradu slika postajalo je sve kraće i kraće.

Konvoluciono neuronsko umrežavanje sažimalo je proces koji bi ljudskim rukama trajao mnogo godina u minute. Do danas, tim je obradio 1,1 petabajta slika – spojenih i opisuju ekvivalent od milijardu digitalnih fotografija.

Nakon što je ekstrakcija karakteristika završena, istraživači su se oslanjali na prodavce komercijalnih podataka o parcelama da spoje informacije o korišćenju zemljišta direktno u karakteristike zgrada američkih struktura.

„Te dodatne informacije, kada su dostupne, čine podatke o strukturama moćnijim. Da li je to kuća, skladište ili crkva? Svaka od njih ima različite implikacije u katastrofi“, rekao je Kristofer.

Ako nisu bili dostupni pouzdani podaci o korišćenju zemljišta, tim je koristio poseban model mašinskog učenja da razlikuje stambene od nestambenih struktura. Strukture su takođe opisane sa drugim atributima kao što su jedinstveni identifikator zgrade, kvadratura, geografska dužina i geografska širina.

„Trebamo mnogo vremena da proverimo da li je ono što predajemo FEMA-i najviši kvalitet koji možemo da pružimo“, rekao je Jang.

Ovaj moćni skup podataka otvorenog koda je javno dostupan na GeoPlatformu vlade SAD. Pored toga, Američki geološki zavod je dodao podatke na Nacionalnu kartu, zajednički napor američkih agencija i partnera da isporuče topografske informacije. ORNL tim se nada da će otvoren pristup podacima biti koristan akademskim institucijama za istraživanje i malim opštinskim agencijama za planiranje rizika.

„Mnogi ruralni okrugi i male jurisdikcije možda neće imati budžet za prikupljanje ili kupovinu ovakvih podataka inače“, rekao je Kristofer. „Mogu ga koristiti osobe koje prve intervencije ili pružaoci osnovnih usluga. Takođe bi se mogli primeniti na potrebe na nivou okruga za planiranje grada ili procene imovine.“

Istraživači ORNL-a na projektu su Tejlor Hauzer, Benjamin Svon, Endru Rajt i Metju Vajthed. Ostali saradnici su Bred Miler, Metju Kroket i Kejti Hejing.

U sledećoj fazi projekta, tim očekuje da popuni dva ključna atributa – tipove zauzetosti i adrese – za ostale države i da se pozabavi informacijama o visini i nadmorskoj visini koje su potrebne za modeliranje poplava.

Izgradnja održivog procesa za otkrivanje i uključivanje promena tokom vremena biće ključ za produženje životnog veka skupa podataka. Pored toga, ovaj moćni model bi mogao da se koristi u slične svrhe širom sveta u planiranju i reagovanju u slučaju katastrofe ili uparen sa drugom tehnologijom detekcije da bi se izvukle druge korisne informacije.

Chris Vaughan, Jangov projektni partner u FEMA-i, bio je entuzijastičan zagovornik američkih struktura, promovišući njihovu upotrebu i reklamirajući konzistentnu šemu i dostupnost podataka.

„Operacije u slučaju katastrofe zahtevaju standardizovan i pristupačan skup podataka strukture kako bi se pojednostavila pomoć preživelima. ORNL-ov rad na američkim strukturama pomogao nam je da podelimo podatke o incidentima sa našim međuagencijskim partnerima kao nikada ranije“, rekao je Von. „Pored toga, oni nam pomažu da zatvorimo dugotrajne praznine u podacima u vezi sa ugroženim populacijama, što je glavni prioritet za naš tim.

Jang je primetio rastuće interesovanje saveznih agencija, istraživačkih organizacija, lokalnih vlada i praktičara ne samo za korišćenje skupa podataka, već i za doprinos i uključivanje podataka iz manjih lokalnih projekata.

„Ovaj projekat se još uvek razvija i očekujemo da ćemo nastaviti sa velikim ažuriranjima trenutnih podataka“, rekla je ona. „Nadamo se da će više zajednica koristiti podatke. Već je dokazano da su vredni kroz rad FEMA-e, ali možda postoje i druge aplikacije koje imaju još veći uticaj.“