Obuka robota kako da uče, donose odluke u hodu

Obuka robota kako da uče, donose odluke u hodu

Marsovci imaju timove stručnjaka za ljude na Zemlji koji im govore šta da rade. Ali roboti u misijama lendera na mesece koji kruže oko Saturna ili Jupitera su previše daleko da bi dobili pravovremene komande sa Zemlje.

Istraživači na katedri za vazduhoplovstvo i računarstvo na Univerzitetu Ilinois Urbana-Champaign razvili su novu metodu zasnovanu na učenju tako da roboti na vanzemaljskim telima mogu sami da donose odluke o tome gde i kako da uzmu uzorke terena.

„Umesto da simuliramo kako da izvučemo svaku moguću vrstu kamena ili zrnastog materijala, stvorili smo novi način da autonomni sletači nauče kako da nauče da brzo hvataju novi materijal na koji naiđe“, rekao je Pranaj Thangeda, dr. student na Odseku za vazduhoplovstvo.

„Takođe uči kako da se prilagodi promenljivim pejzažima i njihovim svojstvima, kao što su topologija i sastav materijala“, rekao je on.

Koristeći ovu metodu, Thangeda je rekao da robot može naučiti kako da uzme novi materijal sa vrlo malo pokušaja. „Ako napravi nekoliko loših pokušaja, saznaće da ne bi trebalo da hvata u tu oblast i pokušaće negde drugde.“

Jedan od izazova za ovo istraživanje je nedostatak znanja o okeanskim svetovima poput Evrope.

„Pre nego što smo poslali nedavne rovere na Mars, orbiteri su nam dali prilično dobre informacije o karakteristikama terena“, rekao je Thangeda. „Ali najbolja slika Evrope koju imamo ima rezoluciju od 256 do 340 metara po pikselu, što nije dovoljno jasno da bi se utvrdile karakteristike.

Thangedin savetnik Melkior Ornik je rekao: „Sve što znamo je da je površina Evrope led, ali to mogu biti veliki blokovi leda ili mnogo sitniji poput snega. Takođe ne znamo šta je ispod leda.“

Za neka ispitivanja, tim je sakrio materijal ispod sloja nečeg drugog. Robot vidi samo gornji materijal i misli da bi bilo dobro da ga uzme. „Kada zapravo zahvati i udari u donji sloj, saznaje da se ne može iskopati i kreće se u drugu oblast“, ​​rekao je Thangeda.

NASA želi da u Evropu pošalje rovere na baterije, a ne nuklearne, jer je, između ostalih razmatranja specifičnih za misiju, od ključne važnosti da se minimizira rizik od kontaminacije okeanskih svetova potencijalno opasnim materijalima.

„Iako nuklearni izvori energije imaju životni vek meseci, baterije imaju oko 20 dana. Ne možemo sebi priuštiti da gubimo nekoliko sati dnevno na slanje poruka napred-nazad. Ovo predstavlja još jedan razlog zašto robotova autonomija donosi odluke samo po sebi je od vitalnog značaja“, rekao je Thangeda.

Ovaj metod učenja za učenje je takođe jedinstven jer omogućava robotu da koristi viziju i vrlo malo iskustva na mreži za postizanje visokokvalitetnih akcija hvatanja na nepoznatim terenima—značajno nadmašujući neprilagodljive metode i druge najsavremenije metode metode meta-učenja.

Tim je koristio robota na Odeljenju za računarske nauke u Ilinoisu. Modeliran je prema ruci lendera sa senzorima za prikupljanje podataka o različitim materijalima, od zrna peska od 1 milimetara do kamenja od 8 centimetara, kao i materijala različite zapremine kao što su seckani karton i pakovanje kikirikija. Dobijena baza podataka u simulaciji sadrži 100 poena znanja za svaki od 67 različitih terena, odnosno ukupno 6.700 poena.

„Prema našim saznanjima, mi smo prvi koji je otvorio veliki skup podataka o granularnim medijima“, rekao je Thangeda. „Takođe smo obezbedili kod za lak pristup skupu podataka kako bi drugi mogli da počnu da ga koriste u svojim aplikacijama.

Model koji je tim napravio biće raspoređen u NASA-inoj laboratoriji za mlazni pogon Ocean World Lander Autonomy Testbed.

„Zainteresovani smo za razvoj autonomnih robotskih sposobnosti na vanzemaljskim površinama, a posebno za izazovne vanzemaljske površine“, rekao je Ornik. „Ova jedinstvena metoda će pomoći u informisanju NASA-inog stalnog interesovanja za istraživanje okeanskih svetova.“

„Vrednost ovog rada je u prilagodljivosti i prenosivosti znanja ili metoda sa Zemlje na vanzemaljsko telo, jer je jasno da nećemo imati mnogo informacija pre nego što lender stigne tamo. A zbog kratkog veka trajanja baterije, mi neće imati mnogo vremena za proces učenja. Lender može trajati samo nekoliko dana, a zatim umreti, tako da je učenje i samostalno donošenje odluka izuzetno korisno.“