Tim korejskih inženjerskih istraživača razvio je četvoronožnu robotsku tehnologiju koja može da se penje uz i niz stepenice i da se kreće bez pada u neravnom okruženju kao što je korenje drveća bez pomoći vizuelnih ili taktilnih senzora čak i u katastrofalnim situacijama u kojima je vizuelna potvrda otežana usled mraka ili gustog dima od plamena.
Istraživački tim profesora Hiun Miunga u Laboratoriji za urbanu robotiku u Školi elektrotehnike stoji iza tehnologije upravljanja hodajućim robotom koja omogućava robusnu „slepu lokomociju“ u različitim atipičnim okruženjima.
Istraživački tim KAIST-a razvio je DreamWaQ tehnologiju, koja je nazvana tako da omogućava hodajućim robotima da se kreću čak i po mraku, baš kao što osoba može hodati bez vizuelne pomoći tek iz kreveta i otići u kupatilo u mraku. Sa ovom tehnologijom instaliranom na bilo kom robotu sa nogama, biće moguće kreirati različite vrste DreamWaQ-a.
Postojeći kontroleri hodajućih robota zasnovani su na kinematičkim i/ili dinamičkim modelima. Ovo se izražava kao metoda upravljanja zasnovana na modelu. Konkretno, u atipičnim okruženjima kao što su otvorena, neravna polja, potrebno je brže dobiti informacije o karakteristikama terena kako bi se održala stabilnost dok hoda. Međutim, pokazalo se da u velikoj meri zavisi od kognitivne sposobnosti za ispitivanje okolnog okruženja.
Nasuprot tome, kontroler koji je razvio istraživački tim profesora Hiun Miunga na osnovu metoda učenja dubokog pojačanja (RL) može brzo izračunati odgovarajuće kontrolne komande za svaki motor hodajućeg robota kroz podatke različitih okruženja dobijenih iz simulatora. Dok su postojeći kontroleri koji su naučili iz simulacija zahtevali posebnu reorganizaciju da bi funkcionisali sa stvarnim robotom, očekuje se da će se ovaj kontroler koji je razvio istraživački tim lako primeniti na različite robote za hodanje jer ne zahteva dodatni proces podešavanja.
DreamWaQ, kontroler koji je razvio istraživački tim, uglavnom se sastoji od mreže za procenu konteksta koja procenjuje informacije o zemlji i robotima i mreže politike koja izračunava kontrolne komande. Mreža procenjivača uz pomoć konteksta procenjuje informacije o zemlji implicitno, a status robota eksplicitno putem inercijalnih informacija i zajedničkih informacija. Ove informacije se unose u mrežu politika da bi se koristile za generisanje optimalnih kontrolnih komandi. Obe mreže se uče zajedno u simulaciji.
Dok se mreža procenjivača uz pomoć konteksta uči kroz nadgledano učenje, mreža politika se uči kroz arhitekturu akter-kritičar, duboku RL metodologiju. Mreža aktera može samo implicitno da zaključi informacije o okolnom terenu. U simulaciji su poznate informacije o okolnom terenu, a kritičar, odnosno mreža vrednosti, koja ima tačne informacije o terenu, ocenjuje politiku mreže aktera.
Ceo ovaj proces učenja traje samo oko sat vremena na računaru sa GPU-om, a stvarni robot je opremljen samo mrežom naučenih aktera. Bez gledanja na okolni teren, prolazi kroz proces zamišljanja koje je okruženje slično jednom od različitih okruženja naučenih u simulaciji koristeći samo inercijski senzor (IMU) unutar robota i merenje uglova zglobova. Ako iznenada naiđe na pomak, kao što je stepenište, neće znati sve dok njegova noga ne dodirne stepenicu, ali će brzo izvući informacije o terenu u trenutku kada stopalo dodirne površinu. Zatim se kontrolna komanda pogodna za procenjenu informaciju o terenu prenosi na svaki motor, omogućavajući brzo prilagođeno hodanje.
Robot DreamWaQer hodao je ne samo u laboratorijskom okruženju, već i po spoljašnjem okruženju oko kampusa sa mnogo ivičnjaka i prepreka, kao i preko polja sa mnogo korenja drveća i šljunka, demonstrirajući svoje sposobnosti tako što je savladao stepenište sa razlikom od visine koja iznosi dve trećine njenog tela. Pored toga, bez obzira na okruženje, istraživački tim je potvrdio da je sposoban za stabilno hodanje u rasponu od male brzine od 0,3 m/s do prilično velike brzine od 1,0 m/s.
Rezultati ove studije dostupni su u radu objavljenom na arKsiv serveru za preprint i prihvaćeni su da budu predstavljeni na predstojećoj IEEE međunarodnoj konferenciji o robotici i automatizaciji (ICRA) koja je zakazana za kraj maja u Londonu.