Istraživači koriste novi pristup da nauče robota da se kreće preko prepreka

Istraživači koriste novi pristup da nauče robota da se kreće preko prepreka

Četvoronožni roboti mogu biti u stanju da direktno preskoče prepreke na svom putu zahvaljujući naporima tri studenta sa Georgia Tech.

Kada je reč o robotskoj lokomociji i navigaciji, Naoki Jokojama kaže da je većina četvoronožnih robota obučena da se oslone ako ih neka prepreka izazove da posrnu. Radeći na većem naporu da razviju robota za domaćinstvo, Jokojama i njegovi saradnici — Simar Kareer i Joanne Truong — krenuli su da obuče svog robota da hoda preko nereda na koji bi mogao naići u domu.

„Glavna motivacija projekta je dobijanje kontrole na niskom nivou nad nogama robota koji takođe uključuje vizuelni unos“, rekao je Jokojama, dr. student u okviru Elektrotehničke i računarske škole. „Zamislili smo kontrolor koji bi mogao da se postavi u zatvorenom okruženju sa puno nereda, kao što su cipele ili igračke na tlu neuredne kuće. Dok slepi kontrolori lokomotiva imaju tendenciju da budu reaktivniji—ako zgaze na nešto, oni“ Pobrinuću se da se ne prevrnu – želeli smo da naši koriste vizuelni unos kako bismo izbegli da u potpunosti nagaze na prepreku.“

Da bi postigli svoj cilj, istraživači su uzeli novi pristup obučavanju spajanja politike vizuelne navigacije visokog nivoa sa politikom vizuelne lokomocije.

U radu koji su savetovali vanredni profesor za interaktivno računarstvo Dhruv Batra i docent Sehoon Ha, Kareer, Iokoiama i Truong pokazuju da njihov pristup sa dve politike uspešno simulira robotsku navigaciju preko prepreka.

Oni svoj pristup nazivaju ViNL (Vizuelna navigacija i lokomocija), i do sada je vodio robote kroz simulirana nova pretrpana okruženja sa stopom uspeha od 72,6%. Tim će predstaviti svoj rad, ViNL: Vizuelna navigacija i kretanje preko prepreka, na IEEE međunarodnoj konferenciji o robotici i automatizaciji, koja se održava od 29. maja do 2. juna u Londonu.

Obe politike su bez modela – robot uči na sopstvenoj simulaciji i ne oponaša nikakve postojeće obrasce ponašanja – i mogu se kombinovati bez ikakve dodatne zajedničke obuke.

„Ovaj rad na jedinstven način kombinuje odvojene politike lokomocije i navigacije na nulti način“, rekao je Kareer, koji je zajedno sa Truongom doktorirao. student u okviru Škole za interaktivno računarstvo. „Ako smislimo poboljšanu politiku navigacije, možemo to samo da uzmemo, da ne radimo dodatni posao i da to primenimo na našeg robota. To je skalabilan pristup. Možete da priključite i reprodukujete ove stvari zajedno sa vrlo malo finog podešavanja. To je moćan.“

Politika vizuelne navigacije podučava robota kroz motivaciju za postizanje cilja. To daje robotu cilj da se kreće od jednog mesta do drugog, izbegavajući sve prepreke. Robot dobija ocenu na osnovu toga koliko je uspešno izvršio svoj zadatak. Ako se spotakne o prepreku, kažnjava se.

„Dali smo mu okruženje koje je imalo vrlo malo prepreka, a zatim malo više i malo više“, rekao je Kareer. „Ovaj postepeni pristup pomaže njegovom učenju. Kada ga samo bacite u okruženje sa milion prepreka, on mnogo ne uspe. Ali ako mu pokažete jednu ili dve prepreke i kažete, ‘pokušajte da naučite ovo’, to je mnogo više stabilan“.

Politika kretanja uči robota kako da koristi svoje udove da pregazi objekat, uključujući i koliko visoko treba da podigne noge.

Pošto će četvoronožac u stvarnom svetu moći da vidi samo ono što vidi njegova prednja kamera, prepreke će nestati iz njegovog pogleda kako im se približi. Tim je to objasnio tako što je uključio memoriju i prostornu svest u svoju mrežnu arhitekturu kako bi naučio robota tačno kada i gde da pređe prepreku.

„Robot ima bogato razumevanje o tome gde mu je ceo ud u odnosu na prepreke“, rekao je Kareer. „Kada ga vidite kako hoda preko prepreka, to nije samo odluka da spusti nogu na mesta gde nema prepreka. To je da se seća gde su sve prepreke u odnosu na njegovo telo i da mu drži udove dalje od puta dok ih ne pređe. .“

A ako je prepreka previsoka da bi se prekoračila, robot takođe može izabrati da je zaobiđe.

„Videli smo da je veoma dobar u navigaciji, pa čak i u slučajevima kada bi mogao da skrene pogrešno, zna da može da se vrati i vrati odakle je došao“, rekao je Truong.

Konačno, grupa je konkretno naučila robota koje vrste objekata treba da traži da pređe u kući, kao što su igračke, i one koje treba da obiđe, kao što je stolica. Ovo takođe pomaže robotu da zna koliko će visoko trebati da podigne noge.

„Ono što je važno za navigaciju je da imamo iskustvo navigacije u kućama u stvarnom svetu, tako da treniramo našu politiku navigacije sa foto-realističnim skeniranjem stanova“, rekao je Truong. „Koristili smo skeniranje preko 1.000 stanova za obuku i procenili robota u scenarijima koje nikada ranije nismo videli. Mi ga postavljamo u novo okruženje, tako da možete uzeti novog robota, staviti ga u novu kuću i moći će i ovo da uradi“.

Istraživači se slažu da je njihov rad višeslojan i ima brojne implikacije koje su van njegovog fokusa, ali su ipak važne. Njihov rad bi mogao da dovede do toga da se roboti otvoreno kreću na otvorenom, selektivno birajući putanje na osnovu preferencija korisnika kako bi izbegli blatnjavu zemlju ili kamenit teren.