Međunarodna grupa istraživača stvorila je novi pristup imitaciji ljudskog kretanja kombinovanjem centralnih generatora šablona (CPG) i učenja dubokog pojačanja (DRL). Metoda ne samo da imitira pokrete hodanja i trčanja, već i generiše pokrete za frekvencije na kojima nema podataka o kretanju, omogućava glatke prelaze iz hodanja u trčanje i omogućava prilagođavanje okruženjima sa nestabilnim površinama.
Detalji njihovog otkrića objavljeni su u časopisu IEEE Robotics and Automation Letters 15. aprila 2024.
Možda ne razmišljamo mnogo o tome, ali hodanje i trčanje uključuju inherentne biološke suvišnosti koje nam omogućavaju da se prilagodimo okruženju ili promenimo brzinu hodanja/trčanja. S obzirom na zamršenost i složenost ovoga, reprodukovanje ovih ljudskih pokreta u robotima je notorno izazovno.
Sadašnji modeli se često bore da prilagode nepoznata ili izazovna okruženja, što ih čini manje efikasnim i manje efikasnim. To je zato što je AI pogodna za generisanje jednog ili malog broja tačnih rešenja. Sa živim organizmima i njihovim kretanjem, ne postoji samo jedan ispravan obrazac koji treba slediti. Postoji čitav niz mogućih pokreta i nije uvek jasno koji je najbolji ili najefikasniji.
DRL je jedan od načina na koji su istraživači pokušali ovo prevazići. DRL proširuje tradicionalno učenje sa pojačanjem koristeći duboke neuronske mreže za rukovanje složenijim zadacima i učenje direktno iz sirovih senzornih inputa, omogućavajući fleksibilnije i moćnije mogućnosti učenja. Njegov nedostatak je ogroman računarski trošak istraživanja ogromnog ulaznog prostora, posebno kada sistem ima visok stepen slobode.
Drugi pristup je učenje imitacijom, u kome robot uči oponašajući podatke merenja pokreta od čoveka koji obavlja isti zadatak pokreta. Iako je učenje imitacijom dobro u učenju u stabilnim okruženjima, ono se muči kada se suoči sa novim situacijama ili okruženjima sa kojima se nije susrelo tokom treninga. Njegova sposobnost da modifikuje i efikasno se kreće postaje ograničena uskim obimom naučenog ponašanja.
„Prevazišli smo mnoga ograničenja ova dva pristupa tako što smo ih kombinovali“, objašnjava Micuhiro Hajašibe, profesor na Fakultetu inženjerskih nauka Univerziteta Tohoku. „Učenje imitacijom je korišćeno za obuku kontrolera nalik CPG-u, i, umesto da primenimo duboko učenje na same CPG-ove, primenili smo ga na oblik refleksne neuronske mreže koja podržava CPG-ove.
CPG su neuronska kola koja se nalaze u kičmenoj moždini koja, poput biološkog provodnika, generišu ritmičke obrasce mišićne aktivnosti. Kod životinja, refleksno kolo radi u tandemu sa CPG-ovima kako bi pružilo adekvatnu povratnu informaciju koja im omogućava da prilagode svoju brzinu i pokrete hodanja/trčanja kako bi odgovarali terenu.
Usvajanjem strukture CPG-a i njegovog refleksivnog parnjaka, metoda adaptivne imitacije CPG-a (AI-CPG) postiže izuzetnu prilagodljivost i stabilnost u stvaranju pokreta uz imitaciju ljudskog pokreta.
„Ovaj proboj postavlja novi standard u generisanju pokreta poput čoveka u robotici, sa sposobnošću prilagođavanja životne sredine bez presedana“, dodaje Hajašibe „Naš metod predstavlja značajan korak napred u razvoju generativnih AI tehnologija za kontrolu robota, sa potencijalnim primenama u različitim industrijama .“
Istraživačka grupa se sastojala od članova Fakulteta inženjerskih nauka Univerziteta Tohoku i Ecole Politechnikue Federale de Lausanne, ili Švajcarskog federalnog instituta za tehnologiju u Lozani.