Nova tehnika za poboljšanje sposobnosti učenja robota koji obavljaju zadatke koji se ponavljaju

Nova tehnika za poboljšanje sposobnosti učenja robota koji obavljaju zadatke koji se ponavljaju

Učenje iz nečijih grešaka iz prošlosti nije ograničeno samo na ljude. I kompjuteri to rade. U industrijama se to radi preko kompjuterskih kontrolnih sistema koji pomažu u radu proizvodnih sistema. Za industrijske robote koji obavljaju specifične zadatke u serijama, recimo proizvodnju odeće, kompjuterskih čipova ili pečenih proizvoda, najčešće korišćena tehnika kontrole je kontrola iterativnog učenja (ILC). Većina industrija se i dalje oslanja na ILC sisteme koji koriste strategiju učenja koja se naziva pravilo ažuriranja proporcionalnog tipa (PTUR). Ova tehnika poboljšava performanse ILC sistema ponavljanjem istog zadatka iznova i iznova i ažuriranjem njegovog kontrolnog ulaza na osnovu grešaka koje su se pojavile u prethodnim iteracijama.

Međutim, ova metodologija kontrole je predložena decenijama ranije. A pošto se ILC sistemi sve više usvajaju za obavljanje složenijih zadataka, postoji potreba za tehnikama koje mogu da uče brže i sa većom preciznošću.

U nedavnom otkriću, grupa naučnika je predložila novu tehniku koja koristi pravilo za ažuriranje frakcijske snage (FPUR) za poboljšanje potencijala performansi linearnih ILC sistema sa jednim ulazom i jednim izlazom. Studija je objavljena u IEEE/CAA Journal of Automatica Sinica.

Stope konvergencije – stope po kojima se razlika između željenog i stvarnog učinka smanjuje tokom vremena – igraju ključnu ulogu u definisanju efikasnosti ILC sistema. Postojeće metode za poboljšanje stope konvergencije često se pokažu kao nezadovoljavajuće u situacijama koje zahtevaju visoku preciznost. Čak iu slučaju konstantnih ili ručno odabranih dostignuća u učenju, trenutni ILC sistemi koji koriste metod linearnog ažuriranja ne uspevaju da u potpunosti iskoriste dostupne informacije. Stoga su naučnici istraživali pristupe izvan PTUR-a, koji su koristili nelinearne metode ažuriranja da bi naučili i postigli željeni rezultat.

„Tradicionalni PTUR koristi linearni termin za grešku praćenja da ažurira kontrolni ulaz. S druge strane, FPUR koristi frakcioni termin za ažuriranje. Pošto svaki pozitivan broj manji od jedan ima veću frakcionu snagu od sebe, intenzitet ažuriranja FPUR-a je veći od PTUR-a za male greške u praćenju, što dovodi do brže stope konvergencije“, objašnjava Zihan Li, vodeći autor studije i student master studija na Fakultetu matematike na Univerzitetu Renmin u Kini.

Tim je razvio novu FPUR metodu inspirisanu novijim strategijama kontrole konačnog vremena (FTC) i terminalnog kliznog režima (TSMC), koje su potencijalne tehnike za prevazilaženje prethodno pomenutih problema i za poboljšanje brzine konvergencije. Naučnici su takođe usvojili pristup nelinearnog mapiranja kako bi istražili dinamiku greške tokom vremena. Ovaj pristup im je omogućio da prijave brze performanse konvergencije i karakterišu moguće granične cikluse grešaka praćenja u ILC sistemima. Pored toga, izvedene su i numeričke simulacije da bi se potvrdila efikasnost nove metode.

Na pitanje kako bi predloženi sistem promenio oblast ILC sistema, Li kaže: „Ova studija služi trima glavnim svrhama. Prvo, pruža algoritam koji koristi nelinearnu metodu ažuriranja za poboljšanje sposobnosti učenja. Drugo, pokazuje da prilagođavanje frakcioni pojmovi snage omogućavaju da se stopa konvergencije reguliše na osnovu stvarnih performansi. I konačno, pokazuje brze stope konvergencije na nivou FTC ​​i TMSC.“

Ova studija je po prvi put pokazala upotrebu FPUR-a za ILC u linearnim sistemima sa jednim ulazom i jednim izlazom. Predložena tehnika bi se potencijalno mogla koristiti u drugim sistemima koji se ponavljaju kao što su autonomna vozila, bespilotne letelice i roboti za rehabilitaciju.