Nova tehnika pomaže robotima da spakuju predmete u uski prostor

Nova tehnika pomaže robotima da spakuju predmete u uski prostor

Svako ko je ikada pokušao da spakuje količinu prtljaga veličine porodice u prtljažnik veličine limuzine zna da je ovo težak problem. Roboti se takođe bore sa zadacima gustog pakovanja.

Za robota, rešavanje problema pakovanja podrazumeva zadovoljavanje mnogih ograničenja, kao što je slaganje prtljaga kako se koferi ne bi izvrnuli iz prtljažnika, teški predmeti ne bi bili postavljeni na lakši, i sudari između robotske ruke i branika automobila se izbegavaju.

Neke tradicionalne metode rešavaju ovaj problem uzastopno, pogađajući delimično rešenje koje ispunjava jedno po jedno ograničenje, a zatim proveravajući da li su neka druga ograničenja prekršena. Sa dugim nizom radnji koje treba preduzeti i gomilom prtljaga za spakovanje, ovaj proces može biti nepraktično dugotrajan.

Istraživači sa MIT-a koristili su oblik generativne AI, nazvan difuzioni model, da bi efikasnije rešili ovaj problem. Njihov metod, opisan u članku objavljenom na arXiv serveru za preprint, koristi kolekciju modela mašinskog učenja, od kojih je svaki obučen da predstavlja jednu specifičnu vrstu ograničenja. Ovi modeli su kombinovani da generišu globalna rešenja za problem pakovanja, uzimajući u obzir sva ograničenja odjednom.

Njihov metod je bio u stanju da generiše efikasna rešenja brže od drugih tehnika i proizveo je veći broj uspešnih rešenja za isto vreme. Važno je da je njihova tehnika takođe bila u stanju da reši probleme sa novim kombinacijama ograničenja i većim brojem objekata, koje modeli nisu videli tokom treninga.

Zbog ove generalizacije, njihova tehnika se može koristiti za podučavanje robota kako da razumeju i odgovore na opšta ograničenja problema pakovanja, kao što je važnost izbegavanja sudara ili želja da jedan objekat bude pored drugog. Ovako obučeni roboti mogli bi da se primene na širok spektar složenih zadataka u različitim okruženjima, od ispunjenja narudžbine u skladištu do organizovanja police za knjige u nečijem domu. Kredit: Massachusetts Institute of Technologi

„Moja vizija je da nateram robote da rade komplikovanije zadatke koji imaju mnoga geometrijska ograničenja i više neprekidnih odluka koje treba da se donose—ovo su vrste problema sa kojima se roboti servisa suočavaju u našim nestrukturiranim i raznolikim ljudskim okruženjima. Sa moćnim alatom za kompoziciju difuzionih modela, sada možemo da rešimo ove složenije probleme i dobijemo odlične rezultate generalizacije“, kaže Žutijan Jang, diplomirani student elektrotehnike i računarstva i glavni autor rada o ovoj novoj tehnici mašinskog učenja.

Njeni koautori su diplomirani studenti MIT-a Jiaiuan Mao i Iilun Du; Jiajun Vu, docent informatike na Univerzitetu Stanford; Džošua B. Tenenbaum, profesor na MIT-ovom odeljenju za mozak i kognitivne nauke i član Laboratorije za računarske nauke i veštačku inteligenciju (CSAIL); Tomas Lozano-Perez, profesor računarstva i inženjerstva na MIT-u i član CSAIL-a; i stariji autor Leslie Kaelbling, Panasonic profesor računarskih nauka i inženjerstva na MIT-u i član CSAIL-a. Istraživanje će biti predstavljeno na Konferenciji o učenju robota održanoj u Atlanti, Džordžija, od 6. do 9. novembra.

Problemi sa kontinuiranim zadovoljenjem ograničenja su posebno izazovni za robote. Ovi problemi se pojavljuju u zadacima manipulacije robotima u više koraka, kao što je pakovanje predmeta u kutiju ili postavljanje stola za večeru. Oni često uključuju postizanje brojnih ograničenja, uključujući geometrijska ograničenja, kao što je izbegavanje sudara između robotske ruke i okoline; fizička ograničenja, kao što je slaganje objekata tako da budu stabilni; i kvalitativnih ograničenja, kao što je stavljanje kašike desno od noža.

Može postojati mnoga ograničenja i ona se razlikuju u zavisnosti od problema i okruženja u zavisnosti od geometrije objekata i ljudskih zahteva.

Da bi efikasno rešili ove probleme, istraživači sa MIT-a razvili su tehniku mašinskog učenja pod nazivom Diffusion-CCSP. Difuzioni modeli uče da generišu nove uzorke podataka koji liče na uzorke u skupu podataka za obuku iterativnim prečišćavanjem njihovog izlaza.

Da bi to uradili, modeli difuzije uče proceduru za pravljenje malih poboljšanja potencijalnog rešenja. Zatim, da bi rešili problem, počinju sa nasumičnim, veoma lošim rešenjem, a zatim ga postepeno poboljšavaju.

Na primer, zamislite nasumično postavljanje tanjira i pribora na simulirani sto, omogućavajući im da se fizički preklapaju. Ograničenja bez sudara između objekata će dovesti do toga da se oni međusobno odguruju, dok će kvalitativna ograničenja povući tanjir u centar, poravnati viljušku za salatu i viljušku za večeru, itd.

Modeli difuzije su veoma pogodni za ovu vrstu problema kontinuiranog zadovoljenja ograničenja jer se uticaji višestrukih modela na pozu jednog objekta mogu komponovati da bi podstakli zadovoljenje svih ograničenja, objašnjava Jang. Polazeći od nasumične početne pretpostavke svaki put, modeli mogu dobiti raznovrstan skup dobrih rešenja. Koristeći generativne AI modele, istraživači sa MIT-a su kreirali tehniku koja bi mogla da omogući robotima da efikasno rešavaju probleme kontinuiranog zadovoljenja ograničenja, kao što je pakovanje objekata u kutiju uz izbegavanje sudara, kao što je prikazano u ovoj simulaciji. Kredit: Massachusetts Institute of Technologi

Za Diffusion-CCSP, istraživači su želeli da uhvate međusobnu povezanost ograničenja. U pakovanju, na primer, jedno ograničenje može zahtevati da određeni objekat bude pored drugog objekta, dok drugo ograničenje može da odredi gde se jedan od tih objekata mora nalaziti.

Diffusion-CCSP uči familiju difuzionih modela, sa po jednim za svaki tip ograničenja. Modeli se obučavaju zajedno, tako da dele neko znanje, kao što je geometrija objekata koji se pakuje.

Modeli zatim rade zajedno na pronalaženju rešenja, u ovom slučaju lokacija za objekte koji se postavljaju, koja zajedno zadovoljavaju ograničenja.

„Ne dolazimo uvek do rešenja na prvu pretpostavku. Ali kada nastavite da usavršavate rešenje i dođe do nekog kršenja, to bi trebalo da vas odvede do boljeg rešenja. Dobićete smernice da nešto ne pogrešite“, kaže ona.

Obuka pojedinačnih modela za svaki tip ograničenja, a zatim njihovo kombinovanje radi predviđanja u velikoj meri smanjuje količinu potrebnih podataka za obuku, u poređenju sa drugim pristupima.

Međutim, obuka ovih modela i dalje zahteva veliku količinu podataka koji pokazuju rešene probleme. Ljudi bi morali da reše svaki problem tradicionalnim sporim metodama, čineći troškove generisanja takvih podataka previsokim, kaže Jang.

Umesto toga, istraživači su preokrenuli proces tako što su prvo došli do rešenja. Koristili su brze algoritme za generisanje segmentiranih kutija i uklapanje raznolikog skupa 3D objekata u svaki segment, obezbeđujući čvrsto pakovanje, stabilne poze i rešenja bez sudara.

„Sa ovim procesom, generisanje podataka je skoro trenutno u simulaciji. Možemo da generišemo desetine hiljada okruženja u kojima znamo da su problemi rešivi,“ kaže ona.

Obučeni koristeći ove podatke, modeli difuzije rade zajedno kako bi odredili lokacije na koje objekte treba postaviti robotski hvatač koji postiže zadatak pakovanja dok ispunjava sva ograničenja.

Sproveli su studije izvodljivosti, a zatim demonstrirali Diffusion-CCSP sa pravim robotom koji rešava niz teških problema, uključujući postavljanje 2D trouglova u kutiju, pakovanje 2D oblika sa ograničenjima prostornih odnosa, slaganje 3D objekata sa ograničenjima stabilnosti i pakovanje 3D objekata sa robotska ruka.

Njihova metoda je nadmašila druge tehnike u mnogim eksperimentima, generišući veći broj efikasnih rešenja koja su bila i stabilna i bez sudara.

U budućnosti, Jang i njeni saradnici žele da testiraju Diffusion-CCSP u komplikovanijim situacijama, kao što su roboti koji se mogu kretati po prostoriji. Oni takođe žele da omoguće Diffusion-CCSP da se bavi problemima u različitim domenima bez potrebe da se ponovo obučavaju za nove podatke.

„Diffusion-CCSP je rešenje za mašinsko učenje koje se zasniva na postojećim moćnim generativnim modelima“, kaže Danfei Ksu, docent na Školi za interaktivno računarstvo na Tehnološkom institutu Džordžije i istraživač na NVIDIA AI, koji nije bio uključen. sa ovim radom. „Može brzo da generiše rešenja koja istovremeno zadovoljavaju višestruka ograničenja sastavljanjem poznatih pojedinačnih modela ograničenja. Iako je još uvek u ranim fazama razvoja, tekući napredak u ovom pristupu obećava da će omogućiti efikasnije, bezbednije i pouzdanije autonomne sisteme u različitim aplikacije“.