ChatGPT i drugi duboki generativni modeli su se pokazali kao neobične imitacije. Ovi supermodeli veštačke inteligencije mogu da stvaraju pesme, završavaju simfonije i kreiraju nove video zapise i slike automatski učeći iz miliona primera prethodnih radova. Ovi izuzetno moćni i svestrani alati su odlični u generisanju novog sadržaja koji liči na sve što su ranije videli.
Ali kako kažu inženjeri MIT-a u novoj studiji, sličnost nije dovoljna ako želite da zaista inovirate u inženjerskim zadacima.
„Duboki generativni modeli (DGM) su veoma obećavajući, ali i sami po sebi manjkavi“, kaže autor studije Lajl Regenveter, diplomirani student mašinstva na MIT-u. „Cilj ovih modela je da imitiraju skup podataka. Ali kao inženjeri i dizajneri, mi često ne želimo da kreiramo dizajn koji je već tamo.“
On i njegove kolege tvrde da će, ako mašinski inženjeri žele pomoć od veštačke inteligencije da generišu nove ideje i dizajne, prvo morati da preusmere te modele izvan „statističke sličnosti“.
„Performanse mnogih ovih modela su eksplicitno vezane za to koliko je generisani uzorak statistički sličan onome što je model već video“, kaže koautor Faez Ahmed, docent mašinstva na MIT-u. „Ali u dizajnu, biti drugačiji može biti važno ako želite da inovirate.“
U svojoj studiji, Ahmed i Regenveter otkrivaju zamke dubokih generativnih modela kada im je zadatak da rešavaju probleme inženjerskog dizajna. U studiji slučaja dizajna okvira bicikla, tim pokazuje da ovi modeli na kraju generišu nove ramove koji oponašaju prethodne dizajne, ali slabe u pogledu inženjerskih performansi i zahteva.
Kada su istraživači predstavili isti problem okvira bicikla DGM-ovima koji su posebno dizajnirali sa inženjerskim ciljevima, a ne samo sa statističkom sličnošću, ovi modeli su proizveli inovativnije okvire sa većim performansama.
Rezultati tima pokazuju da se modeli veštačke inteligencije fokusirani na sličnost ne prevode baš kada se primenjuju na inženjerske probleme. Ali, kao što istraživači takođe ističu u svojoj studiji, uz pažljivo planiranje metrika koje odgovaraju zadatku, AI modeli bi mogli biti efikasan „ko-pilot“ dizajna.
„Ovde se radi o tome kako veštačka inteligencija može pomoći inženjerima da budu bolji i brži u stvaranju inovativnih proizvoda“, kaže Ahmed. „Da bismo to uradili, prvo moramo da razumemo zahteve. Ovo je jedan korak u tom pravcu.“
Nova studija tima nedavno se pojavila na internetu i biće objavljena u decembarskom štampanom izdanju časopisa Computer-Aided Design. Istraživanje je saradnja između kompjuterskih naučnika u MIT-IBM Vatson AI Lab i mašinskih inženjera u DeCoDe laboratoriji MIT-a. Koautori studije su Akash Srivastava i Dan Gutreund iz MIT-IBM Vatson AI Lab. Animacija koja prikazuje transformacije uobičajenih dizajna bicikala. Kredit: Massachusetts Institute of Technologi
Kao što Ahmed i Regenvetter pišu, DGM su „moćni učenici, koji se mogu pohvaliti neuporedivom sposobnošću“ da obrađuju ogromne količine podataka. DGM je širok pojam za svaki model mašinskog učenja koji je obučen da nauči distribuciju podataka, a zatim ih koristi za generisanje novog, statistički sličnog sadržaja.
Izuzetno popularan ChatGPT je jedan tip dubokog generativnog modela poznatog kao model velikog jezika ili LLM, koji u model uključuje mogućnosti obrade prirodnog jezika kako bi omogućio aplikaciji da generiše realistične slike i govor kao odgovor na razgovorne upite. Ostali popularni modeli za generisanje slike uključuju DALL-E i Stable Diffusion.
Zbog svoje sposobnosti da uče iz podataka i generišu realistične uzorke, DGM se sve više primenjuju u više inženjerskih domena. Dizajneri su koristili duboke generativne modele za izradu novih okvira aviona, dizajna metamaterijala i optimalne geometrije za mostove i automobile. Ali uglavnom, modeli su oponašali postojeće dizajne, bez poboljšanja performansi postojećih dizajna.
„Dizajnerima koji rade sa DGM-ovima nekako nedostaje ova trešnja na vrhu, koja prilagođava cilj obuke modela da se fokusira na zahteve dizajna“, kaže Regenveter. „Dakle, ljudi na kraju generišu dizajne koji su veoma slični skupu podataka.“
U novoj studiji, on ističe glavne zamke u primeni DGM-a na inženjerske zadatke i pokazuje da osnovni cilj standardnih DGM-ova ne uzima u obzir specifične zahteve dizajna. Da bi ovo ilustrovao, tim se poziva na jednostavan slučaj dizajna okvira bicikla i pokazuje da se problemi mogu pojaviti već u početnoj fazi učenja.
Kako model uči iz hiljada postojećih biciklističkih ramova različitih veličina i oblika, on bi mogao smatrati da dva okvira sličnih dimenzija imaju slične performanse, dok je u stvari mali prekid veze u jednom okviru — premali da bi se registrovao kao značajna razlika u statističkoj sličnosti metrika—čini okvir mnogo slabijim od drugog, vizuelno sličnog okvira.
Istraživači su preneli primer bicikla unapred da vide koje dizajne bi DGM zapravo generisao nakon što je naučio iz postojećih dizajna. Prvo su testirali konvencionalnu „vanilu“ generativnu adversarijsku mrežu, ili GAN – model koji se široko koristi u sintezi slika i teksta, a podešen je jednostavno da generiše statistički sličan sadržaj. Oni su obučili model na skupu podataka od hiljada ramova za bicikle, uključujući komercijalno proizvedene dizajne i manje konvencionalne, jednokratne okvire koje su dizajnirali hobisti.
Kada je model naučio iz podataka, istraživači su ga zamolili da generiše stotine novih ramova bicikla. Model je proizveo realistične dizajne koji su podsećali na postojeće okvire. Ali nijedan od dizajna nije pokazao značajno poboljšanje u performansama, a neki su čak bili i malo inferiorniji, sa težim, strukturno manje čvrstim okvirima.
Tim je zatim izvršio isti test sa još dva DGM-a koji su posebno dizajnirani za inženjerske zadatke. Prvi model je onaj koji je Ahmed prethodno razvio da bi napravio dizajn aeroprofila visokih performansi. On je izgradio ovaj model da bi dao prioritet statističkoj sličnosti kao i funkcionalnim performansama.
Kada se primeni na zadatak okvira bicikla, ovaj model je generisao realistične dizajne koji su takođe bili lakši i jači od postojećih dizajna. Ali takođe je proizveo fizički „nevažeće“ okvire, sa komponentama koje se nisu baš uklapale ili su se preklapale na fizički nemoguće načine.
„Videli smo dizajne koji su bili znatno bolji od skupa podataka, ali i dizajne koji su bili geometrijski nekompatibilni jer model nije bio fokusiran na ispunjavanje ograničenja dizajna“, kaže Regenvetter.
Poslednji model koji je tim testirao bio je onaj koji je Regenvetter napravio da generiše nove geometrijske strukture. Ovaj model je dizajniran sa istim prioritetima kao i prethodni modeli, sa dodatnim sastojkom dizajnerskih ograničenja i davanjem prioriteta fizički održivim okvirima, na primer, bez prekida veze ili preklapanja šipki. Ovaj poslednji model proizveo je dizajne sa najvišim performansama, koji su takođe bili fizički izvodljivi.
„Otkrili smo da kada model prevaziđe statističku sličnost, može doći do dizajna koji su bolji od onih koji već postoje“, kaže Ahmed. „To je dokaz šta AI može da uradi, ako je eksplicitno obučen za zadatak dizajna.“
Na primer, ako se DGM-ovi mogu izgraditi sa drugim prioritetima, kao što su performanse, ograničenja dizajna i novina, Ahmed predviđa da bi „brojne oblasti inženjerstva, kao što su molekularni dizajn i civilna infrastruktura, od velike koristi. Rasvetljavanjem potencijalnih zamki oslanjanja isključivo na statističkoj sličnosti, nadamo se da ćemo inspirisati nove puteve i strategije u generativnim AI aplikacijama izvan multimedije.“