Model koristi ljudske upute i skice za stvaranje realističnih modnih slika

Veštačka inteligencija (AI) je nedavno počela da se probija u mnoge kreativne industrije, na primer, u obliku alata za digitalne umetnike, arhitekte, dizajnere enterijera i urednike slika. U ovim kontekstima, veštačka inteligencija može da automatizuje procese koji su dosadni ili dugotrajni, a istovremeno potencijalno inspiriše umetnike i olakšava njihov kreativni proces.

Istraživači sa Univerziteta u Firenci, Univerziteta Modena i Reggio Emilia i Univerziteta u Pizi nedavno su krenuli da istraže potencijal AI modela u modnom dizajnu. U radu prethodno objavljenom na arKsiv-u, predstavili su novi okvir kompjuterske vizije koji bi mogao pomoći modnim dizajnerima da vizualizuju svoje dizajne, pokazujući im kako bi mogli da izgledaju na ljudskom telu.

Većina prethodnih studija koje su istraživale upotrebu veštačke inteligencije u modnoj industriji fokusirale su se na računarske alate koji mogu preporučiti odevne predmete slične onima koje odabere korisnik ili modele koji mogu da pokažu onlajn kupcima kako bi odeća izgledala na njihovom telu (tj. virtuelni sistemi za isprobavanje) . Ovaj tim italijanskih istraživača, s druge strane, krenuo je da razvije okvir koji bi mogao da podrži rad dizajnera, pokazujući im kako odeća koju su dizajnirali mogu izgledati u stvarnom životu, kako bi mogli da pronađu novu inspiraciju, identifikuju potencijalne probleme i promenite svoje dizajne ako je potrebno.

„Za razliku od prethodnih radova koji su se uglavnom fokusirali na virtuelno isprobavanje odevnih predmeta, mi predlažemo zadatak multimodalnog uslovljenog uređivanja modnih slika, vodeći generisanje modnih slika usmerenih na čoveka prateći multimodalne zahteve, kao što su tekst, poze ljudskog tela, i skice odeće“, napisali su Alberto Baldrati, Davide Moreli i njihove kolege u svom listu.

„Mi se bavimo ovim problemom tako što predlažemo novu arhitekturu zasnovanu na modelima latentne difuzije, pristup koji ranije nije korišćen u modnom domenu.

Umesto da koriste generativne adversarijske mreže (GAN), arhitekture veštačkih neuronskih mreža koje se često koriste za generisanje novih tekstova ili slika, istraživači su odlučili da kreiraju okvir zasnovan na modelima latentne difuzije ili LDM-ovima. Pošto su obučeni u komprimovanom i nižedimenzionalnom latentnom prostoru, LDM mogu kreirati visokokvalitetne sintetičke slike.

Iako su ovi obećavajući modeli primenjeni na mnoge zadatke koji zahtevaju generisanje veštačkih slika ili video zapisa, oni su retko korišćeni u kontekstu modnog uređivanja slika. Većina prethodnih radova u ovoj oblasti uvela je arhitekture zasnovane na GAN-u, koje generišu slike nižeg kvaliteta od LDM-ova.

Većina postojećih skupova podataka za obuku AI modela o zadacima modnog dizajna uključuje samo slike odeće niske rezolucije i ne uključuje informacije neophodne za kreiranje modnih slika na osnovu tekstualnih upita i skica. Da bi efikasno obučili svoj model, Baldrati, Morelli i njihove kolege su morali prvo da ažuriraju ove postojeće skupove podataka ili kreiraju nove.

„S obzirom na nedostatak postojećih skupova podataka koji su pogodni za zadatak, takođe proširujemo dva postojeća modna skupa podataka, odnosno Dress Code i VITON-HD, sa multimodalnim napomenama prikupljenim na poluautomatski način“, objasnili su Baldrati, Morelli i njihove kolege u svom radu. . „Eksperimentalni rezultati na ovim novim skupovima podataka pokazuju efikasnost našeg predloga, kako u smislu realizma tako i u pogledu koherentnosti sa datim multimodalnim ulazima.“

U početnim procenama, model koji je kreirao ovaj tim istraživača postigao je veoma obećavajuće rezultate, stvarajući realistične slike odevnih predmeta na ljudskim telima inspirisane ljudskim skicama i specifičnim tekstualnim naredbama. Izvorni kod njihovog modela i multimodalne napomene koje su dodali skupovima podataka uskoro će biti objavljeni na GitHub-u.

U budućnosti bi ovaj novi model mogao biti integrisan u postojeće ili nove softverske alate za modne dizajnere. Takođe bi mogao da informiše razvoj drugih AI arhitektura zasnovanih na LDM-ovima za kreativne aplikacije u stvarnom svetu.

„Ovo je jedan od prvih uspešnih pokušaja da se oponaša posao dizajnera u kreativnom procesu modnog dizajna i mogao bi da bude polazna tačka za kapilarno usvajanje modela difuzije u kreativnim industrijama, nadzora od strane ljudi“, Baldrati, Morelli i njihovi kolege zaključuju u svom radu.

Model koristi ljudske upute i skice za stvaranje realističnih modnih slika

Merc: Izbori u Baden-Virtembergu gorak rezultat, nećemo sarađivati sa AFD

Fritule sa slaninicom

AUTOPUT PAKOVRAĆE–POŽEGA: Tunel bez dozvole, deonica bez funkcije, građani bez odgovora

VUČIĆEV PAD: Šta stoji iza gubitka podrške predsedniku Srbije

Premijer Severne Makedonije Mickoski ponovo ističe da neće podržati ustavne izmene bez jasnih garancija

Napadi ukrajinske vojske na ruske vojne ciljeve u poslednjim danima

Đukanović: Crna Gora ne treba incidente dok se približava članstvu u EU

Relikvija Časnog pojasa Presvete Bogorodice privukla više od milion vernika u Beogradu

Jaka Jermenija se suočava sa optužbama i pritiscima pred izbore, dok se odnosi s Rusijom komplikuju

Premijer Severne Makedonije Mickoski ponovo ističe da neće podržati ustavne izmene bez jasnih garancija

Napadi ukrajinske vojske na ruske vojne ciljeve u poslednjim danima

Đukanović: Crna Gora ne treba incidente dok se približava članstvu u EU

Poraz košarkaša Partizana, Dubai poveo 1:0 u finalu ABA lige

U ponedeljak počinje Petrovski post

IAEA: Lokalni prekid vatre kod nuklearke Zaporožje zbog popravke dalekovoda

Premijer Severne Makedonije Mickoski ponovo ističe da neće podržati ustavne izmene bez jasnih garancija

Napadi ukrajinske vojske na ruske vojne ciljeve u poslednjim danima

Đukanović: Crna Gora ne treba incidente dok se približava članstvu u EU

Prva vakcina na svetu koju je osmislila veštačka inteligencija

Upozorenje UN: Pripremite se za El Ninjo, očekuje se jedan od najjačih ikada, slede ekstremne vremenske prilike

Rilmenidin: Lek protiv hipertenzije koji može usporiti starenje i produžiti život

Istraživanje pokazuje da bi obnavljanje DNK moglo usporiti proces starenja kod ljudi

Otkrivanje veštačke inteligencije OpenAI: Novi rezultat u matematici izaziva veliku pažnju

Požar u podzemnoj garaži na Zvezdari zahvatio nekoliko automobila

Teška povreda tokom karnevalske parade: helikopterom prebačena osoba u bolnicu

U Nišu pronađeno telo žene, sumnja se da je ubijena

Odbojkašice Srbije ubedljivo poražene od Kine u Ligi nacija

Finansijska podrška Crvenoj zvezdi i Partizanu: Istraživanje otkriva ključne podatke

Košarkaši Panatinaikosa pobedili Olimpijakos i izjednačili na 1:1 u finalu grčke lige

Ženska odbojkaška reprezentacija Srbije poražena od Poljske u Ligi nacija

Nemački teniser Aleksander Zverev plasirao se u finale Rolan Garosa

Sutra promenljivo sa kratkotrajnom kišom, temperatura do 30 stepeni

Danas promenljivo sa kišom i pljuskovima, temepratura do 29 stepeni

Pretežno sunčano i toplije, u večernjim satima naoblačenje i kiša

Pročitajte još