DALL-E mini: Kada se mašinsko učenje spoji sa umetnošću

DALL-E mini: Kada se mašinsko učenje spoji sa umetnošću

DALL-E mini je veštačka inteligencija koja oživljava sva glupa pitanja „šta ako“ koja nikada niste postavili: Šta ako je Voldemort bio član Green Day-a? Šta ako postoji McDonald’s u Mordoru? Šta ako su naučnici poslali Roombu na dno Marijanskog rova?

Ne morate više da se pitate kako bi izgledala Roomba koja čisti dno Marijanskog rova. DALL-E mini vam može pokazati.

DALL-E mini je onlajn generator teksta u sliku koji je eksplodirao u popularnosti na društvenim medijima poslednjih nedelja.

Program uzima tekstualnu frazu — kao što je „zalazak sunca na planini“, „Ajfelova kula na mesecu“, „Obama pravi zamak od peska“ ili bilo šta drugo što možete zamisliti — i stvara sliku od toga.

Rezultati mogu biti čudno lepi, kao „sinthvave buddha“ ili „grumen piletine koji puši cigaretu na kiši“. Drugi, poput „Teletubiji u staračkom domu“, su zaista zastrašujući.

DALL-E mini je stekao popularnost na internetu nakon što su korisnici društvenih medija počeli da koriste program za mešanje prepoznatljivih ikona pop kulture u bizarne, fotorealistične meme.

Boris Dajma, kompjuterski inženjer iz Teksasa, prvobitno je kreirao DALL-E mini kao prijavu za takmičenje u kodiranju. Daima-in program je dobio ime po veštačkoj inteligenciji na kojoj je zasnovan: Inspirisan neverovatno moćnim DALL-E kompanije OpenAI kompanije za veštačku inteligenciju, DALL-E mini je u osnovi veb aplikacija koja primenjuje sličnu tehnologiju na lakše dostupan način. (Daima je od tada preimenovala DALL-E mini u Craiion na zahtev kompanije).

Dok OpenAI ograničava većinu pristupa svojim modelima, Dajmin model može da koristi svako na internetu, a razvijen je u saradnji sa istraživačkim zajednicama veštačke inteligencije na Tviteru i GitHubu.

„Dobio bih zanimljive povratne informacije i sugestije od AI zajednice“, rekao je Dajma za NPR preko telefona. „I postao je bolji, i bolji, i bolji“ u generisanju slika, sve dok nije dostigao ono što je Dejma nazvao „virusnim pragom“.

Dok slike koje DALL-E mini proizvodi i dalje mogu izgledati izobličene ili nejasne, Daima kaže da je dostigla tačku u kojoj su slike dovoljno dobre i da su dosegle dovoljno široku publiku, da su uslovi bili pravi da projekat postane viralan.

Iako je DALL-E mini jedinstven po svojoj širokoj dostupnosti, ovo nije prvi put da je umetnost generisana veštačkom inteligencijom u vestima.

Godine 2018, aukcijska kuća umetnosti Christie’s prodala je portret generisan veštačkom inteligencijom za više od 400.000 dolara.

Ziv Epstein, istraživač u Human Dinamics Group MIT Media Lab-a, kaže da napredak AI generatora slika komplikuje pojmove vlasništva u umetničkoj industriji.

U slučaju modela sa mašinskim učenjem kao što je DALL-E mini, postoje brojne zainteresovane strane koje treba uzeti u obzir kada se razmatra ko treba da dobije kredit za stvaranje umetničkog dela.

„Ovi alati su ovi difuzni društveno-tehnički sistemi“, rekao je Epstein za NPR. „[Generacija AI umetnosti je] komplikovano uređenje ljudskih aktera i računarskih procesa koji međusobno deluju na ovaj ludi način.“

Prvo, tu su koderi koji su kreirali model.

Za DALL-E mini, to je prvenstveno Daima, ali i članovi zajednice AI otvorenog koda koji su sarađivali na projektu. Zatim tu su vlasnici slika na kojima je AI obučena — Daima je koristila postojeću biblioteku slika za podešavanje modela, u suštini podučavajući program kako da prevodi tekst u slike.

Konačno, tu je korisnik koji je smislio tekstualni upit — poput „CCTV snimaka Darta Vejdera koji krade monocikl“ — za DALL-E mini. Tako da je teško reći ko tačno „posjeduje“ ovu sliku Gambija koji izvodi koncert NPR Tini Desk-a.

Neki programeri takođe brinu o etičkim implikacijama generatora AI medija.

Duboki fajkovi, često ubedljive primene modela mašinskog učenja za prikazivanje lažnih slika političara ili poznatih ličnosti, su glavna briga softverskog inženjera Džejmsa Betkera.

Betker je tvorac Tortoise, programa za pretvaranje teksta u govor koji implementira neke od najnovijih tehnika mašinskog učenja za generisanje govora na osnovu referentnog glasa.

U početku je započeo Tortoise kao sporedni projekat, Betker je rekao da nije motivisan da nastavi da ga razvija zbog moguće zloupotrebe.

„To je ono zbog čega sam apsolutno zabrinut — ljudi koji pokušavaju da nateraju političare da kažu stvari koje zapravo nisu rekli, ili čak daju izjave pod zakletvom koje iznosite na sud… [koje su] potpuno lažne“, rekao je Betker za NPR.

Ali dostupnost AI projekata otvorenog koda kao što su Daima’s i Betker’s takođe je proizvela neke pozitivne efekte. Kornjača je programerima koji ne mogu priuštiti angažovanje glasovnih glumaca dala način da kreiraju realističan glas za svoje projekte. Slično tome, Daima je rekla da su mala preduzeća koristila DALL-E mini za generisanje grafike kada nisu mogla da priušte angažovanje dizajnera.

Sve veća dostupnost AI alata takođe može pomoći ljudima da se upoznaju sa potencijalnim pretnjama medija koje generiše veštačka inteligencija. Dajmi i Betkeru, dostupnost njihovih projekata jasno stavlja do znanja ljudima da brzo napreduju mogućnosti veštačke inteligencije i njene sposobnosti da širi dezinformacije.

Epštajn sa MIT-a je rekao isto: „Ako su ljudi u stanju da komuniciraju sa veštačkom inteligencijom i na neki način i sami budu kreatori, to ih na neki način možda štiti od dezinformacija.