Ranije ove nedelje OpenAI je lansirao GPT-4o („o“ za „omni“), novu verziju sistema veštačke inteligencije (AI) koji pokreće popularni ChatGPT chatbot. GPT-4o se promoviše kao korak ka prirodnijem angažmanu sa AI. Prema demonstracionom video snimku, može da vodi glasovne razgovore sa korisnicima u skoro realnom vremenu, pokazujući ličnost i ponašanje poput čoveka.
Ovaj naglasak na ličnosti će verovatno biti predmet spora. U OpenAI-jevim demonstracijama, GPT-4o zvuči prijateljski, empatično i privlačno. Priča „spontane“ šale, kikoće se, flertuje, pa čak i peva. Sistem veštačke inteligencije takođe pokazuje da može da reaguje na govor tela i emocionalni ton korisnika.
Pokrenuta sa modernizovanim interfejsom, OpenAI-jeva nova verzija ChatGPT chat bota izgleda dizajnirana da poveća angažovanje korisnika i olakša kreiranje novih aplikacija na osnovu njegovih mogućnosti teksta, slike i zvuka.
GPT-4o je još jedan korak napred za razvoj veštačke inteligencije. Međutim, fokus na angažovanju i ličnosti postavlja važna pitanja o tome da li će zaista služiti interesima korisnika, kao i etičke implikacije stvaranja veštačke inteligencije koja može da simulira ljudske emocije i ponašanja.
OpenAI zamišlja GPT-4o kao prijatniju i privlačniju konverzacionu veštačku inteligenciju. U principu, ovo bi moglo učiniti interakcije efikasnijim i povećati zadovoljstvo korisnika.
Studije pokazuju da je veća verovatnoća da će korisnici verovati i sarađivati sa čet-botovima koji pokazuju društvenu inteligenciju i osobine ličnosti. Ovo bi se moglo pokazati relevantnim u oblastima kao što je obrazovanje, gde studije pokazuju da čatbotovi sa veštačkom inteligencijom mogu da poboljšaju rezultate učenja i motivaciju.
Međutim, neki komentatori brinu da korisnici mogu postati preterano vezani za AI sisteme sa ljudskim ličnostima ili emocionalno oštećeni jednosmernom prirodom interakcije između čoveka i računara.
„The Her effect“
GPT-4o je odmah inspirisao poređenja — uključujući i od šefa OpenAI Sema Altmana — sa naučno-fantastičnim filmom Her iz 2013. godine, koji daje živopisnu sliku potencijalnih zamki interakcije čoveka i AI.
U filmu, protagonista, Teodor, postaje duboko fasciniran i vezan za Samantu, sistem veštačke inteligencije sa sofisticiranom i duhovitom ličnošću. Njihova veza zamagljuje granice između stvarnog i virtuelnog, postavljajući pitanja o prirodi ljubavi i intimnosti i vrednosti veze između ljudi i AI.
Iako ne bi trebalo ozbiljno da poredimo GPT-4o sa Samantom, to izaziva slične zabrinutosti. AI saputnici su već ovde. Kako AI postaje sve veštija u oponašanju ljudskih emocija i ponašanja, povećava se rizik da korisnici formiraju duboke emocionalne vezanosti. To može dovesti do preteranog oslanjanja, manipulacije, pa čak i štete.
Dok OpenAI pokazuje zabrinutost da se njegovi alati za veštačku inteligenciju ponašaju bezbedno i da se primenjuju na odgovoran način, tek treba da naučimo šire implikacije oslobađanja harizmatične veštačke inteligencije na svet. Trenutni sistemi veštačke inteligencije nisu eksplicitno dizajnirani da zadovolje ljudske psihološke potrebe – cilj koji je teško definisati i izmeriti.
Impresivne mogućnosti GPT-4o pokazuju koliko je važno da imamo neki sistem ili okvir za obezbeđivanje AI alata da se razvijaju i koriste na načine koji su usklađeni sa javnim vrednostima i prioritetima.
GPT-4o takođe može da radi sa video zapisima (korisnika i njegovog okruženja, preko kamere uređaja ili unapred snimljenih video snimaka) i da odgovara u razgovoru. U demonstracijama OpenAI, GPT-4o komentariše okruženje i odeću korisnika, prepoznaje objekte, životinje i tekst i reaguje na izraze lica.
Google-ov Project Astra AI asistent, predstavljen samo jedan dan nakon GPT-4o, pokazuje slične mogućnosti. Takođe se čini da ima vizuelno pamćenje: u jednom od Google-ovih promotivnih videa, pomaže korisniku da pronađe svoje naočare u užurbanoj kancelariji, iako trenutno nisu vidljive AI.
GPT-4o i Astra nastavljaju trend ka više „multimodalnim“ modelima koji mogu da rade sa tekstom, slikama, audio i video zapisima. Prethodnik GPT-4o, GPT-4 Turbo, može da obrađuje tekst i slike zajedno, ali ne i audio i video. Originalna verzija ChatGPT-a, objavljena pre manje od dve godine, bila je zasnovana samo na tekstu.
GPT-4o je takođe značajno brži od svog prethodnika.
Sposobnost rada preko zvuka, vizije i teksta u realnom vremenu smatra se ključnom za razvoj naprednih AI sistema koji mogu da razumeju svet i efikasno postignu složene i smislene ciljeve.
Ali neki kritičari tvrde da su mogućnosti teksta GPT-4o samo postepeno bolje od GPT-4 Turbo i konkurenata kao što su Google Gemini Ultra i Anthropic Claude 3 Opus.
Da li će glavne laboratorije veštačke inteligencije moći da održe nedavni brzi tempo poboljšanja tako što će nastaviti da prave veće i sofisticiranije modele? Ovo je vruća tema debate među stručnjacima, a ishod će odrediti uticaj tehnologije u narednim godinama.
Manje blistav, ali značajan aspekt lansiranja GPT-4o je to što je, za razliku od njegovih prethodnika iz porodice GPT-4, novi AI sistem dostupan svim korisnicima u besplatnoj verziji ChatGPT-a, podložno ograničenjima upotrebe.
To znači da su milioni korisnika širom sveta upravo dobili nadogradnju sa GPT-3.5 na moćniji AI sistem sa više funkcija. GPT-4o je znatno korisniji od GPT-3.5 za različite svrhe, kao što su rad i obrazovanje. Uticaj ovog razvoja će vremenom postati očigledniji.
OpenAI-jevo otkrivanje GPT-4o razočaralo je entuzijaste za sve moćnije AI sisteme, koji su se nadali da će dolazak GPT-5 biti neizbežan nakon više od godinu dana od lansiranja GPT-4.
Umesto toga, ovonedeljno otkrivanje GPT-4o i najnovije Google-ove AI najave naglašavaju karakteristike koje su ugrađene u njihove proizvode. Ovi novi razvoji ukazuju na mogućnosti kao što su sofisticiraniji virtuelni asistenti sposobni da obavljaju složene zadatke u ime korisnika, uključujući bogatiju interakciju i planiranje.