Nova studija otkriva ograničenja GPT-4 u razumevanju analogija

Nova studija otkriva ograničenja GPT-4 u razumevanju analogija

Istraživači sa Univerziteta u Amsterdamu i Instituta Santa Fe analizirali su sposobnost GPT-4 i drugih velikih jezičkih modela u rešavanju analognog rezonovanja, otkrivajući značajne slabosti u njihovom razumevanju apstraktnih koncepata. Studija, objavljena u Transactions on Machine Learning Research, pokazuje da iako AI može uspešno rešiti standardne analogne zadatke, njegovi rezultati značajno opadaju kada se problemi modifikuju.

Analogno rezonovanje je ključna sposobnost ljudske spoznaje, koja omogućava prepoznavanje sličnosti između različitih pojmova i situacija. Istraživači su uporedili učinak ljudi i AI modela na tri vrste analitičkih problema, uključujući numeričke matrice i analogije priča. Dok su ljudi zadržali visoke performanse čak i kada su zadaci promenjeni, GPT modeli su pokazali znatno slabiju fleksibilnost, često se oslanjajući na obrasce iz podataka umesto na dublje razumevanje.

Na primer, u zadacima sa cifrenim matricama, AI se mučio kada je promenjena pozicija nedostajućeg broja, dok su ljudi lako prepoznali logiku problema. U analognim pričama, GPT-4 je često birao prvi ponuđeni odgovor, dok su ljudi bili manje podložni ovom faktoru. Promena ključnih elemenata priča dodatno je smanjila tačnost modela, što sugeriše da se AI više oslanja na površinske sličnosti nego na dublju uzročnu analizu.

Zaključak studije naglašava da, iako AI može pokazati impresivne rezultate, to ne znači da zaista razume informacije na način na koji to rade ljudi. Ograničena sposobnost generalizacije na varijacije problema postavlja važno pitanje o pouzdanosti AI u oblastima kao što su obrazovanje, pravo i zdravstvena zaštita.

„Ovo je ključno upozorenje za primenu veštačke inteligencije u donošenju odluka“, ističu autori studije. „AI modeli mogu biti moćni alati, ali još uvek nisu zamena za ljudsko rezonovanje i kritičko mišljenje.“