Poboljšanje AI velikih jezičkih modela pomaže im da se bolje usklade sa ljudskom moždanom aktivnošću

Poboljšanje AI velikih jezičkih modela pomaže im da se bolje usklade sa ljudskom moždanom aktivnošću

Generativna veštačka inteligencija (GenAI) je u poslednjih nekoliko godina promenila pejzaž društvenih interakcija. Veliki jezički modeli (LLM) su postali centralni deo pažnje, koristeći algoritme dubokog učenja za treniranje GenAI platformi za obradu jezika.

Studija sprovedena na Politehničkom univerzitetu u Hong Kongu otkrila je da LLM funkcionišu sličnije ljudskom mozgu kada su obučeni na načine koji oponašaju ljudski jezik. Ovo je pružilo dragocene uvide u proučavanje mozga i razvoj modela veštačke inteligencije.

Trenutni LLM uglavnom se oslanjaju na kontekstualno predviđanje reči kao osnovnu strategiju obuke. Iako jednostavna, ova strategija je postigla iznenađujući uspeh zahvaljujući velikim skupovima podataka i parametrima modela, što je vidljivo u popularnim LLM poput ChatGPT.

Nedavna istraživanja ukazuju da predviđanje reči u LLM može poslužiti kao model za razumevanje ljudske obrade jezika. Međutim, ljudi ne samo predviđaju sledeću reč, već integrišu informacije visokog nivoa za razumevanje prirodnog jezika.

Profesor Li Ping sa Politehničkog univerziteta vođen je istraživačkim timom koji je istraživao zadatak predviđanja sledeće rečenice (NSP), simulirajući proces razumevanja na nivou diskursa u ljudskom mozgu. Njihovo istraživanje je objavljeno u časopisu Science Advances.

Kroz obuku dva modela, jednog sa NSP poboljšanjem i drugog bez, istraživači su prikupili podatke funkcionalne magnetne rezonance od osoba koje su čitale povezane i nepovezane rečenice. Uporedili su obrasce iz modela sa obrascima mozga iz fMRI podataka.

Rezultati su pokazali da obuka sa NSP donosi koristi. Model sa NSP-om se pokazao efikasnijim u oponašanju ljudske moždane aktivnosti u poređenju sa modelom obučenim samo na predviđanju reči. Osim toga, njegov mehanizam je uspešno simulirao neuronske obrasce razumevanja ljudskog diskursa.

Ovi rezultati pružaju nove uvide u način na koji ljudski mozak obrađuje kompletan diskurs, poput razgovora. Na primer, delovi desne strane mozga, a ne samo leve, pokazali su značajnu ulogu u razumevanju dužeg diskursa. Model obučen sa NSP je takođe pokazao sposobnost predviđanja brzine čitanja, što ukazuje da je simulacija razumevanja diskursa kroz NSP pomogla veštačkoj inteligenciji da bolje razume ljudsko ponašanje.

Profesor Li Ping ističe da napredak u oblasti veštačke inteligencije ne sme biti ograničen samo na skaliranje podataka, već bi trebalo usmeriti napore na efikasnost modela, koristeći manje podataka. Njihovi nalazi sugerišu da različiti zadaci učenja, poput NSP, mogu unaprediti LLM da bude bliži ljudskom modelu i potencijalno približiti veštačku inteligenciju ljudskoj.

Osim toga, istraživači su istakli da neurokognitivni istraživači mogu koristiti LLM za proučavanje jezičkih mehanizama višeg nivoa u ljudskom mozgu, te da će saradnja između istraživača iz oblasti veštačke inteligencije i neurokognicije rezultirati budućim studijama zasnovanim na veštačkoj inteligenciji o mozgu, kao i studijama inspirisanim veštačkom inteligencijom.