Da bismo se probili kroz svet, naš mozak mora da razvije intuitivno razumevanje fizičkog sveta oko nas, koji onda koristimo za tumačenje senzornih informacija koje dolaze u mozak.
Kako mozak razvija to intuitivno razumevanje? Mnogi naučnici veruju da može da koristi proces sličan onome što je poznato kao „samokontrolisano učenje“. Ova vrsta mašinskog učenja, prvobitno razvijena kao način da se kreiraju efikasniji modeli za kompjuterski vid, omogućava računarskim modelima da uče o vizuelnim scenama isključivo na osnovu sličnosti i razlika između njih, bez oznaka ili drugih informacija.
Par studija istraživača iz Centra za integrativnu računarsku neuronauku K. Lise Iang (ICoN) na MIT-u nudi nove dokaze koji podržavaju ovu hipotezu. Istraživači su otkrili da kada su obučavali modele poznate kao neuronske mreže koristeći određeni tip samonadgledanog učenja, rezultujući modeli su generisali obrasce aktivnosti veoma slične onima koji se vide u mozgovima životinja koje su obavljale iste zadatke kao i modeli.
Nalazi sugerišu da su ovi modeli u stanju da nauče predstave fizičkog sveta koje mogu da koriste da naprave tačna predviđanja o tome šta će se desiti u tom svetu i da mozak sisara možda koristi istu strategiju, kažu istraživači.
„Tema našeg rada je da veštačka inteligencija dizajnirana da pomogne u izgradnji boljih robota na kraju bude i okvir za bolje razumevanje mozga uopšte“, kaže Aran Najebi, postdoktor u ICoN centru. „Još ne možemo reći da li je to ceo mozak, ali na skalama i različitim delovima mozga, čini se da naši rezultati ukazuju na princip organizacije.
Najebi je vodeći autor jedne od studija, u koautorstvu sa Rišijem Rajalinghamom, bivšim postdoktorom MIT-a sada u Meta Realiti Labs, i starijim autorima Mehrdadom Džazajerijem, vanrednim profesorom mozga i kognitivnih nauka i članom McGovern Instituta za istraživanje mozga; i Robert Jang, docent za mozak i kognitivne nauke i pridruženi član McGovern instituta.
Ila Fiete, direktor ICoN centra, profesor mozga i kognitivnih nauka i pridruženi član McGovern instituta, viši je autor druge studije, koju je zajedno vodio Mikail Khona, diplomirani student MIT-a i Rilan Schaeffer, bivši viši naučni saradnik na MIT-u.
Obe studije će biti predstavljene na Konferenciji o neuronskim sistemima za obradu informacija (NeurIPS) 2023. u decembru.
Rani modeli kompjuterskog vida uglavnom su se oslanjali na nadgledano učenje. Koristeći ovaj pristup, modeli se obučavaju da klasifikuju slike od kojih je svaka označena imenom—mačka, auto, itd. Dobijeni modeli dobro funkcionišu, ali ova vrsta obuke zahteva mnogo podataka označenih ljudima.
Da bi stvorili efikasniju alternativu, poslednjih godina istraživači su se okrenuli modelima izgrađenim kroz tehniku poznatu kao kontrastno samonadgledano učenje. Ova vrsta učenja omogućava algoritmu da nauči da klasifikuje objekte na osnovu toga koliko su slični jedni drugima, bez davanja spoljnih oznaka.
„Ovo je veoma moćan metod jer sada možete iskoristiti veoma velike moderne skupove podataka, posebno video zapise, i zaista otključati njihov potencijal“, kaže Najebi. „Mnogo moderne veštačke inteligencije koju sada vidite, posebno u poslednjih nekoliko godina sa ChatGPT i GPT-4, rezultat je obuke samonadzirane funkcije cilja na velikom skupu podataka kako bi se dobila veoma fleksibilna reprezentacija.
Ove vrste modela, koje se nazivaju i neuronske mreže, sastoje se od hiljada ili miliona procesorskih jedinica povezanih jedna sa drugom. Svaki čvor ima veze različite jačine sa drugim čvorovima u mreži. Kako mreža analizira ogromne količine podataka, snage tih veza se menjaju kako mreža uči da obavlja željeni zadatak.
Kako model obavlja određeni zadatak, mogu se meriti obrasci aktivnosti različitih jedinica unutar mreže. Aktivnost svake jedinice može biti predstavljena kao obrazac pokretanja, sličan obrascima pokretanja neurona u mozgu. Prethodni rad Najebija i drugih pokazao je da samonadgledani modeli vida stvaraju aktivnost sličnu onoj koja se vidi u sistemu vizuelne obrade mozga sisara. Kredit: Massachusetts Institute of Technologi
U obe nove NeurIPS studije, istraživači su krenuli da istraže da li kompjuterski modeli drugih kognitivnih funkcija pod samonadzorom mogu takođe pokazati sličnosti sa mozgom sisara. U studiji koju je vodio Najebi, istraživači su obučavali modele sa samonadzorom da predvide buduće stanje svog okruženja kroz stotine hiljada naturalističkih video zapisa koji prikazuju svakodnevne scenarije.
„U poslednjoj deceniji ili tako nešto, dominantna metoda za izgradnju modela neuronskih mreža u kognitivnoj neuronauci je obučavanje ovih mreža na pojedinačnim kognitivnim zadacima. Ali modeli obučeni na ovaj način retko se generalizuju na druge zadatke“, kaže Jang. „Ovde testiramo da li možemo da izgradimo modele za neki aspekt saznanja tako što ćemo prvo trenirati na naturalističkim podacima koristeći samokontrolisano učenje, a zatim proceniti u laboratorijskim postavkama.
Kada je model bio obučen, istraživači su ga generalizovali na zadatak koji su zvali „Mental-Pong“. Ovo je slično video igrici Pong, gde igrač pomera veslo da bi udario loptu koja putuje preko ekrana. U verziji Mental-Pong, lopta nestaje neposredno pre nego što udari u veslo, tako da igrač mora da proceni njenu putanju da bi udario loptu.
Istraživači su otkrili da je model bio u stanju da prati putanju skrivene lopte sa tačnošću sličnom onoj neurona u mozgu sisara, što je pokazano u prethodnoj studiji Rajalinghama i Jazaierija da simulira njenu putanju – kognitivni fenomen poznat kao „mentalni simulacija“. Štaviše, obrasci neuronske aktivacije koji se vide u okviru modela bili su slični onima koji se vide u mozgu životinja dok su igrale igru – konkretno, u delu mozga koji se zove dorsomedijalni frontalni korteks. Nijedna druga klasa računarskog modela nije bila u stanju da uporedi biološke podatke tako blisko kao ova, kažu istraživači.
„Postoji mnogo napora u zajednici mašinskog učenja da se stvori veštačka inteligencija“, kaže Jazaieri. „Relevantnost ovih modela za neurobiologiju zavisi od njihove sposobnosti da dodatno zahvate unutrašnje funkcionisanje mozga. Činjenica da Aranov model predviđa neuronske podatke je zaista važna jer sugeriše da se možda približavamo izgradnji veštačkih sistema koji oponašaju prirodnu inteligenciju .“
Studija koju su vodili Khona, Schaeffer i Fiete fokusirala se na vrstu specijalizovanih neurona poznatih kao ćelije mreže. Ove ćelije, koje se nalaze u entorhinalnom korteksu, pomažu životinjama da se kreću, radeći zajedno sa ćelijama mesta koje se nalaze u hipokampusu.
Dok se ćelije mesta pale kad god se životinja nalazi na određenoj lokaciji, ćelije mreže se pale samo kada se životinja nalazi na jednom od vrhova trouglaste rešetke. Grupe ćelija mreže stvaraju preklapajuće rešetke različitih veličina, što im omogućava da kodiraju veliki broj pozicija koristeći relativno mali broj ćelija.
U nedavnim studijama, istraživači su obučili nadgledane neuronske mreže da oponašaju funkciju ćelija mreže predviđajući sledeću lokaciju životinje na osnovu njene početne tačke i brzine, što je zadatak poznat kao integracija putanje. Međutim, ovi modeli su zavisili od pristupa privilegovanim informacijama o apsolutnom prostoru u svakom trenutku – informacijama koje životinja nema.
Inspirisan upečatljivim svojstvima kodiranja multiperiodične mreže-ćelije koda za prostor, MIT tim je obučio kontrastni samonadgledani model kako bi izvršio ovaj isti zadatak integracije putanje i efikasno predstavio prostor dok to radi. Za podatke o obuci koristili su sekvence unosa brzine. Model je naučio da razlikuje pozicije na osnovu toga da li su slične ili različite — obližnje pozicije su generisale slične kodove, ali dalje pozicije su generisale više različitih kodova.
„To je slično modelima obuke na slikama, gde ako su dve slike obe glave mačaka, njihovi kodovi bi trebalo da budu slični, ali ako je jedna glava mačke, a druga kamion, onda želite da se njihovi kodovi odbijaju“, Khona kaže. „Preuzimamo istu ideju, ali je primenjujemo na prostorne putanje.“
Kada je model bio obučen, istraživači su otkrili da obrasci aktivacije čvorova unutar modela formiraju nekoliko rešetkastih obrazaca sa različitim periodima, veoma sličnim onima koje formiraju ćelije mreže u mozgu.
„Ono što me oduševljava u vezi sa ovim radom je to što uspostavlja veze između matematičkog rada na upečatljivim informacijsko-teorijskim svojstvima mrežnog ćelijskog koda i izračunavanja integracije staza“, kaže Fiete. „Dok je matematički rad bio analitičan – koja svojstva poseduje kod ćelije mreže? – pristup optimizacije efikasnosti kodiranja kroz samonadgledano učenje i dobijanje podešavanja sličnog mreži je sintetički: pokazuje koja svojstva mogu biti neophodna i dovoljna da se objasni zašto mozak ima ćelije mreže“.