Kada čovek uoči poznato lice ili vozilo koje dolazi, mozgu je potrebno samo 100 milisekundi (oko jedne desetine sekunde) da ga identifikuje i, što je još važnije, postavi ga u pravi kontekst kako bi se moglo razumeti, a pojedinac može da reaguje u skladu sa tim.
Nije iznenađujuće da računari mogu to da urade brže, ali da li su tačni kao ljudi u stvarnom svetu? Ne uvek, i to je problem, prema studiji koju je vodila zapadni stručnjak za neuroimage Marieke Mur.
Računari se mogu naučiti da obrađuju dolazne podatke, poput posmatranja lica i automobila, koristeći veštačku inteligenciju poznatu kao duboke neuronske mreže ili duboko učenje. Ovaj tip procesa mašinskog učenja koristi međusobno povezane čvorove ili neurone u slojevitoj strukturi koja podseća na ljudski mozak.
Ključna reč je „sliči“ jer kompjuteri, uprkos moći i obećanjima dubokog učenja, tek treba da savladaju ljudske proračune i, što je najvažnije, komunikaciju i vezu između tela i mozga, posebno kada je u pitanju vizuelno prepoznavanje.
„Iako obećavajuće, duboke neuronske mreže su daleko od toga da budu savršeni računarski modeli ljudskog vida“, rekao je Mur, zapadni profesor koji je zajedno imenovan na odeljenjima psihologije i računarstva.
Prethodne studije su pokazale da duboko učenje ne može savršeno da reprodukuje ljudsko vizuelno prepoznavanje, ali malo njih je pokušalo da utvrdi koje aspekte ljudskog vida duboko učenje ne uspeva da oponaša.
Tim je koristio neinvazivni medicinski test pod nazivom magnetoencefalografija (MEG) koji meri magnetna polja proizvedena električnim strujama mozga. Koristeći MEG podatke dobijene od ljudskih posmatrača tokom posmatranja objekata, Mur i njeni međunarodni saradnici otkrili su jednu ključnu tačku neuspeha. Otkrili su da delovi objekata koji se lako mogu imenovati, kao što su „oko“, „točak“ i „lice“, mogu objasniti varijaciju u ljudskoj neuronskoj dinamici iznad onoga što duboko učenje može da pruži.
„Ovi nalazi sugerišu da se duboke neuronske mreže i ljudi mogu delimično oslanjati na različite karakteristike objekata za vizuelno prepoznavanje i daju smernice za poboljšanje modela“, rekao je Mur.
Studija pokazuje da duboke neuronske mreže ne mogu u potpunosti da uzmu u obzir neuronske odgovore merene kod ljudskih posmatrača dok pojedinci gledaju fotografije objekata, uključujući lica i životinje, i ima velike implikacije za upotrebu modela dubokog učenja u okruženju u stvarnom svetu, kao što je samo- upravljanje vozilima.
„Ovo otkriće daje naznake o tome šta neuronske mreže ne uspevaju da razumeju na slikama, naime vizuelne karakteristike koje ukazuju na ekološki relevantne kategorije objekata kao što su lica i životinje“, rekao je Mur. „Predlažemo da se neuronske mreže mogu poboljšati kao modeli mozga dajući im iskustvo učenja više nalik ljudskom, poput režima obuke koji jače naglašava pritiske ponašanja kojima su ljudi izloženi tokom razvoja.
Na primer, za ljude je važno da brzo identifikuju da li je objekat životinja koja se približava ili ne, i ako jeste, da predvide njegov sledeći posledični potez. Integrisanje ovih pritisaka tokom treninga može imati koristi od mogućnosti pristupa dubokog učenja za modeliranje ljudske vizije.