Korišćenje neuronskih mreža za predviđanje načina na koji mozak obrađuje prirodne zvukove

Korišćenje neuronskih mreža za predviđanje načina na koji mozak obrađuje prirodne zvukove

Poslednjih godina, tehnike mašinskog učenja su ubrzale i inovirale istraživanja u brojnim oblastima, uključujući neuronauku. Identifikovanjem obrazaca u eksperimentalnim podacima, ovi modeli bi, na primer, mogli da predvide neuronske procese povezane sa specifičnim iskustvima ili sa obradom senzornih stimulusa.

Istraživači sa CNRS-a i Univerziteta Eks-Marsej i Univerziteta u Mastrihtu nedavno su pokušali da koriste računarske modele da predvide kako ljudski mozak transformiše zvukove u semantičke reprezentacije onoga što se dešava u okruženju. Njihov rad, objavljen u Nature Neuroscience, pokazuje da bi neki modeli zasnovani na dubokim neuronskim mrežama (DNN) mogli biti bolji u predviđanju neuronskih procesa iz neuroimaginga i eksperimentalnih podataka.

„Naš glavni interes je da napravimo numerička predviđanja o tome kako se prirodni zvuci percipiraju i predstavljaju u mozgu, i da koristimo računarske modele da bismo razumeli kako transformišemo čujni akustični signal u semantičku predstavu objekata i događaja u slušnom okruženju“, Bruno Đordano, jedan od istraživača koji su sproveli studiju, rekao je za Medical Kspress. „Jedna velika prepreka ovome nije nedostatak računarskih modela – novi modeli se redovno objavljuju – već nedostatak sistematskih poređenja njihove sposobnosti da uzmu u obzir podatke o ponašanju ili neuroimadžingu.

Ključni cilj nedavnog rada Đordana i njegovih kolega bio je da sistematski uporede performanse različitih računarskih modela u predviđanju neuronskih reprezentacija prirodnih zvukova. U svojim eksperimentima, tim je procenio tri klase računarskih modela, naime akustičke, semantičke i DNN-ove od zvuka do događaja.

„Počeli smo da razgovaramo o potrebi sprovođenja sistematskog poređenja računarskih modela tokom prvih meseci pandemije COVID-a“, objasnio je Đordano. „Posle nekoliko daljinskih sesija razmišljanja, shvatili smo da već imamo podatke koji su nam potrebni da odgovorimo na naše pitanje: skup podataka o ponašanju prikupljen 2009. sa 20 kanadskih učesnika koji su procenili uočenu različitost skupa od 80 prirodnih zvukova i fMRI skup podataka prikupljen 2016. sa pet holandskih učesnika koji su čuli drugačiji skup od 288 prirodnih zvukova dok smo snimali njihove fMRI odgovore.“

Bez potrebe da prikupljaju nove podatke u laboratoriji, istraživači su stoga krenuli da testiraju performanse tri pristupa računarskog modeliranja koje su odabrali koristeći podatke prikupljene u prethodnim eksperimentima. Konkretno, oni su mapirali zvučne stimuluse koji su predstavljeni ljudskim učesnicima na različite računarske modele, a zatim izmerili stepen do kojeg su mogli da predvide kako su učesnici odgovorili na stimuluse i šta se dogodilo u njihovom mozgu.

„Bili smo zapanjeni u kojoj meri su DNN-ovi zvuka i događaja koji je nedavno razvio Google nadmašili konkurentske akustičke i semantičke modele“, rekao je Đordano. „Oni su tako dobro predvideli naše podatke o ponašanju i fMRI da bismo mapiranjem zvukova na DNN mogli da predvidimo ponašanje naših kanadskih učesnika iz 2009. iz fMRI odgovora holandskih učesnika iz 2016, čak i ako su zvuci koje su čuli bili potpuno drugačiji.

Giordano i njegove kolege su otkrili da su modeli zasnovani na DNN-u uveliko nadmašili oba računarska pristupa zasnovana na akustici i tehnikama koje karakterišu cerebralne odgovore na zvukove stavljajući ih u različite kategorije (npr. glasovi, ulični zvuci, itd.). U poređenju sa ovim tradicionalnijim računarskim pristupima, DNN-ovi mogu predvideti neuronsku aktivnost i ponašanje učesnika sa znatno većom tačnošću.

Na osnovu svojih zapažanja i rezultata koje su proizveli modeli zasnovani na DNN-u, istraživači su takođe pretpostavili da ljudski mozak ima smisao za prirodne zvukove na sličan način na koji obrađuje reči. Dok se značenje reči zaključuje obradom pojedinačnih slova, pojava i slogova, značenje zvukova se može izdvojiti kombinovanjem različitih skupova elementarnih jedinica.

„Sada radimo na prikupljanju novih podataka o neuroima za testiranje specifičnih hipoteza koje je naša studija iznela o tome šta bi mogle biti ove elementarne jedinice“, dodao je Elia Formisano. „Takođe radimo na obuci novih i više ‘mozak’ neuronskih mreža za obradu prirodnih zvukova. Na primer, naš koautor, Michele Esposito, razvio je neuronsku mrežu koja uči numeričke reprezentacije verbalnih deskriptora zvuka (semantička ugradnja) , umesto kategorija zvučnih događaja. Ova mreža, postavljena da bude predstavljena na Međunarodnoj konferenciji o akustici, govoru i obradi signala (ICASSP) 2023, nadmašuje Google-ove mreže u predviđanju prirodne percepcije zvuka.“