AI može da dekodira govor iz moždane aktivnosti sa iznenađujućom tačnošću

Veštačka inteligencija može da dekodira reči i rečenice iz moždane aktivnosti sa iznenađujućom – ali još uvek ograničenom – tačnošću. Koristeći samo nekoliko sekundi podataka o aktivnosti mozga, AI pogađa šta je osoba čula. On navodi tačan odgovor u svojih 10 najboljih mogućnosti do 73 posto vremena, otkrili su istraživači u preliminarnoj studiji.

„Učinak veštačke inteligencije bio je iznad onoga što su mnogi ljudi mislili da je moguće u ovoj fazi“, kaže Đovani Di Liberto, kompjuterski naučnik na Triniti koledžu u Dablinu koji nije bio uključen u istraživanje.

Razvijena u matičnoj kompaniji Facebook-a, Meta, AI bi na kraju mogla da se koristi za pomoć hiljadama ljudi širom sveta koji nisu u stanju da komuniciraju govorom, kucanjem ili gestovima, izveštavaju istraživači 25. avgusta na arKsiv.org. To uključuje mnoge pacijente u minimalno svesnim, zaključanim ili „vegetativnim stanjima“ – što je danas opšte poznato kao sindrom budnosti bez reakcije.

Većina postojećih tehnologija koje pomažu takvim pacijentima da komuniciraju zahtevaju rizične operacije mozga za implantaciju elektroda. Ovaj novi pristup „mogao bi da obezbedi održiv put da se pomogne pacijentima sa komunikacijskim deficitom… bez upotrebe invazivnih metoda“, kaže neuronaučnik Žan-Remi King, istraživač Meta AI koji trenutno radi na Ecole Normale Superieure u Parizu.

King i njegove kolege obučili su računarski alat za otkrivanje reči i rečenica na 56.000 sati govornih snimaka sa 53 jezika. Alat, takođe poznat kao jezički model, naučio je kako da prepozna specifične karakteristike jezika kako na finom nivou – razmišljanje o slovima ili slogovima – tako i na širem nivou, kao što su reč ili rečenica.

Tim je primenio AI sa ovim jezičkim modelom na baze podataka iz četiri institucije koje su uključivale moždanu aktivnost 169 volontera. U ovim bazama podataka, učesnici su slušali različite priče i rečenice iz, na primer, „Starac i more“ Ernesta Hemingveja i „Alise u zemlji čuda“ Luisa Kerola, dok su mozgovi ljudi skenirani pomoću magnetoencefalografije ili elektroencefalografije. Te tehnike mere magnetnu ili električnu komponentu moždanih signala.

Zatim, uz pomoć računarske metode koja pomaže u obračunu fizičkih razlika između stvarnih mozgova, tim je pokušao da dekodira ono što su učesnici čuli koristeći samo tri sekunde podataka o moždanoj aktivnosti svake osobe. Tim je naložio veštačkoj inteligenciji da uskladi zvuke govora iz snimaka priča sa obrascima moždane aktivnosti koje je AI izračunao kao da odgovaraju onome što ljudi čuju. Zatim je napravio predviđanja o tome šta je osoba možda čula tokom tog kratkog vremena, s obzirom na više od 1.000 mogućnosti.

Koristeći magnetoencefalografiju ili MEG, tačan odgovor je bio u 10 najboljih pretpostavki AI do 73 posto vremena, otkrili su istraživači. Kod elektroencefalografije ta vrednost je pala na ne više od 30 odsto. „[Taj MEG] učinak je veoma dobar“, kaže Di Liberto, ali je manje optimističan u pogledu njegove praktične upotrebe. „Šta možemo s tim? Ništa. Apsolutno ništa.“

Razlog je, kaže, taj što MEG zahteva glomaznu i skupu mašinu. Dovođenje ove tehnologije u klinike zahtevaće naučne inovacije koje mašine čine jeftinijim i lakšim za korišćenje.

Takođe je važno razumeti šta „dekodiranje“ zaista znači u ovoj studiji, kaže Džonatan Brenan, lingvista sa Univerziteta Mičigen u En Arboru. Reč se često koristi da opiše proces dešifrovanja informacija direktno iz izvora — u ovom slučaju, govora iz moždane aktivnosti. Ali veštačka inteligencija je to mogla da uradi samo zato što joj je obezbeđena konačna lista mogućih tačnih odgovora da bi mogla da nagađa.

„Što se tiče jezika, to ga neće smanjiti ako želimo da ga proširimo na praktičnu upotrebu, jer je jezik beskonačan“, kaže Brenan.

Štaviše, kaže Di Liberto, AI je dekodirao informacije učesnika koji pasivno slušaju zvuk, što nije direktno relevantno za neverbalne pacijente. Da bi to postalo značajno sredstvo komunikacije, naučnici će morati da nauče kako da dešifruju iz moždane aktivnosti ono što ovi pacijenti nameravaju da kažu, uključujući izraze gladi, nelagodnosti ili jednostavno „da“ ili „ne“.

Nova studija je „dekodiranje percepcije govora, a ne proizvodnje“, slaže se King. Iako je produkcija govora krajnji cilj, za sada smo „prilično daleko“.

Pročitajte još