Istraživači koriste mašinsko učenje da bi ispitali značenja u različitim jezicima

Istraživači koriste mašinsko učenje da bi ispitali značenja u različitim jezicima

Način na koji se značenja usklađuju na različitim jezicima sugeriše da prevođenje i međukulturalna komunikacija mogu biti izazovni, ali istraživačima nije jasno šta karakteriše ovo usklađivanje i koji faktori mogu da utiču na to.

Međutim, nedavna studija objavljena u PNAS-u koristila je mašinsko učenje kako bi otkrila da su značenja na različitim jezicima slična unutar domena značenja, ali se razlikuju u različitim domenima. Istraživanje je takođe pokazalo da konkretna značenja (npr. ruka, drvo, lonac) variraju manje od apstraktnih značenja u različitim jezicima (demokratija, istina, sreća), ali jezici koji se govore u bližem okruženju obično imaju mnogo sličnija značenja.

Istraživački tim su predvodili prof. Džejms Evans sa Odeljenja za sociologiju i Moli Luis, koja je započela istraživanje kao postdoktor na Učikagu. Njihova studija koristila je podatke velikih razmera da bi razmotrila ključna pitanja lingvističke antropologije.

Evans ukazuje na Sapir-Vorfovu hipotezu, koja sugeriše da struktura jezika utiče na poglede na svet i spoznaju njegovih govornika. To bi značilo da jezik vodi razmišljanje. Istraživanja su od tada osporila snažnu verziju ove hipoteze, a Evansov tim je koristio mašinsko učenje da bi sagledao mnoge jezike u svim domenima: Da li se oni postavljaju na određene načine? Kako istraživači mogu da okarakterišu razliku u njihovim značenjima?

Istraživači su koristili dva velika izvora podataka: članke na Vikipediji, koji pokrivaju iste teme na različitim jezicima, i eseje Test of English as a Foreign Language (TOEFL) u kojima ljudi čiji maternji jezik nije engleski pišu o temi na engleskom. Ono što su otkrili bio je jak dokaz za relativizam u značenju, pokazujući kako određeni jezik kojim osoba govori utiče na način na koji prikupljaju ideje i razmišljaju o stvarnosti.

„Pokazujemo da su konkretni objekti više očuvani u različitim jezicima, ali i dalje variraju“, rekao je Evans. „Dakle, ako ste dalje u kulturnom prostoru, ili kako strukturišete srodstvo, ili vaše iskustvo sa okruženjem i klimom, ili fizička udaljenost; svako doprinosi razlici u tome kako strukturišete značenja među rečima.

Evans objašnjava da je studija pokazala mnogo moćniji način razmišljanja o razlici između jezika. Ne u smislu apstraktnosti i konkretnosti reči, već njihovih lokalnih i globalnih asocijacija jedna na drugu.

„Domeni kao što su zdravstvena zaštita — lekari, medicinske sestre, bolest; ili religija — sveštenici, šamani, blagoslovi, kletve — kada koristite neku od reči, koristite i druge reči“, rekao je Evans. „Ovi domeni imaju tendenciju da budu visoko očuvani u različitim jezicima. Ali ono što je drugačije je razdaljina između tih domena.“

On daje primer na mandarinskom kineskom. Na ovom jeziku, razgovor o porodici često uključuje upotrebu metafora fizičkog prostora, kao što su planine i okeani. Na drugom jeziku, međutim, koriste metafore vezane za zdravlje i lečenje.

„Unutar domena, jezici su uglavnom isti; ali među domenima, ove razlike stvaraju više i manje dostupne metafore, obrte fraza, promene u narativu“, rekao je on. „Te kognitivne blizine — koje su vam dostupne preko vašeg maternjeg jezika — dramatično oblikuju način na koji ćete pisati i čitati naraciju i stepen do kojeg će vam objašnjenje delovati poznato i uverljivo, ili iznenađujuće i sumnjivo.

Ako možemo da naučimo da predvidimo ove asocijacije, rekao je Evans, možemo bolje da prilagodimo i poboljšamo prevode. Na primer, umesto da Gugl nudi prevod od reči do reči koji može izgubiti značenje metafore, on bi mogao da ga oblikuje u asocijaciju koja ima smisla na maternjem jeziku čitaoca. Može oblikovati i način na koji se uči drugi jezik; mogli bismo podučavati metaforu i asocijacije na isti način na koji učimo sintaksu i gramatiku. Takođe bi moglo da pomogne u pisanju edikta i zakona koji utiču na ljude koji govore različite jezike.

„Postoji merljiva kultura koja je ugrađena u jezik“, rekao je Evans. „I to duboko oblikuje način na koji ljudi doživljavaju svet, konstruišu metafore i saopštavaju ideje.“