Naučnici kreiraju model za predviđanje depresije i anksioznosti

Naučnici kreiraju model za predviđanje depresije i anksioznosti

Istraživači sa Univerziteta u Sao Paulu (USP) u Brazilu koriste veštačku inteligenciju (AI) i Tviter, jednu od najvećih svetskih platformi društvenih medija, kako bi pokušali da stvore modele predviđanja anksioznosti i depresije koji bi u budućnosti mogli da obezbede znakove ovih poremećaja pre klinička dijagnoza.

Izgradnja baze podataka, nazvana SetembroBR, bila je prvi korak u studiji. Naziv je referenca na Žuti septembar, godišnju kampanju podizanja svesti o samoubistvu i prevenciju, kao i na činjenicu da je prikupljanje podataka za studiju počelo jednog dana u septembru.

Drugi korak je još uvek u toku, ali je pružio neke preliminarne nalaze, kao što je mogućnost otkrivanja da li će osoba verovatno razviti depresiju samo na osnovu svojih prijatelja i pratilaca na društvenim mrežama, bez uzimanja u obzir sopstvenih postova.

Baza podataka koju je sastavila grupa sadrži informacije koje se odnose na korpus tekstova (na portugalskom) i mrežu veza koja uključuje 3.900 korisnika Tvitera koji su prijavili da su im dijagnostikovani ili lečeni od mentalnog zdravlja pre ankete. Korpus obuhvata sve javne tvitove koje ovi korisnici postavljaju pojedinačno (bez retvitova), ukupno oko 47 miliona ovih kratkih tekstova.

„Prvo smo ručno prikupili vremenske okvire, analizirajući tvitove oko 19.000 korisnika, što je ekvivalentno populaciji sela ili malog grada. Zatim smo koristili dva skupa podataka, jedan za korisnike koji su prijavili da im je dijagnostikovan problem mentalnog zdravlja i drugi nasumično odabran za kontrolne svrhe. Želeli smo da napravimo razliku između ljudi sa depresijom i opšte populacije“, rekao je Ivandre Paraboni, poslednji autor članka i profesor na USP-ovoj školi za umetnost, nauku i humanističke nauke (EACH).

Studija je takođe prikupila tvitove prijatelja i pratilaca, u skladu sa zapažanjem da ljudi sa problemima mentalnog zdravlja imaju tendenciju da prate određene naloge, kao što su forumi za diskusije, uticajni ljudi i poznate ličnosti koje javno priznaju svoju depresiju. „Ovi ljudi privlače jedni druge. Imaju zajedničke interese“, rekao je Paraboni, koji je istraživač u Centru za veštačku inteligenciju (C4AI).

Poremećaji mentalnog zdravlja, uključujući depresiju i anksioznost, su sve veća globalna zabrinutost. Svetska zdravstvena organizacija (SZO) procenila je na osnovu podataka iz 2021. da je 3,8 odsto svetske populacije, ili oko 280 miliona ljudi, pogođeno depresijom.

SZO je takođe procenila povećanje od 25% u globalnoj prevalenci ovih problema mentalnog zdravlja tokom pandemije COVID-19. Tvitovi su prikupljeni za studiju tokom ovog perioda.

U nedavnoj anketi brazilskog ministarstva zdravlja u kojoj je učestvovalo 784.000 učesnika, 11,3% je reklo da im je dijagnostikovana depresija. Većina su bile žene.

Prema prethodnim istraživanjima, problemi mentalnog zdravlja se često odražavaju u jeziku koji oboleli koriste. Ovaj nalaz je doveo do značajnog broja studija koje uključuju obradu prirodnog jezika (NLP), sa fokusom na depresiju, anksioznost i bipolarni poremećaj, između ostalog. Međutim, većina ovih studija analizira tekstove na engleskom i ne odgovaraju uvek profilu većine Brazilaca.

Istraživači su prethodno obradili korpus kako bi uklonili hashtagove, URL adrese, emotikone i nestandardne znakove, a da su zadržali originalne tekstove. Zatim su primenili duboko učenje, tehniku veštačke inteligencije koja uči računare da obrađuju podatke na način inspirisan ljudskim mozgom, kako bi kreirali četiri klasifikatora teksta i ugradnje reči (matematičke reprezentacije odnosa između reči zavisne od konteksta) koristeći modele zasnovane na dvosmernim reprezentacijama kodera. od transformatora (BERT), algoritam mašinskog učenja za NLP. Ovi modeli odgovaraju neuronskoj mreži koja uči kontekste i značenja praćenjem sekvencijalnih odnosa podataka, kao što su reči u rečenici.

Ulaz za obuku sastojao se od uzorka od 200 tvitova nasumično odabranih od svakog korisnika. Parametri su definisani izvršenjem unakrsnog validacije podataka o obuci pet puta i izračunavanjem prosečnog rezultata.

Zaključak je bio da se BERT najbolje pokazao u predviđanju depresije i anksioznosti, sa statistički značajnom razlikom između njega i LogReg-a, sledeće najbolje opcije. Pošto su modeli analizirali nizove reči i kompletnih rečenica, bilo je moguće primetiti da ljudi sa depresijom, na primer, imaju tendenciju da pišu o temama povezanim sa sobom, koristeći glagole i fraze u prvom licu, kao i teme kao što su smrt, kriza i psihologija.

„Znaci depresije koji se mogu otkriti tokom posete lekaru nisu nužno isti kao oni koji se pojavljuju na društvenim medijima“, rekao je Paraboni. „Na primer, upotreba zamenica u prvom licu jednine ja i ja bila je veoma očigledna, a u psihologiji se to smatra klasičnim znakom depresije. Takođe smo primetili čestu upotrebu emotikona srca od strane depresivnih korisnika. To se široko smatra simbol naklonosti i ljubavi, ali možda ga psiholozi još nisu okarakterisali kao takvog“.

Svi prikupljeni tekstovi su anonimizovani. „Nismo objavili ni stvarne tvitove ni imena korisnika. Vodili smo računa da studenti uključeni u projekat nemaju pristup korisničkim podacima kako bismo zaštitili identitet ljudi“, rekao je on.

Istraživači sada proširuju bazu podataka, usavršavaju svoje računarske tehnike i nadograđuju modele kako bi videli da li mogu da proizvedu alat za buduću upotrebu u skriningu potencijalnih obolelih od problema mentalnog zdravlja i pomoći porodicama i prijateljima mladih ljudi koji su u riziku od depresije i anksioznost.

Brazil je treći među zemljama koje najviše koriste društvene medije u svetu, prema istraživanju kompanije Comscore objavljenom početkom marta, iza Indije i Indonezije, ali ispred Sjedinjenih Država, Meksika i Argentine. Njegovih 131,5 miliona korisnika je onlajn u proseku 46 sati mesečno. Najviše korišćene platforme su Jutjub, Fejsbuk, Instagram, TikTok, Kvai i Tviter, koji je nedavno promenio pravila i počeo da naplaćuje određene usluge.

Studija je objavljena u članku objavljenom u časopisu Language Resources and Evaluation.