Neki alati veštačke inteligencije za zdravstvenu negu mogu biti zbunjeni načinima na koji ljudi različitih polova i rasa govore, prema novoj studiji koju je vodila kompjuterska naučnica CU Boulder Teodora Chaspari.
Studija zavisi od, možda neizrečene, realnosti ljudskog društva: ne govore svi isto. Žene, na primer, imaju tendenciju da govore višim glasom od muškaraca, dok se slične razlike mogu pojaviti između, recimo, belih i crnih govornika.
Sada, istraživači su otkrili da bi te prirodne varijacije mogle zbuniti algoritme koji pregledaju ljude na probleme mentalnog zdravlja kao što su anksioznost ili depresija. Rezultati doprinose rastućem broju istraživanja koja pokazuju da AI, baš kao i ljudi, može da pravi pretpostavke na osnovu rase ili pola.
„Ako veštačka inteligencija nije dobro obučena ili ne uključuje dovoljno reprezentativnih podataka, ona može da propagira ove ljudske ili društvene predrasude“, rekao je Chaspari, vanredni profesor na Odseku za računarske nauke.
Ona i njene kolege objavile su svoje nalaze 24. jula u časopisu Frontiers in Digital Health.
Chaspari je primetio da bi AI mogla biti obećavajuća tehnologija u svetu zdravstvene zaštite. Fino podešeni algoritmi mogu da pregledaju snimke ljudi koji govore, tražeći suptilne promene u načinu na koji govore koje bi mogle da ukažu na osnovne probleme mentalnog zdravlja.
Ali ti alati moraju dosledno da rade za pacijente iz mnogih demografskih grupa, rekao je kompjuterski naučnik. Da bi saznali da li je veštačka inteligencija dorasla zadatku, istraživači su ubacili audio uzorke stvarnih ljudi u zajednički skup algoritama za mašinsko učenje.
Rezultati su izazvali nekoliko crvenih zastavica: činilo se da alati veštačke inteligencije, na primer, nedovoljno dijagnostikuju žene koje su u riziku od depresije više nego muškarci – rezultat koji bi, u stvarnom svetu, mogao sprečiti ljude da dobiju negu koja im je potrebna.
„Sa veštačkom inteligencijom možemo da identifikujemo ove sitnozrnate obrasce koje ljudi ne mogu uvek da primete“, rekao je Časpari, koji je vodio rad kao član fakulteta na Teksaškom A&M univerzitetu. „Međutim, dok postoji ova prilika, postoji i veliki rizik.
Ona je dodala da način na koji ljudi govore može biti snažan prozor u njihove osnovne emocije i blagostanje – nešto što pesnici i dramski pisci odavno znaju.
Istraživanja sugerišu da ljudi sa dijagnozom kliničke depresije često govore tiše i monotonije od drugih. Ljudi sa anksioznim poremećajima, u međuvremenu, imaju tendenciju da pričaju sa višim tonom i sa više „trepetanja“, merenjem disanja u govoru.
„Znamo da na govor u velikoj meri utiče nečija anatomija“, rekao je Časpari. „Za depresiju, postoje neke studije koje pokazuju promene u načinu na koji se dešavaju vibracije u glasnim naborima, ili čak u tome kako glas modulira glas.“
Tokom godina, naučnici su razvili AI alate da traže upravo takve promene.
Chaspari i njene kolege odlučile su da algoritme stave pod mikroskop. Da bi to uradio, tim je koristio snimke ljudi koji razgovaraju u nizu scenarija: u jednom, ljudi su morali da razgovaraju od 10 do 15 minuta sa grupom stranaca.
U drugom, muškarci i žene su razgovarali duže vreme u okruženju sličnom poseti lekara. U oba slučaja, govornici su posebno popunjavali upitnike o svom mentalnom zdravlju. Studija je uključivala Michael Iang i Abd-Allah El-Attar, studente osnovnih studija na Tekas A&M.
Činilo se da su rezultati svuda.
Na snimcima javnih govora, na primer, latino učesnici su izjavili da su se u proseku osećali mnogo nervoznije od belih ili crnih govornika. AI, međutim, nije uspeo da otkrije tu povećanu anksioznost. U drugom eksperimentu, algoritmi su takođe označili jednak broj muškaraca i žena kao izloženi riziku od depresije. U stvarnosti, žene koje govore imale su simptome depresije mnogo češće.
Časpari je napomenuo da su rezultati tima samo prvi korak. Istraživači će morati da analiziraju snimke mnogo više ljudi iz širokog spektra demografskih grupa pre nego što budu mogli da shvate zašto je AI pogrešio u određenim slučajevima – i kako da poprave te pristrasnosti.
Ali, rekla je ona, studija je znak da programeri veštačke inteligencije treba da nastave sa oprezom pre nego što unesu AI alate u svet medicine, „Ako mislimo da algoritam zapravo potcenjuje depresiju za određenu grupu, ovo je nešto o čemu treba da obavestimo kliničare.“