Istraživači procenjuju tačnost vesti povezanih sa zdravljem pomoću veštačke inteligencije

Istraživači procenjuju tačnost vesti povezanih sa zdravljem pomoću veštačke inteligencije

Može biti izazovno proceniti kvalitet onlajn vesti – postavljajući pitanje da li su prave ili lažne. Kada su u pitanju vesti o zdravlju i saopštenja za javnost o medicinskim tretmanima i procedurama, pitanje može biti još složenije, posebno ako priča nije potpuna i još uvek ne spada nužno u kategoriju lažnih vesti.

Da bi pomogli da se identifikuju priče sa naduvanim tvrdnjama, netačnostima i mogućim povezanim rizicima, istraživači sa Univerziteta u Nju Hempširu razvili su novi model mašinskog učenja, primenu veštačke inteligencije, koji bi novinske službe poput društvenih medija mogle lako da koriste za bolji pregled medicinskih vesti za tačnost.

„Način na koji većina ljudi razmišlja o lažnim vestima je nešto što je potpuno izmišljeno, ali posebno u zdravstvu, ne mora da bude lažno. Moguće je da možda nešto ne pominju“, rekla je Ermira Zifla, docent nauke o odlučivanju na UNH-ovom koledžu za biznis i ekonomiju Peter T. Paul. „U studiji ne iznosimo tvrdnje o namerama novinskih organizacija koje ih objavljuju. Ali ako se stvari izostave, trebalo bi da postoji način da se to pogleda.“

Zifla i koautor studije Burcu Eke Rubini, docenti za nauke o odlučivanju, otkrili su u svom istraživanju, objavljenom u Decision Support Sistems , da pošto većina ljudi nema medicinsko znanje da razume složenost vesti, modeli mašinskog učenja razvili su nadmašili procene laika u proceni kvaliteta zdravstvenih priča.

Oni su koristili podatke iz Health News Review-a koji su uključivali vesti i saopštenja za štampu o novim tretmanima zdravstvene zaštite objavljene u različitim medijskim kućama od 2013. do 2018. Članke je već procenjivala grupa zdravstvenih stručnjaka — lekara, novinara i kliničkih profesori — koristeći deset različitih kriterijuma za ocenjivanje koje su stručnjaci razvili. Kriterijumi su uključivali troškove i koristi tretmana ili testa, svaku moguću štetu, kvalitet argumenata, novinu i dostupnost postupka i nezavisnost izvora.

Istraživači su zatim razvili algoritam zasnovan na istim ekspertskim kriterijumima i obučili modele mašina da klasifikuju svaki aspekt vesti, odgovarajući tim kriterijumima kao „zadovoljavajuće“ ili „nezadovoljavajuće“.

Performanse modela su sledeće upoređene sa ocenama laika dobijenim kroz posebnu anketu gde su učesnici ocenili iste članke kao „zadovoljavajuće“ ili „nezadovoljavajuće“ na osnovu istih kriterijuma. Istraživanje je otkrilo „pristrasnost optimizma“, pri čemu je većina od 254 učesnika ocenila članke kao zadovoljavajuće, što se značajno razlikuje od kritičnijih procena modela.

Istraživači naglašavaju da ni u kom slučaju ne žele da zamene mišljenje stručnjaka, već se nadaju da će započeti razgovor o proceni vesti na osnovu više kriterijuma i ponuditi lako dostupnu i jeftinu alternativu putem softvera otvorenog koda za bolju procenu zdravstvenih vesti.