U studiji od skoro 5.000 skrining mamografa interpretiranih pomoću AI algoritma koji je odobrila FDA, karakteristike pacijenata kao što su rasa i starost uticale su na lažno pozitivne rezultate. Rezultati studije objavljeni su u Radiologija.
„AI je postao resurs za radiologe da poboljšaju svoju efikasnost i tačnost u očitavanju skrining mamograma uz ublažavanje sagorevanja čitača“, rekao je Derek L. Nguien, MD, docent na Univerzitetu Duke u Durhamu, Severna Karolina. „Međutim, uticaj karakteristika pacijenata na performanse AI nije dobro proučen.“
Dr Ngujen je rekao da iako preliminarni podaci sugerišu da algoritmi veštačke inteligencije primenjeni na skrining mamografskim pregledima mogu poboljšati dijagnostičke performanse radiologa za otkrivanje raka dojke i smanjiti vreme interpretacije, postoje neki aspekti veštačke inteligencije kojih treba biti svestan.
„Postoji nekoliko demografski raznolikih baza podataka za obuku AI algoritama, a FDA ne zahteva različite skupove podataka za validaciju“, rekao je on. „Zbog razlika među populacijama pacijenata, važno je istražiti da li softver veštačke inteligencije može da se prilagodi i da radi na istom nivou za različite uzraste, rase i etničke pripadnosti pacijenata.
U retrospektivnoj studiji, istraživači su identifikovali pacijente sa negativnim (bez dokaza o raku) skrining pregledima digitalne tomosinteze dojke obavljenim u Medicinskom centru Univerziteta Djuk između 2016. i 2019. Svi pacijenti su praćeni tokom dvogodišnjeg perioda nakon skrining mamografa, a nijedan pacijent dijagnostikovan je malignitet dojke.
Istraživači su nasumično odabrali podgrupu ove grupe koja se sastojala od 4.855 pacijenata (srednja starost 54 godine) široko raspoređenih u četiri etničke/rasne grupe. Podgrupa je uključivala 1.316 (27%) belaca, 1.261 (26%) crnaca, 1.351 (28%) azijskih i 927 (19%) hispanoameričkih pacijenata.
Komercijalno dostupan AI algoritam je interpretirao svaki pregled u podskupu mamografa, generišući i ocenu slučaja (ili izvesnost maligniteta) i ocenu rizika (ili rizik od maligniteta koji sledi godinu dana).
„Naš cilj je bio da procenimo da li su performanse algoritma veštačke inteligencije ujednačene po godinama, tipovima gustine grudi i različitim rasama/etničkim grupama pacijenata“, rekao je dr Ngujen.
S obzirom da su svi mamografi u studiji bili negativni na prisustvo raka, sve što je algoritam označio kao sumnjivo smatralo se lažno pozitivnim rezultatom. Lažno pozitivni rezultati slučajeva bili su značajno verovatniji kod crnaca i starijih pacijenata (71-80 godina) i manje verovatni kod azijskih pacijenata i mlađih pacijenata (41-50 godina) u poređenju sa pacijentima bele rase i ženama između 51 i 60 godina.
„Ova studija je važna jer naglašava da bilo koji softver veštačke inteligencije koji je kupila zdravstvena ustanova možda neće imati jednak učinak za sve uzraste pacijenata, rase/etničke grupe i gustinu grudi“, rekao je dr Ngujen. „U budućnosti, mislim da bi nadogradnje softvera AI trebalo da se fokusiraju na obezbeđivanje demografske raznolikosti.“
Dr Ngujen je rekao da zdravstvene ustanove treba da razumeju populaciju pacijenata kojima služe pre nego što kupe AI algoritam za skrining tumačenje mamografa i da pitaju prodavce o njihovoj obuci za algoritam.
„Poznavanje osnovnog stanja o demografiji vaše ustanove i pitanje dobavljača o etničkoj i starosnoj raznolikosti njihovih podataka o obuci pomoći će vam da razumete ograničenja sa kojima ćete se suočiti u kliničkoj praksi“, rekao je on.