Lekari-istraživači u Medicinskom centru Beth Israel Deaconess (BIDMC) uporedili su verovatnoćajno rezonovanje četbota sa rezonovanjem ljudskih kliničara. Nalazi, objavljeni u JAMA Network Open, sugerišu da bi veštačka inteligencija mogla poslužiti kao korisni alati za podršku kliničkim odlukama za lekare.
„Ljudi se bore sa probabilističkim rasuđivanjem, praksom donošenja odluka na osnovu izračunavanja šanse“, rekao je autor studije, Adam Rodman, MD, lekar interne medicine i istraživač na Odeljenju za medicinu u BIDMC-u.
„Probabilističko rezonovanje je jedna od nekoliko komponenti postavljanja dijagnoze, što je neverovatno složen proces koji koristi niz različitih kognitivnih strategija. Odlučili smo da procenimo verovatnoća u izolaciji jer je to dobro poznata oblast u kojoj bi ljudi mogli da koriste podršku.“ “
Zasnovajući svoju studiju na prethodno objavljenom nacionalnom istraživanju više od 550 praktičara koji su izvodili verovatnoća rezonovanja o pet medicinskih slučajeva, Rodman i kolege su dali javno dostupni model velikog jezika (LLM), Chat GPT-4, istu seriju slučajeva i pokrenuli identičan upitajte 100 puta da biste generisali niz odgovora.
Chatbot — baš kao i praktičari pre njih — imao je zadatak da proceni verovatnoću date dijagnoze na osnovu prezentacije pacijenata. Zatim, s obzirom na rezultate testova kao što su radiografija grudnog koša za upalu pluća, mamografija za rak dojke, stres test za koronarne arterijske bolesti i urinokultura za infekciju urinarnog trakta, chatbot program je ažurirao svoje procene.
Kada su rezultati testa bili pozitivni, bilo je nerešeno; chatbot je bio tačniji u postavljanju dijagnoze od ljudi u dva slučaja, slično tačan u dva slučaja i manje tačan u jednom slučaju. Ali kada su testovi bili negativni, chatbot je zablistao, pokazujući veću tačnost u postavljanju dijagnoza nego ljudi u svih pet slučajeva.
„Ljudi ponekad osećaju da je rizik veći nego što jeste nakon negativnog rezultata testa, što može dovesti do preteranog lečenja, više testova i previše lekova“, rekao je Rodman.
Ali Rodman je manje zainteresovan za to kako chatbotovi i ljudi rade od prstiju do pete nego za to kako bi se učinak visokokvalifikovanih lekara mogao promeniti kao odgovor na to da im ove nove tehnologije podrške budu dostupne u klinici, dodao je Rodman. On i njegove kolege to istražuju.
„LLM-ovi ne mogu da pristupe spoljašnjem svetu—oni ne izračunavaju verovatnoće na način na koji to rade epidemiolozi, pa čak ni igrači pokera. Ono što oni rade ima mnogo više zajedničkog sa načinom na koji ljudi donose verovatnoće na licu mesta,“ rekao je on. .
„Ali to je ono što je uzbudljivo. Čak i ako je nesavršeno, njihova jednostavnost upotrebe i sposobnost da se integrišu u kliničke tokove rada bi teoretski mogli da nateraju ljude da donose bolje odluke“, rekao je on. „Buduća istraživanja kolektivne ljudske i veštačke inteligencije su preko potrebna.“