Forma veštačke inteligencije koja se zove modeliranje velikog jezika (LLM), ista tehnologija iza ChatGPT-a, mogla bi jednog dana poboljšati negu raka jetre tako što bi izvlačila važne podatke iz medicinskih karata mnogo brže od ljudi, pokazala je nedavna studija UCSF.
LLM koriste duboko učenje i velike skupove podataka za razumevanje, sumiranje, generisanje i predviđanje sadržaja.
Studija koju je vodio gastroenterolog UCSF i hepatolog za transplantaciju Jin Ge, MD, i objavljena u Gastroenterologi, otkrila je da je LLM opšte namene za ekstrakciju podataka o tumoru jetre 93% tačan u poređenju sa onim kada su ljudi izvukli podatke. Tačnost je porasla na 99% kada je LLM izdvojio određene vrste podataka, a proces je bio 20 puta brži.
Model, kreiran u UCSF i primenjen na podatke o zaštićenim zdravstvenim informacijama (PHI), posmatrao je osam elemenata iz oko 1.100 izveštaja o slikama 753 pacijenta. Elementi su uključivali broj i veličinu tumora jetre pacijenata, stepen njihovih tumora, da li postoje dokazi o metastatskoj bolesti u abdomenu i da li je došlo do recidiva tumora.
Istraživači su uporedili tačnost modela sa onom kod lekara koji su izvukli iste podatke i koji su se smatrali „zlatnim standardom“ za potrebe proučavanja. Model je bio najbolji u identifikaciji metastatske bolesti iz izveštaja o slikanju, sa ukupnom tačnošću od 99%, a najgore u identifikaciji veličine tumora iz izveštaja, sa tačnošću od 89%.
„Generalno gledano, model je imao bolje rezultate u jednostavnijim zadacima koji uključuju klasifikaciju, a ne u složenijim koji uključuju poređenje ili aritmetiku“, rekao je Ge.
Lekarima je trebalo 28 sati da izvuku sve podatke iz grafikona u poređenju sa dva sata za LLM, izvestili su autori.
Iako model trenutno nije odobren za kliničku upotrebu, jedna od potencijalnih aplikacija bi mogla biti da se utvrdi da li pacijent ispunjava uslove za transplantaciju jetre na osnovu ukupne količine raka otkrivenog u njihovom telu, napisali su autori. Općenitije aplikacije osim raka jetre mogle bi uključivati modeliranje predviđanja zasnovano na tekstu, proširenu podršku za kliničko odlučivanje i chatbote koji se nalaze u kontaktu sa pacijentima i provajderima, napisali su.
Studija je jedna od prvih koja je uporedila upotrebu LLM veštačke inteligencije sa ručnim pregledom grafikona za ekstrakciju podataka istraživačkog nivoa iz grafikona, primetio je Ge. Jedna od njegovih mogućih slabosti, rekao je on, je korišćenje pregleda ljudskih karata kao „zlatnog standarda“.
„Moglo bi biti da su ljudi manje precizni, a mašine su zapravo bolje u nekim od ovih zadataka“, rekao je Ge.