Google-ov novi čet-bot položio ispit za medicinsko licenciranje u SAD

Google-ov novi čet-bot položio ispit za medicinsko licenciranje u SAD

Google-ov medicinski chatbot sa veštačkom inteligencijom postigao je prolaznu ocenu na teškom američkom medicinskom ispitu, ali njegovi odgovori su i dalje lošiji od onih koji su dali lekari, kaže se u recenziranoj studiji u sredu.

Prošle godine objavljivanje ChatGPT-a pokrenulo je trku između tehnoloških giganata u rastućem polju AI.

Iako je mnogo urađeno o budućim mogućnostima – i opasnostima – veštačke inteligencije, zdravlje je jedna oblast u kojoj je tehnologija već pokazala opipljiv napredak, sa algoritmima koji mogu da čitaju određene medicinske snimke kao i ljudi.

Google je prvi put predstavio svoj AI alat za odgovaranje na medicinska pitanja, pod nazivom Med-PaLM, u studiji pre štampe u decembru. Za razliku od ChatGPT-a, nije objavljen u javnosti.

Američki tehnološki gigant kaže da je Med-PaLM prvi veliki jezički model, tehnika veštačke inteligencije koja je obučena na ogromnim količinama teksta koji su proizveli ljudi, koja je položila ispit za medicinsko licenciranje u SAD (USMLE).

Prelazna ocena za ispit, koji polažu studenti medicine i lekari na obuci u Sjedinjenim Državama, je oko 60 odsto.

​U februaru, studija je rekla da je ChatGPT postigao prolazne ili skoro prolazne rezultate.

U recenziranoj studiji objavljenoj u časopisu Nature u sredu, Guglovi istraživači su rekli da je Med-PaLM postigao 67,6 procenata na pitanjima sa višestrukim izborom u USMLE stilu.

„Med-PaLM deluje ohrabrujuće, ali ostaje inferioran u odnosu na kliničare“, navodi se u studiji.

Da bi identifikovao i smanjio „halucinacije“ – naziv kada modeli veštačke inteligencije nude lažne informacije – Gugl je rekao da je razvio novo merilo za procenu.

Karan Singhal, Gugl istraživač i vodeći autor nove studije, rekao je za AFP da je tim koristio benchmark da testira noviju verziju svog modela sa „super uzbudljivim“ rezultatima.

Med-PaLM 2 je dostigao 86,5 procenata na USMLE ispitu, nadmašujući prethodnu verziju za skoro 20 procenata, prema studiji pre štampe objavljenoj u maju koja nije recenzirana.

Džejms Devenport, kompjuterski naučnik sa britanskog Univerziteta Bat, koji nije uključen u istraživanje, rekao je da „postoji slon u sobi“ za ove medicinske četbote sa veštačkom inteligencijom.

Postoji velika razlika između odgovaranja na „medicinska pitanja i stvarne medicine“, što uključuje dijagnostikovanje i lečenje pravih zdravstvenih problema“, rekao je on.

Entoni Kon, stručnjak za veštačku inteligenciju na britanskom Univerzitetu Lids, rekao je da bi halucinacije verovatno uvek bile problem za tako velike jezičke modele, zbog njihove statističke prirode.

Stoga ove modele „uvek treba posmatrati kao pomoćnike, a ne kao donosioce konačnih odluka“, rekao je Kon.

Singhal je rekao da bi se u budućnosti Med-PaLM mogao koristiti za podršku lekarima da ponude alternative koje se možda ne bi razmatrale drugačije.

Vall Street Journal je ranije ove nedelje izvestio da se Med-PaLM 2 od aprila testira u prestižnoj američkoj istraživačkoj bolnici Maio Clinic.

Singhal je rekao da ne može da govori o konkretnim partnerstvima.

Ali on je naglasio da svako testiranje neće biti „kliničko, ili okrenuto pacijentu, niti može da nanese štetu pacijentima“.

Umesto toga, to bi bilo za „više administrativnih zadataka koji se mogu relativno lako automatizovati, sa niskim ulozima“, dodao je on.

© Agencija Frans pres