Naučnici smatraju da je ChatGPT netačan kada odgovara na pitanja o kompjuterskom programiranju

Tim kompjuterskih naučnika sa Univerziteta Purdue otkrio je da je popularni LLM, ChatGPT, veoma netačan kada odgovara na pitanja o kompjuterskom programiranju. U svom radu objavljenom u okviru Proceedings of the CHI Conference on Human Factors in Computing Sistems, grupa opisuje kako su izvukli pitanja sa veb stranice StackOverflov i postavili ih ChatGPT-u, a zatim izmerili stepen tačnosti kada su odgovarali.

Tim je takođe predstavio svoje nalaze na Konferenciji o ljudskim faktorima u računarskim sistemima (CHI 2024) održanoj od 11. do 16. maja.

ChatGPT i drugi LLM-i su bili u vestima u poslednje vreme – pošto su takve aplikacije dostupne široj javnosti, postale su veoma popularne. Nažalost, zajedno sa riznicom korisnih informacija uključenih u mnoge odgovore koje daju takve aplikacije, postoji niz netačnosti. Još žalosnije je to što nije uvek jasno kada aplikacije daju pogrešne odgovore.

U ovoj novoj studiji, tim u Purdue-u je primetio da su mnogi studenti programiranja počeli da koriste LLM ne samo da pomognu u pisanju koda za programske zadatke, već i da odgovore na pitanja u vezi sa programiranjem. Na primer, student bi mogao da pita ChatGPT, koja je razlika između sortiranja oblačića i sortiranja spajanjem, ili, još popularnije, šta je rekurzija?

Da bi saznali koliko su LLM tačni u odgovaranju na takva pitanja, istraživački tim je fokusirao svoje napore samo na jedno od njih — ChatGPT. Da bi pronašli pitanja koja će koristiti za testiranje aplikacije, istraživači su koristili pitanja koja su slobodno dostupna na veb lokaciji StackOverflov—to je sajt koji je napravljen da pomogne programerima da nauče više o programiranju radeći sa drugima u oblasti njihovog interesovanja. Na jednom delu sajta korisnici mogu postavljati pitanja na koja će odgovarati drugi koji znaju odgovore.

Istraživački tim je koristio 517 pitanja pronađenih na sajtu, a zatim je izmerio koliko često je ChatGPT davao tačan odgovor. Nažalost, to je bilo samo 52% vremena. Takođe su otkrili da su odgovori obično više opširniji nego što bi to bio slučaj kada je stručnjaku za ljude postavljeno isto pitanje.

Zabrinjavajuće, tim je otkrio da su učesnici korisničke studije preferirali odgovore koje je dao ChatGPT u 35% vremena. Istraživači su takođe otkrili da isti korisnici koji su čitali odgovore koje je dao ChatGPT prilično često nisu uhvatili greške koje su napravljene — prevideli su pogrešne odgovore 39% vremena.

Naučnici smatraju da je ChatGPT netačan kada odgovara na pitanja o kompjuterskom programiranju

AUTOPUT PAKOVRAĆE–POŽEGA: Tunel bez dozvole, deonica bez funkcije, građani bez odgovora

VUČIĆEV PAD: Šta stoji iza gubitka podrške predsedniku Srbije

U Subotici pronađeno telo tinejdžera u automobilu

Načelnik ukrajinske vojske: Predaja teritorije bi bila „neprihvatljiva“

Dolovac sa predsednikom Eurodžasta: Prate se inicijative za promenu načina rada tužilaštava u Srbiji

Apelacioni sud ukinuo presudu Hrkalović, naložio da se ponovi suđenje

Sukob policije i zemljoradnika u Grčkoj: Protest zbog kašnjenja subvencija EU

U Subotici pronađeno telo tinejdžera u automobilu

Načelnik ukrajinske vojske: Predaja teritorije bi bila „neprihvatljiva“

Dolovac sa predsednikom Eurodžasta: Prate se inicijative za promenu načina rada tužilaštava u Srbiji

Fajnenšel tajms: Nikolas Maduro pooštrava ličnu bezbednost zbog većih tenzija sa SAD

Teška nesreća kod Zlatibora

Gutereš: G20 da pokrene hitne globalne akcije

U Subotici pronađeno telo tinejdžera u automobilu

Načelnik ukrajinske vojske: Predaja teritorije bi bila „neprihvatljiva“

Dolovac sa predsednikom Eurodžasta: Prate se inicijative za promenu načina rada tužilaštava u Srbiji

Dojče vele: Nemački naučnici otkrili antitelo protiv HIV-a

Istraživanje otkrilo izuzetno retku mutaciju u varijaciji krvi koja zbunjuje lekare

Rani znaci Alchajmerove bolesti mogu biti skriveni u načinu govora osobe

Mali „Ajnštajn“ iz Belgije završio doktorski rad iz kvantne fizike u rekordnom roku

Naučnici otkrili ključne delove ljudskog genoma gde se mutacije najčešće javljaju

Grčka: Brod sa migrantima potonuo, pronađena četiri tela, među kojima je jedno dete

Tragična nesreća: Pogibija ekstremnog sportiste Felixa Baumgartnera zbog ljudske greške

Zgrada u centru Madrida delimično se srušila, tri povređene osobe

Tanjga: Vojvodina uvek ide na pobedu, Zvezda će imati dodatan motiv protiv nas

Disciplinska i etička komisija FSS-a kaznila Spartak iz Subotice sa milion dinara

RSS: Svetska federacija potvrdila da je Srbija oštećena u meču protiv Farskih ostrva

Španski fudbaler Erik Garsija ostaje u Barseloni do juna 2031. godine

FK Crvena zvezda: Meč sa Vojvodinom u znaku humanosti i uspomene na Sinišu Mihajlovića

Sutra oblačno sa slabom kišom, temperatura do 12 stepeni

Do kraja dana oblačno sa kišom, temperatura do 13 stepeni

Danas oblačno sa kišom, temperatura do 13 stepeni

Pročitajte još