Istraživači su kreirali alat za veštačku inteligenciju koji koristi sekvence životnih događaja – kao što su istorijat zdravlja, obrazovanje, posao i prihod – da bi predvideli sve, od ličnosti osobe do njene smrtnosti.
Napravljen korišćenjem modela transformatora, koji pokreću velike jezičke modele (LLM) kao što je ChatGPT, nova alatka, life2vec, obučena je na skupu podataka koji je izvučen iz celokupne populacije Danske—6 miliona ljudi. Danska vlada je skup podataka stavila na raspolaganje samo istraživačima.
Alat koji su istraživači izgradili na osnovu ovog složenog skupa podataka sposoban je da predvidi budućnost, uključujući životni vek pojedinaca, sa tačnošću koja prevazilazi najsavremenije modele. Ali uprkos svojoj prediktivnoj moći, tim koji stoji iza istraživanja kaže da se najbolje koristi kao temelj za budući rad, a ne kao cilj sam po sebi.
„Iako koristimo predviđanje da procenimo koliko su ovi modeli dobri, alatka ne bi trebalo da se koristi za predviđanje na stvarnim ljudima“, kaže Tina Eliasi-Rad, profesor računarstva i inauguracioni predsednik Džozef E. Aun, profesor na Northeastern Universiti. „To je model predviđanja zasnovan na specifičnom skupu podataka određene populacije.“
Eliasi-Rad je u projekat donela svoju ekspertizu etike veštačke inteligencije. „Ovi alati vam omogućavaju da sagledate svoje društvo na drugačiji način: politike koje imate, pravila i propise koje imate“, kaže ona. „O tome možete razmišljati kao o skeniranju onoga što se dešava na terenu.“
Uključivanjem društvenih naučnika u proces pravljenja ovog alata, tim se nada da on donosi pristup usredsređen na ljude razvoju veštačke inteligencije koji ne gubi iz vida ljude usred ogromnog skupa podataka na kojem je njihov alat obučen.
„Ovaj model nudi mnogo sveobuhvatniji odraz sveta kako ga žive ljudska bića od mnogih drugih modela“, kaže Sune Leman, autorka u radu, koji je nedavno objavljen u Nature Computational Science. Istraživački brifing na ovu temu predstavljen je u istom broju časopisa.
U srcu life2vec-a je ogroman skup podataka koji su istraživači koristili za obuku svog modela. Podacima raspolaže Statistički zavod Danske, centralni organ za dansku statistiku, i, iako su strogo regulisani, mogu im pristupiti neki članovi javnosti, uključujući istraživače. Razlog zašto je tako strogo kontrolisan je što uključuje detaljan registar svakog danskog državljanina.
Mnogi događaji i elementi koji čine život i koji su navedeni u podacima, od zdravstvenih faktora i obrazovanja do prihoda. Istraživači su koristili te podatke da kreiraju dugačke obrasce ponavljajućih životnih događaja da bi se uneli u svoj model, uzimajući pristup transformatorskog modela koji se koristi za obuku LLM-a o jeziku i prilagođavajući ga za ljudski život predstavljen kao niz događaja.
„Cela priča o ljudskom životu, na neki način, takođe se može posmatrati kao ogromna duga rečenica mnogih stvari koje se mogu desiti osobi“, kaže Leman, profesor mreže i nauke o složenosti na DTU Compute, Technical Univerzitet u Danskoj i prethodno postdoktorski saradnik na Northeastern.
Model koristi informacije koje uči posmatrajući milione sekvenci životnih događaja da bi izgradio ono što se naziva vektorskim reprezentacijama u prostorima za ugradnju, gde počinje da kategoriše i crta veze između životnih događaja kao što su prihod, obrazovanje ili zdravstveni faktori. Ovi prostori za ugrađivanje služe kao osnova za predviđanja koja model na kraju pravi.
Jedan od životnih događaja koji su istraživači predvideli bila je verovatnoća smrtnosti osobe.
„Kada vizualizujemo prostor koji model koristi za predviđanje, on izgleda kao dugačak cilindar koji vas vodi od male verovatnoće smrti do velike verovatnoće smrti“, kaže Leman. „Onda možemo pokazati da je na kraju gde postoji velika verovatnoća smrti, mnogo tih ljudi zaista umrlo, a na kraju gde je mala verovatnoća smrti, uzroci smrti su nešto što nismo mogli da predvidimo, poput automobila nezgode“.
Rad takođe ilustruje kako je model sposoban da predvidi pojedinačne odgovore na standardni upitnik ličnosti, posebno kada je reč o ekstrovertnosti.
Eliasi-Rad i Leman primećuju da iako model daje veoma precizna predviđanja, ona su zasnovana na korelacijama, visoko specifičnim kulturnim i društvenim kontekstima i vrstama pristrasnosti koje postoje u svakom skupu podataka.
„Ova vrsta alata je poput opservatorije društva – a ne svih društava“, kaže Eliasi-Rad. „Ova studija je rađena u Danskoj, a Danska ima svoju kulturu, svoje zakone i svoja društvena pravila. Da li se to može uraditi u Americi je druga priča.“
S obzirom na sva ta upozorenja, Eliassi-Rad i Lehmann svoj prediktivni model gledaju manje kao krajnji proizvod, a više kao početak razgovora. Leman kaže da su velike tehnološke kompanije verovatno godinama stvarale ove vrste prediktivnih algoritama u zaključanim sobama. On se nada da ovaj rad može da počne da stvara otvorenije, javno razumevanje o tome kako ovi alati funkcionišu, za šta su sposobni i kako treba i kako ne treba da se koriste.