Tokom protekle decenije, veštačka inteligencija je prožela skoro svaki ugao nauke: modeli mašinskog učenja su korišćeni za predviđanje proteinskih struktura, procenu dela amazonske prašume koja je izgubljena zbog krčenja šuma, pa čak i za klasifikaciju dalekih galaksija koje bi mogle biti dom egzoplaneta.
Ali dok se veštačka inteligencija može koristiti za ubrzavanje naučnih otkrića – pomažući istraživačima da naprave predviđanja o pojavama koje bi mogle biti teške ili skupe za proučavanje u stvarnom svetu – ona takođe može odvesti naučnike na krivi put. Na isti način na koji čet-botovi ponekad „haluciniraju“ ili izmišljaju stvari, modeli mašinskog učenja ponekad mogu predstavljati obmanjujuće ili potpuno lažne rezultate.
U članku objavljenom na internetu u Science, istraživači sa Univerziteta Kalifornije, Berkli, predstavljaju novu statističku tehniku za bezbedno korišćenje predviđanja dobijenih iz modela mašinskog učenja za testiranje naučnih hipoteza.
Tehnika, nazvana zaključivanje zasnovano na predviđanju (PPI), koristi malu količinu podataka iz stvarnog sveta da ispravi izlaz velikih, opštih modela — kao što je AlphaFold, koji predviđa strukture proteina — u kontekstu specifičnih naučnih pitanja.
„Ovi modeli imaju za cilj da budu opšti: oni mogu da odgovore na mnoga pitanja, ali mi ne znamo na koja pitanja odgovaraju dobro, a na koja loše – a ako ih koristite naivno, ne znajući u kom ste slučaju, može dobiti loše odgovore“, rekao je autor studije Majkl Džordan, Pehong Čen uvaženi profesor elektrotehnike i računarskih nauka i statistike na UC Berkelei. „Sa PPI, možete da koristite model, ali ispravite moguće greške, čak i kada ne znate prirodu tih grešaka na samom početku.“
Kada naučnici sprovode eksperimente, oni ne traže samo jedan odgovor – oni žele da dobiju niz uverljivih odgovora. Ovo se radi izračunavanjem „intervala poverenja“, koji se, u najjednostavnijem slučaju, može naći ponavljanjem eksperimenta mnogo puta i gledanjem kako rezultati variraju.
U većini naučnih studija, interval poverenja se obično odnosi na zbirnu ili kombinovanu statistiku, a ne na pojedinačne tačke podataka. Nažalost, sistemi mašinskog učenja se fokusiraju na pojedinačne tačke podataka, i stoga naučnicima ne pružaju one vrste procena nesigurnosti do kojih im je stalo. Na primer, AlphaFold predviđa strukturu jednog proteina, ali ne daje pojam poverenja za tu strukturu, niti način da se dobiju intervali poverenja koji se odnose na opšta svojstva proteina.
Naučnici mogu biti u iskušenju da koriste predviđanja iz AlphaFold-a kao da su podaci za izračunavanje klasičnih intervala poverenja, zanemarujući činjenicu da ova predviđanja nisu podaci. Problem sa ovim pristupom je u tome što sistemi mašinskog učenja imaju mnogo skrivenih predrasuda koje mogu iskriviti rezultate. Ove pristrasnosti delom proizilaze iz podataka o kojima su obučeni, a koji su generalno postojeća naučna istraživanja koja možda nisu imala isti fokus kao trenutna studija.
„Zaista, u naučnim problemima, često smo zainteresovani za fenomene koji su na ivici između poznatog i nepoznatog“, rekao je Džordan. „Vrlo često, nema mnogo podataka iz prošlosti koji su na toj ivici, a to čini generativnim AI modelima još verovatnijim da ’haluciniraju‘, proizvodeći izlaz koji je nerealan.
PPI omogućava naučnicima da inkorporiraju predviđanja iz modela kao što je AlphaFold bez ikakvih pretpostavki o tome kako je model izgrađen ili podacima na kojima je obučen. Da bi se to uradilo, PPI zahteva malu količinu podataka koji su nepristrasni, u odnosu na konkretnu hipotezu koja se istražuje, uparena sa predviđanjima mašinskog učenja koja odgovaraju tim podacima. Dovodeći ova dva izvora dokaza zajedno, PPI je u stanju da formira validne intervale poverenja.
Na primer, istraživački tim je primenio PPI tehniku na algoritme koji mogu precizno odrediti područja krčenja šuma u Amazonu koristeći satelitske snimke. Ovi modeli su bili tačni, generalno, kada su testirani pojedinačno na regionima u šumi; međutim, kada su ove procene kombinovane da bi se procenilo krčenje šuma širom Amazona, intervali poverenja su postali veoma iskrivljeni. Ovo je verovatno zato što se model borio da prepozna određene novije obrasce krčenja šuma.
Sa PPI, tim je bio u mogućnosti da ispravi pristrasnost u intervalu poverenja koristeći mali broj oblasti krčenja šuma označenih ljudima.
Tim je takođe pokazao kako se tehnika može primeniti na niz drugih istraživanja, uključujući pitanja o savijanju proteina, klasifikaciji galaksija, nivoima ekspresije gena, brojanju planktona i odnosu između prihoda i privatnog zdravstvenog osiguranja.
„Zaista nema ograničenja u pogledu vrste pitanja na koja bi se ovaj pristup mogao primeniti“, rekao je Džordan. „Smatramo da je PPI preko potrebna komponenta moderne nauke koja intenzivno koristi podatke, modele i kolaborativne nauke.“