Kako koristiti veštačku inteligenciju za otkriće, a da nauku ne odvedete na krivi put

Tokom protekle decenije, veštačka inteligencija je prožela skoro svaki ugao nauke: modeli mašinskog učenja su korišćeni za predviđanje proteinskih struktura, procenu dela amazonske prašume koja je izgubljena zbog krčenja šuma, pa čak i za klasifikaciju dalekih galaksija koje bi mogle biti dom egzoplaneta.

Ali dok se veštačka inteligencija može koristiti za ubrzavanje naučnih otkrića – pomažući istraživačima da naprave predviđanja o pojavama koje bi mogle biti teške ili skupe za proučavanje u stvarnom svetu – ona takođe može odvesti naučnike na krivi put. Na isti način na koji čet-botovi ponekad „haluciniraju“ ili izmišljaju stvari, modeli mašinskog učenja ponekad mogu predstavljati obmanjujuće ili potpuno lažne rezultate.

U članku objavljenom na internetu u Science, istraživači sa Univerziteta Kalifornije, Berkli, predstavljaju novu statističku tehniku za bezbedno korišćenje predviđanja dobijenih iz modela mašinskog učenja za testiranje naučnih hipoteza.

Tehnika, nazvana zaključivanje zasnovano na predviđanju (PPI), koristi malu količinu podataka iz stvarnog sveta da ispravi izlaz velikih, opštih modela — kao što je AlphaFold, koji predviđa strukture proteina — u kontekstu specifičnih naučnih pitanja.

„Ovi modeli imaju za cilj da budu opšti: oni mogu da odgovore na mnoga pitanja, ali mi ne znamo na koja pitanja odgovaraju dobro, a na koja loše – a ako ih koristite naivno, ne znajući u kom ste slučaju, može dobiti loše odgovore“, rekao je autor studije Majkl Džordan, Pehong Čen uvaženi profesor elektrotehnike i računarskih nauka i statistike na UC Berkelei. „Sa PPI, možete da koristite model, ali ispravite moguće greške, čak i kada ne znate prirodu tih grešaka na samom početku.“

Kada naučnici sprovode eksperimente, oni ne traže samo jedan odgovor – oni žele da dobiju niz uverljivih odgovora. Ovo se radi izračunavanjem „intervala poverenja“, koji se, u najjednostavnijem slučaju, može naći ponavljanjem eksperimenta mnogo puta i gledanjem kako rezultati variraju.

U većini naučnih studija, interval poverenja se obično odnosi na zbirnu ili kombinovanu statistiku, a ne na pojedinačne tačke podataka. Nažalost, sistemi mašinskog učenja se fokusiraju na pojedinačne tačke podataka, i stoga naučnicima ne pružaju one vrste procena nesigurnosti do kojih im je stalo. Na primer, AlphaFold predviđa strukturu jednog proteina, ali ne daje pojam poverenja za tu strukturu, niti način da se dobiju intervali poverenja koji se odnose na opšta svojstva proteina.

Naučnici mogu biti u iskušenju da koriste predviđanja iz AlphaFold-a kao da su podaci za izračunavanje klasičnih intervala poverenja, zanemarujući činjenicu da ova predviđanja nisu podaci. Problem sa ovim pristupom je u tome što sistemi mašinskog učenja imaju mnogo skrivenih predrasuda koje mogu iskriviti rezultate. Ove pristrasnosti delom proizilaze iz podataka o kojima su obučeni, a koji su generalno postojeća naučna istraživanja koja možda nisu imala isti fokus kao trenutna studija.

„Zaista, u naučnim problemima, često smo zainteresovani za fenomene koji su na ivici između poznatog i nepoznatog“, rekao je Džordan. „Vrlo često, nema mnogo podataka iz prošlosti koji su na toj ivici, a to čini generativnim AI modelima još verovatnijim da ’haluciniraju‘, proizvodeći izlaz koji je nerealan.

PPI omogućava naučnicima da inkorporiraju predviđanja iz modela kao što je AlphaFold bez ikakvih pretpostavki o tome kako je model izgrađen ili podacima na kojima je obučen. Da bi se to uradilo, PPI zahteva malu količinu podataka koji su nepristrasni, u odnosu na konkretnu hipotezu koja se istražuje, uparena sa predviđanjima mašinskog učenja koja odgovaraju tim podacima. Dovodeći ova dva izvora dokaza zajedno, PPI je u stanju da formira validne intervale poverenja.

Na primer, istraživački tim je primenio PPI tehniku na algoritme koji mogu precizno odrediti područja krčenja šuma u Amazonu koristeći satelitske snimke. Ovi modeli su bili tačni, generalno, kada su testirani pojedinačno na regionima u šumi; međutim, kada su ove procene kombinovane da bi se procenilo krčenje šuma širom Amazona, intervali poverenja su postali veoma iskrivljeni. Ovo je verovatno zato što se model borio da prepozna određene novije obrasce krčenja šuma.

Sa PPI, tim je bio u mogućnosti da ispravi pristrasnost u intervalu poverenja koristeći mali broj oblasti krčenja šuma označenih ljudima.

Tim je takođe pokazao kako se tehnika može primeniti na niz drugih istraživanja, uključujući pitanja o savijanju proteina, klasifikaciji galaksija, nivoima ekspresije gena, brojanju planktona i odnosu između prihoda i privatnog zdravstvenog osiguranja.

„Zaista nema ograničenja u pogledu vrste pitanja na koja bi se ovaj pristup mogao primeniti“, rekao je Džordan. „Smatramo da je PPI preko potrebna komponenta moderne nauke koja intenzivno koristi podatke, modele i kolaborativne nauke.“

Kako koristiti veštačku inteligenciju za otkriće, a da nauku ne odvedete na krivi put

Kosovska policija uhapsila pet osoba u Štrpcu u okviru istrage o navodnim ratnim zločinima

Merc: Izbori u Baden-Virtembergu gorak rezultat, nećemo sarađivati sa AFD

Fritule sa slaninicom

AUTOPUT PAKOVRAĆE–POŽEGA: Tunel bez dozvole, deonica bez funkcije, građani bez odgovora

VUČIĆEV PAD: Šta stoji iza gubitka podrške predsedniku Srbije

Vučić: Prvo Vlada podnosi ostavku, pa raspisujem izbore, neću bez njih biti premijer

Bakingemska palata: Endi Bernam postao premijer Velike Britanije

Meštani Vizića i Neština očekuju propusnice za prelazak granice, blokada još traje

Pripadnici MUP-a uhapsili Beograđanina zbog sumnje u ozbiljna krivična dela

Milanović kritikovao Plenkovića što je u Parizu sedeo iza Vučića

Vučić: Prvo Vlada podnosi ostavku, pa raspisujem izbore, neću bez njih biti premijer

Bakingemska palata: Endi Bernam postao premijer Velike Britanije

Meštani Vizića i Neština očekuju propusnice za prelazak granice, blokada još traje

Umjetnost kao terapija: Kako umetničke aktivnosti usporavaju proces starenja kod ljudi

Arenaerpeton supinatus: Otkriće drevnog stvorenja iz doba pre dinosaurusa u Australiji

Zlatni blago iz doba bronzanog doba otkriva tajne meteoritskog gvožđa

Vučić: Prvo Vlada podnosi ostavku, pa raspisujem izbore, neću bez njih biti premijer

Bakingemska palata: Endi Bernam postao premijer Velike Britanije

Meštani Vizića i Neština očekuju propusnice za prelazak granice, blokada još traje

Dodik upozorava na dugotrajnost rata u Ukrajini i posledice za EU

Požar kod Madrida uništio 26.000 hektara, 1.200 ljudi evakuisano

Melatonin može pomoći u ublažavanju hronične boli, otkriva nova studija

Astronomi otkrili atmosferu na potencijalno nastanjivoj planeti LHS 1140 b

Naučnici otkrili novu vrstu majmuna koja se godinama skrivala u šumama Konga

Nova bugarska vlada učvrstila protivljenje podršci EU Ukrajini nakon izbora

Požar u podzemnoj garaži na Zvezdari zahvatio nekoliko automobila

Teška povreda tokom karnevalske parade: helikopterom prebačena osoba u bolnicu

Potencijalni rivali Vojvodine u Ligi konferencija irski Šelburn i Kalju Nome iz Estonije

UEFA skratila spisak potencijalnih rivala Partizana u trećem kolu kvalifikacija za Ligu konferencija

Utakmice Svetskog fudbalskog prvenstva uživo posmatralo skoro sedam miliona ljudi

Fudbaleri Španije prvaci sveta, Feran Tores „slomio“ Argentince u 106. minutu

Italijanski vozač Formule 1 Kimi Antoneli pobednik trke za Veliku nagradu Belgije

U Srbiji danas promenljivo oblačno s kišom, temperatura do 33 stepena

U Srbiji danas promenljivo oblačno sa sunčanim intervalima

Veći deo dana sunčano, uz pojavu kiše sa grmljavinom – temperatura do 37 stepeni

Pročitajte još