Kada se voda zamrzne, ona prelazi iz tečne faze u čvrstu fazu, što dovodi do drastične promene u svojstvima kao što su gustina i zapremina. Fazni prelazi u vodi su toliko česti da većina nas verovatno i ne razmišlja o njima, ali fazni prelazi u novim materijalima ili složenim fizičkim sistemima su važna oblast proučavanja.
Da bi u potpunosti razumeli ove sisteme, naučnici moraju biti u stanju da prepoznaju faze i otkriju prelaze između njih. Ali kako kvantifikovati fazne promene u nepoznatom sistemu često je nejasno, posebno kada su podaci oskudni.
Istraživači sa MIT-a i Univerziteta u Bazelu u Švajcarskoj primenili su generativne modele veštačke inteligencije na ovaj problem, razvijajući novi okvir za mašinsko učenje koji može automatski mapirati fazne dijagrame za nove fizičke sisteme.
Njihov pristup mašinskom učenju zasnovan na fizici je efikasniji od napornih, ručnih tehnika koje se oslanjaju na teorijsku ekspertizu. Važno je da njihov pristup koristi generativne modele, ne zahteva ogromne, označene skupove podataka za obuku koji se koriste u drugim tehnikama mašinskog učenja.
Takav okvir bi mogao pomoći naučnicima da istraže termodinamička svojstva novih materijala ili otkriju zaplitanje u kvantnim sistemima, na primer. Na kraju, ova tehnika bi mogla omogućiti naučnicima da autonomno otkriju nepoznate faze materije.
„Ako imate novi sistem sa potpuno nepoznatim svojstvima, kako biste izabrali koju količinu koja se može posmatrati da proučavate? Nada je, barem uz alate zasnovane na podacima, da biste mogli da skenirate velike nove sisteme na automatizovan način, i to će pokazati vas do važnih promena u sistemu.
„Ovo bi moglo biti alat u procesu automatizovanog naučnog otkrivanja novih, egzotičnih svojstava faza“, kaže Frank Šefer, postdoktor u Julia Lab u Laboratoriji za računarske nauke i veštačku inteligenciju (CSAIL) i koautor rada na ovaj pristup.
Šeferu se pridružuju prvi autor Julian Arnold, diplomirani student na Univerzitetu u Bazelu; Alan Edelman, profesor primenjene matematike na Departmanu za matematiku i rukovodilac Julia Lab-a; i viši autor Kristof Bruder, profesor na Odseku za fiziku na Univerzitetu u Bazelu.
Istraživanje je objavljeno u Phisical Reviev Letters.
Dok voda koja prelazi u led može biti među najočiglednijim primerima promene faze, egzotičnije promene faze, kao kada materijal prelazi iz normalnog provodnika u superprovodnik, su od velikog interesovanja za naučnike.
Ovi prelazi se mogu otkriti identifikacijom „parametra porudžbine“, količine koja je važna i za koju se očekuje da će se promeniti. Na primer, voda se smrzava i prelazi u čvrstu fazu (led) kada njena temperatura padne ispod 0°C. U ovom slučaju, odgovarajući parametar poretka mogao bi se definisati u smislu proporcije molekula vode koji su deo kristalne rešetke u odnosu na one koji ostaju u neuređenom stanju.
U prošlosti, istraživači su se oslanjali na stručnost fizike da bi ručno napravili fazne dijagrame, oslanjajući se na teorijsko razumevanje da bi znali koji su parametri poretka važni. Ne samo da je ovo zamorno za složene sisteme, a možda i nemoguće za nepoznate sisteme sa novim ponašanjem, već takođe uvodi ljudsku pristrasnost u rešenje.
U skorije vreme, istraživači su počeli da koriste mašinsko učenje za pravljenje diskriminativnih klasifikatora koji mogu da reše ovaj zadatak tako što će naučiti da klasifikuju statistiku merenja kao da dolazi iz određene faze fizičkog sistema, na isti način na koji takvi modeli klasifikuju sliku kao mačka ili pas.
Istraživači sa MIT-a pokazali su kako se generativni modeli mogu koristiti za rešavanje ovog zadatka klasifikacije mnogo efikasnije i na način zasnovan na fizici.
Programski jezik Julia, popularni jezik za naučno računarstvo koji se takođe koristi u uvodnim časovima linearne algebre MIT-a, nudi mnoge alate koji ga čine neprocenjivim za konstruisanje takvih generativnih modela, dodaje Šefer.
Generativni modeli, poput onih koji su u osnovi ChatGPT i Dall-E, obično rade tako što procenjuju distribuciju verovatnoće nekih podataka, koje koriste za generisanje novih tačaka podataka koje odgovaraju distribuciji (kao što su nove slike mačaka koje su slične postojećim slikama mačaka) .
Međutim, kada su dostupne simulacije fizičkog sistema koristeći isprobane naučne tehnike, istraživači besplatno dobijaju model njegove distribucije verovatnoće. Ova distribucija opisuje statistiku merenja fizičkog sistema.
Uvid MIT tima je da ova distribucija verovatnoće takođe definiše generativni model na osnovu kojeg se može konstruisati klasifikator. Oni uključuju generativni model u standardne statističke formule da bi direktno konstruisali klasifikator umesto da ga uče iz uzoraka, kao što je učinjeno sa diskriminativnim pristupima.
„Ovo je zaista lep način da ugradite nešto što znate o svom fizičkom sistemu duboko u vašu šemu mašinskog učenja. On ide daleko dalje od samog izvođenja inženjeringa karakteristika na vašim uzorcima podataka ili jednostavnih induktivnih predrasuda“, kaže Šefer.
Ovaj generativni klasifikator može odrediti u kojoj se fazi sistem nalazi prema nekom parametru, kao što su temperatura ili pritisak. I pošto istraživači direktno aproksimiraju distribucije verovatnoće koje su u osnovi merenja iz fizičkog sistema, klasifikator ima znanje o sistemu.
Ovo omogućava njihovoj metodi da radi bolje od drugih tehnika mašinskog učenja. I pošto može da radi automatski bez potrebe za opsežnom obukom, njihov pristup značajno poboljšava računarsku efikasnost identifikacije faznih prelaza.
Na kraju dana, slično kao što se može zatražiti od ChatGPT-a da reši matematički problem, istraživači mogu postaviti pitanja generativnom klasifikatoru poput „da li ovaj uzorak pripada fazi I ili fazi II?“ ili „da li je ovaj uzorak generisan na visokoj ili niskoj temperaturi?“
Naučnici bi takođe mogli da koriste ovaj pristup za rešavanje različitih zadataka binarne klasifikacije u fizičkim sistemima, eventualno da otkriju zapetljanost u kvantnim sistemima (Da li je stanje upleteno ili ne?) ili da utvrde da li je teorija A ili B najpogodnija za rešavanje određenog problema. Oni bi takođe mogli da koriste ovaj pristup da bolje razumeju i poboljšaju velike jezičke modele kao što je ChatGPT tako što će identifikovati kako bi određeni parametri trebalo da se podese tako da chatbot daje najbolje rezultate.
U budućnosti, istraživači takođe žele da prouče teorijske garancije o tome koliko bi merenja trebalo da bi efikasno otkrili fazne prelaze i procenili količinu izračunavanja koja bi im bila potrebna.