Istraživači koriste velike jezičke modele da ubrzaju otkrivanje materijala

Istraživači koriste velike jezičke modele da ubrzaju otkrivanje materijala

Istraživači sa Prinstona su kreirali alat za veštačku inteligenciju (AI) za predviđanje ponašanja kristalnih materijala, što je ključni korak u unapređenju tehnologija kao što su baterije i poluprovodnici. Iako se kompjuterske simulacije obično koriste u dizajnu kristala, nova metoda se oslanja na veliki jezički model, sličan onima koji pokreću generatore teksta kao što je ChatGPT.

Sintetizacijom informacija iz tekstualnih opisa koji uključuju detalje kao što su dužina i uglovi veza između atoma i merenja elektronskih i optičkih svojstava, nova metoda može preciznije i temeljnije predvideti svojstva novih materijala od postojećih simulacija — i potencijalno ubrzati proces projektovanja i testiranja novih tehnologija.

Istraživači su razvili tekstualni benchmark koji se sastoji od opisa više od 140.000 kristala iz projekta Materials, a zatim su ga koristili za obuku prilagođene verzije velikog jezičkog modela nazvanog T5, koji je prvobitno kreirao Google Research. Oni su testirali sposobnost alata da predvidi svojstva prethodno proučavanih kristalnih struktura, od obične kuhinjske soli do silicijumskih poluprovodnika. Sada kada su pokazali njegovu moć predviđanja, oni rade na primeni alata u dizajnu novih kristalnih materijala.

Metoda, predstavljena 29. novembra na jesenjem sastanku Društva za istraživanje materijala u Bostonu, predstavlja novo merilo koje bi moglo pomoći da se ubrza otkrivanje materijala za širok spektar primena, kaže viši autor studije Adji Bousso Dieng, docent računarskih nauka na Princeton.

Rad koji opisuje metodu, „LLM-Prop: Predviđanje fizičkih i elektronskih svojstava kristalnih čvrstih materija iz njihovih tekstualnih opisa,“ je sada postavljen na arXiv server za preprint.

Postojeći alati zasnovani na veštačkoj inteligenciji za predviđanje svojstava kristala oslanjaju se na metode koje se nazivaju neuronske mreže grafova, ali one imaju ograničenu računarsku moć i ne mogu na adekvatan način da obuhvate nijanse geometrije i dužine veza između atoma u kristalu, kao i elektronska i optička svojstva koje proizilaze iz ovih struktura. Diengov tim je prvi koji se pozabavio problemom koristeći velike jezičke modele, rekla je ona.

„Napravili smo ogroman napredak u kompjuterskoj viziji i prirodnom jeziku“, rekao je Dieng, „ali još uvek nismo mnogo napredovali kada je u pitanju rad sa grafovima [u AI]. Dakle, želeo sam da pređem sa grafikona na njegovo stvarno prevođenje u domen gde već imamo odlične alate. Ako imamo tekst, onda možemo da iskoristimo sve ove moćne [velike jezičke modele] na tom tekstu.“

Pristup zasnovan na jezičkom modelu „daje nam potpuno novi način da sagledamo problem“ dizajna materijala, rekao je koautor studije Kreg Arnold, profesor mašinstva i vazduhoplovstva sa Prinstona Suzan Dod Braun i prodekan za inovacije. „Zaista se radi o tome kako da pristupim svom ovom znanju koje je čovečanstvo razvilo i kako da obradim to znanje da bih krenuo napred? Ono je karakteristično drugačije od naših trenutnih pristupa, i mislim da je to ono što mu daje veliku moć.“