Naučnici artikulišu nove standarde podataka za AI modele

Naučnici artikulišu nove standarde podataka za AI modele

Ambiciozni pekari se često pozivaju da prilagode nagrađivane recepte zasnovane na različitim kuhinjskim postavkama. Neko bi, na primer, mogao da koristi mutilicu za jaja umesto miksera da napravi nagrađivane kolačiće sa komadićima čokolade.

Mogućnost reprodukcije recepta u različitim situacijama i različitim postavkama ključna je i za talentovane kuvare i za naučnike koji se bave računarstvom, od kojih se ovi drugi suočavaju sa sličnim problemom prilagođavanja i reprodukcije sopstvenih „recepta“ kada pokušavaju da potvrde i rade sa novim AI modeli. Ovi modeli imaju primenu u naučnim oblastima u rasponu od klimatskih analiza do istraživanja mozga.

„Kada govorimo o podacima, imamo praktično razumevanje digitalne imovine kojom se bavimo“, rekao je Eliu Huerta, naučnik i vođa Translacione veštačke inteligencije u Nacionalnoj laboratoriji Argonne Ministarstva energetike SAD (DOE). „Sa AI modelom, to je malo manje jasno; da li govorimo o podacima strukturiranim na pametan način, ili je to računarstvo, ili softver, ili mešavina?“

U novoj studiji, Huerta i njegove kolege su artikulisali novi skup standarda za upravljanje AI modelima. Prilagođeni iz nedavnih istraživanja o automatizovanom upravljanju podacima, ovi standardi se nazivaju FAIR, što je skraćenica za pronalaženje, dostupnost, interoperabilnost i ponovnu upotrebu.

„Učinivši modele veštačke inteligencije PRAVILNIM, više ne moramo svaki put da gradimo svaki sistem iz temelja“, rekao je naučnik iz Argone Ben Blaiszik. „Postaje lakše ponovo koristiti koncepte iz različitih grupa, pomažući u stvaranju unakrsnog oprašivanja u timovima.“

Prema Huerti, činjenica da mnogi modeli veštačke inteligencije trenutno nisu FER predstavlja izazov za naučno otkriće. „Za mnoge studije koje su do sada urađene, teško je dobiti pristup i reprodukovati AI modele koji se pominju u literaturi“, rekao je on. „Kreiranjem i deljenjem modela FAIR AI, možemo smanjiti količinu dupliranja napora i podeliti najbolje prakse o tome kako da koristimo ove modele da bismo omogućili veliku nauku.“

Da bi zadovoljili potrebe raznolike zajednice korisnika, Huerta i njegove kolege su kombinovali jedinstveni paket upravljanja podacima i računarskih platformi visokih performansi kako bi uspostavili FAIR protokol i kvantifikovali „FAIR-nost“ modela AI. Istraživači su uparili FAIR podatke objavljene u onlajn spremištu pod nazivom Materials Data Faciliti, sa FAIR AI modelima objavljenim u drugom onlajn spremištu pod nazivom Data and Learning Hub for Science, kao i sa AI i superkompjuterskim resursima u Argonne Leadership Computing Faciliti (ALCF). ).

Na ovaj način, istraživači su uspeli da stvore računarski okvir koji bi mogao da pomogne u premošćivanju različitog hardvera i softvera, stvarajući AI modele koji bi mogli da se pokreću na sličan način na svim platformama i koji bi dali ponovljive rezultate. ALCF je korisnički objekat DOE Office of Science.

Dva ključa za kreiranje ovog okvira su platforme nazvane funcKs i Globus, koje omogućavaju istraživačima da pristupe računarskim resursima visokih performansi direktno sa svojih laptopova. „FuncKs i Globus mogu pomoći da se prevaziđu razlike u hardverskim arhitekturama“, rekao je koautor Ian Foster, direktor Argonneovog odeljenja za nauku i učenje o podacima. „Ako neko koristi jednu računarsku arhitekturu, a neko drugi koristi drugu, sada imamo način da govorimo zajednički jezik veštačke inteligencije. To je veliki deo u tome da AI postane interoperabilnija.“

U studiji, istraživači su koristili primer skupa podataka AI modela koji je koristio podatke o difrakciji iz Argonneovog naprednog izvora fotona, takođe korisničkog objekta DOE Kancelarije za nauku. Da bi izvršio proračune, tim je koristio SambaNova sistem ALCF AI Testbed i NVIDIA GPU-ove (jedinice za obradu grafike) superkompjutera Theta.

„Uzbuđeni smo što vidimo prednosti FAIR produktivnosti od deljenja modela i podataka kako bismo omogućili više istraživača pristup računarskim resursima visokih performansi“, rekao je Mark Hamilton, potpredsednik NVIDIA za arhitekturu i inženjering rešenja. „Zajedno podržavamo sve šireći univerzum računarstva visokih performansi koji kombinuje eksperimentalne podatke i rad instrumenta na ivici sa AI kako bi se povećao tempo naučnog otkrića.“

„SambaNova je uzbuđena zbog partnerstva sa istraživačima u Nacionalnoj laboratoriji Argonne kako bi se bavila inovacijama u interfejsu veštačke inteligencije i novih hardverskih arhitektura“, dodala je Dženifer Glor, potpredsednica za inženjering za korisnike u SambaNova Sistems. „AI će imati značajnu ulogu u budućnosti naučnog računarstva, a razvoj FAIR principa za AI modele zajedno sa novim alatima će osnažiti istraživače da omoguće autonomno otkriće u velikim razmerama. Radujemo se nastavku saradnje i razvoja u ALCF-u AI Testbed.“