Istraživač je upravo završio pisanje naučnog rada. Ona zna da bi njen rad mogao imati koristi iz druge perspektive. Da li je nešto previdela? Ili možda postoji primena njenog istraživanja o kojoj nije razmišljala. Drugi skup očiju bi bio sjajan, ali čak ni najljubazniji saradnici možda neće moći da odvoje vreme da pročitaju sve potrebne pozadinske publikacije kako bi nadoknadili korak.
Kevin Iager—vođa grupe za elektronske nanomaterijale u Centru za funkcionalne nanomaterijale (CFN), kancelariji američkog Ministarstva energetike (DOE) Kancelarije za nauku u Nacionalnoj laboratoriji DOE u Brookhavenu—zamislio je kako je nedavni napredak u veštačkoj inteligenciji (AI) i mašinsko učenje (ML) moglo bi pomoći naučnom razmišljanju i stvaranju ideja. Da bi to postigao, razvio je chatbot sa znanjem o vrstama nauke kojima se bavi.
Brzi napredak u AI i ML ustupio je mesto programima koji mogu da generišu kreativan tekst i koristan softverski kod. Ovi čet-botovi opšte namene nedavno su zaokupili maštu javnosti. Postojećim robotima za ćaskanje — zasnovanim na velikim, raznolikim jezičkim modelima — nedostaje detaljno poznavanje naučnih poddomena.
Koristeći metodu pronalaženja dokumenata, Iagerov bot ima znanje u oblastima nauke o nanomaterijalima koje drugi botovi nisu. Detalji ovog projekta i kako drugi naučnici mogu da iskoriste ovog AI kolegu za sopstveni rad nedavno su objavljeni u Digital Discovery.
„CFN već dugo traži nove načine da iskoristi AI/ML da ubrza otkrivanje nanomaterijala. Trenutno nam pomaže da brzo identifikujemo, katalogiziramo i izaberemo uzorke, automatizujemo eksperimente, kontrolnu opremu i otkrijemo nove materijale. Esther Tsai, naučnik u grupi za elektronske nanomaterijale u CFN-u, razvija AI saputnika kako bi pomogao da se ubrzaju eksperimenti istraživanja materijala u Nacionalnom sinhrotronskom izvoru svetlosti II (NSLS-II).“ NSLS-II je još jedna ustanova Kancelarije za nauku Ministarstva nauke u laboratoriji Brookhaven.
U CFN-u je bilo dosta posla na AI/ML koji može pomoći u pokretanju eksperimenata kroz upotrebu automatizacije, kontrola, robotike i analize, ali imati program koji je vješt sa naučnim tekstom bilo je nešto što istraživači nisu istraživali kao duboko. Mogućnost brzog dokumentovanja, razumevanja i prenošenja informacija o eksperimentu može pomoći na više načina — od rušenja jezičkih barijera do uštede vremena sumiranjem većih delova posla.
Da bi se napravio specijalizovani chatbot, program je zahtevao tekst specifičan za domen — jezik preuzet iz oblasti na koje bot treba da se fokusira. U ovom slučaju, tekst su naučne publikacije. Tekst specifičan za domen pomaže modelu veštačke inteligencije da razume novu terminologiju i definicije i upoznaje ga sa graničnim naučnim konceptima. Što je najvažnije, ovaj odabrani skup dokumenata omogućava modelu veštačke inteligencije da utemelji svoje rezonovanje koristeći pouzdane činjenice.
Da bi oponašali prirodni ljudski jezik, AI modeli se obučavaju na postojećem tekstu, omogućavajući im da nauče strukturu jezika, zapamte različite činjenice i razviju primitivnu vrstu zaključivanja. Umesto da mukotrpno ponovo obučava AI model na tekstu o nanonauci, Iager mu je dao mogućnost da traži relevantne informacije u odabranom skupu publikacija. Obezbeđivanje biblioteke relevantnih podataka bilo je samo pola bitke. Da bi ovaj tekst koristio tačno i efikasno, bot bi trebao način da dešifruje tačan kontekst.
„Izazov koji je uobičajen sa jezičkim modelima je to što oni ponekad ‘haluciniraju’ stvari koje zvuče uverljivo, ali neistinite“, objasnio je Jager. „Ovo je bilo ključno pitanje koje treba rešiti za čet-bot koji se koristi u istraživanju za razliku od onog koji radi nešto poput pisanja poezije. Ne želimo da izmišlja činjenice ili citate. Ovo je trebalo rešiti. Rešenje za ovo je bilo nešto što smo nazovite ‘ugrađivanje’, način kategorizacije i brzog povezivanja informacija iza scene.“
Ugrađivanje je proces koji pretvara reči i fraze u numeričke vrednosti. Dobijeni „vektor ugradnje“ kvantifikuje značenje teksta. Kada korisnik postavi pitanje chatbotu, ono se takođe šalje modelu ugradnje ML-a da izračuna njegovu vektorsku vrednost. Ovaj vektor se koristi za pretragu kroz unapred izračunatu bazu podataka delova teksta iz naučnih radova koji su na sličan način ugrađeni. Bot zatim koristi isečke teksta koje pronađe da su semantički povezani sa pitanjem da bi dobio potpunije razumevanje konteksta.
Upit korisnika i isečci teksta se kombinuju u „prompt“ koji se šalje velikom jezičkom modelu, ekspanzivnom programu koji kreira tekst po uzoru na prirodni ljudski jezik, koji generiše konačan odgovor. Ugrađivanje osigurava da je tekst koji se izvlači relevantan u kontekstu pitanja korisnika. Pružajući delove teksta iz tela pouzdanih dokumenata, chatbot generiše odgovore koji su činjenični i izvorni.
„Program treba da bude kao referentni bibliotekar“, rekao je Jager. „Potrebno je da se u velikoj meri oslanja na dokumente da bi pružio odgovore. Mora da bude u stanju da tačno protumači šta ljudi pitaju i da bude u stanju da efikasno sastavi kontekst tih pitanja kako bi dobio najrelevantnije informacije. Iako odgovori možda neće bude savršen, već je u stanju da odgovori na izazovna pitanja i pokrene neke zanimljive misli dok planira nove projekte i istraživanja.“
CFN razvija AI/ML sisteme kao alate koji mogu da oslobode ljudske istraživače da rade na izazovnijim i zanimljivijim problemima i da izvuku više iz svog ograničenog vremena dok računari automatizuju zadatke koji se ponavljaju u pozadini. Još uvek ima mnogo nepoznanica o ovom novom načinu rada, ali ova pitanja su početak važnih diskusija koje naučnici trenutno vode kako bi se osiguralo da je upotreba AI/ML bezbedna i etička.
„Postoji niz zadataka koje bi čet-bot specifičan za domen kao što je ovaj mogao da reši iz radnog opterećenja naučnika. Klasifikacija i organizovanje dokumenata, sumiranje publikacija, ukazivanje na relevantne informacije i upoznavanje sa novom temom su samo neki od potencijala aplikacije“, primetio je Jager. „Uzbuđen sam što vidim kuda će sve ovo ići. Nikada nismo mogli da zamislimo gde smo sada pre tri godine, i radujem se tome gde ćemo biti za tri godine.“
Za istraživače zainteresovane da sami isprobaju ovaj softver, izvorni kod za CFN-ov chat bot i povezane alate mogu se naći u ovom GitHub repozitorijumu.