DeepMind jedinica kompanije Alphabet Inc. danas je detaljno predstavila AlphaTensor, sistem veštačke inteligencije koji je sposoban da otkrije nove algoritme koji se mogu koristiti za rešavanje matematičkih problema.
DeepMind istraživači su koristili AlphaTensor da razviju novi način izvođenja množenja matrice. Množenje matrice je vrsta proračuna koju AI aplikacije i određeni drugi programi intenzivno koriste prilikom obrade podataka. Prema DeepMind-u, AlphaTensor je pronašao metodu za izvođenje množenja matrice brže nego što je to do sada bilo moguće.
AlphaTensor je zasnovan na AI sistemu nazvanom AlphaZero koji je DeepMind prvi put debitovao 2018. AlphaZero je dizajniran za igranje društvenih igara kao što su šah, Go i šogi. DeepMind je napravio niz nadogradnji sistema veštačke inteligencije koje mu omogućavaju da se uhvati u koštac sa složenim matematičkim problemima.
Množenje matrica, proračuni koje je DeepMind ubrzao koristeći svoj novodebitovani AlphaTensor sistem, su vrsta matematičke operacije koja uključuje matrice. Matrica je skup brojeva raspoređenih u redove i kolone slično tabeli. Množenje matrice je proračun koji koristi dve matrice za generisanje treće matrice.
Matematičari su vekovima vršili množenje matrica na jedan specifičan način sve do 1960-ih, kada je otkriven novi, brži metod izvođenja takvih proračuna. Međutim, taj brži metod se može primeniti samo na određene vrste množenja matrice koje uključuju relativno malo brojeva. Štaviše, „veće verzije ovog problema ostale su nerešene“, detaljno su naveli istraživači DeepMinda u današnjem postu na blogu.
Prema DeepMind-u, njegov AlphaTensor sistem je otkrio poboljšanu verziju metode bržeg množenja matrice. Štaviše, AI je generisao hiljade potpuno novih algoritama za izvođenje množenja matrice. Neki od tih algoritama su optimizovani za rad na određenim tipovima hardvera kao što su grafičke kartice Nvidia Corp.
Da bi napravili AlphaTensor, istraživači DeepMind-a su razvili novi pristup otkrivanju algoritama.
Istraživači su zadatak otkrivanja novih algoritama množenja matrice pretvorili u igru pod nazivom TensorGame. Da bi pobedio u igri, AI sistem mora da završi složenu matematičku operaciju kao tenzorsku dekompoziciju. Završetak tenzorske dekompozicije ne samo da omogućava AI sistemu da pobedi u igri, već i generiše novi algoritam množenja matrice u procesu.
DeepMind je opremio AlphaTensor arhitekturom neuronske mreže posebno optimizovanom za otkrivanje algoritama. Zatim je jedinica Abeceda obučila sistem veštačke inteligencije koristeći metod poznat kao učenje pojačanja. Metoda uključuje poboljšanje tačnosti neuronske mreže kroz pokušaje i greške tako što će ona više puta obavljati određeni zadatak.
Koristeći AlphaTensor, DeepMind je uspeo da otkrije efikasniju verziju jednog od najbržih poznatih algoritama za rešavanje množenja matrice. „Na primer, ako tradicionalni algoritam koji se uči u školi množi matricu 4×5 sa 5×5 koristeći 100 množenja, a ovaj broj je smanjen na 80 ljudskom genijalnošću, AlphaTensor je pronašao algoritme koji rade istu operaciju koristeći samo 76 množenja, ” DeepMind istraživači su detaljno objasnili.
AlphaTensor je takođe otkrio hiljade novih algoritama za množenje matrica. Kao deo projekta, DeepMind je prilagodio AlphaTensor da razvije algoritme koji su optimizovani za rad na određenim čipovima kao što su Nvidijina V100 grafička kartica i TPU v2, AI čip koji je razvio Google LLC. Ovi algoritmi rade do 20% brže od postojećih metoda množenja matrice, prema jedinici Alphabet.
„Pošto je množenje matrice ključna komponenta u mnogim računarskim zadacima, koji obuhvataju kompjutersku grafiku, digitalnu komunikaciju, obuku neuronskih mreža i naučno računarstvo, algoritmi otkriveni AlphaTensorom mogli bi da učine proračune u ovim oblastima znatno efikasnijim“, objasnili su istraživači DeepMinda. „AlphaTensor-ova fleksibilnost da uzme u obzir bilo koju vrstu cilja takođe bi mogla da podstakne nove aplikacije za dizajniranje algoritama koji optimizuju metriku kao što je potrošnja energije.