Tim istraživača je koristio AI da identifikuje termoelektrični materijal sa povoljnim vrednostima. Grupa je bila u stanju da se kreće kroz konvencionalne zamke AI i izazove velikih podataka, nudeći odličan primer kako AI može revolucionisati nauku o materijalima. Detalji su objavljeni u časopisu Science China Materials 8. marta 2024.
„Tradicionalne metode pronalaženja odgovarajućih materijala uključuju pokušaje i greške, što je dugotrajno i često skupo“, kaže Hao Li, vanredni profesor na Naprednom institutu za istraživanje materijala Univerziteta Tohoku (VPI-AIMR) i odgovarajući autor rada. „AI transformiše ovo pročešljavanjem baza podataka kako bi identifikovao potencijalne materijale koji se zatim mogu eksperimentalno verificirati.“
Ipak, izazovi ostaju. Skupovi podataka o materijalima velikih razmera ponekad sadrže greške, a prekomerno prilagođavanje predviđenih svojstava zavisnih od temperature je takođe česta greška. Preterivanje se dešava kada model nauči da uhvati šum ili nasumične fluktuacije u podacima o obuci, a ne osnovni obrazac ili odnos.
Kao rezultat toga, model radi dobro na podacima o obuci, ali ne uspeva da generalizuje nove, nevidljive podatke. Kada se predviđaju svojstva zavisna od temperature, prekomerno prilagođavanje može dovesti do netačnih predviđanja kada model naiđe na nove uslove izvan opsega podataka o obuci.
Li i njegove kolege su pokušali da prevaziđu ovo kako bi razvili termoelektrični materijal. Ovi materijali pretvaraju toplotnu energiju u električnu energiju, ili obrnuto. Stoga je dobijanje visoko precizne zavisnosti od temperature kritično.
„Prvo smo izvršili niz racionalnih radnji da identifikujemo i odbacimo sumnjive podatke, dobijajući 92.291 tačku podataka koja se sastoji od 7.295 kompozicija i različitih temperatura iz baze podataka Starridata2 — onlajn baze podataka koja prikuplja digitalne podatke iz objavljenih radova“, navodi Li.
Zatim su istraživači izgradili modele izgradnje mašina koristeći metodu Gradijenta Boosting Decision Tree. Model je postigao izvanredne R2 vrednosti 0,89, ~0,90 i ~0,89 na skupu podataka za obuku, skupu podataka za testiranje i novim eksperimentalnim podacima van uzorka objavljenim 2023. godine, demonstrirajući tačnost modela u predviđanju novih dostupnih materijala.
„Mogli bismo da koristimo ovaj model da izvršimo opsežnu procenu stabilnih materijala iz baze podataka Projekta materijala, predviđajući potencijalne termoelektrične performanse novih materijala i pružajući smernice za eksperimente“, kaže Ksue Jia, docent na VPI-AIMR, i koautor rada.
Na kraju, studija ilustruje važnost poštovanja rigoroznih smernica kada je u pitanju prethodna obrada podataka i podela podataka u mašinskom učenju, tako da se bavi gorućim pitanjima u nauci o materijalima. Istraživači su optimistični da se njihova strategija može primeniti i na druge materijale, kao što su elektrokatalizatori i baterije.