AI stvara novi blistav protein, simulirajući 500 miliona godina evolucije

AI stvara novi blistav protein, simulirajući 500 miliona godina evolucije

Sinteza novih proteina, ključnih gradivnih blokova biološkog života, predstavlja polje nauke sa velikim potencijalom. Nedavno razvijeni AI model obećava stvaranje uputstava za nove proteine van onih koji su prirodno pronađeni. Američki naučnici su koristili evolutivni model ESM3 kako bi sintetizovali novi protein nazvan ESMGFP (zelena fluorescentna proteina), koji deli samo 58% svog materijala sa najbližim prirodnim rođakom. Ovo je rezultat ekvivalentan 500 miliona godina evolucije koji je AI obrađivao, prema procenama istraživačkog tima. Ovo otvara put za kreiranje personalizovanih proteina koji se mogu dizajnirati za specifične svrhe ili otključavanje novih funkcija već postojećih proteina.

Tim istraživača, predvođen Thomasom Haiesom, osnivačem evolucije u Njujorku, ističe da je više od tri milijarde godina evolucije kodirano u strukturi prirodnih proteina. Oni su uspeli da pokažu da jezički modeli obučeni na evolutivnim podacima mogu generisati funkcionalne proteine koji su daleko od poznatih. ESM3 je obučen na impresivnih 3,15 milijardi proteinskih sekvenci, 236 miliona proteinskih struktura i 539 miliona proteinskih napomena. Kroz prepoznavanje obrazaca u velikom skupu podataka, AI model može razumeti kako funkcioniše i može stvarati nove proteine.

Jedna od posebnosti ESMGFP proteina je njegova fluorescentnost, slična njegovom prirodnom rođaku. Fluorescentni proteini su važni u medicini i biotehnologiji jer omogućavaju praćenje i označavanje različitih procesa. Tim istraživača ističe da su odabrali funkcionalnost fluorescencije zbog njenih jednostavne merljivosti i estetskog značaja u prirodi. AI olakšava proces sinteze proteina eliminisanjem potrebe za mnogim probama i greškama, otvarajući mogućnosti za istraživanje proteina koji nisu poznati.

Istraživači objašnjavaju da se proteini mogu posmatrati kao organizovani prostor gde svaki protein ima svoje „komšije“ i gde se mutacioni događaji dešavaju. Evolucija zahteva da svaki protein prelazi u sledeći bez gubitka funkcionalnosti. Model jezika prepoznaje proteine u ovom prostoru. Proteini koje je dizajnirao ESM3 tek treba da budu potvrđeni, sintetizovani i testirani, što zahteva vreme. Međutim, istraživački tim je optimističan u pogledu daljeg napretka u ovom polju, predviđajući mogućnost proizvodnje proteina za različite svrhe, od lekova do biomaterijala, uz pomoć AI tehnologije.

Modeli jezika proteina ne rade unutar fizičkih ograničenja evolucije, već implicitno stvaraju mnoštvo potencijalnih evolutivnih puteva. Ovo istraživanje objavljeno je u časopisu Science.