Novi alat za veštačku inteligenciju može predvideti funkcije enzima na osnovu njihovih aminokiselinskih sekvenci, čak i kada su enzimi neproučeni ili slabo shvaćeni. Istraživači su rekli da AI alat, nazvan CLEAN, nadmašuje vodeće najsavremenije alate u preciznosti, pouzdanosti i osetljivosti. Bolje razumevanje enzima i njihovih funkcija bila bi blagodat za istraživanja u oblasti genomike, hemije, industrijskih materijala, medicine, farmaceutskih proizvoda i još mnogo toga.
„Baš kao što ChatGPT koristi podatke iz pisanog jezika za kreiranje prediktivnog teksta, mi koristimo jezik proteina da predvidimo njihovu aktivnost“, rekao je vođa studije Huimin Zhao, profesor hemijskog i biomolekularnog inženjeringa na Univerzitetu Ilinois Urbana-Šampejn. „Skoro svaki istraživač, kada radi sa novom sekvencom proteina, želi odmah da zna šta protein radi. Osim toga, kada pravi hemikalije za bilo koju primenu — biologiju, medicinu, industriju — ovaj alat će pomoći istraživačima da brzo identifikuju odgovarajuće enzime koji su potrebni za sintezu hemikalija i materijala“.
Istraživači će objaviti svoje nalaze u časopisu Science i učiniti CLEAN dostupnim na mreži 31. marta.
Sa napretkom u genomici, mnogi enzimi su identifikovani i sekvencirani, ali naučnici imaju malo ili nimalo informacija o tome šta ti enzimi rade, rekao je Džao, član Instituta za genomsku biologiju Carl R. Voese u Ilinoisu.
Drugi računarski alati pokušavaju da predvide funkcije enzima. Tipično, oni pokušavaju da dodele enzimsku proviziju – ID kod koji pokazuje kakvu reakciju enzim katalizuje – tako što upoređuju traženu sekvencu sa katalogom poznatih enzima i pronalaze slične sekvence. Međutim, ovi alati ne rade tako dobro sa manje proučavanim ili nekarakterističnim enzimima, ili sa enzimima koji obavljaju više poslova, rekao je Zhao.
„Nismo prvi koji koristi AI alate za predviđanje brojeva provizije enzima, ali smo prvi koji koristi ovaj novi algoritam dubokog učenja koji se zove kontrastivno učenje za predviđanje funkcije enzima. Smatramo da ovaj algoritam radi mnogo bolje od AI alate koje koriste drugi“, rekao je Zhao. „Ne možemo garantovati da će svačiji proizvod biti tačno predviđen, ali možemo dobiti veću preciznost od druge dve ili druge tri metode.
Istraživači su eksperimentalno verifikovali svoj alat i računarskim i in vitro eksperimentima. Otkrili su da alat ne samo da može da predvidi funkciju prethodno nekarakterističnih enzima, već je i ispravio enzime koje je vodeći softver pogrešno označio i ispravno identifikovao enzime sa dve ili više funkcija.
Džaova grupa čini CLEAN dostupnim na mreži za druge istraživače koji žele da okarakterišu enzim ili utvrde da li enzim može da katalizuje željenu reakciju.
„Nadamo se da će ovaj alat biti široko korišćen od strane široke istraživačke zajednice“, rekao je Zhao. „Sa veb interfejsom, istraživači mogu samo da unesu sekvencu u okvir za pretragu, poput pretraživača, i vide rezultate.“
Zhao je rekao da grupa planira da proširi AI iza CLEAN-a kako bi karakterisao druge proteine, kao što su vezujući proteini. Tim se takođe nada da će dalje razvijati algoritme za mašinsko učenje kako bi korisnik mogao da traži željenu reakciju i da bi veštačka inteligencija ukazala na odgovarajući enzim za posao.
„Postoji mnogo nekarakterističnih vezujućih proteina, kao što su receptori i faktori transkripcije. Takođe želimo da predvidimo i njihove funkcije“, rekao je Zhao. „Želimo da predvidimo funkcije svih proteina tako da možemo znati sve proteine koje ćelija ima i bolje proučiti ili konstruisati celu ćeliju za biotehnologiju ili biomedicinske primene.
Zhao je takođe profesor bioinženjeringa, hemije i biomedicinskih i translacionih nauka Univerziteta Illinois na Medicinskom koledžu Karl Ilinois.
Rad je naslovljen „Predviđanje funkcije enzima korišćenjem kontrastivnog učenja“.