Enzimi igraju ključnu ulogu u ćelijskim metaboličkim procesima. Da bi omogućili kvantitativnu procenu ovih procesa, istraživači treba da znaju takozvani „broj obrtaja“ (skraćeno: k cat ) enzima. U časopisu Nature Communications, tim bioinformatičara sa Univerziteta Hajnrih Hajne u Dizeldorfu (HHU) sada opisuje alatku za predviđanje ovog parametra za različite enzime koristeći metode veštačke inteligencije.
Enzimi su važni biokatalizatori u svim živim ćelijama. Obično su to veliki proteini, koji vezuju manje molekule – takozvane supstrate – a zatim ih pretvaraju u druge molekule, „proizvode“.
Bez enzima, reakcija koja pretvara supstrate u proizvode ne bi mogla da se odvija, ili bi to mogla da se odvija veoma malom brzinom. Većina organizama poseduje hiljade različitih enzima. Enzimi imaju mnogo primena u širokom spektru biotehnoloških procesa iu svakodnevnom životu—od razlaganja testa za hleb do deterdženata.
Maksimalna brzina kojom određeni enzim može da pretvori svoje supstrate u produkte određena je takozvanim obrtnim brojem k kat. To je važan parametar za kvantitativna istraživanja aktivnosti enzima i igra ključnu ulogu u razumevanju ćelijskog metabolizma.
Međutim, u eksperimentima je dugotrajno i skupo odrediti k cat broj obrtaja, zbog čega oni nisu poznati za ogromnu većinu reakcija. Istraživačka grupa za računarsku biologiju ćelije u HHU na čelu sa profesorom dr Martinom Lerčerom je sada razvila novi alat pod nazivom TurNuP za predviđanje broja k cat obrtaja enzima pomoću AI metoda.
Da bi se obučio k cat model predviđanja, informacije o enzimima i katalizovanim reakcijama su pretvorene u numeričke vektore korišćenjem modela dubokog učenja. Ovi numerički vektori poslužili su kao ulaz za model mašinskog učenja — takozvani model povećanja gradijenta — koji predviđa brojeve obrtaja k cat.
Glavni autor Alekander Kroll je rekao: „TurNuP nadmašuje prethodne modele i čak se može uspešno koristiti za enzime koji imaju samo malu sličnost sa onima u skupu podataka za obuku. Prethodni modeli nisu bili u stanju da daju bilo kakva smislena predviđanja osim ako najmanje 40% enzimske sekvence nije identično najmanje jednom enzimu u setu za obuku. Nasuprot tome, TurNuP već može da napravi smislena predviđanja za enzime sa maksimalnim identitetom sekvence od 0 do 40%.
Profesor Lercher dodaje: „U našoj studiji pokazujemo da se predviđanja TurNuP-a mogu koristiti za predviđanje koncentracija enzima u živim ćelijama mnogo tačnije nego što je to bio slučaj do sada.“
Kako bi model predviđanja učinio lako dostupnim što većem broju korisnika, tim HHU je razvio veb server prilagođen korisniku, koji drugi istraživači mogu da koriste za predviđanje broja k cat obrtaja enzima.