U radu koji je nedavno objavljen u Nature Communications, Istraživačka grupa za modeliranje proteina HUN-REN-ELTE (Institut za hemiju) postavila je temelje za matematičku metodu, omogućavajući kompjuterski potpomognuto poređenje trodimenzionalnih struktura proteina. Metoda je jedinstvena po tome što su do sada dostupne alternative uzimale u obzir samo položaj atoma, nova tehnika, nazvana LoCoHD (Local Composition Hellinger Distance), takođe uključuje hemijske informacije o atomima.
Proteini su molekularne mašine koje sprovode procese neophodne za funkcionisanje ćelija, delujući kao molekularni prekidači, transkribujući informacije iz DNK, transportujući male i velike molekule i regulišući hemijske reakcije povezane sa metabolizmom. Međutim, da bi sve ovo uspelo, dotični protein mora imati pravu prostornu konformaciju, odnosno sopstveni, ispravan 3D raspored.
Nekoliko eksperimentalnih metoda (rendgenska kristalografija, nuklearna magnetna rezonantna spektroskopija, krio-elektronska mikroskopija) je dostupno za određivanje rasporeda atoma u proteinu, a tokom poslednjih nekoliko decenija, istraživači proteina su otkrili oblik skoro 220.000 proteina. Ovi rezultati sve više zahtevaju razvoj računarskih metoda sposobnih za analizu ovih aranžmana.
Jedan takav metod je algoritam pod nazivom LoCoHD, koji je razvio Žolt Fazekaš, dr. kandidat na hemijskoj školi ELTE Hevesi Giorgi i istraživač u istraživačkoj grupi dr Andraša Perčela. Algoritam upoređuje lokalnu sredinu oko aminokiselina u proteinima na osnovu njihove hemijske prirode (npr. elementarni sastav, naelektrisanje, hidrofobnost, itd.).
Metoda odlučuje na jednostavnoj skali od 0 do 1 koliko se dotične strukture razlikuju jedna od druge. Vrednosti blizu 0 ukazuju na veliku sličnost između atomskog rasporeda i hemijskih svojstava, dok vrednosti bliske 1 ukazuju da proteini koji se porede mogu imati veoma različita svojstva. Dobijena numerička vrednost (tzv. metrika) se stoga može koristiti za dobijanje novih informacija o sistemu koji se proučava.
Algoritam koristi protokol u više koraka za generisanje broja koji predstavlja strukturne razlike. U prvom koraku, pretvara prave atome u proteinu u takozvane primitivne atome. Oni se mogu predstaviti kao virtuelno označene pozicije čije oznake govore o hemijskoj prirodi originalnog atoma.
Tako, na primer, primitivni atom može biti „pozitivno naelektrisan azot“, „negativno naelektrisani kiseonik“, „neutralno naelektrisani kiseonik“, „aromatični ugljenik“ itd. Oznake se generišu prema tzv. primitivnom šema za kucanje, koja nam na tabelarni način govori kako da pretvorimo stvarne atome u primitivne atome. Korisnik može slobodno odrediti ovu tabelu, fiksirajući hemijsku rezoluciju metode.
Drugi korak je određivanje referentnih tačaka poređenja odabirom podskupa primitivnih atoma. Ovi odabrani specijalni primitivni atomi se nazivaju atomi sidra. Za svaki izabrani par atoma sidra, algoritam izvodi korak poređenja, čiji rezultat daje meru različitosti koju želimo. Ovi brojevi se mogu koristiti na lokalnom nivou, ili se mogu usredsrediti u jedan deskriptor koji karakteriše ceo protein.
U studiji, istraživači su istakli da se metoda može koristiti i na dvogodišnjim takmičenjima CASP (Kritička procena predviđanja strukture proteina), što je dobro poznato takmičenje u oblasti istraživanja proteina. Tokom ovog događaja, takmičari koriste različite algoritme za modeliranje oblika proteina koji imaju još neobjavljene strukture. CASP sudije koriste brojne metode poređenja strukture za procenu kandidata, ali nijedna od njih ne uzima u obzir hemiju lokalnog okruženja aminokiselina.
Koristeći podatke sa takmičenja CASP14 2020, istraživači su sada izvršili komparativnu analizu nekoliko modelovanih proteina, uključujući strukture predviđene metodom AlphaFold2 zasnovanom na veštačkoj inteligenciji. Među njima su istakli analizu proteina iz virusa SARS-CoV-2 pod nazivom ORF8. U modelovanim strukturama ovog proteina identifikovana su aminokiselinska okruženja koja se značajno razlikuju po obrascima interakcije od okruženja pronađenih u eksperimentalnoj strukturi.
Pored proučavanja statičkih struktura, istraživači su takođe testirali da li je metoda pogodna za analizu unutrašnjeg kretanja proteina. Koristili su simulacije sposobne da reprodukuju molekularna kretanja i podatke izvučene iz strukturnih ansambala. Jedan od sistema koji se proučavao bio je protein podocin, koji obavlja vitalne funkcije u bubrezima i čije mutacije mogu izazvati teška, često fatalna stanja.
LoCoHD metoda je korišćena za identifikaciju aminokiselina u proteinu koje prolaze kroz velike hemijsko-ekološke promene tokom kretanja podocina, što može uticati i na njegovu strukturu i funkciju. Slično tome, LoCoHD metoda je uspešno primenjena u proučavanju HIV-1 kapsidnog proteina, u kojem je identifikovana aminokiselina kritična za formiranje virusnog omotača.
Ovi rezultati nisu samo istraživački kuriozitet, već efikasnijim proučavanjem proteinskih struktura možemo se približiti boljem razumevanju patogena koji izazivaju teške bolesti i razvoju efikasnih lekova i terapeutika.