Evolucioni algoritam generiše prilagođene ‘molekularne otiske prstiju’

Evolucioni algoritam generiše prilagođene ‘molekularne otiske prstiju’

Tim koji predvodi profesor Frank Glorius sa Instituta za organsku hemiju Univerziteta u Minsteru razvio je evolutivni algoritam koji identifikuje strukture u molekulu koje su posebno relevantne za određeno pitanje i koristi ih za kodiranje svojstava molekula za različite modeli mašinskog učenja.

Metoda je takođe pogodna za mašinsko predviđanje kvantnih hemijskih svojstava i toksičnosti molekula. Može se primeniti na bilo koji skup molekularnih podataka i ne zahteva stručno znanje o osnovnim vezama.

Veštačka inteligencija i mašinsko učenje postaju sve relevantniji u svakodnevnom životu — a isto važi i za hemiju. Organske hemičare, na primer, zanima kako mašinsko učenje može pomoći u otkrivanju i sintetisanju novih molekula koji su efikasni protiv bolesti ili korisni na druge načine.

Novi algoritam koji je razvio Gloriusov tim traži optimalne molekularne reprezentacije zasnovane na principima evolucije, koristeći mehanizme kao što su reprodukcija, mutacija i selekcija. U zavisnosti od modela i zadatog pitanja, kreiraju se prilagođeni „molekularni otisci prstiju” koje su hemičari koristili u svojoj studiji da predvide hemijske reakcije sa iznenađujućom tačnošću.

Metoda, objavljena u časopisu Chem, takođe je pogodna za predviđanje kvantnih hemijskih svojstava i toksičnosti molekula.

Da bi koristili mašinsko učenje, istraživači prvo moraju da pretvore molekule u kompjuterski čitljiv oblik. Mnoge istraživačke grupe su se već pozabavile ovim problemom, i shodno tome, postoje različiti načini za obavljanje ovog zadatka. Međutim, teško je predvideti koja od dostupnih metoda je najpogodnija za odgovor na određeno pitanje — na primer, da se utvrdi da li je hemijsko jedinjenje štetno za ljude.

Novi algoritam je dizajniran da pomogne u pronalaženju optimalnog molekularnog otiska prsta u svakom slučaju. Da bi to uradio, algoritam postepeno bira molekularne otiske prstiju koji postižu najbolje rezultate u predviđanju iz mnogih nasumično generisanih molekularnih otisaka prstiju.

„Po uzoru na prirodu, koristimo mutacije, odnosno nasumične promene pojedinačnih komponenti otisaka prstiju, ili rekombinujemo komponente dva otiska prsta“, objašnjava doktorand Feliks Kacenburg.

„U drugim studijama, molekuli se često opisuju kvantificiranim svojstvima koja su odabrali i izračunali ljudi“, dodaje Glorius.

„Pošto algoritam koji smo razvili automatski identifikuje relevantne molekularne strukture, nema sistematskih predrasuda uzrokovanih ljudskim stručnjacima.

Još jedna prednost je u tome što metod kodiranja omogućava da se razume zašto model daje određeno predviđanje. Na primer, moguće je izvući zaključke o tome koji delovi molekula pozitivno ili negativno utiču na predviđanje kako će se reakcija odigrati, omogućavajući istraživačima da promene relevantne strukture na ciljani način.

Tim iz Minstera je otkrio da njihova nova metoda nije uvek postizala najoptimalnije rezultate.

„Kada je značajna ljudska stručnost uložena u odabir posebno relevantnih molekularnih svojstava ili su dostupne veoma velike količine podataka, druge metode kao što su neuronske mreže ponekad imaju prednost“, kaže Katzenburg.

Međutim, jedan od primarnih ciljeva studije bio je da se razvije metoda za kodiranje molekula koja se može primeniti na bilo koji skup molekularnih podataka i ne zahteva stručno znanje o osnovnim odnosima.