Istraživači su razvili platformu koja kombinuje automatizovane eksperimente sa veštačkom inteligencijom da predvide kako će hemikalije reagovati jedna na drugu, što bi moglo da ubrza proces dizajniranja novih lekova.
Predviđanje kako će molekuli reagovati je od vitalnog značaja za otkrivanje i proizvodnju novih farmaceutskih proizvoda, ali istorijski je ovo bio proces pokušaja i grešaka, a reakcije često ne uspevaju. Da bi predvideli kako će molekuli reagovati, hemičari obično simuliraju elektrone i atome u pojednostavljenim modelima, proces koji je računski skup i često netačan.
Sada su istraživači sa Univerziteta u Kembridžu razvili pristup zasnovan na podacima, inspirisan genomikom, gde su automatizovani eksperimenti kombinovani sa mašinskim učenjem da bi se razumela hemijska reaktivnost, što uveliko ubrzava proces. Oni su svoj pristup, koji je potvrđen na skupu podataka od više od 39.000 farmaceutski relevantnih reakcija, nazvali hemijskim „reaktomom“.
Njihovi rezultati, objavljeni u časopisu Nature Chemistri, su proizvod saradnje između Kembridža i Pfizera.
„Reaktom bi mogao da promeni način na koji razmišljamo o organskoj hemiji“, rekla je dr Ema King-Smit iz Kembridž laboratorije Kevendiš, prva autorka lista. „Dublje razumevanje hemije moglo bi nam omogućiti da mnogo brže pravimo farmaceutske proizvode i mnoge druge korisne proizvode. Ali što je još važnije, razumevanje za koje se nadamo da ćemo stvoriti biće od koristi svakome ko radi sa molekulima.“
Reaktomski pristup izdvaja relevantne korelacije između reaktanata, reagensa i performansi reakcije iz podataka i ukazuje na praznine u samim podacima. Podaci se generišu iz veoma brzih automatizovanih eksperimenata sa velikom propusnošću.
„Hemija visoke propusnosti je promenila igru, ali smo verovali da postoji način da se otkrije dublje razumevanje hemijskih reakcija od onoga što se može primetiti iz početnih rezultata eksperimenta velike propusnosti“, rekao je King-Smit.
„Naš pristup otkriva skrivene odnose između komponenti reakcije i ishoda“, rekao je dr Alfa Li, koji je vodio istraživanje. „Skup podataka na kojem smo obučili model je ogroman — to će pomoći da se proces hemijskog otkrića dovede od pokušaja i greške do doba velikih podataka.“
U povezanom radu, objavljenom u Nature Communications, tim je razvio pristup mašinskom učenju koji omogućava hemičarima da uvedu precizne transformacije u unapred određene regione molekula, omogućavajući brži dizajn lekova.
Pristup omogućava hemičarima da podese složene molekule — poput promene dizajna u poslednjem trenutku — bez potrebe da ih prave od nule. Pravljenje molekula u laboratoriji je obično proces u više koraka, poput izgradnje kuće. Ako hemičari žele da menjaju jezgro molekula, konvencionalni način je da se ponovo izgradi molekul, kao što je rušenje kuće i obnavljanje od nule. Međutim, osnovne varijacije su važne za dizajn lekova.
Klasa reakcija poznatih kao reakcije funkcionalizacije u kasnoj fazi pokušava da direktno uvede hemijske transformacije u jezgro, izbegavajući potrebu da se počne od nule. Međutim, izazovno je učiniti funkcionalizaciju u kasnoj fazi selektivnom i kontrolisanom – obično postoji mnogo regiona molekula koji mogu da reaguju i teško je predvideti ishod.
„Funkcionalizacije u kasnoj fazi mogu dati nepredvidive rezultate, a trenutne metode modeliranja, uključujući našu sopstvenu stručnu intuiciju, nisu savršene“, rekao je King-Smith. „Predvidljiviji model bi nam dao priliku za bolji skrining.
Istraživači su razvili model mašinskog učenja koji predviđa gde će molekul reagovati i kako mesto reakcije varira u zavisnosti od različitih uslova reakcije. Ovo omogućava hemičarima da pronađu načine da precizno podese jezgro molekula.
„Prethodno smo obučili model na velikom broju spektroskopskih podataka – efektivno podučavajući model opštoj hemiji – pre nego što smo ga fino podesili da predvidi ove zamršene transformacije“, rekao je King-Smit. Ovaj pristup je omogućio timu da prevaziđe ograničenje malih podataka: postoji relativno malo reakcija funkcionalizacije u kasnoj fazi prijavljenih u naučnoj literaturi. Tim je eksperimentalno potvrdio model na raznovrsnom skupu molekula sličnih lekovima i bio je u stanju da precizno predvidi mesta reaktivnosti pod različitim uslovima.
„Primena mašinskog učenja u hemiji često je ugušena problemom da je količina podataka mala u poređenju sa prostranstvom hemijskog prostora“, rekao je Li. „Naš pristup – dizajniranje modela koji uče iz velikih skupova podataka koji su slični, ali nisu isti kao problem koji pokušavamo da rešimo – rešava ovaj fundamentalni izazov sa malim brojem podataka i može da otključa napredak izvan funkcionalizacije u kasnoj fazi.“