Istraživački tim razvija brzi proces za genetsko poboljšanje osobina biljaka

Istraživački tim razvija brzi proces za genetsko poboljšanje osobina biljaka

Istraživači zainteresovani za poboljšanje date osobine u biljkama sada mogu da identifikuju gene koji regulišu ekspresiju ove osobine bez ikakvih eksperimenata.

Kranthi Varala sa Univerziteta Purdue i 10 koautora objavili su detalje novog regulatornog alata za otkrivanje gena zasnovanog na vebu u Zborniku radova Nacionalne akademije nauka. Varala ima patent na čekanju na rezultate koji se odnose na ekonomski važnu biosintezu ulja semena.

Tim Purdue-USDA nastojao je da izgradi resurs koji uči, iz velike količine javno dostupnih podataka, da brzo identifikuje koji posebni geni koji se nazivaju faktori transkripcije regulišu ekspresiju date osobine u različitim biljnim vrstama.

„Svaka studija se fokusira na nekoliko njih“, rekao je Varala, docent hortikulture i pejzažne arhitekture. „Naša premisa je bila da ako možemo sve to staviti u jednu analizu, onda možemo koristiti ove podatke da izgradimo nešto globalno.

Arabidopsis je služio kao model biljke PNAS studije, „ali ovaj pristup nema ništa specifično za Arabidopsis“, rekao je Varala. „Pristup je dovoljno opšti da biste mogli da počnete sa skupom podataka o kukuruzu. Mogli biste to da uradite sa pirinčem, sa paradajzom, bez obzira na usevu na kome radite sve dok imate hiljade merenja ekspresije gena koje su ljudi uradili. A postoje sada preko desetina vrsta gde imamo desetine hiljada studija o ekspresiji gena.“

Da bi dokazao da sistem funkcioniše, tim se fokusirao na genetski put koji reguliše način na koji biljke prave i skladište ulje u svom semenu. Tim je odabrao tu osobinu zbog njenog značaja u proizvodnji hrane i biogoriva i zato što je već poznato više od 300 gena koji su uključeni.

Genetski manipulišući transkripcionim faktorima biljke, istraživači mogu povećati ili smanjiti količinu ulja proizvedenog u semenu.

Kao i drugi istraživači, Varala je tokom godina sprovodio mnoge projekte gde je njegov cilj bio da identifikuje gene i regulatore uključene u rešavanje jednog problema. To je značilo sprovođenje pažljivih, dugotrajnih eksperimenata. Ali prikupljeni podaci nisu pružili sve odgovore koje je tražio. Uporedio je to sa izradom jednačine znajući samo tri od 10 uključenih faktora.

„Ne možete da rešite jednačinu“, rekao je. Isto tako, Varala je često želeo da postavi više pitanja nego što su podaci mogli da odgovore. To ga je motivisalo da izgradi okvir koji koristi sve moguće podatke da postavi ta pitanja bez potrebe da radi sve relevantne eksperimente kako bi dobio listu kandidata kojima je onda potrebna genetska validacija.

„Pokušavam da skratim početnu fazu prikupljanja podataka“, rekao je Varala, kako bi naučnici mogli da se fokusiraju na sprovođenje genetskih validacija. Ali da bi to uradio, njegov tim je morao da počne sa skupom podataka zasnovanim na 18.000 pojedinačnih studija.

Varala i njegov tim analizirali su ovaj masivni skup podataka koristeći Bell i sada penzionisane Braun superkompjutere u Purdue-ovom Rosen centru za napredno računarstvo. Tim je napravio okvir za mašinsko učenje kako bi ubrzao proces za druge.

Bilo bi nemoguće da jedna osoba to uradi ručno. Tim bi to mogao da uradi, ali to bi dovelo do predrasuda u načinu na koji članovi grupe obrađuju podatke. Klasifikator mašinskog učenja radi bez pristrasnosti.

Novina pristupa je u tome što se umesto povlačenja podataka koji se odnose na sve organe, fokusira na skupove podataka specifičnih za organe. Nezavisne mreže gena regulišu ove organe – lišće, korenje, izdanke, cveće i seme.

„Umesto da koristimo sve organe, rekli smo, u okviru eksperimenata sa semenom koje su ljudi radili godinama, možemo li da koristimo sve podatke da naučimo nešto što se dešava u semenu, a ne nužno u korenu ili listu ili cvetu? To se poboljšalo naš pristup mnogo“, rekao je Varala.

Tim je koristio računarsku metodu nazvanu pristup zaključivanja da bi predvideo koji faktori transkripcije će regulisati proces biosinteze ulja semena u Arabidopsisu.

„Oni koje poznajemo pomažu nam da potvrdimo da naš pristup funkcioniše ispravno. Oni koje ne poznajemo su dobri kandidati za otkrivanje nove biologije“, rekao je Varala. „Ovaj čisto računarski pristup ne zna ništa o semenima ili ulju ili bilo čemu sličnom. Dali smo mu listu gena i uspeo je da ponovo otkrije one poznate bez poznavanja bilo kakvog biološkog konteksta.“

Glavni autor, Rajeev Ranjan, postdoktorski istraživač na Odeljenju za hortikulturu i pejzažnu arhitekturu u Purdueu, uzeo je ostalih 12 od 20 najboljih i pitao da li su ta predviđanja tačna. „Uspeli smo da generišemo mutantne linije za jedanaest od tih dvanaest. Pet od tih jedanaest menja sadržaj ulja u semenu“, rekao je on. „Dalje, takođe smo pokazali da prekomerna ekspresija jednog faktora povećava semensko ulje do dvanaest procenata.

Osam poznatih regulatornih gena, dodatih osam novih, pokazalo je da je pristup zaključivanja tačno identifikovao 13 od 20 najboljih kandidata. Snaga pristupa je u tome što radeći samo na listi gena, može sa velikom preciznošću predvideti koji će regulisati osobinu od interesa.

„To je dugo trajalo jer je to dug, komplikovan proces i nije bilo garancije da će uspeti“, rekao je Varala iz četvorogodišnjeg projekta. „Ništa u ovoj skali ranije nije pokušano.“