Duge nekodirajuće RNK (lncRNA) su sveprisutni transkripti sa ključnim regulatornim ulogama u različitim biološkim procesima, uključujući remodeliranje hromatina, post-transkripcionu regulaciju i epigenetske modifikacije. Dok akumuliranje dokaza razjašnjava mehanizme pomoću kojih biljne lncRNA moduliraju rast, razvoj korena i mirovanje semena, njihova tačna identifikacija ostaje izazovna zbog nedostatka metoda specifičnih za biljke.
Trenutno su glavne metode za identifikaciju biljnih lncRNA u velikoj meri razvijene na osnovu skupova podataka o ljudima ili životinjama. Shodno tome, tačnost i efikasnost ovih metoda u predviđanju biljnih lncRNA nije u potpunosti procenjena.
Nedavno je u časopisu Horticulture Research objavljen istraživački članak pod nazivom „Plant-LncPipe: računarski cevovod koji pruža značajno poboljšanje u identifikaciji lncRNA biljaka“ grupe koju predvodi Jian-Feng Mao sa Univerziteta za šumarstvo u Pekingu i Univerziteta Umea.
Ova studija je u velikoj meri prikupila visokokvalitetne podatke o sekvenciranju RNK iz različitih biljaka i koristila ove podatke specifične za biljke da bi ponovo obučila modele tri glavna alata za predviđanje lncRNA, naime CPAT, LncFinder i PLEK. Performanse preobučenih modela su upoređene i procenjene sa drugim popularnim alatima za predviđanje lncRNA, kao što su CPC2, CNCI, RNAplonc i LncADeep.
Rezultati su pokazali da su ponovo obučeni modeli značajno poboljšali performanse predviđanja za biljne lncRNA. Među njima, dva preobučena modela, LncFinder-plant i CPAT-plant, nadmašila su druge u višestrukim metrikama evaluacije, čineći ih najpogodnijim alatima za identifikaciju lncRNA biljaka.
Ovo istraživanje razvilo je računarski cevovod pod nazivom Plant-LncPipe za identifikaciju i analizu biljnih lncRNA.
Ovaj cevovod integriše dva modela identifikacije vrhunskih performansi, CPAT-plant i LncFinder-plant, omogućavajući sveobuhvatan računarski proces koji obuhvata prethodnu obradu sirovih podataka, sklapanje transkripta, identifikaciju lncRNA, klasifikaciju lncRNA i poreklo lncRNA. Ovaj računarski cevovod se može široko primeniti na različite biljne vrste. Plant-LncPipe je javno dostupan.
Studija pokazuje da je ponovna obuka modela predviđanja lncRNA na visokokvalitetnim transkriptomskim podacima biljaka omogućila preciznije hvatanje karakteristika lncRNA biljaka, značajno povećavajući preciznost i pouzdanost predviđanja. Studija je naglasila važnost prekvalifikacije specifične za vrstu kako bi se poboljšala tačnost modela. Preobuka postojećih zrelih modela zadržala je prethodno akumulirano iskustvo i metodologije dok je dodatno pojačala primenljivost i tačnost modela.