Globalna potrošnja farmaceutskih proizvoda svake godine brzo raste, dostižući 4 milijarde doza u 2020. Kako se sve više lekova metaboliše u ljudskom telu i ulaze u postrojenja za prečišćavanje otpadnih voda i otpadnih voda, količina i vrste supstanci u tragovima koje se nalaze u njima se takođe povećavaju.
Kada ove supstance u tragovima uđu u reke i okeane i koriste se kao izvori vode, mogu imati štetne efekte na životnu sredinu i zdravlje ljudi, uključujući kancerogenezu i endokrini poremećaj. Zbog toga su potrebne tehnologije za brzo i precizno predviđanje svojstava i ponašanja ovih supstanci u tragovima, ali analiza nepoznatih supstanci u tragovima zahteva skupu opremu, vešte stručnjake i dugo vremena.
Tim Korejskog instituta za nauku i tehnologiju (KIST) predvođen Hong Seok-vonom, šefom Centra za istraživanje vodnih resursa i ciklusa, i Son Munom, višim istraživačem, razvio je tehnologiju za klasifikaciju supstanci u tragovima prema njihovim fizičko-hemijskim osobinama i predvide njihove koncentracije koristeći tehnologiju veštačke inteligencije zasnovane na grupisanju i predviđanju.
Istraživači su koristili samoorganizovane mape, tehniku veštačke inteligencije koja grupiše podatke u mape na osnovu njihovih sličnosti, da klasifikuju 29 poznatih supstanci u tragovima, uključujući medicinska jedinjenja i kofein, na osnovu informacija kao što su fizičko-hemijska svojstva, funkcionalne grupe i mehanizmi bioloških reakcija. Istraživanje je objavljeno u časopisu npj Clean Water.
Nasumične šume, tehnika mašinskog učenja koja klasifikuje podatke u podskupove, zatim su dalje izgrađene da bi se predvidela svojstva i promene koncentracije novih supstanci u tragovima.
Ako nova supstanca u tragovima pripada klasteru u samoorganizovanoj mapi, svojstva drugih supstanci u tom klasteru mogu se koristiti za predviđanje kako će se promeniti svojstva i koncentracija nove supstance u tragovima.
Kao rezultat primene ovog AI modela grupisanja i predviđanja (samoorganizovana mapa i nasumična šuma) na 13 novih supstanci u tragovima, tačnost predviđanja od oko 0,75 bila je odlična, što je daleko nadmašilo tačnost predviđanja od 0,40 postojećih AI tehnika koje koriste biološke informacije.
U poređenju sa tradicionalnim metodama predviđanja zasnovanim na formulama, model analize zasnovan na podacima istraživačkog tima KIST-a ima prednost što samo unosi fizičko-hemijska svojstva supstanci u tragovima i efikasno identifikuje kako će se koncentracija novih supstanci u tragovima promeniti u procesu tretmana otpadnih voda kroz grupisanje sa supstance sa sličnim podacima.
Pored toga, AI model vođen podacima može se koristiti u budućnosti za predviđanje koncentracije novih supstanci kao što su lekovi koji su od društvenog značaja.
„Može se primeniti ne samo na stvarna postrojenja za prečišćavanje otpadnih voda, već i na većinu objekata vezanih za prečišćavanje vode gde postoje nove supstance u tragovima, i može da obezbedi brze i tačne podatke u procesu kreiranja politike za srodne propise,“ rekao je dr. Seokvon Hong i dr Mun, sin KIST-a.
„Pošto koristi tehnologiju mašinskog učenja, tačnost predviđanja će se poboljšati kako se relevantni podaci budu akumulirali.“