Poslednjih godina, veštačka inteligencija je pokazala ogroman potencijal za razvoj i unapređenje širokog spektra tehnologija. Dobar primer je procena pravca lica, koja pronalazi aplikacije u sistemima za pomoć vozaču koji sprečavaju ometanu vožnju, metode za sprečavanje varanja na pregledima i softver za kreiranje trodimenzionalnih (3D) virtuelnih avatara.
Tradicionalne tehnike procene orijentacije lica prepoznaju karakteristične delove lica, uključujući nos, oči i usta, i otkrivaju njihove pokrete. Međutim, takve dvodimenzionalne (2D) metode zasnovane na slici izazivaju zabrinutost za privatnost i ne uspevaju kada su crte lica skrivene zbog maske ili ako je lice okrenuto na stranu.
Rešenje može biti u optimizaciji detekcije lica korišćenjem podataka oblaka tačaka (podaci dobijeni iz diskretnog skupa tačaka podataka) i senzora dubine. U stvari, neke prethodne studije su koristile model procene zasnovan na dubokom učenju podataka 3D oblaka tačaka u pet pravaca lica: frontalno, dijagonalno frontalno, desno, levo i horizontalno. Međutim, s obzirom na nivo tačnosti koji je potreban za sisteme pomoći vozaču koji ključno verifikuju status vozača, ova klasifikacija od pet klasa (k = 5) je nedovoljna za zadovoljavajuće otkrivanje pravca lica.
Da bi rešili ovo ograničenje, naučnici sa Tehnološkog instituta Šibaura, predvođeni profesorom Čintakom Premačandrom sa Fakulteta za inženjerstvo i nauku, razvili su precizniji, horizontalni pristup detekcije širokog dometa (sa k > 5). Oni su precizno izmerili horizontalni ugao lica tokom prikupljanja podataka o treningu koristeći žiroskopske senzore.
Njihov rad je stavljen na internet u IEEE Sensors Journal.
U ovoj studiji, naučnici su prikupili podatke oblaka tačaka iz različitih orijentacija koristeći senzor dubine, koji je integrisan sa žiro senzorom tokom prikupljanja podataka. Ovi podaci su korišćeni za obuku modela klasifikacije zasnovanog na dubokom učenju, koji je korišćen za procenu orijentacije lica.
Naučnici su promenili horizontalni ugao lica u odnosu na kameru sa +90 stepeni na -90 stepeni, koristeći veličine koraka od 30, 22,5, 18 i 15 stepeni između njih. Kao rezultat toga, klasifikacija pravca lica bila je predstavljena sa više od sedam klasa (k = 7, 9, 11, 13).
„Precizni podaci o obuci za svaku orijentaciju dobijeni su integracijom senzora dubine i žiro senzora, koji smanjuju broj uzoraka oblaka tačaka potrebnih za konstruisanje modela klasifikacije. Štaviše, primena procesa smanjenja težine da bi se smanjila težina podataka oblaka tačaka je poboljšana efikasnost treninga i rezultiralo brzom procenom orijentacije lica“, objašnjava prof. Premachandra.
Predloženi metod klasifikacije, dizajniran za više od sedam časova, postiže izvanredne performanse u detekciji pravca lica kroz duboko učenje. Na primer, pokazao je stope tačnosti klasifikacije od preko 98%, 95% i 91% za 7, 9 i 11 klasa, respektivno, što predstavlja značajno poboljšanje u odnosu na konvencionalne tehnike procene orijentacije lica.
Sve u svemu, ova studija otvara nova vrata širokom spektru praktičnih primena gde je potrebna precizna detekcija orijentacije lica. Kako objašnjava prof. Premachandra, „Naši nalazi nude potencijalno rešenje za rešavanje problema kao što je ometana vožnja, koja može biti rezultat gledanja u stranu ili zaspavanja tokom vožnje. Koristeći ovaj metod procene orijentacije lica, može biti moguće upozoriti vozače u situacijama pospanost i na kraju pomoći u smanjenju učestalosti saobraćajnih nesreća na globalnom nivou.“