Novi model za proizvodnju prirodnijeg sintetizovanog govora

Najnovija tehnološka dostignuća omogućavaju razvoj računarskih alata koji bi mogli značajno da poboljšaju kvalitet života osoba sa invaliditetom ili senzornim oštećenjima. Ovo uključuje takozvane modele konverzije elektromiografije u govor (ETS), dizajnirane da pretvaraju električne signale koje proizvode skeletni mišići u govor.

Istraživači sa Univerziteta u Bremenu i SUPSI su nedavno predstavili Diff-ETS, model za ETS konverziju koji bi mogao proizvesti prirodniji sintetizovani govor. Ovaj model, predstavljen u radu objavljenom na serveru za preprint arXiv, mogao bi se koristiti za razvoj novih sistema koji omogućavaju ljudima koji ne mogu da govore, kao što su pacijenti koji su bili podvrgnuti laringektomiji (operacija uklanjanja dela ljudske govorne kutije), da komuniciraju sa drugima.

Većina ranije uvedenih tehnika za ETS konverziju ima dve ključne komponente: EMG enkoder i vokoder. Elektromiografski (EMG) enkoder može da konvertuje EMG signale u akustične karakteristike govora, dok vokoder koristi ove karakteristike govora da sintetiše govorne signale.

„Zbog neadekvatne količine dostupnih podataka i bučnih signala, sintetizovani govor često pokazuje nizak nivo prirodnosti“, napisali su Zhao Ren, Kevin Scheck i njihove kolege u svom radu. „U ovom radu predlažemo Diff-ETS, ETS model koji koristi verovatnoća difuzije zasnovan na rezultatu za poboljšanje prirodnosti sintetizovanog govora. Model difuzije se primenjuje da bi se poboljšao kvalitet akustičkih karakteristika koje predviđa EMG enkoder. “

Za razliku od mnogih drugih ETS modela konverzije razvijenih u prošlosti, koji se sastoje od enkodera i vokodera, model istraživača ima tri komponente, naime EMG enkoder, difuzioni verovatnoćan model i vokoder. Difuzioni probabilistički model, druga od ovih komponenti, je stoga novi dodatak, koji bi mogao rezultirati prirodnijim sintetizovanim govorom.

Ren, Scheck i njihove kolege su obučili EMG enkoder da predvidi takozvani log Mel spektrogram (tj. vizuelni prikaz audio signala) i mete fonema iz EMG signala. Difuzioni probabilistički model je, s druge strane, obučen da poboljša log Mel spektrograme, dok prethodno obučeni vokoder može prevesti ovaj spektrogram u sintetizovani govor.

Istraživači su procenili Diff-ETS model u nizu testova, upoređujući ga sa osnovnom ETS tehnikom. Njihova otkrića su bila veoma obećavajuća, jer je govor koji je sintetizovao bio prirodniji i nalik čoveku od onog proizvedenog osnovnom metodom.

„U našim eksperimentima, procenili smo fino podešavanje difuzionog modela na osnovu predviđanja unapred obučenog EMG enkodera i obuku oba modela na način od kraja do kraja“, napisali su Ren, Šek i njihove kolege u svom radu. „Uporedili smo Diff-ETS sa osnovnim ETS modelom bez difuzije koristeći objektivne metrike i test slušanja. Rezultati su pokazali da je predloženi Diff-ETS značajno poboljšao prirodnost govora u odnosu na osnovnu liniju.“

U budućnosti, model ETS konverzije koji je razvio ovaj tim istraživača mogao bi se koristiti za razvoj boljih tehnologija za veštačko generisanje zvučnog govora. Ovi sistemi mogu omogućiti ljudima koji ne mogu da govore da izraze svoje misli naglas, olakšavajući njihovu interakciju sa drugima.

„U budućim nastojanjima, moguće je smanjiti broj parametara modela koristeći različite metode, na primer, kompresiju modela i destilaciju znanja, čime se generišu uzorci govora u realnom vremenu“, napisali su istraživači. „Štaviše, model difuzije se može obučiti zajedno sa enkoderom i vokoderom za dalje poboljšanje kvaliteta govora.“

Novi model za proizvodnju prirodnijeg sintetizovanog govora

AUTOPUT PAKOVRAĆE–POŽEGA: Tunel bez dozvole, deonica bez funkcije, građani bez odgovora

VUČIĆEV PAD: Šta stoji iza gubitka podrške predsedniku Srbije

Dušan Lajović na startu kvalifikacija za Australijan open igra protiv Argentinca Akoste

Perić: Neistinite su informacije da se Univerzitet iz Kosovske Mitrovice premešta u Novi Pazar

Hiljade turista zaglavljeni u severnoj Finskoj: Letovi otkazani usled ekstremne hladnoće

Tramp razmatra različite opcije za intervenciju u Iranu zbog nasilja i protesta

Sećanje na bombardovanje NATO i posledice po Srbiju kao moralni kompas društva

Dušan Lajović na startu kvalifikacija za Australijan open igra protiv Argentinca Akoste

Perić: Neistinite su informacije da se Univerzitet iz Kosovske Mitrovice premešta u Novi Pazar

Hiljade turista zaglavljeni u severnoj Finskoj: Letovi otkazani usled ekstremne hladnoće

Skup podrške studentima u Kragujevcu u 19h

UN: Avganistanu potrebno 128,8 miliona dolara za oporavak od zemljotresa

Njujork tajms: Tramp dao „zeleno svetlo“ CIA za tajne operacije unutar Venecuele

Dušan Lajović na startu kvalifikacija za Australijan open igra protiv Argentinca Akoste

Perić: Neistinite su informacije da se Univerzitet iz Kosovske Mitrovice premešta u Novi Pazar

Hiljade turista zaglavljeni u severnoj Finskoj: Letovi otkazani usled ekstremne hladnoće

Bear Grylls i njegovi ekstremni saveti o preživljavanju: Da li je pijenje urina bezbedno?

Fosilizovani kičmeni stubovi otkriveni na Aljasci potiču od neočekivane životinje, a ne vunastih mamuta

Feomelanin u crvenoj kosi: tajna supermoć za sprečavanje oštećenja ćelija

Kako percepcija o opadanju moralnosti može biti netačna i obmanjujuća

Vežbanje na hladnom vremenu: Kako smanjiti rizik od povreda tokom zimskih aktivnosti

Grčka: Brod sa migrantima potonuo, pronađena četiri tela, među kojima je jedno dete

Tragična nesreća: Pogibija ekstremnog sportiste Felixa Baumgartnera zbog ljudske greške

Zgrada u centru Madrida delimično se srušila, tri povređene osobe

Dušan Lajović na startu kvalifikacija za Australijan open igra protiv Argentinca Akoste

Obradović pred meč sa Bosnom: Moramo da vratimo zajedništvo u igri

Vaterpolisti Rumunije ubedljivo pobedli Slovačku na EP u Beogradu

Fudbaleri Crvene zvezde bolji od Debrecina u trećem pripremnom meču u Antaliji

Vaterpolisti Italije deklasirali Tursku na EP u Beogradu

Sutra oblačno, na palninama sneg – temperatura od -5 do 1 stepen

Do kraja dana oblačno sa slabim snegom, temperatura od -4 do 0 stepeni

Danas oblačno sa slabim snegom, temperatura od -4 do 0

Pročitajte još