Dok se ljudi pripremaju za razorni uticaj veštačke inteligencije na posao i svakodnevni život, oni u svetu audio knjiga kažu da se njihova oblast već transformiše.
AI ima sposobnost da kreira snimke koji zvuče ljudi — brzinom montažne trake — dok zaobilazi barem deo usluga ljudskih profesionalaca koji godinama zarađuju za život od svojih glasova.
Mnogi od njih već vide nagli pad poslovanja.
Tanja Ebi već 20 godina radi kao glumica i profesionalni pripovedač. U svom domu ima studio za snimanje.
Ali u proteklih šest meseci videla je da joj se radno opterećenje prepolovilo. Njene rezervacije sada traju samo do juna, dok bi se u normalnoj godini produžile do avgusta.
Mnoge njene kolege prijavljuju sličan pad.
Iako bi drugi faktori mogli biti u igri, rekla je za AFP: „Izgleda da ima smisla da AI utiče na sve nas.
Ne postoji etiketa koja identifikuje snimke potpomognute veštačkom inteligencijom kao takve, ali profesionalci kažu da hiljade audio knjiga koje su trenutno u opticaju koriste „glasove“ generisane iz baze podataka.
Među najsavremenijim, DeepZen nudi cene koje mogu smanjiti troškove proizvodnje audio knjige na jednu četvrtinu ili manje od troškova tradicionalnog projekta.
Mala kompanija sa sedištem u Londonu crpi iz baze podataka koju je kreirala beležeći glasove nekoliko glumaca od kojih je zatraženo da govore u različitim emocionalnim registrima.
„Svaki glas koji koristimo, potpisujemo ugovor o licenci i plaćamo snimke“, rekao je izvršni direktor DeepZena Kamis Tailan.
Za svaki projekat, dodao je, „plaćamo honorare na osnovu posla koji radimo“.
Ne poštuju svi taj standard, rekao je Ebi.
„Pojavljuju se sve ove nove kompanije koje nisu toliko moralne“, rekla je ona, a neke koriste glasove koji se nalaze u bazama podataka, a da za njih ne plaćaju.
„Postoji ta siva zona“ koju koristi nekoliko platformi, priznao je Tailan.
„Uzimaju tvoj glas, moj glas, pet tuđih glasova zajedno što samo stvara poseban glas… Kažu da ne pripada nikome.“
Sve kompanije za audio knjige koje je kontaktirao AFP negirale su da koriste takve prakse.
Speechki, start-up sa sedištem u Teksasu, koristi i sopstvene snimke i glasove iz postojećih baza podataka, rekao je izvršni direktor Dima Abramov.
Ali to se radi tek nakon što je potpisan ugovor koji pokriva prava korišćenja, rekao je on.
Pet najvećih američkih izdavačkih kuća nije odgovorilo na zahteve za komentar.
Ali profesionalci koje je kontaktirao AFP rekli su da nekoliko tradicionalnih izdavača već koristi takozvanu generativnu veštačku inteligenciju, koja može da kreira tekstove, slike, video zapise i glasove od postojećeg sadržaja – bez ljudske intervencije.
„Profesionalna naracija je oduvek bila i ostaće ključna za audio iskustvo slušanja“, rekao je portparol te Amazonove podružnice, giganta u američkom sektoru audio knjiga.
„Međutim, kako se tehnologija pretvaranja teksta u govor poboljšava, vidimo budućnost u kojoj ljudske performanse i sadržaj generisan iz teksta u govor mogu koegzistirati.“
Divovi američke tehnologije, duboko uključeni u eksplozivno razvijajuću oblast veštačke inteligencije, svi se bave obećavajućim poslom digitalno pripovedanih audio knjiga.
Početkom ove godine, Apple je najavio da prelazi na audio knjige sa pripovedanjem veštačke inteligencije, što je potez za koji je rekao da će „stvaranje audio knjiga učiniti dostupnijim svima“, posebno nezavisnim autorima i malim izdavačima.
Gugl nudi sličnu uslugu, koju opisuje kao „auto-naracija“.
„Moramo da demokratizujemo izdavačku industriju, jer se samo najpoznatija i velika imena pretvaraju u audio“, rekao je Tejlan.
„Sintetička naracija je upravo otvorila vrata starim knjigama koje nikada nisu snimljene, i svim knjigama iz budućnosti koje nikada neće biti snimljene zbog ekonomije“, dodao je Abramov iz Speechkija.
S obzirom na troškove snimanja zasnovanog na ljudskim bićima, dodao je, samo nekih pet odsto svih knjiga se pretvara u audio knjige.
Ali Abramov je insistirao da će rastuće tržište koristiti i glasovnim glumcima.
Oni će zaraditi više novca, napraviće više snimaka“, rekao je on.
„Suština pripovedanja je podučavanje čovečanstva kako da bude čovek. I snažno osećamo da to nikada ne bi trebalo da bude dato mašini da nas nauči kako da budemo ljudi“, rekla je Emili Elet, glumica i pripovedač audio knjiga koja je suosnivala Professional Udruženje naratora audio knjiga (PANA).
„Pripovedanje priča“, dodala je, „treba da ostane u potpunosti ljudsko.
Ebi je podvukao česte kritike digitalno generisanih snimaka.
U poređenju sa ljudskim snimkom, rekla je, AI proizvodu „nedostaje emocionalna povezanost“.
Ibi je rekla da se, međutim, plaši da će se ljudi naviknuti na mašinski generisanu verziju, „i mislim da se to tiho dešava.“
Njena želja je jednostavno „da kompanije obaveste slušaoce da slušaju komad generisan veštačkom inteligencijom… Samo želim da ljudi budu iskreni u vezi sa tim“.