Snežana, Pepeljuga i Uspavana lepotica imaju više zajedničkog od svog porekla kao klasične bajkovite figure i, sada, deo Diznijevog poznatog spiska likova. Njihove bajke su takođe pune rodnih predrasuda i stereotipa, prema naučnicima književnosti – a sada i AI.
Tim istraživača sa Univerziteta Northeastern, Univerziteta Kalifornije u Los Anđelesu i IBM Research-a kreirali su okvir veštačke inteligencije koji može da analizira dečije knjige priča i otkrije slučajeve rodne pristrasnosti. Njihovo istraživanje je objavljeno na arKsiv serveru za preprint.
O načinu na koji bajke prikazuju i podučavaju lekcije, moral i sociokulturne uloge deci, posebno mladim devojčicama, raspravlja se u akademskim krugovima i šire decenijama. Ove priče su pune princeza kojima je potrebno spasavanje i zgodnih prinčeva koji su tu da ih spasu.
Nadamo se da će alat za proveru pravopisa koji je pokretan veštačkom inteligencijom, koji je njegov tim napravio, koristiti pisci i izdavači, kao i istraživači, kako bi kreirali inkluzivnije priče za decu, kaže Dakuo Vang, vanredni profesor na Northeastern i jedan od istraživači na projektu.
„Ako u budućnosti budem imao devojčicu, ne želim da se oseća obeshrabreno da preuzme te zadatke ili da savlada te izazove [ili] kaže, neko će doći da me spase ili to ne bi trebalo da bude nešto što bih uradio kao devojka“, kaže Vang. „Ako možemo da razvijemo tehnologiju za automatsko otkrivanje ili označavanje te vrste rodnih predrasuda i stereotipa, onda ona može barem da posluži kao ograda ili sigurnosna mreža ne samo za drevne bajke, već i za nove priče koje se pišu i stvaraju svaki dan danas. “
Sav ovaj rad započeo je kao deo stalnog istraživanja tima o tome kako veštačka inteligencija može pomoći u izgradnji veština učenja jezika za malu decu. Tim je već bio zainteresovan za bajke kao alate za učenje jezika i prikupio je stotine priča iz celog sveta koje je koristio kao „korpus“ za njihov algoritam za analizu.
Angažovali su grupu stručnjaka za obrazovanje – nastavnika i naučnika – da pročešljaju priče i naprave listu pitanja i odgovora koji bi pomogli da se dokaže da li je dete učilo iz ovih priča. Krajnji rezultat je bio 10.000 parova pitanje-odgovor – i spoznaja da sve ove priče, bez obzira odakle su dolazile, imaju u sebi „tvrdoglave i duboke“ rodne stereotipe.
Princeza pojede otrovnu jabuku, bude zatvorena, kidnapovana ili prokleta ili umre i nema agenciju da promeni svoju situaciju. U međuvremenu, muški likovi – prinčevi, kraljevi i heroji – ubijali su zmajeve, razbijali kletve i spasavali princezu.
Prethodna istraživanja u ovoj oblasti fokusirala su se na ono što Vang naziva „površnim nivoom“ pristrasnosti. To je značilo analizu priča i identifikaciju parova reči ili fraza, poput „princ“ i „hrabri“, koji povezuju ideje i identitete na specifične načine. Ali Vang i ostatak tima su želeli da idu dublje.
Fokusirali su se na „vremenske narativne lance događaja“, specifičnu kombinaciju i redosled događaja i radnji koje lik doživljava ili preduzima.
„To je zapravo iskustvo i radnja koja definiše ko je ova osoba, a te akcije utiču na naše čitaoce o tome šta [oni] treba da urade ili ne treba da urade da bi oponašali taj izmišljeni lik“, kaže Vang.
Koristeći stotine priča koje su prikupili, tim je kreirao automatizovane procese za izdvajanje imena likova i polova zajedno sa svakim događajem. Zatim su te događaje uskladili kao lanac za svaki lik. Takođe su automatizovali proces grupisanja događaja i akcija po određenim kategorijama. Svaki događaj je analiziran i dat mu je odnos šanse, koliko često je povezan sa muškim ili ženskim likom.
Od 33.577 događaja analiziranih u studiji, 69% je pripisano muškim likovima, a 31% ženskim likovima. Događaji vezani za ženske likove često su bili povezani sa domaćim poslovima kao što su doterivanje, čišćenje, kuvanje i šivenje, dok su oni za muške likove bili povezani sa neuspehom, uspehom ili agresijom.
Sa svim tim informacijama, Vang i tim su kreirali alat za obradu prirodnog jezika koji bi mogao da ide dalje od analize pojedinačnih događaja kako bi se pronašla pristrasnost u lancima događaja.
„Neko se spasava pa se venčava i živi srećno do kraja života; neki drugi su ubili čudovište, spasili princezu i živeli srećno do kraja života“, kaže Vang. „Nije deo ‘živeo srećno do kraja života’ ili deo ‘venčati se’ ono što se razlikuje. Zapravo događaji koji se dešavaju pre ovih događaja u lancu čine razliku.“
Automatizacijom ovog procesa, Vang kaže da se nada da će alat naći upotrebu među ljudima izvan istraživačke zajednice koji zapravo stvaraju – ili rekreiraju – ove priče. U tom procesu, oni mogu početi da sprečavaju da priče prenesu ove zastarele, štetne ideje na sledeću generaciju.
„Sa našim alatom, oni mogu jednostavno da učitaju svoj prvi nacrt u alat kao što je ovaj i on bi trebalo da generiše neki rezultat ili metar koji pokazuje: „Evo stvari koje možete, a možda i ne želite da proverite. Ako ova namera nije ono što biste želeli da izrazite, onda bi možda trebalo da razmislite o ponovnom pisanju. Evo nekoliko predloga“, kaže Vang.
Napred, Vang i tim planiraju da prošire svoj rad kako bi sagledali druge oblike pristrasnosti. Oni će takođe koristiti svoj alat za procenu pristrasnosti druge veštačke inteligencije. Nadaju se da će koristiti svoj algoritam da analiziraju da li ChatGPT ima iste rodne predrasude i stereotipe kada kreira sadržaj zasnovan na ovim pričama.
„Mi predlažemo da je ovo zapravo zadatak, zadatak koji tehnička zajednica može da pomogne da se savlada“, kaže Vang. „Ne kažemo da je naša metoda najbolja. Mi samo kažemo da je naša metoda prva koja radi ovaj zadatak, a ovaj zadatak je toliko preovlađujući. Možda bi trebalo da preusmerimo deo naše pažnje na ove postojeće društvene izazove i zadatke.“