Istraživači razvijaju automatsko prepoznavanje teksta za drevne klinaste ploče

Istraživači razvijaju automatsko prepoznavanje teksta za drevne klinaste ploče

Nova aplikacija za veštačku inteligenciju (AI) koju je razvio tim sa Univerziteta Martin Luter Hale-Vitenberg (MLU), Univerziteta Johanes Gutenberg u Majncu i Univerziteta primenjenih nauka u Majncu sada je u stanju da dešifruje teško čitljive tekstove na klinastim tabletama.

Umesto fotografija, AI sistem koristi 3D modele tableta, dajući znatno pouzdanije rezultate od prethodnih metoda. Ovo omogućava pretragu sadržaja više tableta da biste ih međusobno uporedili. Takođe otvara put za potpuno nova istraživačka pitanja. Nalazi su objavljeni u časopisu The Eurographics Association.

Za svoj novi pristup, istraživači su koristili 3D modele skoro 2.000 klinastih tableta, uključujući oko 50 iz kolekcije u MLU. Prema procenama, u svetu još uvek postoji oko milion takvih tableta. Mnogi od njih su stari više od 5.000 godina i stoga su među najstarijim sačuvanim pisanim zapisima čovečanstva.

Pokrivaju izuzetno širok spektar tema. „Na njima se može naći sve: od spiskova za kupovinu do sudskih odluka. Tablete pružaju uvid u prošlost čovečanstva pre nekoliko milenijuma. Međutim, veoma su izlizane i zbog toga ih je teško dešifrovati čak i za uvežbane oči“, kaže Hubert Mara, asistent profesor na MLU.

To je zato što su klinaste ploče nepečene komade gline u koje je utisnuto pisanje. Da stvar bude komplikovana, sistem pisanja je tada bio veoma složen i obuhvatao je nekoliko jezika. Zbog toga, ne samo da su potrebni optimalni uslovi osvetljenja da bi se simboli pravilno prepoznali, već je potrebno i mnogo pozadinskog znanja. „Do sada je bilo teško pristupiti sadržaju mnogih klinastih tableta odjednom — na neki način morate da znate tačno šta tražite i gde“, dodaje Mara.

Njegova laboratorija je došla na ideju da razvije sistem veštačke inteligencije koji se zasniva na 3D modelima. Novi sistem dešifruje znakove bolje od prethodnih metoda. U principu, AI sistem radi na istoj liniji kao OCR softver (optičko prepoznavanje karaktera), koji pretvara slike pisanja i teksta u mašinski čitljiv tekst.

Ovo ima mnogo prednosti. Jednom pretvoren u kompjuterski tekst, tekst se može lakše čitati ili pretraživati. „OCR obično radi sa fotografijama ili skeniranim slikama. To nije problem za mastilo na papiru ili pergamentu. Međutim, u slučaju klinastih tablica, stvari su teže jer svetlost i ugao gledanja u velikoj meri utiču na to koliko dobro se određeni karakteri mogu identifikovati, “ objašnjava Ernst Štocner iz MLU. Razvio je novi sistem veštačke inteligencije kao deo svoje magistarske teze pod Hubertom Marom.

Tim je obučio novi softver veštačke inteligencije koristeći trodimenzionalna skeniranja i dodatne podatke. Veliki deo ovih podataka obezbedio je Univerzitet primenjenih nauka u Majncu, koji nadgleda projekat velikog izdanja za 3D modele glinenih tableta. Sistem veštačke inteligencije je kasnije uspeo da pouzdano prepozna simbole na tabletama. „Bili smo iznenađeni kada smo otkrili da naš sistem čak dobro funkcioniše i sa fotografijama, koje su zapravo lošiji izvorni materijal“, kaže Stocner.

Rad istraživača iz Halea i Majnca pruža novi pristup onome što je do sada bio relativno ekskluzivan materijal i otvara mnoge nove linije istraživanja. Do sada je to bio samo prototip koji je u stanju da pouzdano razlikuje simbole iz dva jezika. Međutim, poznato je da postoji ukupno dvanaest klinopisnih jezika. U budućnosti, softver bi takođe mogao da pomogne da se dešifruju istrošeni natpisi, na primer na grobljima, koji su trodimenzionalni poput klinastog pisma.