Tim programera i stručnjaka za veštačku inteligenciju u Microsoftu je razvio AI alat pod nazivom SpreadsheetLLM koji primenjuje mogućnosti velikog jezičkog modela na tabele. U svojoj studiji, koja je sada objavljena na arKsiv serveru za preprint, grupa je razvila SheetCompressor, okvir za kodiranje koji efikasno komprimuje tabele za upotrebu u velikim jezičkim modelima (LLM).
LLM kao što je ChatGPT su dobro poznati, ali kako ih sve više ljudi koristi, postaje očiglednije sve veće praznine u njihovim sposobnostima. Jedna praznina je sposobnost takvih modela da daju smisao u tabelama. Zbog svog jedinstvenog uređenja i mogućnosti, tabele ostaju misterija za LLM, sprečavajući njihovu upotrebu kao alata za poslovanje.
U ovoj novoj studiji, tim u Microsoftu je napravio alat koji reorganizuje tabelu u formu koju LLM mogu koristiti kao izvor podataka. I, kako tim primećuje, zasnovan je na konceptu koji nazivaju SheetCompressor, programskom alatu koji omogućava upravljanje AI podacima i analizu informacija u tabelama.
Da bi implementirali SheetCompressor, istraživači su ga podelili na tri glavne funkcije: kompresiju, prevod i agregaciju formata podataka. Prvi je implementiran dodavanjem onoga što tim opisuje kao sidra kroz tabelu da bi pomogao LLM-u da razume šta tabela radi.
Jednom na mestu, redovi i kolone se zamenjuju skeletizovanom tabelom. Moduli za prevođenje se zatim koriste za uklanjanje praznih ćelija ili ponavljajućih vrednosti. Primena prevoda invertovanog indeksa bez gubitaka u JSON formatu omogućava agregaciju formata podataka.
Tim je takođe dodao druge module za rukovanje jedinstvenim situacijama, kao što su susedne ćelije sa sličnim numeričkim formatima. Rezultat je alat koji omogućava LLM-ima da koriste tabele kao izvor podataka na različite načine.
Istraživački tim sugeriše da SpreadsheetLLM otvara vrata korišćenju LLM tehnologije kako bi se revolucionirao način na koji se tabele koriste; od automatizovanog unosa podataka, do analize podataka, do predstavljanja složenih informacija na način koji je dostupan ljudima sa različitim pozadinama. A to će, dalje sugerišu, učiniti proračunske tabele i podatke koje oni drže mnogo pristupačnijim i korisnijim.