Veštačka inteligencija (AI) je otvorila nove mogućnosti u muzičkoj industriji, omogućavajući razvoj alata za generisanje muzičkih kompozicija i numera za instrumente. Istraživači iz LG AI Research kompanije su predstavili interaktivni sistem koji omogućava korisnicima da lako transformišu svoje ideje u muziku. Ovaj sistem koristi autoregresivni transformator samo za dekoder, obučen na muzičkim skupovima podataka, uz intuitivan korisnički interfejs.
Model zasnovan na transformatoru podržava timski sistem za generisanje simbolične muzike, obučen na Lakh MIDI i MetaMIDI skupovima podataka. Ovi skupovi sadrže preko 400.000 MIDI datoteka sa različitim informacijama o muzičkim numerama. Kako bi obučili model, istraživači su konvertovati MIDI datoteke u reprezentaciju muzičkog događaja (REMI) formata, koji kodira MIDI podatke u tokene koji predstavljaju muzičke karakteristike.
Interfejs koji su istraživači kreirali omogućava korisnicima da odrede aspekte muzike koje žele da model generiše, kao što su instrumenti i tempo pesme. Nakon generisanja pesme, korisnici mogu da je uređuju, dodajući ili uklanjajući instrumente ili podešavajući vreme puštanja muzike.
Istraživači su zaključili da njihov model može pouzdano da generiše do 4 takta muzike na osnovu korisničkih specifikacija. U budućim studijama, planiraju da unaprede sistem kako bi generisao duže muzičke numere, proširio specifikacije korisnika i poboljšao korisnički interfejs.