Samonadgledano mašinsko učenje prilagođava se novim zadacima bez ponavljanja treninga

Oblast mašinskog učenja tradicionalno je podeljena u dve glavne kategorije: „nadgledano“ i „nenadgledano“ učenje. U kontrolisanom učenju, algoritmi se obučavaju na označenim podacima, gde je svaki ulaz uparen sa odgovarajućim izlazom, dajući algoritmu jasne smernice. Nasuprot tome, učenje bez nadzora oslanja se isključivo na ulazne podatke, zahtevajući da algoritam otkrije obrasce ili strukture bez ikakvih označenih izlaza.

Poslednjih godina pojavila se nova paradigma poznata kao „samokontrolisano učenje“ (SSL), koja zamagljuje granice između ovih tradicionalnih kategorija. Učenje pod nadzorom u velikoj meri zavisi od ljudskih stručnjaka koji označavaju podatke i služe kao „supervizor“. Međutim, SSL zaobilazi ovu zavisnost koristeći algoritme za automatsko generisanje oznaka iz neobrađenih podataka.

SSL algoritmi se koriste za širok spektar primena, od obrade prirodnog jezika (NLP) do kompjuterskog vida, bioinformatike i prepoznavanja govora. Tradicionalni SSL pristupi podstiču predstavljanje semantički sličnih (pozitivnih) parova da budu bliske, a one različitih (negativnih) parova da budu udaljenije.

Pozitivni parovi se obično generišu korišćenjem standardnih tehnika povećanja podataka kao što su nasumično podešavanje boje, teksture, orijentacije i izrezivanja. Usklađivanje reprezentacija za pozitivne parove može biti vođeno ili invarijantnošću, koja promoviše neosetljivost na ova povećanja, ili ekvivarijansom, koja održava osetljivost na njih.

Izazov je, međutim, u tome što sprovođenje invarijantnosti ili ekvivarijanse unapred definisanog skupa povećanja uvodi jake „induktivne pretpostavke“ – inherentne pretpostavke o svojstvima koja naučene reprezentacije moraju da zadovolje – koje su daleko od univerzalnih u nizu nizvodnih vrednosti. zadataka.

U radu objavljenom na arKsiv serveru za preprint, tim iz Laboratorije za računarske nauke i veštačku inteligenciju MIT-a (CSAIL) i Tehničkog univerziteta u Minhenu predložili su novi pristup samonadziranom učenju koji se bavi ovim ograničenjima oslanjanja na unapred definisane podatke. augmentacije, i umesto toga uči iz opšte reprezentacije koja se može prilagoditi različitim transformacijama obraćajući pažnju na kontekst, koji predstavlja apstraktni pojam zadatka ili okruženja.

Ovo omogućava učenje reprezentacija podataka koje su fleksibilnije i prilagodljivije za različite nizvodne zadatke, različite simetrije i osetljive karakteristike, eliminišući potrebu za ponovnim obučavanjem za svaki zadatak.

Nazivajući svoj metod „kontekstualno samokontrolisano učenje“ (ContextSSL), istraživači demonstriraju njegovu efikasnost kroz opsežne eksperimente na nekoliko skupova podataka. Osnovna ideja je da se uvede kontekst inspirisan svetskim modelima—predstavama agentovog okruženja koje obuhvataju njegovu dinamiku i strukturu.

Uključujući ove svetske modele, pristup omogućava modelu da dinamički prilagodi svoje reprezentacije da budu invarijantne ili ekvivarijantne na osnovu zadatka. Ovo eliminiše potrebu za obukom odvojenih reprezentacija za svaki nizvodni zadatak i omogućava opštiji i fleksibilniji pristup SSL-u.

ContextSSL koristi transformatorski modul za kodiranje konteksta kao niza tripleta stanje-akcija-sledeće stanje, koji predstavljaju prethodna iskustva sa transformacijama. Posmatrajući kontekst, model uči da selektivno sprovodi invarijantnost ili ekvivarijansu na osnovu transformacione grupe predstavljene u kontekstu.

„Konkretno, naš cilj je da obučimo reprezentacije koje postaju više ekvivalentne osnovnoj transformacionoj grupi sa sve većim kontekstom“, kaže dr. CSAIL. student Sharut Gupta, glavni autor novog rada od istraživača koji uključuju profesore MIT-a Tommi Jaakkola i Stefanie Jegelka. „Ne želimo da svaki put fino podešavamo modele, već da izgradimo fleksibilan model opšte namene koji bi mogao da se bavi različitim okruženjima sličnim ljudima.“

ContextSSL demonstrira značajna poboljšanja performansi na nekoliko benčmarka računarskog vida, uključujući 3DIEBench i CIFAR-10, za zadatke koji zahtevaju i invarijantnost i ekvivarijansu. U zavisnosti od konteksta, reprezentacija koju je naučio ContextSSL prilagođava se pravim karakteristikama koje su bile korisne za dati nizvodni zadatak.

Kao primer, tim je testirao sposobnost ContextSSL-a da nauči reprezentacije za određeni atribut pola na MIMIC-III, velikoj kolekciji medicinske dokumentacije koja uključuje ključne identifikatore kao što su lekovi, demografija pacijenata, dužina boravka u bolnici (LOS) i podaci o preživljavanju .

Tim je istražio ovaj skup podataka jer obuhvata zadatke iz stvarnog sveta koji imaju koristi i od ekvivarijanse i od invarijantnosti: ekvivarijansa je ključna za zadatke kao što je medicinska dijagnoza gde doze lekova zavise od pola i fizioloških karakteristika pacijenata, dok je invarijantnost od suštinskog značaja za osiguranje pravičnosti u predviđanju ishoda kao što je dužina boravka u bolnici ili medicinskih troškova.

Istraživači su na kraju otkrili da, kada ContextSSL vodi računa o kontekstu koji promoviše rodnu osetljivost, i tačnost predviđanja roda i predviđanje medicinskog tretmana se poboljšavaju sa kontekstom. Naprotiv, kada kontekst promoviše invarijantnost, učinak se poboljšava na osnovu predviđanja dužine boravka u bolnici (LOS) i različitih metrika pravednosti merenih izjednačenim kvotama (EO) i jednakosti mogućnosti (EOPP).

„Ključni cilj samonadgledanog učenja je da generiše fleksibilne reprezentacije koje se mogu prilagoditi mnogim nizvodnim zadacima“, kaže viši naučnik Google DeepMind za istraživanje Dilip Krišnan, koji nije bio uključen u rad. „Umesto da se peče u invarijantnosti ili ekvivarijansi a priori, mnogo je korisnije odlučiti o ovim svojstvima na način specifičan za zadatak.

„Ovaj zanimljiv rad čini važan korak u ovom pravcu. Pametnim korišćenjem sposobnosti učenja u kontekstu transformatorskih modela, njihov pristup se može koristiti za nametanje invarijantnosti ili ekvivarijanse različitim transformacijama na jednostavan i efikasan način.“

Samonadgledano mašinsko učenje prilagođava se novim zadacima bez ponavljanja treninga

AUTOPUT PAKOVRAĆE–POŽEGA: Tunel bez dozvole, deonica bez funkcije, građani bez odgovora

VUČIĆEV PAD: Šta stoji iza gubitka podrške predsedniku Srbije

Vučić: Izbori ili u maju ili decembru naredne godine, ali realnije je u decembru

Dan volontera: Milica Đurđević Stamenkovski naglašava važnost odgovornosti prema zajednici

Tepić iznela ozbiljne optužbe protiv Macure i Vučića na konferenciji za novinare

Donacije hrane kompanija u saradnji sa Bankama hrane i lokalnim zajednicama

Orban: Narednih dana se odlučuje da li će se rat iz Ukrajine proširiti na Evropu

Vučić: Izbori ili u maju ili decembru naredne godine, ali realnije je u decembru

Dan volontera: Milica Đurđević Stamenkovski naglašava važnost odgovornosti prema zajednici

Tepić iznela ozbiljne optužbe protiv Macure i Vučića na konferenciji za novinare

Fajnenšel tajms: Nikolas Maduro pooštrava ličnu bezbednost zbog većih tenzija sa SAD

Teška nesreća kod Zlatibora

Gutereš: G20 da pokrene hitne globalne akcije

Vučić: Izbori ili u maju ili decembru naredne godine, ali realnije je u decembru

Dan volontera: Milica Đurđević Stamenkovski naglašava važnost odgovornosti prema zajednici

Tepić iznela ozbiljne optužbe protiv Macure i Vučića na konferenciji za novinare

Dojče vele: Nemački naučnici otkrili antitelo protiv HIV-a

Istraživanje otkrilo izuzetno retku mutaciju u varijaciji krvi koja zbunjuje lekare

Rani znaci Alchajmerove bolesti mogu biti skriveni u načinu govora osobe

Mali „Ajnštajn“ iz Belgije završio doktorski rad iz kvantne fizike u rekordnom roku

Naučnici otkrili ključne delove ljudskog genoma gde se mutacije najčešće javljaju

Grčka: Brod sa migrantima potonuo, pronađena četiri tela, među kojima je jedno dete

Tragična nesreća: Pogibija ekstremnog sportiste Felixa Baumgartnera zbog ljudske greške

Zgrada u centru Madrida delimično se srušila, tri povređene osobe

Španski fudbaler Erik Garsija ostaje u Barseloni do juna 2031. godine

FK Crvena zvezda: Meč sa Vojvodinom u znaku humanosti i uspomene na Sinišu Mihajlovića

Mesi: Možda ću propustiti Svetsko prvenstvo 2026.

Košarkaši Crvene zvezde u Areni večeras dočekuju Barselonu

Košarkaši Partizana pobedili Bajern u prvoj utakmici posle ostavke Obradovića

Sutra oblačno sa slabom kišom, temperatura do 12 stepeni

Do kraja dana oblačno sa kišom, temperatura do 13 stepeni

Danas oblačno sa kišom, temperatura do 13 stepeni

Pročitajte još