I modelli di linguaggio di grandi dimensioni, sebbene potenti, sono statici e non si adattano facilmente a compiti o conoscenze nuove.
Il quadro SEAL permette ai modelli di auto-adattarsi generando dei propri dati di finetuning e direttive di aggiornamento.
A fronte di nuovi input, il modello produce un 'auto-edit', che ristruttura l'informazione e specifica parametri di ottimizzazione per aggiornamenti persistenti dei pesi.
Viene utilizzato un ciclo di apprendimento per rinforzo con la performance del modello aggiornato come segnale di ricompensa.
I risultati degli esperimenti dimostrano che SEAL è promettente per l'adattamento auto-diretto dei modelli di linguaggio.
Get notified when new stories are published for "🇮🇹 Hacker News Italiano"