Meta ha presentato V-JEPA 2, un modello innovativo di intelligenza artificiale progettato per comprendere e prevedere lo stato fisico del mondo. Questo modello migliora le capacità di previsione e pianificazione di robot in ambienti sconosciuti con la possibilità di interazione senza preparazione previa (zero-shot).
V-JEPA 2 utilizza un'architettura di previsione a incorporamento congiunto per elaborare video, permettendo ai robot di pianificare azioni in nuovi ambienti e di trattare oggetti non previamente visti nei dati di addestramento.
Sono stati creati tre nuovi benchmark per misurare l'efficacia nella comprensione fisica del mondo da parte dei modelli esistenti: IntPhys 2 per valutare scenari fisicamente plausibili, MVPBench che misura la comprensione video-linguistica, e CausalVQA che esamina la comprensione delle relazioni causa-effetto.
Get notified when new stories are published for "🇮🇹 Hacker News Italiano"