V-JEPA 2 is een wereldmodel dat uitblinkt in visueel begrip en voorspelling in de fysieke wereld en kan worden gebruikt voor zero-shot robotplanning met onbekende objecten.
Het model bouwt verder op eerdere JEPA-modellen en introduceert drie nieuwe benchmarks om het fysieke redeneringsvermogen van AI-systemen te evalueren.
V-JEPA 2 maakt gebruik van een joint-embedding predictive architecture met een encoder en predictor.
Het model is getraind met meer dan 1 miljoen uur video en 1 miljoen afbeeldingen om voorspellingen en plannen te maken zonder menselijke annotatie.
Nieuwe benchmarks zoals IntPhys 2 en MVPBench testen de vaardigheden van modellen in fysiek redeneren en causaliteit.
Get notified when new stories are published for "🇳🇱 Hacker News Dutch"