V-JEPA 2 ist ein fortschrittliches Weltmodell für visuelles Verständnis und Vorhersage in der physischen Welt.
Das Modell ermöglicht Zero-Shot-Planung und Robotersteuerung in neuen Umgebungen.
V-JEPA 2 basiert auf einer Joint Embedding Predictive Architecture (JEPA) mit einem Encoder und einem Vorhersage-Modul.
Drei neue Benchmarks wurden eingeführt, um die physische Vernunft von Modellen in Videos zu messen.
Das Modell zeigt herausragende Leistungen in Aufgaben wie Aktionserkennung und Vorhersage bei neuen Objekten und Umgebungen.
Get notified when new stories are published for "🇩🇪 Hacker News Deutsch"