V-JEPA 2 er en verdensmodel, der når state-of-the-art præstationer inden for visuel forståelse og forudsigelse i den fysiske verden.
Modellen V-JEPA 2 kan bruges til robotplanlægning uden forudgående data ('zero-shot') i nye miljøer.
Der er introduceret tre nye benchmarks til at evaluere modeller for deres evne til at forstå den fysiske verden gennem video.
V-JEPA 2 benytter en joint-embedding predictive architecture (JEPA) og er trænet med selv-supervised learning.
Den nye model kan planlægge sekvenser af handlinger og forstå observationer samt forudsige verdens udvikling.
Get notified when new stories are published for "🇩🇰 Hacker News Dansk"