Model V-JEPA 2 osiąga nowoczesne wyniki w zrozumieniu i przewidywaniu wizualnym w świecie fizycznym oraz umożliwia planowanie robotów bez treningu na nowośc.
Nowy model wspiera trzy nowe benchmarki do oceny zdolności rozumienia świata fizycznego przez istniejące modele wideo.
V-JEPA 2 korzysta z architektury Meta Joint Embedding Predictive Architecture (JEPA), a jego trening obejmuje obserwację bez akcji oraz trening uwzględniający akcje robota.
Model V-JEPA 2 może być używany do planowania w środowiskach, które nie były wcześniej trenowane, np. przy używaniu nowych przedmiotów.
Get notified when new stories are published for "🇵🇱 Hacker News Polski"