V-JEPA 2 adalah model dunia yang digunakan untuk pemahaman visual dan perencanaan robot di lingkungan baru tanpa pelatihan lebih lanjut.
Model ini dibangun dengan Meta Joint Embedding Predictive Architecture (JEPA) dan memiliki 1,2 miliar parameter.
V-JEPA 2 dilatih melalui pembelajaran mandiri dari video dan melibatkan dua tahap: pra-pelatihan tanpa tindakan dan pelatihan dengan aksi.
Tersedia tiga benchmark baru untuk mengevaluasi model dalam memahami dunia fisik dari video.
Benchmark IntPhys 2 dirancang untuk mengukur kemampuan model membedakan skenario yang masuk akal dan tidak masuk akal secara fisika.
Get notified when new stories are published for "Berita Peretas 🇮🇩 Bahasa Indonesia"