V-JEPA 2, video üzerinden eğitilmiş bir dünya modeli, fiziksel dünyada ileri düzey anlamak ve tahmin yapmak için kullanılıyor.
Model, tanıdık olmayan nesneler ve ortamlarla etkileşimde bulunmak üzere robot kontrolünde sıfırdan planlama yapabiliyor.
Gelecek adımlar, dünya modellerinin çok zamanlı ve çok duyusal alanlardaki yeteneklerinin geliştirilmesi olacak.
V-JEPA 2, insan performansına yakın performans gösteren üç yeni benchmark sundu.
Bu yeni benchmarklar, video üzerinden fiziksel dünyayı anlamakta mevcut modellerin performansını değerlendirmeye yönelik.
Get notified when new stories are published for "🇹🇷 Hacker News Türkçe"