V-JEPA 2 — это мировая модель, способная к передовому распознаванию и прогнозированию визуальной информации, а также к роботизированному планированию "с нуля".
Модель V-JEPA 2 улучшает предсказание действий и взаимодействие с незнакомыми объектами и средами.
В новой модели применяется метод самоуправляемого обучения на видеоданных, что снижает потребность в аннотации людьми.
Meta выпускает три новых эталона для оценки способности моделей к физическому пониманию мира через видео.
Get notified when new stories are published for "🇷🇺 Hacker News Русский"