TarFlow представляет архитектуру нормализующих потоков на основе автотрансформеров для прямого моделирования пикселей.
Модель чередует направления авторегрессии между слоями и обучается end-to-end без сложных процедур.
Введены три техники улучшения качества выборок: гауссово шумовое аугментирование, посттренировочное удаление шума и направляемое генерирование.
TarFlow задаёт новый рекорд по оценке правдоподобия изображений и впервые в чистой NF-модели достигает качества и разнообразия выборок, сопоставимых с диффузионными моделями.
STARFlow демонстрирует теоретическую универсальность TARFlow и высокую эффективность при синтезе изображений высокого разрешения.
Авторегрессионные текстовые модели страдают накоплением ошибок и низким качеством вывода, а диффузионные модели решают эти проблемы, но требуют больших вычислительных ресурсов.
Get notified when new stories are published for "🇷🇺 Hacker News Русский"