TarFlow est une architecture de Flux de Normalisation basée sur des blocs Transformers autoregressifs opérant sur des patchs d’images.
La direction de l’autoregression alterne entre les couches pour améliorer la modélisation.
Trois techniques clés améliorent la qualité des échantillons : augmentation par bruit gaussien, débruitage post-entraînement, et guidance efficace pour les réglages conditionnels et non conditionnels.
TarFlow établit de nouveaux records d’estimation de vraisemblance pour les images, surpassant largement les méthodes précédentes.
Pour la première fois avec un modèle de Flux de Normalisation autonome, TarFlow génère des échantillons d’une qualité et d’une diversité comparables à celles des modèles de diffusion.
STARFlow, dérivé de TARFlow, démontre la viabilité de la synthèse d’images haute résolution via des Flux de Normalisation évolutifs.
Get notified when new stories are published for "🇫🇷 Hacker News Français"