TarFlow는 Masked Autoregressive Flows를 Transformer 블록으로 확장한 간단하고 확장 가능한 아키텍처이다.
이미지 패치에 오토리그레시브 Transformer 블록을 쌓고 층별로 생성 방향을 교차하여 픽셀을 직접 모델링하고 생성할 수 있다.
학습 중 가우시안 노이즈 증강, 사후 훈련 복원 절차, 클래스 조건 및 무조건 설정을 위한 효과적인 가이던스 방법을 도입하여 샘플 품질을 개선했다.
TarFlow는 이미지 우도 추정에서 기존 최고 성능을 크게 경신하며 새로운 최첨단 결과를 달성했다.
단일 정상화 흐름 모델로 확산 모델에 필적하는 샘플 품질과 다양성을 처음으로 실현했다.
Get notified when new stories are published for "🇰🇷 Hacker News 한국어"