TREAD encaminha tokens selecionados aleatoriamente de camadas iniciais para camadas profundas do modelo.
O método é agnóstico à arquitetura, não exige modificações estruturais nem parâmetros adicionais.
TREAD reduz o custo computacional e simultaneamente melhora a performance na geração visual.
O algoritmo acelera a convergência em até 14x comparado ao DiT em 400 000 iterações e 37x em relação ao melhor resultado do DiT em 7 000 000 iterações.
Alcança um FID competitivo de 2.09 em modo guiado e 3.93 em modo não guiado.
Get notified when new stories are published for "Hacker News 🇵🇹 Português"