Il progetto miniDiffusion è un'implementazione del modello Stable Diffusion 3.5 in puro PyTorch, progettato per scopi educativi e sperimentali.
Il codice si concentra sulla semplificazione massima, con solo circa 2800 linee di codice che vanno dai VAE al DiT fino agli script di training e dataset.
Gli encoder di testo sono implementati nei file t5_encoder.py e clip.py, con tokenizer in tokenizer.py.
La repository comprende implementazioni di modelli come VAE, CLIP e Encoder di Testo T5, e include funzionalità avanzate come il Multi-Modal Diffusion Transformer Model.
Il progetto è sotto licenza MIT e viene descritto come in fase sperimentale, richiedendo ulteriori test.
Get notified when new stories are published for "🇮🇹 Hacker News Italiano"