Il modello DeepSeek-V3.1-Base è disponibile su Hugging Face.
Non esiste una scheda descrittiva (model card) per questo modello.
Il modello ha una dimensione di 685 miliardi di parametri.
Supporta i formati tensoriali BF16, F8_E4M3 e F32.
È distribuito in formato Safetensors e tramite nuovi provider di inferenza.
Get notified when new stories are published for "Hacker News 🇮🇹 Italiano"