Gemma 3n è un modello AI mobile-first e multimodale per dispositivi edge, capace di gestire immagini, audio, video e testo.
Disponibile in due versioni ottimizzate (E2B a 5B parametri, E4B a 8B) che operano con soli 2–3 GB di memoria.
L’architettura MatFormer annidata offre due modelli integrati (E2B ed E4B) e consente di creare taglie personalizzate con Mix-n-Match.
Le Per-Layer Embeddings (PLE) alleggeriscono il carico sulla memoria dell’acceleratore permettendo di caricare sul CPU gran parte dei parametri.
Il KV Cache Sharing accelera del 2× la gestione di contesti lunghi, ideale per streaming video e audio.
L’encoder audio integrato supporta trascrizione automatica (ASR) e traduzione parlato-testo on-device.
MobileNet-V5-300M è il nuovo encoder visivo ultra-efficiente che offre fino a 60 fps real-time con footprint ridotto.
Ampio supporto in ecosistemi open source (Hugging Face, llama.cpp, Docker, Google AI Edge, Ollama e altri).
Disponibile oggi con guide, demo e challenge per sviluppatori (Gemma 3n Impact Challenge).
Get notified when new stories are published for "🇮🇹 Hacker News Italiano"