Guida Sviluppatori a Gemma 3n

Gemma 3n è un modello AI mobile-first e multimodale per dispositivi edge, capace di gestire immagini, audio, video e testo.

Disponibile in due versioni ottimizzate (E2B a 5B parametri, E4B a 8B) che operano con soli 2–3 GB di memoria.

L’architettura MatFormer annidata offre due modelli integrati (E2B ed E4B) e consente di creare taglie personalizzate con Mix-n-Match.

Le Per-Layer Embeddings (PLE) alleggeriscono il carico sulla memoria dell’acceleratore permettendo di caricare sul CPU gran parte dei parametri.

Il KV Cache Sharing accelera del 2× la gestione di contesti lunghi, ideale per streaming video e audio.

L’encoder audio integrato supporta trascrizione automatica (ASR) e traduzione parlato-testo on-device.

MobileNet-V5-300M è il nuovo encoder visivo ultra-efficiente che offre fino a 60 fps real-time con footprint ridotto.

Ampio supporto in ecosistemi open source (Hugging Face, llama.cpp, Docker, Google AI Edge, Ollama e altri).

Disponibile oggi con guide, demo e challenge per sviluppatori (Gemma 3n Impact Challenge).

Get notified when new stories are published for "🇮🇹 Hacker News Italiano"

No Sign-In needed. One-Click Subscribe.