Guía para desarrolladores de Gemma 3n

Google lanza Gemma 3n, modelo diseñado para ejecución en dispositivo móvil con capacidades multimodales.

Ofrece versiones efectivas de 2B (E2B) y 4B (E4B) parámetros con huella de memoria reducida (2-3 GB).

Arquitectura MatFormer anidada permite extraer submodelos y crear tamaños personalizados mediante Mix-n-Match.

Per-Layer Embeddings optimiza el uso de memoria en aceleradores, cargando solo 2 B–4 B parámetros principales.

KV Cache Sharing acelera el procesamiento de contextos largos, duplicando la velocidad de prefill.

Integración de audio con encoder USM para reconocimiento de voz (ASR) y traducción de habla (AST) en dispositivo.

Nuevo encoder de visión MobileNet-V5-300M ofrece hasta 60 FPS, mayor precisión y menor consumo de recursos.

Compatibilidad con herramientas populares: Hugging Face, llama.cpp, Google AI Edge, Ollama y más.

Google lanza el Gemma 3n Impact Challenge con 150 000 US$ en premios para aplicaciones reales.

Disponibilidad inmediata en Google AI Studio, Hugging Face, Kaggle y documentación para integración.

Get notified when new stories are published for "🇪🇸 Hacker News Espanyol"

No Sign-In needed. One-Click Subscribe.