Google lanza Gemma 3n, modelo diseñado para ejecución en dispositivo móvil con capacidades multimodales.
Ofrece versiones efectivas de 2B (E2B) y 4B (E4B) parámetros con huella de memoria reducida (2-3 GB).
Arquitectura MatFormer anidada permite extraer submodelos y crear tamaños personalizados mediante Mix-n-Match.
Per-Layer Embeddings optimiza el uso de memoria en aceleradores, cargando solo 2 B–4 B parámetros principales.
KV Cache Sharing acelera el procesamiento de contextos largos, duplicando la velocidad de prefill.
Integración de audio con encoder USM para reconocimiento de voz (ASR) y traducción de habla (AST) en dispositivo.
Nuevo encoder de visión MobileNet-V5-300M ofrece hasta 60 FPS, mayor precisión y menor consumo de recursos.
Compatibilidad con herramientas populares: Hugging Face, llama.cpp, Google AI Edge, Ollama y más.
Google lanza el Gemma 3n Impact Challenge con 150 000 US$ en premios para aplicaciones reales.
Disponibilidad inmediata en Google AI Studio, Hugging Face, Kaggle y documentación para integración.
Get notified when new stories are published for "🇪🇸 Hacker News Espanyol"