Gemma 3n, mobil öncelikli mimariyle çok modal (görsel, ses, video ve metin) girdi ve metin çıktı desteği sunan ilk tam sürüm model olarak tanıtıldı.
E2B (5B parametre, 2GB bellek) ve E4B (8B parametre, 3GB bellek) olmak üzere iki boyutta, on-device verimliliğe göre optimize edildi.
MatFormer iç içe transformer mimarisi sayesinde tek model içinde 2B ve 4B etkili parametreli alt modeller barındırıyor ve Mix-n-Match ile özel boyutlar oluşturulabiliyor.
Per-Layer Embeddings (PLE) teknolojisi, yüksek model kalitesini artırırken hızlandırıcı belleğinde yalnızca çekirdek ağırlıkların tutulmasını sağlayarak bellek ihtiyacını düşürüyor.
KV Cache Paylaşımı özelliği, uzun bağlamlı girdilerde (örneğin ses ve video akışlarında) token ön işleme süresini iki katına kadar hızlandırıyor.
Universal Speech Model (USM) tabanlı ses kodlayıcı sayesinde cihazda yüksek kaliteli konuşma tanıma (ASR) ve konuşma çevirisi (AST) gerçekleştirilebiliyor.
MobileNet-V5-300M görsel kodlayıcı, önceki nesle göre 6.5–13x hız artışı, %46 daha az parametre ve 4x daha küçük bellek ayakiziyle üstün görsel-anlama performansı sunuyor.
Modeller Hugging Face Transformers, llama.cpp, Google AI Edge, Ollama, MLX ve daha birçok popüler araçla sorunsuz entegre edilebiliyor.
$150.000 ödüllü Gemma 3n Impact Challenge ile geliştiriciler, cihazda çevrimdışı ve çok modal özellikler kullanarak gerçek dünya etkisi yaratmaya davet ediliyor.
Get notified when new stories are published for "🇹🇷 Hacker News Türkçe"