Gemma 3n開発者ガイド公開

1

Gemma 3nがフルリリースされ、モバイルファースト設計でオンデバイスAIを強化

2

5B（E2B）／8B（E4B）モデルを実装し、実質2B／4B相当のメモリ効率（2～3GB）で動作

3

MatFormerアーキテクチャにより入れ子型のモデルサイズ切り替えやMix-n-Matchによるカスタムサイズ生成が可能

4

Per-Layer Embeddings（PLE）で高速メモリを節約しつつモデル品質を向上

5

KVキャッシュ共有で長文入力やストリーミング処理の初動速度を2倍に加速

6

Universal Speech Modelベースの音声エンコーダでオンデバイスASRとASTを実現

7

MobileNet-V5-300M視覚エンコーダでリアルタイム画像・動画解析を13倍高速化、メモリ使用量を大幅削減

8

主要ツール（Hugging Face, llama.cpp, Ollamaなど）と連携し、Gemma 3n Impact Challengeで開発コミュニティを支援