Gemma 3nがフルリリースされ、モバイルファースト設計でオンデバイスAIを強化
5B(E2B)/8B(E4B)モデルを実装し、実質2B/4B相当のメモリ効率(2~3GB)で動作
MatFormerアーキテクチャにより入れ子型のモデルサイズ切り替えやMix-n-Matchによるカスタムサイズ生成が可能
Per-Layer Embeddings(PLE)で高速メモリを節約しつつモデル品質を向上
KVキャッシュ共有で長文入力やストリーミング処理の初動速度を2倍に加速
Universal Speech Modelベースの音声エンコーダでオンデバイスASRとASTを実現
MobileNet-V5-300M視覚エンコーダでリアルタイム画像・動画解析を13倍高速化、メモリ使用量を大幅削減
主要ツール(Hugging Face, llama.cpp, Ollamaなど)と連携し、Gemma 3n Impact Challengeで開発コミュニティを支援
Get notified when new stories are published for "🇯🇵 Hacker News 日本語"