全新Gemma 3n发布,实现原生多模态(图像、音频、视频、文本)输入与文本输出。
E2B(5B参数/2GB内存)与E4B(8B参数/3GB内存)两种模型,专为设备端部署优化。
MatFormer套娃Transformer架构支持模型大小弹性切分、预提取与Mix-n-Match自定义裁剪。
Per-Layer Embeddings分层嵌入显著提升模型质量,同时减轻加速器内存负担。
KV Cache共享技术将长上下文预填处理速度提升约2倍。
集成USM音频编码器,支持本地ASR和AST,英西等语种表现优异。
MobileNet-V5视觉编码器在移动端实现量化后13倍速度提升、4倍内存缩减并提高视觉理解。
与Hugging Face、Ollama、llama.cpp等主流生态兼容,一键部署与微调。
发布Impact Challenge竞赛,提供150,000美元奖金,鼓励构建具有社会影响力的应用。
Get notified when new stories are published for "🇨🇳 Hacker News 简体中文"