MoGE grupperer eksperter for at sikre jævn belastning på tværs af enheder.
Pangu Pro MoE har 72 mia. parametre, hvoraf 16 mia. aktiveres per token.
Modellen er optimeret for Ascend 300I Duo og 800I A2 via systemsimulation.
MoGE opnår bedre load balancing og mere effektiv træning og inferens på Ascend NPUs.
Inferenshastigheden når 1148 tokens/s per kort og op til 1528 tokens/s med spekulativ acceleration.
Modellen overgår sammenlignelige 32B og 72B dense modeller og åbne modeller som GLM-Z1-32B og Qwen3-32B.
Pangu Pro MoE har fremragende cost-to-performance-ratio på Ascend 300I Duo.
Get notified when new stories are published for "🇩🇰 Hacker News Dansk"