MiniMax-M1 er den første store åbne hybrid-opmærksomheds model.
Modellen bruger en hybrid blanding-af-eksperter-arkitektur og en lys-opmærksomhedsmekanisme.
Den understøtter en kontekstlængde på 1 million tokens.
Forbedrer skalerbarheden under testtid med lavt ressourceforbrug.
Overgår andre førende åbne vægtmodeller i komplekse opgaver.
Trænet med storskalig forstærkningslæring på forskellige problemer.
Get notified when new stories are published for "🇩🇰 Hacker News Dansk"