MiniMax-M1 ist das erste offene, groß angelegte Hybrid-Attention-Reasoning-Modell weltweit.
Es basiert auf einer Mix-of-Experts-Architektur kombiniert mit einer Lightning-Attention-Mechanik.
Das Modell unterstützt eine Kontextlänge von 1 Million Tokens und ist effizient in der Verarbeitung und Skalierung.
MiniMax-M1 übertrifft in Experimenten andere Modelle bei komplexen Aufgaben, die lange Eingaben und intensives Denken erfordern.
Das Modell wurde mit unterschiedlichen Problemtypen im Rahmen von Reinforcement Learning trainiert.
Get notified when new stories are published for "🇩🇪 Hacker News Deutsch"