MiniMax-M1 adalah model penalaran berukuran besar pertama di dunia dengan beban terbuka dan perhatian hibrida.
Model ini menggabungkan arsitektur Mixture-of-Experts (MoE) dengan mekanisme lightning attention.
MiniMax-M1 memiliki konteks panjang hingga 1 juta token dan efisien pada tugas yang membutuhkan pemrosesan input panjang dan pemikiran ekstensif.
Model ini dilatih menggunakan pembelajaran penguatan berskala besar pada berbagai masalah, termasuk rekayasa perangkat lunak dunia nyata.
MiniMax-M1 mengungguli model-model terbuka lainnya pada tugas kompleks seperti teknik perangkat lunak, penggunaan alat agentic, dan tugas konteks panjang.
Get notified when new stories are published for "Berita Peretas 🇮🇩 Bahasa Indonesia"