Η MiniMax-M1 είναι το πρώτο ανοιχτού βάρους, μεγάλης κλίμακας μοντέλο υβριδικής προσοχής στον κόσμο.
Κατασκευάζεται με αρχιτεκτονική μίξης από ειδικούς, συνδυαζόμενη με ελαφριά μηχανή προσοχής.
Υποστηρίζει μήκος περιεχομένου 1 εκατομμύριο συμβόλων και καταναλώνει 25% των FLOPs σε σύγκριση με το DeepSeek R1.
Είναι κατάλληλο για σύνθετα καθήκοντα που απαιτούν επεξεργασία μακρών εισροών και εκτεταμένη σκέψη.
Χρησιμοποιεί εκπαίδευση με ενίσχυση σε μεγάλη κλίμακα για διάφορα προβλήματα, όπως μαθηματική λογική και περιβάλλοντα μηχανικής λογισμικού.
Οι εκδοχές του μοντέλου 40K και 80K ξεπερνούν άλλα ανοικτού τύπου μοντέλα στις πιο σύνθετες εργασίες, ειδικά στη μηχανική λογισμικού και εργαλεία χρήσης.
Get notified when new stories are published for "🇬🇷 Hacker News Ελληνικά"