MiniMax-M1은 세계 최초의 대규모 하이브리드 주의 모델입니다.
기존의 MiniMax-Text-01을 기반으로 하며 4560억 개의 매개 변수를 가지고 있습니다.
고급 라이트닝 주의 전략을 통해 효율적인 테스트 타임 계산 확장을 지원합니다.
모형은 전통적인 수학적 추리부터 소프트웨어 공학 환경에 이르는 다양한 문제를 푸는 대규모 강화 학습을 통해 훈련되었습니다.
기본적으로 1백만 개의 토큰을 지원하며, DeepSeek R1보다 8배 더 큰 콘텐츠를 통합할 수 있습니다.
40K 및 80K판의 두 가지 버전의 모델이 존재합니다.
복잡한 소프트웨어 공학 및 도구 사용, 긴 문맥 과제에서 뛰어난 성능을 발휘합니다.
Get notified when new stories are published for "🇰🇷 Hacker News 한국어"