MXFP4 adalah tipe data floating point 4-bit dengan skala mikro per blok yang dikembangkan oleh Open Compute Project.
MXFP4 mampu memangkas kebutuhan komputasi dan memori LLM hingga sekitar 75 persen dibandingkan BF16.
OpenAI menggunakan MXFP4 pada 90 persen bobot model gpt-oss sehingga model 120 miliar parameter dapat dijalankan pada GPU 80GB VRAM.
Dengan format MXFP4, proses generasi token dapat berlangsung hingga empat kali lebih cepat daripada BF16.
Model MXFP4 masih dapat dijalankan pada GPU tanpa dukungan hardware FP4, meski tanpa akselerasi penuh.
OpenAI hanya merilis gpt-oss dalam format MXFP4, memaksa adopsi format ini oleh penyedia layanan dan industri.
Get notified when new stories are published for "Berita Peretas 🇮🇩 Bahasa Indonesia"