Evolusi Arsitektur GPT-OSS

1

OpenAI merilis model LLM open-weight gpt-oss-20b dan gpt-oss-120b, pertama kali sejak GPT-2.

2

Model ini menghilangkan dropout dan mengadopsi RoPE untuk encoding posisi serta mengganti GELU dengan Swish/SwiGLU.

3

Menggunakan Mixture-of-Experts (MoE) untuk meningkatkan kapasitas model dengan memanggil sebagian pakar per token.

4

Mengoptimalkan efisiensi perhatian dengan Grouped Query Attention dan sliding window attention setiap layer kedua.

5

Mengganti LayerNorm dengan RMSNorm untuk mengurangi biaya komputasi normalisasi.

6

Mendukung kuantisasi MXFP4 untuk menjalankan model lokal pada GPU tunggal, termasuk GPU konsumen 16 GB.

7

Menyediakan kontrol tingkat reasoning dalam prompt dengan opsi low/medium/high untuk mengatur panjang dan akurasi respon.

8

Bersaing dengan Qwen3 dalam trade-off kedalaman vs lebar arsitektur dan jumlah pakar MoE.

9

Lisensi Apache 2.0 memungkinkan penggunaan komersial tanpa batasan dan model ini hampir menyamai GPT-5 pada beberapa benchmark.