Qwen3-Coder adalah model Mixture-of-Experts 480B parameter dengan 35B parameter aktif yang mendukung konteks hingga 256K token secara native dan dapat diperluas hingga 1M token.
Model ini mencapai hasil terbaik di antara model terbuka untuk tugas Agentic Coding, Agentic Browser-Use, dan Agentic Tool-Use, sebanding dengan Claude Sonnet 4.
Pra-pelatihan meliputi skala 7,5T token dengan rasio kode 70%, peningkatan kapasitas konteks besar, dan data sintetik berkualitas tinggi.
Pelatihan pasca menggunakan Code Reinforcement Learning untuk meningkatkan keberhasilan eksekusi kode dan Long-Horizon RL untuk tugas multi-langkah, memanfaatkan 20.000 lingkungan paralel di Alibaba Cloud.
Alat baris perintah Qwen Code dibuka sumbernya untuk memudahkan pemrograman agentik dan kompatibel dengan berbagai alat pengembang populer.
Qwen3-Coder dapat diakses melalui Qwen Code, integrasi dengan Claude Code, konfigurasi Cline, atau API OpenAI Compatible di Alibaba Cloud Model Studio.
Rencana pengembangan mencakup ukuran model tambahan, pengurangan biaya penyebaran, dan eksplorasi kemampuan self-improvement untuk agen pemrograman.
Get notified when new stories are published for "Berita Peretas 🇮🇩 Bahasa Indonesia"