Qwen3-4B-Thinking-2507 meningkatkan kemampuan penalaran dalam logika, matematika, sains, pemrograman, dan tugas akademik.
Model ini memiliki perbaikan kemampuan umum seperti mengikuti instruksi, penggunaan alat, dan pembuatan teks sesuai preferensi manusia.
Memiliki kapasitas konteks panjang hingga 262.144 token untuk memahami konten besar.
Versi ini mendukung mode berpikir otomatis tanpa perlu pengaturan tambahan <think>.
Model berukuran 4 miliar parameter dengan 36 lapisan dan konfigurasi atensi 32 untuk query dan 8 untuk key/value.
Get notified when new stories are published for "Berita Peretas 🇮🇩 Bahasa Indonesia"