DeepSeek V3.1: Peningkatan Model AI Inkremental

DeepSeek menunda rilis v4 dan r2 karena kendala teknis saat melatih model pakai chip Huawei Ascend, sehingga menggunakan chip Nvidia untuk pelatihan tetapi Ascend untuk inferensi.

Versi DeepSeek V3.1 dirilis dengan dua mode (Think/Non-Think), dukungan konteks hingga 128K token, dan peningkatan efisiensi serta kemampuan agen.

Uji awal melaporkan sedikit peningkatan skor, seperti 66 di benchmark SWE dan 71,6% di Aider Polyglot, meski hasilnya masih diperdebatkan.

Komunitas menunjukkan respons minim, dengan keluhan halusinasi tinggi dan kegagalan tugas sederhana, menandakan perbaikan bersifat inkremental.

DeepSeek V3.1 dianggap tidak mengubah gambaran besar, dan fokus beralih ke pengembangan v4 dan r2 selanjutnya.

Subscribe to Similar Stories

Get notified when new stories are published for "Berita Peretas 🇮🇩 Bahasa Indonesia"

No Sign-In needed. One-Click Subscribe.

•

Berita Peretas 🇮🇩 Bahasa Indonesia•August 23, 2025 at 06:24 PM