DeepSeek menunda rilis v4 dan r2 karena kendala teknis saat melatih model pakai chip Huawei Ascend, sehingga menggunakan chip Nvidia untuk pelatihan tetapi Ascend untuk inferensi.
Versi DeepSeek V3.1 dirilis dengan dua mode (Think/Non-Think), dukungan konteks hingga 128K token, dan peningkatan efisiensi serta kemampuan agen.
Uji awal melaporkan sedikit peningkatan skor, seperti 66 di benchmark SWE dan 71,6% di Aider Polyglot, meski hasilnya masih diperdebatkan.
Komunitas menunjukkan respons minim, dengan keluhan halusinasi tinggi dan kegagalan tugas sederhana, menandakan perbaikan bersifat inkremental.
DeepSeek V3.1 dianggap tidak mengubah gambaran besar, dan fokus beralih ke pengembangan v4 dan r2 selanjutnya.
Get notified when new stories are published for "Berita Peretas 🇮🇩 Bahasa Indonesia"