Hibrit düşünme modu hem düşünme hem düşünmeme modunu tek modelde destekliyor.
Araç çağrı performansı post-eğitim optimizasyonu ile önemli ölçüde geliştirildi.
Düşünme modunda önceki versiyona göre benzer kaliteyi daha hızlı sunuyor.
İki aşamalı uzun bağlam uzatma yaklaşımıyla eğitim veri seti önemli ölçüde genişletildi.
32K uzatma fazı 630 milyar tokene, 128K uzatma fazı 209 milyar tokene çıkarıldı.
UE8M0 FP8 veri formatı kullanılarak mikroskalaya uyumluluk sağlandı.
Çeşitli benchmark testlerinde düşünme ve düşünmeme modlarında yüksek başarı elde edildi.
Get notified when new stories are published for "Hacker News 🇹🇷 Türkçe"