Zincir Düşünce Modellerinin Kırılgan Gerçeği

1

LLM'lerin zincir düşünce (CoT) yetenekleri gerçek mantıksal akıl yürütme değil, eğitim verisinden öğrendikleri desenlerin taklidine dayanıyor.

2

CoT modelleri, eğitim verisinden farklı veya yeni mantıksal dönüşümlerle karşılaştıklarında performansları hızla bozuluyor.

3

Eğitim verisindeki uzunluk, format veya içerik farklılıkları yanıt doğruluğunu önemli ölçüde düşürüyor.

4

Modeller bazen doğru sonuçlara yanlış veya güvenilmez akıl yürütme yollarıyla ulaşabiliyor.

5

Süpervizörlü ince ayar (SFT) ile ufak ölçüde gelişme sağlansa da, bu gerçek genelleme yeteneği sağlamıyor.

6

CoT modellerinin ürettiği akıcı ama anlamsız metinler yanıltıcı bir güvenilirlik hissi yaratıyor.

7

Gelecekte model değerlendirmelerinde eğitim verisinden bağımsız görevler kullanılmalı, modeller derin çıkarımsal yetenekler göstermeli.