Хрупкая имитация рассуждений LLM

1

Модели цепочки мыслей имитируют рассуждения, повторяя шаблоны обучения, а не демонстрируют истинное логическое понимание.

2

В лабораторном окружении DataAlchemy LLM проваливались при задачах «вне домена», требующих новых комбинаций ROT-шифра и циклических сдвигов.

3

Небольшие отклонения в длине, формате или последовательности операций резко ухудшали точность ответов моделей.

4

Дообучение с помощью SFT улучшает результаты на конкретных задачах, но не обеспечивает обобщённого логического вывода.

5

Исследователи предупреждают о ненадёжности «цепочек мыслей» в критически важных сферах и призывают к разработке моделей с более глубокими способностями к выводу.

Хрупкая имитация рассуждений LLM

Subscribe to Similar Stories

Хрупкая имитация рассуждений LLM

Subscribe to Similar Stories