Понимание Нейросетей: Что Мы Знаем и Не Знаем

1

Мы полностью понимаем математику создания и обучения нейросетей.

2

Нейросети состоят из матриц и обучаются методом градиентного спуска.

3

Цели обучения заранее определены, например, предсказание токенов или генерация изображений.

4

Мы не понимаем, как именно внутренние веса вызывают конкретное поведение моделей.

5

Механистическая интерпретируемость и обратное проектирование позволяют частично выяснить внутренние механизмы.

6

Некоторые неожиданные способности, как арифметика, объясняются скрытыми геометрическими представлениями.

7

Для практического использования глубокое понимание не всегда требуется, но важно для исследований и надёжности.