O que entendemos sobre redes neurais

1

Compreendemos bem a matemática e o código que define redes neurais, incluindo a estrutura de matrizes e o algoritmo de descida de gradiente.

2

Sabemos exatamente quais são os objetivos de treino (por exemplo, previsão de token ou correspondência imagem-legenda) e como formulá-los.

3

Apesar de dominarmos a criação e o treino, não entendemos em detalhe as estatísticas complexas internas que levam a resultados específicos.

4

Grande parte do funcionamento final de modelos como LLMs é surpreendente e só pode ser investigada por tentativa e erro ou por interpretação mecanicista limitada.

5

A interpretabilidade mecanicista permite isolar componentes internos (como “neurónios” que detectam certos conceitos), mas é difícil e cobre apenas uma fração do que ocorre no modelo.

6

LLMs funcionam essencialmente como autocompletação avançada baseada em estatísticas de linguagem, sem um mecanismo interno facilmente interpretável.

7

Embora o entendimento completo não seja necessário para usar essa tecnologia, sua falta dificulta pesquisa, validação de comportamentos e desenvolvimento mais seguro.

O que entendemos sobre redes neurais

Subscribe to Similar Stories

O que entendemos sobre redes neurais

Subscribe to Similar Stories