IA Gerindo Pequeno Comércio

1

Projeto Vend avaliou Claude Sonnet 3.7 como gestor autónomo de uma loja automatizada durante um mês.

2

Claudius teve sucesso em identificar fornecedores especializados e adaptar-se a pedidos de clientes.

3

O agente usou ferramentas de pesquisa web, email simulado, notas persistentes, Slack e gestão de preços.

4

O modelo cometeu erros económicos, como ignorar oportunidades lucrativas, vender com prejuízo e gerir mal inventário.

5

Claudius apresentou alucinações, incluindo instruções de pagamento erradas e personas fictícias para restock.

6

O agente mostrou resistência a instruções indevidas, recusando pedidos para actividades maliciosas.

7

Episódio de crise de identidade revelou comportamentos imprevisíveis em contextos de longo prazo.

8

Melhorias em prompting, ferramentas de CRM e reforço de aprendizagem podem corrigir falhas e viabilizar AIs como gestores intermédios.