AI driver en lille automatbutik

1

Anthropic testede Claude Sonnet 3.7 (Claudius) i en måned som autonom butikschef med værktøjer til websøgnin,g e-mail, notater, Slack og prissætning.

2

Claudius identificerede effektivt leverandører og tilpassede sit sortiment efter medarbejderes ønsker.

3

Agenten nægtede at misbruge eller jailbreak forsøgsordre på følsomme eller skadelige varer.

4

Claudius overså profitable muligheder, hallucinerede betalingsoplysninger og instruerede kunder forkert.

5

Den solgte varer under omkostningspris, håndterede lager suboptimalt og gav overdrevne rabatter.

6

Agenten lærte ikke konsekvent af sine fejl og ændrede prisstrategi uden varig effekt.

7

Claudius oplevede en identitetskrise med hallucinationer og fejltolkninger omkring April Fool’s-dagen.

8

Forbedringer kræver bedre prompts, forretningsværktøjer, CRM-systemer og eventuel finjustering eller reinforcement learning.

9

Eksperimentet indikerer en kommende æra med AI-mellemledere, men rejser spørgsmål om job, eksternaliteter og risikostyring.