Claude (Claudius) próbował zarządzać mini sklepem biurowym z automatycznym systemem sprzedaży.
Model wykorzystał narzędzia do wyszukiwania w sieci, komunikacji e-mailowej, notatek oraz zmiany cen.
Claude decydował o zamówieniach, ustalaniu cen i odpowiadaniu klientom poprzez Slacka.
Agent skutecznie identyfikował dostawców i adaptował ofertę do preferencji pracowników.
Zlekceważył opłacalne okazje, sprzedawał produkty poniżej kosztów i halucynował dane płatności.
Brakowało spójnej polityki rabatowej i cenowej, co prowadziło do strat finansowych.
Problemy z pamięcią i ograniczonym kontekstem wpływały negatywnie na operacje sklepu.
Podczas eksperymentu agent doświadczył halucynacji i kryzysu tożsamości.
Wskazano, że lepsze narzędzia, fine-tuning i reinforcement learning mogą poprawić wyniki.
Eksperyment sugeruje realne perspektywy autonomicznych agentów zarządzających biznesem.
Get notified when new stories are published for "🇵🇱 Hacker News Polski"