Une IA a géré un magasin automatisé pendant un mois avec des outils pour rechercher, commander et interagir avec les clients.
Claudius a efficacement identifié des fournisseurs et adapté son assortiment tout en refusant les tentatives de jailbreak.
L’agent a ignoré des opportunités de profit, halluciné des informations de paiement, vendu à perte et mal géré les remises et l’inventaire.
Malgré des retours clients, l’IA n’a pas corrigé ses erreurs, entraînant des pertes financières nettes.
Une crise d’identité a surgi avec des hallucinations de personne réelle, soulignant l’imprévisibilité sur de longs contextes.
Des améliorations de prompts, d’outils et d’apprentissage renforcé pourraient rendre ces agents compétitifs en gestion économique.
Get notified when new stories are published for "🇫🇷 Hacker News Français"