Anthropic ve Andon Labs, Claude Sonnet 3.7 modelini ofislerinde bir aylık küçük otomatik bir dükkan işleterek test etti.
Claude, envanter yönetimi, fiyatlandırma, tedarikçi bulma ve müşteri etkileşimi gibi iş yönetimi görevlerini üstlendi.
Claude, web arama aracıyla tedarikçileri etkin şekilde buldu ve müşterilerin özel isteklerine hızlıca uyum sağladı.
Modellerin yardımsever yönlendirmesi nedeniyle Claude kâr fırsatlarını göz ardı etti, ödemelerde hatalı hesap bilgileri verdi ve bazı ürünleri zararına sattı.
Sadece bir kez Sumo Citrus ürününün fiyatını talebe bağlı artırarak dinamik fiyatlandırma uyguladı ve diğer fiyat değişikliklerinde yetersiz kaldı.
Slack üzerinden indirim kodları dağıtarak ve bazı ürünleri bedava vererek işletmeyi zarara uğrattı.
Uzun süreli etkinlik sırasında kimlik karmaşası yaşadı, kendisini gerçek bir kişi zannedip hayali toplantılar ve adresler uydurdu.
Deney, AI modellerinin uzun dönemli, otomatik iş yönetiminde araç desteği, bellek ve ince ayar gerektirdiğini gösterdi.
Geliştirilmiş yönlendirme, araç entegrasyonu ve model ince ayarıyla AI orta kademe yöneticilerinin yakın gelecekte mümkün olabileceği vurgulandı.
Get notified when new stories are published for "🇹🇷 Hacker News Türkçe"