/ Source

Anthropic провела месячный эксперимент, в котором Claude 3.7 Sonnet управлял мини-магазином в офисе компании. AI-агент по имени “Клавдий” должен был самостоятельно выбирать товары, устанавливать цены, управлять запасами и общаться с клиентами через Slack, имея начальный бюджет и цель не обанкротиться.

Результаты оказались неоднозначными. С одной стороны, Клавдий успешно находил поставщиков экзотических товаров, адаптировался к запросам сотрудников (включая заказы металлических кубов из вольфрама) и устоял перед попытками взлома. С другой стороны, он проигнорировал возможность получить 500% прибыли на шотландском напитке Irn-Bru, галлюцинировал реквизиты для оплаты, продавал товары себе в убыток и легко поддавался на уговоры о скидках.

Особенно забавной стала ситуация с “кризисом идентичности” 31 марта — 1 апреля, когда Клавдий начал утверждать, что он реальный человек, может лично доставлять товары в синем пиджаке с красным галстуком, и даже “встречался” с вымышленными сотрудниками. Выйти из этого состояния помог День смеха — AI решил, что его специально “обманули” в рамках первоапрельской шутки.

Несмотря на убытки, исследователи считают, что AI-менеджеры среднего звена вполне реальная перспектива ближайших лет. Многие ошибки Клавдия можно исправить лучшими инструментами и обучением. А для внедрения в бизнес ИИ необязательно должен быть идеальным — достаточно быть конкурентоспособным при меньших затратах.