/ Source

OpenAI представила предварительную версию AI-агента Operator, который может самостоятельно выполнять задачи в интернете, используя собственный браузер для просмотра страниц, кликов и скроллинга. Пока доступно только в США для подписчиков ChatGPT Pro за $200 в месяц.

Агент построен на основе модели “Computer-Using Agent”, которая объединяет возможности GPT-4o по распознаванию изображений с продвинутым механизмом рассуждений через обучение с подкреплением. Operator может “видеть” интерфейс через скриншоты и взаимодействовать с ним как обычный пользователь, без необходимости в специальных API.

В общем-то, это аналог Computer Use от Anthropic, но бросается в глаза подчеркнутая утилитарность — компания подчеркивает, что сотрудничает с DoorDash, Instacart, Uber и другими компаниями, явно стремясь показать очевидные юзкейсы для ChatGPT, как ассистента для совершенно бытовых вопросов. Вероятно, и с интерфейсной точки зрения оно более дружественно и его можно использовать без особых ухищрений. Подождем, когда доедет до нас.