OpenAI представила новую мощную функцию генерации изображений, полностью интегрированную в модель GPT-4o. Теперь пользователи могут создавать не просто красивые картинки, а практически полезные и точные изображения, включая логотипы, диаграммы и инфографику, с высокой степенью детализации и отличным отображением текста.
Ключевое преимущество GPT-4o — способность понимать контекст и следовать сложным инструкциям пользователя. Модель может обрабатывать до 10-20 различных объектов в одном изображении, сохраняя их свойства и отношения друг с другом, что позволяет создавать по-настоящему сложные и содержательно точные визуализации.
Кроме того, GPT-4o обладает продвинутыми возможностями обучения в процессе взаимодействия с пользователем, анализируя загружаемые изображения и интегрируя детали в дальнейшие генерации.
Все генерируемые изображения будут помечены водяными знаками. Функция станет доступна в течение этой недели для всех пользователей ChatGPT, включая бесплатных. Через некоторое время станет доступно и использование функции через API.
Если же кому-то хочется продолжать использовать для генерации картинок DALL-E, оно останется доступным для использования через отдельный DALL-E GPT.