Google запустила свою модель генерации видео Veo в ограниченный доступ через платформу Vertex AI, опередив конкурирующий продукт OpenAI Sora, который был анонсирован еще в феврале, но до сих пор недоступен пользователям.
Veo может генерировать видео в разрешении 1080p различных визуальных стилей на основе текстовых или изображений-промптов. Качество генерации впечатляет — например, в демо-роликах с собакой модель сохраняет консистентность узора шерсти и ошейника при движении, хотя есть и артефакты вроде просвечивающих рук в концертном видео.
Модель включает встроенные механизмы защиты от генерации вредоносного контента и нарушения авторских прав, а также технологию цифровых водяных знаков SynthID от DeepMind. Параллельно Google расширяет доступ к Imagen 3 для создания изображений, добавляя возможности редактирования по промптам и внедрения фирменного стиля.
Впрочем, глюки генерации там так же присутствуют.