| Телеграм-канал БлоGнот

4 декабря 2024 г. / Source

Google запустила свою модель генерации видео Veo в ограниченный доступ через платформу Vertex AI, опередив конкурирующий продукт OpenAI Sora, который был анонсирован еще в феврале, но до сих пор недоступен пользователям.

Veo может генерировать видео в разрешении 1080p различных визуальных стилей на основе текстовых или изображений-промптов. Качество генерации впечатляет — например, в демо-роликах с собакой модель сохраняет консистентность узора шерсти и ошейника при движении, хотя есть и артефакты вроде просвечивающих рук в концертном видео.

Модель включает встроенные механизмы защиты от генерации вредоносного контента и нарушения авторских прав, а также технологию цифровых водяных знаков SynthID от DeepMind. Параллельно Google расширяет доступ к Imagen 3 для создания изображений, добавляя возможности редактирования по промптам и внедрения фирменного стиля.

Впрочем, глюки генерации там так же присутствуют.