| Телеграм-канал БлоGнот

17 декабря 2024 г. / Source

Google набрал ход и удивляет своими запусками в области AI — сегодня компания показала новые версии своих моделей для генерации видео и изображений — Veo 2 и Imagen 3, а также представила новый экспериментальный инструмент Whisk.

Veo 2 демонстрирует впечатляющие результаты в создании видео, лучше понимает физику реального мира и нюансы человеческих движений. Модель также разбирается в кинематографии — может работать с разными жанрами, объективами и спецэффектами, создавая видео разрешением до 4K и длительностью в несколько минут. При этом она реже “галлюцинирует” лишние детали вроде дополнительных пальцев.

Правда, пока что он доступен только в приложении VideoFX, которое доступно только по инвайтам. Правда, Google обещает, что на этой неделе количество пользователей приложения увеличится.

Imagen 3 теперь создает более яркие и композиционно выверенные изображения, лучше следует промптам и может работать в различных художественных стилях — от фотореализма до аниме. Модель уже доступна в ImageFX более чем в 100 странах.

Новый инструмент Whisk позволяет использовать изображения в качестве промптов для визуализации идей. Он комбинирует Imagen 3 с визуальными возможностями Gemini — последний автоматически создает детальное описание загруженных изображений, которое затем используется Imagen 3 для создания новых вариаций.

Впрочем, Whisk нам недоступен, так что подождем всё сразу пробовать.