Google анонсировал выход обновленных версий своих моделей генерации видео и изображений Veo 2 и Imagen 3, которые теперь доступны в инструментах Google Labs — VideoFX и ImageFX, а также в новом инструменте под названием Whisk. Veo 2 генерирует высококачественные видео с улучшенной реалистичностью и пониманием кинематографии, в то время как Imagen 3 производит более яркие и лучше скомпонованные изображения с разнообразными художественными стилями.
Ранее в этом году компания представила свои модели генерации видео Veo и генерации изображений Imagen 3. За это время пользователи смогли воплотить свои идеи в жизнь с помощью этих инструментов: создатели контента на YouTube исследуют креативные возможности видеофонов для своих коротких видео, корпоративные клиенты улучшают рабочие процессы в Vertex AI, а креативщики используют VideoFX и ImageFX для рассказа своих историй. Вместе с такими партнерами, как режиссеры и бизнесмены, Google продолжает развивать и улучшать эти технологии.
Обновленная модель Veo 2 достигает передовых результатов в сравнительных тестах, проведенных с участием людей. Модель демонстрирует лучшее понимание реальной физики и нюансов человеческого движения и выражения, что позволяет улучшить детализированность и реалистичность видео. Veo 2 воспринимает уникальный язык кинематографии, так что пользователи могут запрашивать жанры, специфицировать объективы и предлагать кинематографические эффекты — и все это будет сгенерировано с разрешением до 4K.
Кроме того, Imagen 3 получил обновления, которые позволяют ему генерировать более яркие изображения и точнее следовать запросам пользователей, обеспечивая богатые детали и текстуры. С сегодняшнего дня последняя версия Imagen 3 будет доступна в ImageFX более чем в 100 странах.
Наконец, новый инструмент Whisk обеспечивает возможность создавать и объединять изображения, которые пользователь может затем модифицировать в нечто уникальное. Whisk сочетает возможности моделей Imagen 3 и визуального понимания Gemini, что позволяет легко комбинировать предметы, сцены и стили в интересных формах.
Whisk начал свое функционирование в США, где пользователи могут попробовать его в Google Labs.
