Google запускает экспериментальную версию Gemini 2.0 Flash с поддержкой генерации изображений

Компания Google объявила о запуске экспериментальной версии Gemini 2.0 Flash, доступной для разработчиков в всех регионах, поддерживаемых Google AI Studio. Теперь пользователи могут попробовать новую возможность нативной генерации изображений с помощью обновленной модели, которая сочетает в себе мультимодальные входные данные, улучшенные возможности рассуждения и понимание естественного языка.

Gemini 2.0 Flash позволяет пользователям не только генерировать изображения, но и редактировать их в ходе естественного языкового диалога, что облегчает процесс доработки визуального контента. Например, модель может иллюстрировать рассказ, сохраняя последовательность персонажей и мест действия. Разработчики могут взаимодействовать с моделью, предоставляя ей отзывы и изменяя стиль иллюстраций.

Одной из ключевых особенностей Gemini 2.0 Flash является способ создания детализированных реалистичных изображений, что делает её особенно полезной при визуализации рецептов или создании рекламных материалов. Внутренние тесты показывают, что новая модель превосходит большинство существующих решений по точности рендеринга длительных последовательностей текста, что ранее было проблемой для аналогичных инструментов.

Разработчикам предлагается начать работу с Gemini 2.0 Flash через API, а также в Google AI Studio, чтобы создавать интерактивные истории с красивыми визуализациями. Google ожидает активной обратной связи от тестировщиков, которая поможет улучшить конечную версию продукта.