Компания Google объявила о запуске ранней версии модели Gemini 2.5 Flash, доступной через Gemini API в Google AI Studio и Vertex AI. Эта новая версия является значительным обновлением, основанным на успешной модели 2.0 Flash, и предлагает улучшенные возможности рассуждений при сохранении высоких показателей скорости и низкой стоимости.
Gemini 2.5 Flash стала первой полностью гибридной моделью рассуждений, которая позволяет разработчикам включать или отключать процесс мышления. Также предусмотрена возможность настройки бюджета на размышления, что дает возможность находить оптимальный баланс между качеством, стоимостью и задержкой. При этом, даже с отключенным мышлением, модель сохраняет скорости, характерные для 2.0 Flash, и улучшает общую производительность.
Новая модель может проводить процесс «мышления», что позволяет ей лучше понимать запросы, разбивать сложные задачи на подзадачи и более точно планировать ответы. Gemini 2.5 Flash показывает высокие результаты на сложных задачах в LMArena, уверенно занимая второе место после модели 2.5 Pro.
Разработчики получили возможность гибкой настройки бюджета на размышления, что позволяет контролировать максимальное количество токенов, генерируемых в процессе обсуждения. Более высокий бюджет позволяет модели глубже анализировать задачи, улучшая качество ответов, однако, модель автоматически определяет, сколько времени потратить на размышления в зависимости от сложности запроса.
Представленная версия модели доступна в предварительном режиме, и Google призывает разработчиков экспериментировать с параметром бюджета размышлений, чтобы оптимизировать решение сложных задач. Обновления для Gemini 2.5 Flash будут представлены в дальнейшем, прежде чем модель станет доступной для полноценного использования в производственных условиях.
