Компания Google выпустила предварительную версию модели Gemini 2.5 Flash через Gemini API в Google AI Studio и Vertex AI. Эта новая версия, основанная на популярной модели 2.0 Flash, значительно улучшает возможности рассуждения, при этом продолжая акцент на скорости и низкой стоимости.
Gemini 2.5 Flash стал первой полностью гибридной моделью рассуждений, позволяя разработчикам включать или отключать процесс «мыслительной активности». Модель предоставляет возможность установить «бюджет на размышления», что помогает находить правильный баланс между качеством, стоимостью и задержкой. Даже при отключенной «мыслительной активности» разработчики могут сохранять высокие скорости, подобные 2.0 Flash, и улучшать общую производительность.
Новые модели Gemini 2.5 представляют собой «мыслительные модели», которые способны прорабатывать свои мысли перед ответом. Вместо мгновенной генерации вывода, модель может выполнять процесс «размышления», чтобы лучше понимать запрос, разбивать сложные задачи и планировать ответ. На сложных задачах, требующих многократных шагов рассуждения, таких как решения математических задач или анализ исследовательских вопросов, этот процесс позволяет модели давать более точные и полные ответы.
Gemini 2.5 Flash демонстрирует лучшие показатели стоимости и производительности, продолжая лидировать как модель с лучшим соотношением цены и качества. Для обеспечения гибкости разработчиков был внедрён параметр «бюджет на размышления», который позволяет точно контролировать максимальное количество токенов, которые модель может генерировать в процессе размышления.
Разработчики уже начали использовать Gemini 2.0 Flash для создания эффективных приложений, включая голосовые ассистенты и инструменты редактирования видео. Мы ждем дальнейших улучшений Gemini 2.5 Flash и более широкой доступности этой модели для производственного использования в ближайшем будущем.
