Сегодня компания Google анонсировала запуск двух обновленных моделей Gemini: Gemini-1.5-Pro-002 и Gemini-1.5-Flash-002. Данные модели строятся на основе последних экспериментальных разработок и содержат значительные улучшения по сравнению с предыдущими версиями, представленными на конференции Google I/O в мае этого года.
Новые модели доступны для разработчиков бесплатно через Google AI Studio и API Gemini, а также для крупных организаций и клиентов Google Cloud через платформу Vertex AI. Модели серии Gemini 1.5 предназначены для универсальной работы с текстами, кодом и мультимодальными задачами, что позволяет, например, обрабатывать информацию из 1000-страничных PDF-документов, отвечать на вопросы о репозиториях с более чем 10 тысяч строк кода и извлекать полезный контент из часових видеозаписей.
С последними обновлениями модели 1.5 Pro и Flash стали более эффективными, предоставляя качественную производительность в продакшене. На тестах, основанных на сложной версии популярного бенчмарка MMLU, был зафиксирован рост показателей на 7%. В то же время, на бенчмарках MATH и HiddenMath модели демонстрируют улучшение на 20%. В области визуального восприятия и генерации кода обе модели также показали прирост в диапазоне от 2 до 7%.
Кроме того, улучшена общая полезность ответов моделей, что означает меньше отказов и больше информативных ответов по широкому кругу тем. Ответы теперь более лаконичны и экономичны, а по сравнению с предыдущими поколениями длина выходных данных визуализированного контента уменьшена на 5-20%. Для чат-продуктов, где пользователи могут предпочитать более длинные ответы, доступны стратегии настройки для достижения более разговорного стиля.
Важным аспектом обновлений стала 64%-я редукция цен на входящие токены и 52%-я на выходные токены, что, по мнению разработчиков, значительно снизит затраты на использование модели Gemini 1.5 Pro, начиная с 1 октября 2024 года. Также планируется увеличение лимитов на обращение к API для моделей 1.5 Flash и 1.5 Pro, что позволит разработчикам создавать больше решений, используя Gemini.
Компания Google продолжает сосредотачиваться на создании безопасных и надежных моделей и будет предлагать набор фильтров безопасности, которые разработчики смогут использовать для своих приложений. Успешные результаты обратной связи с разработчиками касательно версии 1.5 Flash-8B побудили компанию продолжить развивать свою дорожную карту от экспериментальных моделей к более стабильным версиям.
