Google DeepMind представил модель AI Gemini 2.0 с расширенными возможностями мультимодальности

Google DeepMind анонсировал запуск Gemini 2.0, нового поколения искусственного интеллекта, который отвечает требованиям «агентного века» и предлагает новые функции, включая нативный вывод изображений и аудио, а также возможность использования инструментов.

Параллельно с этим, модель Gemini 2.0 Flash стала доступна для разработчиков и проверенных тестеров, с планами на более широкое распространение в начале следующего года. Gemini 2.0 строится на успехах предыдущих моделей, включая Gemini 1.0 и 1.5, которые сделали значительные шаги вперед в области мультимодальности.

По словам CEO Google и Alphabet Сундар Пичаи, данные лежат в основе человеческого прогресса, и благодаря новым функциям Gemini 2.0, которые позволяют интегрировать различные типы ввода и вывода, пользователи смогут получить более изощренные и полезные инструменты для работы с информацией.

Среди новых возможностей — Deep Research, функция, использующая продвинутые методы рассуждения. Она может помогать пользователям исследовать сложные темы и составлять отчеты. Кроме того, возможности для доступа к AI Overviews будут расширены, что позволит более эффективно справляться с многоэтапными вопросами.

Google также активно исследует новые агентные эксперименты, включая Project Astra и Project Mariner, которые направлены на углубление взаимодействия между человеком и ИИ. Среди прочего, Project Mariner демонстрирует потенциальные возможности AI для выполнения задач непосредственно в браузере пользователя.

Компания подчеркивает важность безопасного и ответственного подхода к разработке AI, и работает над новыми методами снижения рисков.

Gemini 2.0 обещает стать значительным шагом вперед в области ИИ, открывая новые горизонты для использования в различных приложениях, от мобильного взаимодействия до сложных исследовательских проектов.