Google DeepMind представила новые модели Gemini для робототехники и искусственного интеллекта

Google DeepMind анонсировала новые разработки в области искусственного интеллекта и робототехники, представив усовершенствованные модели Gemini, ориентированные на интеграцию языка, визуальных данных и физических действий. Среди ключевых новинок — Gemini 2.5 Flash, обладающая возможностями работы с текстом, изображениями, видео и аудио, а также новой функцией «мышления» — так называемым «бюджетом мышления», позволяющим регулировать уровень рассуждений модели и ее стоимость. Эта модель демонстрирует высокие показатели на сложных тестах и превосходит конкурентов, таких как Claude 3.7 Sonnet и DeepSeek R1, по результатам испытаний Humanity’s Last Exam.

Особое внимание оказывает разработка Gemini Robotics, объединяющая возможности ИИ для управления роботами. В демонстрационных видео показано, как роботы, оснащённые новой моделью, управляемой через голосовые команды, успешно выполняют задачи: складывают бумагу, передают овощи, аккуратно помещают очки в футляр и осуществляют другие действия. Эти роботы способны применять концептуальное понимание окружающего мира для выполнения разнообразных заданий, что существенно расширяет возможности автоматизации в промышленности и услугах.

Google также представила версию Gemini Robotics-ER, которая разрабатывается для контроля конкретных роботов и может использоваться исследователями для создания собственных систем. Уведомлено о сотрудничестве с компаниями, такими как Boston Dynamics и Agility Robotics, для внедрения технологий в реальные робототехнические решения. Однако разработчики предупреждают о возможных рисках, связанных с управлением роботами ИИ, и анонсировали создание теста ASIMOV — нового бенчмарка, оценивающего безопасность и надежность роботов в различных сценариях.

Несмотря на потенциал, работая в противофазе с конкуренцией и общественными ожиданиями, Google подчеркивает, что технология находится на ранней стадии развития и требует строгого контроля, а полномасштабное внедрение таких решений возможно лишь через несколько лет.