Команда RoboCat представила нового основания агента, способного управлять различными роботизированными манипуляторами, научившись выполнять задачи всего лишь после 100 демонстраций, а также самостоятельно генерировать новые данные для улучшения своих навыков.
С учетом того, что роботы все чаще становятся частью нашей повседневной жизни, их программирование для выполнения специфических задач остается актуальной темой. Применение недавних достижений в области искусственного интеллекта может значительно расширить возможности роботов, однако процесс создания универсальных роботов замедляется из-за необходимости собирать данные обучения в реальном времени.
В новом исследовании представлен RoboCat, самосовершенствующийся AI-агент, который обучается выполнять множество задач с использованием различных манипуляторов, автоматически создавая новые учебные данные для улучшения своей техники. RoboCat продемонстрировал скорость обучения, позволяющую ему осваивать новые задачи с помощью всего лишь 100 примеров благодаря доступу к обширному и разнообразному набору данных.
Кроме того, RoboCat базируется на многомодальной модели Gato, способной обрабатывать язык, изображения и действия в имитационных и физических средах. Встроенные в его архитектуру алгоритмы позволили агенту обучаться на миллионах траекторий выполнения задач, собирая данные из четырех различных типов роботов.
Необходимая для успешной адаптации и управления различными манипуляторами RoboCat обучался за несколько часов. Агент также продемонстрировал высокую степень успешности в выполнении задач, требующих точности и понимания, включая поднятие деталей и решение паззлов.
Согласно проведенным испытаниям, ученые отмечают, что только после 1000 демонстраций RoboCat смог управлять новыми манипуляторами так, что успешность его действий составила 86%. Таким образом, способности к самосовершенствованию RoboCat открывают новые горизонты для разработки универсальных помощников в робототехнике и ускоряют научные исследования в этой области.
