Команда исследователей из Interactive Agent представила новый исследовательский фреймворк, который позволяет создавать искусственные интеллекты (ИИ), способные понимать человеческие инструкции и выполнять действия в открытых условиях. Этот проект имеет целью преодолеть сложности, возникающие при интерпретации запросов, таких как «Поставь мяч рядом с коробкой», что требует глубокого понимания намерений и контекста.
Вместо традиционного подхода, основанного на написании компьютерного кода, исследователи выбрали путь машинного обучения (ML), который позволяет ИИ учитывать нюансы человеческих взаимодействий, создавая их в виде в игровой среде. В рамках данного проекта был собран обширный объем данных о реальном взаимодействии, который позволяет ИИ учиться и адаптироваться к поставленным задачам.
Для создания ботов исследователи использовали метод имитации, обучая агентов основам взаимодействий между людьми. Затем эти агенты улучшались благодаря циклам взаимодействия с людьми и получаемой обратной связи, что привело к созданию агентов, способных выполнять широкий спектр действий в режиме реального времени.
Выводы, полученные в ходе экспериментов, показывают, что агентов можно обучать не только путем имитации, но и с использованием метода обучения с подкреплением (RL), где человеческая обратная связь помогает формировать модель награды для оптимизации поведения агентов. Ожидается, что это исследование приведет к созданию гибких ИИ, способных к более естественному взаимодействию с людьми.
