NEVIS’22: Новый подход к эффективному переносу знаний в области компьютерного зрения

В новом исследовании, проведенном Марком-Аурелио Ранзато и Амаль Раннен-Трики, представлена инновационная методология, позволяющая улучшить процесс обучения глубоких нейронных сетей, опираясь на 30-летний опыт в области компьютерного зрения. В их статье под названием NEVIS’22: Поток из 100 задач, отобранных из 30 лет исследований в области компьютерного зрения, исследователи предлагают платформу для изучения эффективного переноса знаний в контролируемой и воспроизводимой среде.

Согласно данным, большие модели глубокого обучения (DL) добились значительных успехов в ряде областей, включая предсказание структуры белков и обработку естественного языка. Однако с увеличением масштаба моделей возникает потребность в более эффективных подходах, поскольку такая масштабируемость требует значительных вычислительных ресурсов и часто предполагает полное переобучение моделей с нуля.

Платформа NEVIS’22 включает 106 задач, извлеченных из публикаций, случайным образом отобранных из онлайн-протоколов крупных конференций по компьютерному зрению за последние три десятилетия. Эти задачи располагаются хронологически, что позволяет моделям накапливать и использовать знания для более эффективного обучения будущим задачам.

Опираясь на методологию, исследователи оценивают обучающие модели по способности изучать новые задачи, анализируя соотношение между ошибками и затратами вычислений. Первые эксперименты показывают, что модели, которые используют общую структуру задач и реализуют подходы к передаче знаний, достигают лучших результатов. В частности, использование тонкой настройки в сочетании с большими предварительно обученными моделями открывает новые перспективы для дальнейших исследований.

NEVIS’22 предоставит возможность научному сообществу разрабатывать более эффективные и результативные постоянно обучающиеся модели, что представляет собой важный шаг вперед в области компьютерного зрения.