Инновационная разработка ученых из MIT, McGill, ETH Zurich, Johns Hopkins, Yale и Mila-Quebec AI Institute представляет собой новый подход к управлению качеством и структурой генерации текстов и программного кода с помощью больших языковых моделей (LLMs). Этот метод позволяет автоматизированно направлять модели на создание корректного и структурированно правильного контента, существенно повышая эффективность и точность при меньших вычислительных затратах.
Основная особенность техники – использование алгоритмов последовательного Монте-Карло (SMC), которые реализуют параллельное поколение и динамическое распределение ресурсов на основе оценки вероятности правильности сгенерированных выходных данных. Такой подход позволяет отбрасывать неперспективные варианты на ранних этапах, фокусируясь на наиболее качественных результатах.
Исследователи продемонстрировали эффективность своего метода в генерации Python-кода, SQL-запросов, молекулярных структур и планов для робототехники. В ряде случаев небольшие LLM с применением их архитектуры превосходили «большие» модели по точности и структурной корректности, при этом используя значительно меньшие ресурсы.
Авторы подчеркивают, что данная технология может найти широкое применение в автоматизированных инструментах для научных исследований, анализа данных и разработки программного обеспечения. В перспективе она может сделать AI-генерацию более надежной для непрофессиональных пользователей, например, позволяя бизнесменам писать сложные SQL-запросы через простые естественные команды.
По словам João Loula, «наше решение не учит модель правильности, а внедряет инженерные знания и ограничения, чтобы направлять выводы модели и гарантировать их соблюдение структурных правил и смысловых требований». Развитие этих методов обещает повысить качество автоматической генерации и расширить возможности использования AI в различных сферах, от научных исследований до бизнес-аналитики.
