Сегодня OpenAI анонсировала запуск нового семейства моделей искусственного интеллекта, оптимизированных для программирования, чтобы усилить свои позиции на фоне растущей конкуренции от таких компаний, как Google и Anthropic. Новые модели доступны для разработчиков через программный интерфейс приложений (API).
Семейство моделей включает три версии: GPT-4.1, GPT-4.1 Mini и GPT-4.1 Nano. По словам Кевина Уэила, главного директора по продуктам OpenAI, новые модели превзошли как наиболее распространённую модель компании GPT-4o, так и её крупнейшую модель GPT-4.5 в некоторых аспектах.
Модель GPT-4.1 набрала 55% на SWE-Bench, известном бенчмарке для оценки способности моделей к программированию, что на несколько процентных пунктов выше, чем у других моделей OpenAI. «Эти модели отличны в программировании и следовании сложным инструкциям», — отметил Уэил в ходе прямой трансляции.
Согласно последним данным, способность AI-моделей писать и редактировать код значительно улучшилась за последние месяцы, что открывает новые автоматизированные возможности для прототипирования программного обеспечения и повышения эффективности так называемых AI-агентов. В прошлом месяце конкуренты, такие как Anthropic и Google, также представили модели, хорошо справляющиеся с программированием.
OpenAI успешно использует интерес к ChatGPT, который был представлен в конце 2022 года, для расширения своей деятельности, предлагая доступ к более продвинутым чат-ботам и моделям AI. В интервью TED, состоявшемся на прошлой неделе, генеральный директор OpenAI Сэм Альтман сообщил, что у компании уже 500 миллионов активных пользователей в неделю, и этот показатель продолжает быстро расти.
Все новые модели имеют возможность анализа в восемь раз большего объёма кода одновременно, что улучшает их способность вносить улучшения и исправлять ошибки. Также новая версия GPT-4.1 на 40% быстрее своей предшественницы GPT-4o, что значительно снижает стоимость обработки запросов пользователей.
Проектирование и тестирование новых моделей в OpenAI остаётся в центре внимания, поскольку компания продолжает исследовать пути повышения эффективности и снижению затрат на разработку.
