OpenAI объявила о выпуске новой мультиформатной модели gpt-image-1, встроенной в свой API, которая позволяет разработчикам и компаниям интегрировать возможности по генерации изображений в собственные платформы и инструменты. Эта модель, ранее использованная в ChatGPT, обеспечивает создание высококачественных изображений по текстовым подсказкам, их редактирование и точное отображение стилей и текста, что открывает широкие практические возможности в различных сферах, включая электронную коммерцию, дизайн, образование и игровую индустрию.
Модель демонстрирует универсальность — она способна преобразовывать эскизы в готовые визуальные материалы, редактировать существующие изображения и массово генерировать маркетинговый контент. Такие крупные компании, как Adobe, Airtable, Figma и Quora уже используют gpt-image-1 для расширения своих функциональных возможностей. Например, Adobe интегрирует модель в продукты Firefly и Express, а Airtable использует её для масштабирования креативных процессов.
OpenAI подчеркнула, что внедренные в API функции защиты и метаданные C2PA позволяют отслеживать происхождение изображений и контролировать их соответствие стандартам безопасности и содержанию. Использование API осуществляется по модели ценообразования — $5 за миллион токенов текста, $10 за входные изображение и $40 за генерацию изображения, что примерно соответствует $0.02, $0.07 и $0.19 за изображение в низком, среднем и высоком качества.
Инструмент уже доступен глобально, и компании активно тестируют его для различных задач, таких как создание логотипов, визуализаций рецептов и рекламных материалов. Новая модель укрепляет позицию OpenAI в сфере генеративных технологий и расширяет возможности интеграции ИИ в бизнес-процессы, что может существенно повысить эффективность креативных и маркетинговых команд предприятий.
