Китайский техгигант Alibaba Cloud анонсировал выпуск своей новой мультимодальной модели искусственного интеллекта Qwen2.5-Omni-7B. Эта модель, обладающая 7 миллиардами параметров, способна обрабатывать текст, изображения, аудио и видео, а также генерировать текстовые и голосовые ответы в реальном времени, что делает ее уникальным инструментом на рынке ИИ.
По словам представителей компании, Qwen2.5-Omni-7B можно запускать на периферийных устройствах, таких как мобильные телефоны и ноутбуки, без потери эффективности. Это открывает новые возможности для разработки экономичных ИИ-агентов, особенно в области голосовых приложений. Например, модель может улучшить жизнь слабовидящих людей, предоставляя им информацию о окружающей среде и помогая ориентироваться в ней.
Компания подчеркивает, что инновационность нового продукта объясняется применением новой архитектуры и высококачественными данными, использованными для обучения модели. Qwen2.5-Omni-7B уже доступна в открытом доступе на таких платформах, как Hugging Face, GitHub, ModelScope и Qwen Chat.
Такое решение соответствует современным требованиям на рынке ИИ-технологий, направленным на создание эффективных моделей, которые могут работать локально и доверительно, обеспечивая конфиденциальность пользователей. Запуск Qwen2.5-Omni-7B укрепляет позиции Alibaba в конкурентной борьбе при разработке ИИ-технологий, делая их более доступными для конечных пользователей.
