Alibaba Cloud представил мультимодальную ИИ-модель Qwen2.5-Omni-7B

Китайский техгигант Alibaba Cloud анонсировал выпуск своей новой мультимодальной модели искусственного интеллекта Qwen2.5-Omni-7B. Эта модель, обладающая 7 миллиардами параметров, способна обрабатывать текст, изображения, аудио и видео, а также генерировать текстовые и голосовые ответы в реальном времени, что делает ее уникальным инструментом на рынке ИИ.

По словам представителей компании, Qwen2.5-Omni-7B можно запускать на периферийных устройствах, таких как мобильные телефоны и ноутбуки, без потери эффективности. Это открывает новые возможности для разработки экономичных ИИ-агентов, особенно в области голосовых приложений. Например, модель может улучшить жизнь слабовидящих людей, предоставляя им информацию о окружающей среде и помогая ориентироваться в ней.

Компания подчеркивает, что инновационность нового продукта объясняется применением новой архитектуры и высококачественными данными, использованными для обучения модели. Qwen2.5-Omni-7B уже доступна в открытом доступе на таких платформах, как Hugging Face, GitHub, ModelScope и Qwen Chat.

Такое решение соответствует современным требованиям на рынке ИИ-технологий, направленным на создание эффективных моделей, которые могут работать локально и доверительно, обеспечивая конфиденциальность пользователей. Запуск Qwen2.5-Omni-7B укрепляет позиции Alibaba в конкурентной борьбе при разработке ИИ-технологий, делая их более доступными для конечных пользователей.

Похожие записи

«Охота за единорогами» — Business StandUp тур от Оскара Хартманна

Samsung ведет переговоры о партнерстве с Perplexity AI для интеграции технологий поиска в смартфоны

Искусственный интеллект DeepNash достиг уровня эксперта в игре Stratego