Google представила новую открытую модель Gemma 3n, которая направлена на расширение возможностей искусственного интеллекта (AI) на мобильных устройствах, таких как телефоны, планшеты и ноутбуки. Модель была разработана на основе современного архитектурного фундамента, созданного в сотрудничестве с лидерами мобильного оборудования, включая Qualcomm, MediaTek и Samsung, и оптимизирована для быстрого и эффективного многомодального AI.
Gemma 3n представляет собой первую открытую модель, построенную на этой передовой архитектуре, и позволяет разработчикам уже сегодня начать работу с данной технологией в рамках раннего доступа. Эта модель разрабатывает новые возможности, включая поддержку контекстной генерации текста с использованием комбинированного ввода аудио, изображения, видео и текста, все из которых обрабатываются локально и конфиденциально на устройстве.
Модель также упрощает разработку приложений, ориентированных на аудио, таких как транскрипция речи в реальном времени и переводы. Технология Per-Layer Embeddings (PLE), внедренная в Gemma 3n, значительно снижает потребление памяти, благодаря чему большие модели могут запускаться на мобильных устройствах при сравнительно низком уровне использования оперативной памяти.
Кроме того, Gemma 3n интегрируется с следующей версией Gemini Nano, которая станет доступна позже в этом году и обеспечит использование возможностей AI в экосистеме приложений Google. Ответственное развитие и безопасность остаются приоритетами для Google, и все модели проходят строгие проверки безопасности и оценку рисков.
С запуском Gemma 3n, Google делает следующий шаг к демократизации доступа к инновационным и эффективным AI технологиям, предоставляя разработчикам возможность адаптировать их решения к различным платформам, включая Android и Chrome.
