BharatGen представляет новый многоязычный обучение модели Param 1 для индийских разработчиков

Инициатива BharatGen, поддерживаемая правительством Индии, представила новую многоязычную языковую модель (LLM) с 2,9 миллиарда параметров, под названием BharatGen Param 1 Indic Scale. Эта модель, содержащая 25% индийских данных, была создана с нуля и демонстрирует резкое отличие от других моделей, таких как Llama от Meta, которые используют всего 0,01% индийских данных.

По словам представителей BharatGen, предварительное обучение таких моделей представляет собой сложную задачу. «Мы приняли на себя этот вызов, чтобы предоставить надежную основу, которую можно легко адаптировать для конкретных приложений», — заявила организация в своем сообщении. Разработчики теперь могут настраивать модель через AIKosha для создания разнообразных приложений, включая индийские чат-боты и системы знаний.

Одновременно с запуском LLM команда, возглавляемая Ганешем Рамакришнаном, представила 20 новых моделей речи, охватывающих 19 различных индийских языков. Эти модели, нацеленные на интерфейсы с голосовым управлением и инновации на основе речи, также будут доступны через AIKosha – официальный репозиторий искусственного интеллекта от министерства MeitY.

Модели речи включают адаптивные модели синтеза речи, обеспечивающие высококачественную озвучку для таких языков как маратхи, бенгали, хинди, телефонный и других. BharatGen подчеркивает, что эти модели были созданы с использованием данных непосредственно для пяти индийских языков и заполняют значительный пробел в высококачественных, общедоступных речевых моделях.

AIKosha, запущенный министром Ашвини Вайшнавом, стал центральной базой ресурсов для моделей искусственного интеллекта в Индии. BharatGen призывает сообщество к совместной работе над созданием ИИ, который действительно «говорит» и служит Индии.

Напомним, что BharatGen включает в себя такие учреждения, как IIT Bombay, IIT Kanpur, IIT Mandi и IIT Madras. Министр ранее утверждал, что в Индии будут собственные базовые модели ИИ в ближайшие 7-8 месяцев, и BharatGen является важным звеном в этой стратегии.