Microsoft представила первую в мире 1-битную модель ИИ BitNet b1.58 2B4T

Исследователи Microsoft объявили о создании самой крупной на сегодняшний день 1-битной модели искусственного интеллекта, получившей название BitNet b1.58 2B4T. Эта модель доступна для использования по лицензии MIT и может быть запущена на таких процессорах, как Apple M2.

Битнеты представляют собой сжатые модели, предназначенные для работы на маломощном оборудовании. В отличие от традиционных моделей, в которых веса квантуются для повышения эффективности, битнеты осуществляют квантование до трех значений: -1, 0 и 1. Это делает их значительно более эффективными с точки зрения памяти и вычислений, что позволяет быстрее работать на устройствах с ограниченными ресурсами.

BitNet b1.58 2B4T является первым битнетом с 2 миллиардами параметров и был обучен на внушительном датасете, содержащем 4 триллиона токенов, что соответствует примерно 33 миллионам книг. По словам исследователей, данная модель показала отличные результаты в тестах, обойдя таких конкурентов как Llama 3.2 1B от Meta и Gemma 3 1B от Google по ряду математических и логических задач.

BitNet b1.58 2B4T не только демонстрирует впечатляющую скорость работы, но и использует значительно меньше памяти по сравнению с аналогичными моделями. Однако для достижения таких высоких показателей требуется использование специализированного фреймворка Microsoft — bitnet.cpp, который пока работает только на ограниченном наборе оборудования.

Несмотря на обещающие характеристики, вопрос совместимости остается актуальным, так как на данный момент в списке поддерживаемых чипов отсутствуют графические процессоры, которые играют ключевую роль в инфраструктуре искусственного интеллекта. Это создает определенные трудности для массового внедрения данной модели.