Французский стартап Pleias анонсировал выход двух новых моделей искусственного интеллекта, ориентированных на структурированное рассуждение и поддержку источников — Pleias-RAG-350M и Pleias-RAG-1B. Эти небольшие модели предназначены для задач поиска, генерации текста с ссылками и мультиязычной обработки, а также доступны в форматах, оптимизированных для работы на CPU.
Модели созданы на основе семейства Pleias 1.0 и распространяются под лицензией Apache 2.0, что позволяет организациям свободно их использовать, модифицировать и внедрять в коммерческих целях. Основная идея — обеспечить дешевое и эффективное решение для предприятий, которым важна прозрачность и возможность цитирования источников, особенно в сферах медицины, юриспруденции и финансов.
Ключевая особенность моделей — встроенная поддержка ссылок, генерируемых непосредственно во время инференса, что повышает уровень доверия и обеспечивает возможность аудита. Несмотря на относительно небольшой размер (350 миллионов и 1 миллиард параметров), модели демонстрируют высокую точность при выполнении сложных многошаговых операций и мульти-язычных задач, соперничая с более крупными аналогами.
Сооснователь Pleias Александр Дория подчеркнул их потенциал для локальных решений в Европе, учитывая ограниченность GPU и необходимость соблюдения GDPR. Планируется расширение возможностей, в том числе за счет более длинных контекстов и интеграции с системами поиска. В будущем компания надеется автоматизировать процессы цитирования и внедрять механизмы агентного поведения, что может существенно трансформировать текущие практики RAG.
