Французская стартап-компания Mistral AI в четверг представила новую платформу Document AI для бизнеса, заявив о создании нового эталона скорости и точности для обработки документов на основе оптического распознавания символов (OCR).
Платформа, способная обрабатывать запросы на низкокачественных сканах и рукописях, представляется как полнофункциональное решение для компаний, работающих с большими объемами документации. Представители компании подчеркивают, что ее решение основано на современном OCR-движке с заявленной точностью более 99% на более чем 11 языках мира.
В отличие от традиционных систем, которые испытывают трудности с обработкой документов с различными макетами, ИИ Mistral способен интерпретировать сложные документы, включая таблицы, формы, контракты и счета, а также преобразовывать их в структурированный формат JSON с пользовательскими шаблонами извлечения. Скорость обработки достигает 2000 страниц в минуту на одном процессоре GPU, что делает это решение одним из самых быстрых в своей категории.
Демонстрация, проведенная на основе юридического контракта, датированного десятилетиями назад, продемонстрировала способность платформы обрабатывать сложные параграфы, устаревшие форматы и встроенные условия, преобразуя их в четко структурированные выходные данные. Даже рукописные заметки и исторические данные о доставке оборудования были извлечены с точностью, превышающей показатели устаревших систем.
Платформа Document AI также включает инструменты для автоматизации полного жизненного цикла документов, от цифровизации и классификации до мониторинга соблюдения норм. Она поддерживает развертывание как на локальных серверах, так и в частных облаках, что важно для отраслей с строгими требованиями к защите данных.
Запуск платформы Document AI следует за более широкими тенденциями предприятий к цифровизации архивов и автоматизации рабочих процессов. Для исследовательских учреждений и многонациональных компаний, работающих с многоязычной документацией, новинка может оказаться весьма полезной.
