Представлен Ghostbuster — новый метод детекции текстов, сгенерированных ИИ

В последнее время использование генеративных языковых моделей, таких как ChatGPT, стало серьезной проблемой в образовательной сфере, поскольку студенты начали использовать их для написания домашних заданий. Это привело к запретам на использование таких моделей в ряде школ. В связи с этим возникает необходимость в надежных инструментах для определения, был ли текст сгенерирован искусственным интеллектом.

Недавно была представлена новая система под названием Ghostbuster, представляющая собой современный метод для детекции AI-сгенерированного текста. Ghostbuster использует вероятностный подход, вычисляя вероятность генерации каждого токена текста с помощью нескольких более простых языковых моделей и комбинируя результаты для окончательной классификации. Что делает Ghostbuster особенно полезным, так это тот факт, что он не требует информации о модели, использованной для генерации текста, что позволяет классифицировать даже тексты, созданные неизвестными моделями, такими как коммерческие версии ChatGPT и Claude.

Разработка Ghostbuster включает три ключевых этапа: вычисление вероятностей, выбор признаков и обучение классификатора. Применяя этот трехступенчатый подход, система достигает 99,0 F1-меры на обучающих данных, что значительно превосходит результаты существующих моделей. Ghostbuster проявляет высокую точность при детекции текстов в различных доменах и условиях, демонстрируя свою универсальность и надежность.

Одной из главных задач системы является обход проблем, связанных с неправильной классификацией текстов, написанных людьми, таких как письменные работы, выполненные учащимися. Важно отметить, что система Ghostbuster показала надежные результаты даже при наличии ошибок в текстах, что позволяет ей адаптироваться к изменениям, происходящим в области генерации контента.

Исследователи намерены продолжать работу над Ghostbuster, добавляя возможности объяснения решений модели и улучшая ее устойчивость против различных обманных методов, нацеленных на автоматические детекторы. Система может помочь в различных случаях использования текста, включая фильтрацию сгенерированного ИИ контента из учебных данных и проверку источников информации в интернете.