Недавние исследования, проведенные на кафедре Google Research и в сотрудничестве с международной командой учёных, представили новую систему CoDoC (Complementarity-driven Deferral-to-Clinical Workflow), которая разработана для определения относительной точности предсказательной искусственной интеллекта (ИИ) в медицинских условиях. Она также рассматривает, когда умная система должна отдать предпочтение мнению клинициста.
Потенциал ИИ значительно увеличивает возможности работы в различных отраслях, однако его интеграция в медицинскую практику требует соблюдения строгих норм для обеспечения безопасности и ответственности. Важность вопроса о том, когда ИИ более точен, а когда лучше полагаться на человека, особенно актуальна в здравоохранении, где предсказательный ИИ всё чаще внедряется в критически важных задачах.
Статья, опубликованная в журнале Nature Medicine, описывает, как CoDoC может улучшить сотрудничество человека и ИИ, минимизируя количество ложных срабатываний. Одним из примеров работы системы стало снижение числа ложноположительных результатов на 25% при анализе большого набора данных по маммографии в Великобритании, не пропустив ни одного истинно положительного результата.
Система CoDoC задействует исключительно деидентифицированные данные, и требует всего три входных параметра для обучения на каждом примере, что делает её доступной для внедрения в существующие клинические workflow без необходимости значительной переработки существующих ИИ инструментов.
При обучении CoDoC оценивает относительную точность предсказательных моделей по сравнению с интерпретацией клиницистов, принимая во внимание уровень уверенности модели. По завершении обучения система определяет, когда решение ИИ более точно, чем мнение врача, и наоборот, тем самым повышая общую эффективность диагностики.
Хотя работа остается теоретической, результаты тестирования CoDoC с использованием нескольких реальных наборов данных демонстрируют значительные преимущества в комбинировании человеческой экспертизы и возможностей предсказательного ИИ. Разработка и дальнейшие испытания системы могут привести к улучшению точности интерпретации медицинских изображений среди разнообразных демографических групп и заболеваний.
