Google Research представляет набор данных для оптимизации работы языковых моделей в области тропических заболеваний

Команда исследователей Google представила новый набор данных и методику оценки с использованием синтетических личностей для оптимизации работы больших языковых моделей (LLM) в контексте тропических и инфекционных заболеваний. Этот шаг направлен на улучшение диагностики и поддержки клинического принятия решений в условиях ограниченных ресурсов, где такие модели могут оказать значительное влияние.

Согласно данным, тропические и инфекционные заболевания (TRINDs) затрагивают около 1.7 миллиарда человек по всему миру, особенно в наименее обеспеченных регионах, нанося наибольший ущерб женщинам и детям. Исследователи столкнулись с недостатком существующих данных и оценок LLM в контексте TRINDs, что дополнительно усложняет диагностику и лечение.

В рамках работы был создан набор данных, включающий более 11,000 синтетических личностей, представляющих различные тропические и инфекционные заболевания. Данная инициатива была представлена на недавних семинарах NeurIPS 2024, где подчёркивалась важность использования LLM в клинической практике.

Исследования показали, что LLM демонстрируют менее эффективные результаты при диагностике TRINDs по сравнению с традиционными медицинскими стандартами, однако их способность к самообучению и адаптации может быть улучшена за счёт целенаправленного обучения и разработки интерфейсов для пользователей. Старшие эксперты в области TRINDs подтвердили, что предложенные инструменты могут стать высокоэффективными и удобными справочниками для инфекционных заболеваний, что создает потенциальные возможности для улучшения диагностики.

Эти находки подчеркивают необходимость продолжительной оценки и доработки LLM, чтобы обеспечить их точность и культурную релевантность в разнообразных клинических условиях. Следующие шаги включают расширение баз данных для учёта многоязычности и мультимодальности, что позволит LLM динамично адаптироваться к реальным ситуациям в медицине.