Обзор машинного обучения для проектирования стратегий прогнозируемых объектов и производительности моделей: очередной шаг объяснимости* (Critical Care, июнь 2024)

*Одной из проблем, связанных с машинным обучением, является объяснимость (explainability [https://citizenside.com/technology/what-is-explainability-in-machine-learning/])

Введение: сепсис, острый и потенциально фатальный системный ответ на инфекцию, оказывает значительное влияние на глобальное здравоохранение, поражая миллионы людей ежегодно. При том, что много исследований достаточно глубоко изучили возможности машинного обучения (Machine Learning [ML]) в системах раннего оповещения о риске развития сепсиса, фокусируясь на таких аспектах, как прогноз, диагностика и клиническое применение, остается неопределенность в отношении разработки более эффективных моделей с расширенным функционалом. В большей степени это касается роли выбранных характеристик и методов извлечения в обогащении точности модели, что остается не изученным. 

Цели: цель обзора — реализовать две основных цели: выявить те витальные характеристики, что могут обогатить модели прогнозирования развития сепсиса среди множества моделей машинного обучения и оценить эффективность модели с помощью метрик производительности, включая AUROC, чувствительность и специфичность. 

Результаты: в анализ было включено 29 исследований, проведенных в различающихся клинических условиях, а именно отделение интенсивной терапии (ОИТ), отделение неотложной помощи и другие, с общим количеством пациентов 1 147 202. Было обнаружено, что одни технологии извлечения данных заметно превосходят другие в терминах чувствительность и AUROC, что указывает на то, что именно эти технологии извлечения данных могут улучшить модели раннего оповещения риска развития сепсиса. 

Выводы: ключевые динамические индикаторы, включая витальные параметры и критические лабораторные данные, играют важную роль в раннем выявлении сепсиса. Применение методов выбора объектов значительно улучшает точность модели, к примеру модели Random Forest и XG Boost показали многообещающие результаты. К тому же модели глубокого обучения (Deep Learning models [DL]) выявили уникальные идеи, что подчеркивает ключевую роль функциональной инженерии при прогнозировании сепсиса, что, в свою очередь, может принести большую пользу в клинической практике. 

Подробнее: https://doi.org/10.1186/s13054-024-04948-6