Сравнение рекомендаций по периоперационным нейрокогнитивным расстройствам, сгенерированных большими языковыми моделями, с существующими руководящими принципами (British Journal of Anaesthesia, февраль 2025)

Введение: периоперационные нейрокогнитивные расстройства (Perioperative neurocognitive disorders [PNDs]) относятся к распространенным осложнениям после хирургии и анестезии, особенно у пациентов пожилого и старческого возраста, что приводят к росту заболеваемости, смертности и стоимости оказания медицинской помощи. По этой причине ведущие медицинские сообщества разработали рекомендации, направленные на предотвращение и лечение PNDs. Авторы этого исследования изучили надежность больших языковых моделей, особенно ChatGPT-4 и Gemini, в генерации рекомендаций для менеджмента PND и сравнили их с опубликованными клиническими руководствами.

Методы: он-лайн перекрестный web-анализ. Рекомендации, сгенерированные искусственным интеллектом (ИИ), были подготовлены в шести разных локациях среди пяти стран (Швейцария, Бельгия, Турция, Канада и Восточное и Западное побережье США). Промпт на английском языке в виде «таблица алгоритма ухода для периоперационных нейрокогнитивных расстройств», был введен в ChatGPT-4 и Gemini, что генерировали таблицы, которые были изучены двумя независимыми рецензентами. Основными результатами стали оценки по шкалам «the Total Disagreement Score (TDS)» и «Quality Assessment of Medical Artificial Intelligence (QAMAI)», что сравнивали выработанные ИИ рекомендации с опубликованными клиническими руководствами. 

Результаты: исследование выработало 14 таблиц с аналогичными результатами для ChatGPT-4 и Gemini по шкалам TDS и QAMAI. Рекомендации, сгенерированные с помощью искусственного интеллекта, хорошо согласуются с опубликованными руководящими принципами, причем наибольшее соответствие наблюдается в рекомендациях, сгенерированных с помощью ChatGPT-4. Полного согласия с руководящими принципами достигнуто не было, а отсутствие цитируемых источников было заметным недостатком.

Выводы: большие языковые модели могут генерировать рекомендации по периоперационным нейрокогнитивным расстройствам, что хорошо согласуются с опубликованными клиническими рекомендациями. С другой стороны, до внедрения в клиническую практику требуется дальнейшая валидация с получением клинической обратной связи. 

Подробнее: https://read.qxmd.com/read/39922789/a-comparison-of-large-language-model-generated-and-published-perioperative-neurocognitive-disorder-recommendations-a-cross-sectional-web-based-analysis?uac=382194SG&ecd=wnl_readjnl_250210&sso=true&redirected=slug

Наш сайт работает без рекламы, и мы рады, что вы с нами! Для поддержки проекта и его развития сканируйте QR-код ниже!

Buy Me a Coffee