Биомаркер и большая языковая модель помогают выявить инфекции легких у пациентов
Диагностика инфекций нижних дыхательных путей у пациентов отделений интенсивной терапии осложняется сходством симптомов инфекционных и неинфекционных состояний. Исследователи из США предложили интегрированный диагностический подход, объединяющий транскриптомный биомаркер организма-хозяина FABP4 и анализ данных электронной медицинской карты с помощью большой языковой модели GPT-4. Комбинированный классификатор выявлял инфекционные и неинфекционные состояния с точностью 96%, чувствительностью 96% и специфичностью 95%.
Инфекции нижних дыхательных путей (ИНДП) трудно диагностировать у пациентов в отделениях интенсивной терапии, при этом эти инфекции представляют собой значительную угрозу для жизни. Клинические проявления инфекционных и неинфекционных причин острой дыхательной недостаточности часто перекрываются, а возбудителя во многих случаях не удается выявить стандартными микробиологическими методами. В условиях диагностической неопределенности врачи вынуждены назначать антибактериальную терапию эмпирически, что ведет к росту антибиотикорезистентности. Ранее было показано, что транскриптомные маркеры организма-хозяина, в частности экспрессия гена FABP4 в легких, могут служить индикатором ИНДП, однако их точности недостаточно для принятия решений о назначении терапии. Ученые из США предположили, что интеграция такого биомаркера с анализом клинических данных электронной медицинской карты с помощью большой языковой модели может существенно улучшить диагностику ИНДП у критически больных пациентов.
Исследование включало две независимые проспективные когорты взрослых пациентов с острой дыхательной недостаточностью, подключенных к аппарату искусственной вентиляции легких. В качестве молекулярного маркера был выбран уровень экспрессии гена FABP4 в трахеальных аспиратах, ранее показанный как информативный биомаркер ИНДП. Параллельно применяли большую языковую модель GPT-4, которой предоставляли текст клинической заметки лечащей команды и описание рентгенограммы грудной клетки. Модель в трех независимых сессиях оценивала вероятность наличия ИНДП, после чего полученный балл использовали в логистической регрессии совместно с уровнем FABP4.
В деривационной когорте диагностика, основанная только на FABP4, и анализ медицинских данных только с помощью GPT-4 показали сопоставимые AUC — около 0,83–0,84, однако комбинирование этих методов значительно улучшило результаты: AUC 0,93, точность 84%, чувствительность 78%, специфичность 88%. Для сравнения, клиническая диагностика при поступлении в отделение интенсивной терапии имела точность 72% и сопровождалась значительным числом ложноположительных диагнозов ИНДП. В независимой валидационной когорте, включавшей преимущественно вирусные инфекции (в том числе COVID-19), интегрированный подход продемонстрировал еще более высокие показатели — AUC 0,98, точность 96%, чувствительность 96% и специфичность 95%.
Дополнительное сравнение анализа, выполненного GPT-4 и врачами, получившими идентичные клинические данные, показало сопоставимую общую точность, но выявило различия в интерпретации информации. Языковая модель чаще опиралась на формулировки рентгенологических заключений, тогда как врачи придавали больший вес клиническому контексту.
Таким образом, авторы показали, что объединение транскриптомного биомаркера хозяина и анализа электронных медицинских записей с помощью большой языковой модели существенно повышает точность диагностики инфекций нижних дыхательных путей у критически больных пациентов. Такой подход потенциально способен снизить необоснованное назначение антибиотиков. Работа представляет собой proof-of-concept и подчеркивает перспективность интеграции молекулярных данных и ИИ-анализа клинической информации, однако для внедрения в клиническую практику требуются более крупные и рандомизированные исследования.
Анализ выдыхаемого воздуха выявляет инфекции нижних дыхательных путей
Источник:
Phan H.V., et. al. Integrating a host biomarker with a large language model for diagnosis of lower respiratory tract infection. // Nature Communications (2025), published online 16 December 2025. DOI: 10.1038/s41467-025-66218-5
Меню
Все темы
0





