Исследование предполагает, что модель искусственного интеллекта может точно предсказать риск рака печени

Поделиться на Pinterest

Может ли модель машинного обучения помочь врачам раньше выявить риск рака печени? Изображение предоставлено: MoMo Productions/Getty Images

Модель машинного обучения точно предсказала риск гепатоцеллюлярной карциномы (ГЦК), используя обычные клинические данные.
Модель превзошла существующие инструменты оценки риска рака печени, выявив больше истинных случаев и уменьшив количество ложноположительных результатов.
Исследование предполагает, что добавление сложных данных, таких как геномика, не улучшило производительность, а это указывает на то, что простых, широко доступных клинических данных достаточно для эффективного прогнозирования рисков.
Этот инструмент может помочь врачам раньше выявлять лиц из группы риска, в том числе тех, у кого не диагностировано заболевание печени, что потенциально улучшит скрининг и результаты лечения пациентов в случае дальнейшей проверки.

Рак печени – это шестая по значимости причина смертности от рака в США. Гепатоцеллюлярная карцинома (ГЦК) – это самый распространенный тип рака печени у взрослых, что составляет большинство случаев. Обычно это происходит у людей с хроническими заболеваниями печени, возникшими в результате гепатита или цирроза печени.

Нередко людям ставят диагноз ГЦК на поздней стадии. Это связано с тем, что на ранних стадиях заболевание обычно протекает бессимптомно. Текущие рекомендации по скринингу в первую очередь ориентированы на лиц с существующим хроническим заболеванием печени.

Однако примерно 20% случаев ГЦК могут развиться у людей без каких-либо признаков заболевания печени. Таким образом, эти люди также подвергаются риску поздней диагностики из-за несоответствия критериям надзора.

Ранняя диагностика ГЦК имеет важное значение, поскольку многие из тех, кто получает поздний диагноз, могут оказаться неподходящими для текущих вариантов лечения.

Растет интерес к потенциальному применению искусственного интеллекта (ИИ) для раннего выявления ГЦК. Теперь новое исследование, опубликованное в журнале Cancer Discovery, предполагает, что инструмент машинного обучения способен прогнозировать риск ГЦК с высокой точностью.

Исследование подчеркивает пробелы в существующих подходах к скринингу

Хотя основное заболевание печени известно как наиболее распространенный фактор риска ГЦК, данные подчеркивают роль других факторов, таких как мужской пол, курение и злоупотребление алкоголем. Поскольку на риск ГЦК могут влиять многочисленные факторы, выявление лиц из группы риска остается проблемой в клинической практике.

Чтобы решить эту проблему, исследовательская группа под руководством Кэролин Шнайдер, доктора медицинских наук, доцента RWTH Ахенского университета, обратилась к машинному обучению, форме искусственного интеллекта, которая может анализировать сложные наборы данных и выявлять закономерности для нескольких переменных одновременно.

Исследователи использовали данные Биобанка Великобритании, который включает информацию о здоровье более чем 500 000 человек. Среди этих участников было выявлено 538 случаев ГЦК. Почти 70% этих случаев произошли у людей без предварительного диагноза цирроза печени или хронического заболевания печени.

Модель машинного обучения была обучена на 80 % набора данных и выполнила первоначальную проверку на оставшихся 20 %.

Чтобы протестировать модель на более широкой популяции, команда также провела внешнюю проверку с использованием исследовательской программы All of Us. Сюда вошли данные более чем 400 000 человек в США, а также более разнообразный пул участников. В реестре зарегистрировано 445 случаев ГЦК.

Шнайдер рассказал Медицинские новости сегодня о потенциальном влиянии этого инструмента: «Мы надеемся, что наш предварительный скрининг можно будет использовать в первичной медико-санитарной помощи для определения тех, кто должен получить дополнительную гепатологическую помощь».

«Потенциально выявляя больше людей из группы риска на более раннем этапе, мы можем разработать способы направления их на скрининг или наблюдение. Надеемся, это поможет нам обнаружить ГЦК на более ранней стадии, поскольку более раннее выявление ГЦК тесно связано с более лечебными вариантами лечения».
– Кэролин Шнайдер, доктор медицинских наук

Простые клинические данные доказали высокую эффективность

Модель машинного обучения использовала подход «случайного леса». Здесь описывается алгоритм, который объединяет результаты нескольких деревьев решений для генерации прогнозов. Исследователи протестировали модели, построенные на основе различных типов клинических данных.

Самая эффективная версия, получившая название «Модель C», объединила демографические данные пациентов, электронные медицинские записи и результаты обычных анализов крови.

Работоспособность этих моделей оценивалась путем расчета площади под рабочей характеристикой приемника (AUROC). Это показатель производительности, который описывает способность алгоритма различать две группы. В этом случае те, кто входит в когорту валидации с ГЦК, по сравнению с теми, у кого нет.

Алгоритм получил оценку AUROC 0,88, где 1 — высший балл. Это указывает на то, что модель имеет высокую точность различения пациентов с ГЦК и без него.

Примечательно, что добавление более сложных данных, таких как геномика, существенно не улучшило производительность. Это говорит о том, что можно предсказать риск ГЦК, используя простые и легко доступные клинические данные без необходимости проведения более дорогих тестов.

Превосходящие текущие модели

Исследователи также сравнили свою модель с распространенными клиническими инструментами, включая FIB-4, APRI, NFS и оценку aMAP. Медицинские работники обычно используют эти модели для оценки фиброза печени или риска рака у людей с известным заболеванием печени.

Результаты показывают, что модель машинного обучения в целом работала лучше, выявляя больше истинных случаев ГЦК и уменьшая при этом ложноположительные результаты.

«Современные подходы к эпиднадзору в основном основаны на циррозе печени, но при этом не учитываются случаи ГЦК, поскольку хронические заболевания печени и особенно цирроз часто не диагностируются», — сказал Шнайдер. МНТ.

«Наша модель представляет собой подход предварительного скрининга на основе рутинных данных, таких как базовая демографическая информация, образ жизни и диагнозы, а также рутинные лабораторные тесты. Этот подход позволил нам идентифицировать людей с риском ГЦК с большей точностью/памятью, чем используемые в настоящее время показатели в нашей протестированной когорте», — отметила она.

Чтобы сделать Модель C более практичной для повседневного клинического использования, команда еще больше упростила ее, уменьшив количество исследуемых клинических особенностей. Упрощенная версия исследует всего 15 регулярно собираемых клинических особенностей и все же превосходит существующие модели.

«Мы привели наш окончательный результат в такую форму, чтобы его можно было легко перенести в другие системы здравоохранения. Модель топ-15 состоит только из регулярно измеряемых параметров, и мы предоставляем код для ее запуска на локальных серверах», — добавил Шнайдер.

Потенциальное влияние на раннее выявление и результаты лечения пациентов

Эти результаты показывают, что модель может помочь врачам первичной медико-санитарной помощи выявить тех, кого в противном случае можно было бы не заметить в соответствии с действующими рекомендациями по скринингу, и направить их на скрининг рака печени.

Это может быть важно для ГЦК, который часто бывает агрессивным, но при раннем выявлении легче поддается лечению.

Хотя модель C в первую очередь обучалась на данных белых участников из Британского биобанка, она сохраняла высокие результаты при тестировании на более этнически разнообразных популяциях в наборе данных «Все мы». Это говорит о том, что данный подход может широко применяться к различным демографическим группам.

«Наши результаты подтверждают потенциальную мобильность нашей модели, но, очевидно, мы хотим протестировать нашу модель в как можно большем количестве систем здравоохранения, чтобы увидеть, от каких факторов зависит хорошая транспортабельность, и выполнить региональную калибровку и проверку», — сказал Шнайдер.

Ограничения исследования и следующие шаги

Хотя результаты являются многообещающими, авторы отмечают несколько ограничений исследования. К ним относятся ретроспективный дизайн и относительно небольшое количество участников с вирусным гепатитом, одной из основных причин ГЦК.

Отвечая на вопрос о будущих планах по тестированию этой модели, Шнайдер рассказал: МНТ: «Нам нужна проспективная многоцентровая проверка, которая покажет, что наша оценка действительно выявляет пациентов, нуждающихся в гепатологической помощи».

«Заболеваемость ГЦК низкая, но развертывание в крупных системах здравоохранения поможет нам в перспективе проверить наш предварительный скрининг. Поэтому мы сделали результаты и весь процесс открыто доступными, с явной целью обеспечить возможность независимого тестирования и внешней проверки во многих системах здравоохранения», — добавила она.

Шнайдер заключил: «Мы надеемся, что несколько клинических центров опробуют эту модель и будем рады оказать поддержку!»

Хотя дальнейшие исследования все еще необходимы для проверки модели C в дополнительных популяциях и реальных клинических условиях, результаты подчеркивают растущий потенциал ИИ в здравоохранении, особенно в совершенствовании стратегий раннего выявления таких заболеваний, как рак печени.