Проблемы применения искусственного интеллекта для прогнозирования, диагностики и лечения COVID-19

COVID-19 предоставляет уникальную возможность понять проблемы разработки приложений искусственного интеллекта (ИИ) во время пандемии нового заболевания. В течение нескольких месяцев после вспышки COVID-19 появилось множество приложений ИИ для отслеживания случаев заболевания, диагностики, эпидемиологического прогнозирования, прогнозов тяжести и риска смертности, а также распределения ресурсов. Технология ИИ в настоящее время более распространена по сравнению с предыдущими периодами вспышек новых заболеваний. Количество и виды данных — клинических, эпидемиологических, генетических, социальных — генерируемых и публикуемых, быстро растут по мере распространения пандемии. Все это служит хорошим предзнаменованием для использования ИИ во время пандемии нового заболевания, однако остаются серьезные проблемы в разработке приложений ИИ для COVID-19. Многие из этих проблем связаны с тем, что COVID-19 является как новым, так и развивающимся заболеванием, вызываемым новым вирусом SARS-CoV-2.

Искусственный интеллект, который включает в себя машинное обучение, обычно зависит от больших объемов данных, чтобы быть эффективным, и определенной степени прозрачности для понимания и оценки моделей ИИ. В начале вспышки COVID-19 способность медицинского сообщества ИИ получать достаточно качественных данных для создания проверенных моделей оказалась сложной задачей. Не менее важно и то, что сами данные развивались по мере того, как методы здравоохранения адаптировались к большему опыту и, следовательно, знаниям о болезни. Эти два условия данных сделали раннюю разработку моделей искусственного интеллекта, специфичных для COVID, невероятно сложной задачей.

Доступность данных

Данные подпитывают ИИ. Получение своевременных, достаточных и качественных данных может быть сложной задачей даже при самых благоприятных обстоятельствах. Возьмем болезнь, вызванную вирусом, которого никто никогда не видел, и вопрос доступности данных становится еще более значимым. В первые пару месяцев до того, как ВОЗ объявила пандемию, данные на уровне отдельных пациентов не были доступны мировому сообществу общественного здравоохранения. Официальные агрегированные данные о случаях не обеспечивают уровень детализации, необходимый для разработки надежных эпидемиологических моделей, основанных на искусственном интеллекте или иным образом (Sun et al, 2020). Когда данные на уровне пациентов не были доступны для определения ключевых эпидемиологических параметров, включая инкубационный период, Hu et al. разработали альтернативный метод, используя только подтвержденные случаи для моделирования пиковой заболеваемости в Китае (Hu et al, 2020). Другая модель искусственного интеллекта была обучена на данных атипичной пневмонии 2003 года и была разработана для прогнозирования эпидемической кривой заболевания после того, как Китай ввел меры строгого контроля (Yang et al, 2020). Не имея данных на уровне пациентов, Сан и соавт. обратились к социальной сети для врачей (dxy.cn) в Китае, чтобы получить доступ к деидентифицированным данным пациентов, которые передавались из местных и национальных учреждений здравоохранения Китая для проведения эпидемиологического исследования. анализ в течение первого месяца вспышки (Sun et al, 2020).

В первые дни вспышки данных было мало, но потребность в них была велика. Нехватка диагностических тестов и длительное время обработки потребовали альтернативных способов диагностики COVID-19. Как только врачи поняли, что КТ-изображения пациентов с COVID-19 обладают уникальными особенностями, исследователи начали использовать методы машинного обучения для разработки инструментов раннего скрининга на основе КТ-сканирований. Однако многие из ранних моделей (до апреля) обычно представляли модели ИИ, обученные на наборах данных с менее чем 300 пациентами с подтвержденным COVID-19.

По мере того, как в Европе становилось все больше случаев заболевания, данные общественного здравоохранения из Европы стали дополнять данные, поступающие из Китая, но количество данных на уровне пациентов все еще было довольно ограниченным (Brinati et al, 2020; Castiglioni et al, 2020). . В областях применения ИИ, таких как расчет риска инфекции, тяжести и смертности, ранние модели обучались на относительно немногочисленных данных (Fang et al, 2020; Chen & Liu, 2020; Jiang et al, 2020). Разработка моделей ИИ для педиатрической популяции оказалась еще более сложной задачей (Ю и др., 2020). Заболеваемость у детей ниже, чем у взрослого населения, а педиатрические случаи, как правило, менее тяжелые и требуют меньшего количества госпитализаций по сравнению со взрослыми (CDC, 2020; CDC, 2020).

Стремясь разработать полезные инструменты для глобального сообщества общественного здравоохранения, исследователи довольствовались доступными данными, признавая при этом ограничения небольших наборов данных при обучении моделей искусственного интеллекта (Wang et al, 2020; Harmon et al, 2020 ). С небольшими наборами данных модели машинного обучения склонны к переоснащению. Небольшие наборы данных также могут содержать шум и выбросы. Кроме того, существуют разные подходы к сбору, хранению и обработке данных, которые также создают шум в данных (Bansal et al, 2020). Систематический обзор моделей прогнозирования COVID-19 рассмотрел 57 исследований, в которых использовалось машинное обучение на медицинских изображениях в диагностических целях, и обнаружил, что эти модели имеют высокий риск систематической ошибки. Это говорит о том, что производительность модели, вероятно, будет хуже при работе с новыми данными или в новых клинических условиях. Кроме того, многие из рассмотренных диагностических моделей основывались на тестах на нуклеиновые кислоты для подтверждения инфекции COVID-19; однако эти тесты, как сообщается, имеют высокий уровень ложноотрицательных результатов (Wynants et al, 2020). Такая ситуация с тестированием еще больше усложняет получение надежных данных для обучения моделей ИИ.

Теперь, когда Соединенные Штаты лидируют в мире по количеству случаев COVID-19, горячие точки в США предоставили больше данных для разработки модели (Vaid et al, 2020). Эпицентры могут быть важны для создания больших наборов данных для разработки более надежных моделей ИИ. Хотя некоторые утверждают, что использование наборов данных из районов с высокой заболеваемостью не может распространяться на районы с низкой заболеваемостью. А модели, основанные на данных одной больничной системы с ее местными практиками и населением, могут не распространяться на другие из-за различий в оборудовании, ИТ-системах или клинических и административных практиках (Van Calster et al, 2019; Panch et al. , 2019; Келли и др., 2019).

Нерепрезентативные данные

Еще одна проблема, связанная с развивающейся пандемией, заключается в том, что географически разрозненные горячие точки не возникают одновременно. Сначала данные поступают из первого, затем второго и, возможно, третьего эпицентра, пока эпидемия не переросла в пандемию, и в этом случае инфицированные пациенты, а значит, и данные, распространяются по земному шару гораздо шире. Чтобы отразить целевое население в глобальном масштабе, модели должны отражать демографическое, социально-экономическое и этническое разнообразие, чтобы уменьшить систематическую ошибку. Возможность иметь географическое и этническое разнообразие в наборах данных подчеркивается исследованием Массачусетского технологического института, показывающим географические различия в симптомах среди пациентов в Азии, Европе и Северной Америке (Bertsimas et al, 2020).

Во время первоначальной вспышки большинство госпитализированных пациентов относились к средней и тяжелой степени из-за более срочной потребности в медицинской помощи и ограниченных возможностей. Поэтому данные на уровне пациентов, которые были доступны в течение зимы, часто были смещены в сторону групп пациентов с тяжелыми симптомами (Graham-Harrison, 2020).

Множество моделей искусственного интеллекта, обученных на небольших наборах данных, ясно показывает, насколько сложно исследователям было получить доступ к большим наборам данных на уровне пациентов в первые несколько месяцев пандемии. Наборы данных, взятые из более тяжелых случаев, или даже данные, взятые только из Китая или только из одной больничной системы, создадут систематическую ошибку выборки в любых моделях ИИ, основанных на этих ранних данных. Когда имеющихся данных недостаточно, часто они неполны и нерепрезентативны для целевых групп населения, маловероятно, что модели ИИ будут распространяться за пределы конкретных больничных систем, географических регионов или групп пациентов (Naudé, 2020).

Эволюция данных

Помимо доступности данных, а также размера и качества наборов данных, одной из основных проблем при разработке моделей ИИ во время пандемии, вызванной новым вирусом, является то, что сами данные развиваются, как и знания о вирусе и болезни. Страны изменили методы подсчета и регистрации инфекций. Первоначально в Китае учитывались только лабораторно подтвержденные случаи. Затем, в середине февраля, страна начала включать в свои отчеты клинически диагностированные случаи, а затем быстро сделала разворот и вернулась к отчетности только о случаях, подтвержденных лабораторными тестами. Первоначально Китай также принял решение не учитывать бессимптомные ПЦР-позитивные случаи в своих официальных подсчетах, что отличается от практики многих других стран, включая США (Xu et al, 2020). Различия в том, как страны подсчитывают и сообщают о случаях, влияют на эпидемиологическое моделирование динамики передачи точно так же, как обнаружение бессимптомных носителей обязательно влияет на модели для прогнозирования распространения и понимания эффективности мер общественного здравоохранения (Cyranoski, 2020; Kolozsvári et al, 2020 ).

Развитие политик

Политика на международном, национальном и региональном уровнях еще более усложнила эпидемиологическое моделирование на основе ИИ. Неадекватное тестирование COVID-19 повлияло бы на способность генерировать эпидемиологические данные, характерные для США. Во всем мире политика по снижению передачи была и остается движущейся целью. Самоизоляция, карантины и ограничения на поездки приходили и уходили и возвращались снова. Мандаты на маски и протоколы повторного открытия сильно различаются. Все эти стратегии общественного здравоохранения влияют на эпидемиологические параметры и, следовательно, на модели распространения. Включение эффектов разнообразных и меняющихся во времени мер вмешательства в эпидемиологические модели на основе ИИ имеет решающее значение для создания точных прогнозов (Wang et al, 2020). Не менее важным является постоянное обновление алгоритмов ИИ новыми данными по мере того, как политики развиваются по-разному в разных местах (Олсон, 2020).

Расширение клинических знаний

Как и следовало ожидать от нового заболевания, медицинское и научное понимание вируса и вызываемого им заболевания со временем улучшилось. По мере расширения спектра клинических знаний онлайн-инструментам на основе ИИ, которые были разработаны ранее в течение первых нескольких месяцев вспышки, может потребоваться обновление их алгоритмов для включения новых клинических результатов и данных. Чат-боты для скрининга симптомов необходимо будет обновить, поскольку менее распространенные симптомы, такие как кожные проявления и диарея, стали очевидными по мере распространения болезни среди более крупных и разнообразных групп населения (Massey & Jones, 2020). Рентгенологи обнаружили, что результаты КТ различаются в зависимости от времени после появления симптомов и прогрессирования заболевания, при этом на поздних стадиях COVID-19 возникают результаты, которые трудно отличить от невирусных инфекций (Bernheim et al, 2020; Liang et al, 2020). »; Ванг и др., 2020; Ли и др., 2020; Лаги, 2020). Эти выводы имеют важное значение для обучения моделей ИИ на основе компьютерной томографии.

По мере того, как пандемия продолжалась, мы также начали замечать сдвиги в демографических данных. В то время как в основном люди среднего и старшего возраста, по-видимому, были затронуты COVID-19 на начальных стадиях, к весне и летом в США начал наблюдаться рост заболеваемости среди людей в возрасте от 20 до 30 лет, а в Европе наблюдался всплеск в конце лета. заболеваемости среди людей в возрасте 20, 30 и 40 лет. Молодые люди, по-видимому, имеют менее тяжелые исходы, а также чаще протекают бессимптомно, чем старшие возрастные группы, и, следовательно, с большей вероятностью являются бессимптомными переносчиками вируса (Snyder, 2020). В США люди в возрасте 50, 60 и 70 лет составляют больший процент от общего числа смертей по сравнению с демографическими показателями того же возраста в Европе (Economist, 2020; Stokes et al, 2020). Эти демографические сдвиги в заболеваемости и смертности в Европе и США повлияют на модели ИИ, основанные на демографических данных и данных о мобильности пациентов.

Улучшения в протоколах лечения также сократили продолжительность пребывания в стационаре, уровень смертности и риск использования ИВЛ (Begley, 2020; Bernstein, 2020, Aloisi et al, 2020), что повлияет на развитие Эпидемиологические модели на основе ИИ, калькуляторы рисков и модели для прогнозирования использования и распределения ресурсов. Однако учет этих изменений и нюансов в данных происходит за счет подгонки данных и повышенных требований к данным (Bertsimas et al, 2020). Это подчеркивает компромиссы, присущие разработке моделей анализа данных для таких сложных данных, как данные, генерируемые пандемией COVID-19.

Эволюция также затрагивает геном вируса SARS-CoV-2. В одном исследовании, в ходе которого было секвенировано более 5000 геномов, было отмечено, что это все еще очень небольшая доля от общего числа инфекций, а также предпочтение отдается тяжелым случаям и изолятам, собранным ранее во время вспышки, когда вирусные геномы имеют тенденцию быть более похожими (Phelan et al, 2020) . Будут ли мутации, обнаруженные исследователями, иметь значение с точки зрения трансмиссивности, вирулентности, лекарственной устойчивости или антигенности, и будет ли вирус мутировать другими важными способами, еще неизвестно. Поскольку генетические мутации потенциально могут повлиять на любые модели ИИ, используемые для разработки молекулярной диагностики, вакцин и терапевтических средств, данные необходимо постоянно оценивать. По мере мутации вируса будут мутировать и данные, используемые для разработки в этих областях (Yong, 2020; ScienceDaily, 2020).

Такая нестационарность в наборах данных здравоохранения проблематична для разработки ИИ в целом, но COVID-19 как новое заболевание еще больше усложняет и без того сложную задачу создания надежных моделей ИИ. Демография пациентов и методы ухода изменились с момента первоначальной вспышки и могут продолжать развиваться. Эта нестационарность данных, а также проблемы с разреженностью данных и смещением выборки могут привести к смещению набора данных. Когда распределения данных для обучения и внешней проверки значительно различаются, производительность моделей ИИ будет отрицательно сказываться, а модели могут снижать обобщаемость (Nestor et al, 2019; Moreno-Torres, 2011; Subbaswamy & Saria, 2019. »).

Использовать ИИ или не использовать ИИ?

Это такой же этический и медицинский вопрос, как и вычислительный. Как поставщики медицинских услуг и органы общественного здравоохранения оценивают, перевешивают ли преимущества моделей с ограниченными данными любые потенциальные риски или вред? Инструменты и методы, такие как трансферное обучение и сочетание нескольких подходов машинного обучения, могут помочь решить проблемы неполной информации и небольших наборов данных на начальных этапах вспышки (Imran et al, 2020; Tsiknakis, 2020; Colubri. и др., 2016»). Однако остается вопрос надежности и обобщаемости моделей, обученных на небольшом количестве данных или одноцентровых данных.

По мере появления новых данных модели, разработанные на начальных этапах, необходимо будет переоценить и/или повторно обучить на более полных наборах данных, чтобы обеспечить точность этих моделей и избежать снижения производительности (Phelan et al, 2020). Хотя, что примечательно, не существует четких стандартов, по которым следует отслеживать показатели производительности и идеальную частоту переобучения моделей, а также способы определения этой частоты (Liu et al, 2019).

Даже при лучшем качестве и количестве данных ограничения все еще существуют. Хотя данные продолжают расширяться и становятся все более глобальными по своему масштабу, во многом причиной эпидемии могут быть локальные меры безопасности общественного здравоохранения, базовая демография, здоровье населения, плотность населения, возможности здравоохранения лечить, а также общественное здравоохранение. способность отслеживать и общаться. Обновление моделей для местных условий — важнейший аспект разработки моделей ИИ во время пандемии и даже в других случаях (Wynants et al, 2020). Медицинский центр Beth Israel Deaconess в Бостоне разработал гиперлокальную модель, предназначенную для конкретной группы пациентов и больничной практики (Stevens et al, 2020). Но сколько медицинских учреждений имеют инфраструктуру и ресурсы для создания и проверки или даже просто настройки решения ИИ?

Возможно, на ранних этапах эпидемии, когда данных мало, полезнее сосредоточить приложения ИИ на определенных областях. Обнаружение вспышек, которое может использовать неклинические данные в реальном времени, является полезным приложением ИИ для раннего выявления небольших кластеров инфекции. Прекрасным примером этого является раннее выявление BlueDot вспышки в Китае (Bansal et al, 2020; Niiler, 2020). Инструменты ИИ для сканирования препринтов и опубликованной литературы могут быть невероятно полезны ученым и клиницистам, учитывая, что на сегодняшний день на серверах препринтов и в журналах опубликованы десятки тысяч статей (Khamsi, 2020; Brainard, 2020). Разработка лекарств — еще одна важная область применения ИИ на ранних стадиях вспышки, если предположить, что вирус не мутирует быстро и значительным образом. Идентификация вакцин и терапевтических мишеней, скрининг эффективных адъювантов вакцин или обнаружение существующих лекарств, которые можно перепрофилировать для лечения COVID-19, полагаются не столько на все движущиеся и скудные исходные данные, сколько на молекулярные данные самого вируса (Ong et al, 2020 ; Руссо и др., 2020; Хан, 2020; Ахуджа и др., 2020; Шульц и др., 2020)

Разработка точных, поддающихся обобщению и подтвержденных внешними данными моделей искусственного интеллекта на ранних стадиях вспышки потребует резкого улучшения глобального потенциала здравоохранения для своевременного получения и обмена достаточными высококачественными данными. Качество моделей ИИ в такой же степени зависит от возможностей и политики здравоохранения, как и от технологий. Доступ к данным зависит от возможности населения получить доступ к здравоохранению, способности учреждений здравоохранения и правительств собирать и передавать данные, а также различных подходов правительств и учреждений к обмену информацией. Как мы видели в случае пандемии нового заболевания, точки данных в цепочке данных COVID-19 могут меняться по мере того, как исследователи и клиницисты приобретают все больший опыт работы с этим новым заболеванием. Это превращает взаимодействие ИИ с COVID-19 в действительно развивающиеся отношения.