— лёгкий способ обсуждать сложные вещи

Искусственные нейронные сети в задачах совершенствования ретроспективного эпидемиологического анализа

You are here

Аннотация: 

Одним из путей повышения действенности профилактических и противоэпидемических мероприятий служит научная обоснованность их планирования, основой которого являются результаты ретроспективного эпидемиологического анализа и прогнозирования заболеваемости (проспективного эпидемиологического анализа). Успешное решение задач в различных отраслях гигиены и эпидемиологии определяет приоритетность инновационной методологической базы как инструментария, расширяющего информационно-аналитический потенциал ученых и практиков. Это нашло свое отражение в «Концепции научного обеспечения деятельности Роспотребнадзора на 2021–2025 гг.» и «Концепции развития системы государственного социально-гигиенического мониторинга в Российской Федерации на период до 2030 года», предусматривающих внедрение и развитие наукоемких технологий аналитических исследований, методов моделирования и прогнозирования ситуаций. Наряду с широким применением многомерных статистических методов, современных географических информационных систем (ГИС) одним из перспективных направлений совершенствования аналитического обеспечения гигиенических и эпидемиологических исследований может стать применение искусственных нейронных сетей (ИНС), представляющих собой программно или аппаратно реализованные математические модели, функционирующие подобно биологическим нейронным сетям. В докладе представлены результаты апробации и сравнительного анализа среднесрочных прогнозов заболеваемости гепатитом А, которые свидетельствуют о более высокой их точности при использовании искусственной нейронной сети (ИНС) типа двухслойного персептрона (Cascade-forward backprop) по сравнению с результатом применения регрессионной модели с традиционным экстраполяционным прогнозированием по теоретическим линиям тенденций, рассчитанных методом наименьших квадратов.

Comments - 17

Уважаемый Брис Игоревич! Подскажите пожалуйста как Вы используете данный социально-гигиенического мониторинга в своей работе? Спасибо!

Добрый день, уважаемые авторы! Очень интересный доклад! Выбранный метод показал высокую точность прогноза на 1-2 года, можно ли его использовать для прогнозирования на более длительные периоды? Для решения каких практических задач вы планируете в дальнейшем использовать нейронные сети?

Добрый день! Спасибо за интересный вопрос. Безусловно нейронные сети можно использовать при прогнозировании на более длительный период, но для этого необходимо задать иной алгоритм для обучения прогнозирующей сети. Нейросетевое моделирование планируется применять для дальнейшего совершенствования и повышения эффективности информационно-аналитического обеспечения систем экологического и социально-гигиенического мониторинга на различных уровнях – федеральном, региональном и муниципальном.

Уважаемый Марат Решидович, в продолжение ответа Олеси Александровны хочу добавить, что в настоящее время мы проводим апробацию применения искусственных нейронных сетей также и при краткосрочном прогнозировании инфекционной заболеваемости на модели гепатита А в развитие методического подхода, использующего расчет максимальной стабильности и регрессионный анализ (М.Д. Алейник, И.Х. Стриковская, В.А. Трифонов, 1984)

Коллеги! А что помешало сформировать модель на более актуальных данных и, соответственно, оценить ее качество на текущий период?

Уважаемая Ирина Владиславовна! Благодарим Вас за интересный вопрос. Нами использованы данные о заболеваемости гепатитом А за 12-месячные эпидемические периоды с относительно высоким уровнем заболеваемости для обеспечения большей наглядности результатов. Так как данная работа проводилась с целью апробации и оценки информативности применения искусственных нейронных сетей в одном из разделов эпидемиологического анализа инфекционных заболеваний нами была использована доступная ранее сформированная база данных, содержащая уточненные регистрационные сведения по датам заболеваний, разработанные по окончательным журналам учета инфекционных заболеваний, а не сведения отчетных форм, которые в случае гепатита А практически непригодны для анализа, так как фактически отражают время выписки больных из инфекционного стационара, а не динамику эпидемического процесса. Актуальные данные о заболеваемости гепатитом А для апробации применения искусственных нейронных сетей оказались непригодны, так как в последние годы в Таганроге регистрируются лишь единичные спорадические случаи заболеваний.

Доброго утра! Крайне интересный доклад и несомненная актуальность рассматриваемой темы. По какой причине выбран именно гепатит А?

Уважаемый Арсений Алексеевич, гепатит А выбран нами в качестве модели для апробации применения ИНС в целях прогнозирования инфекционной заболеваемости. В дальнейшем предполагается апробация применения ИНС в других направлениях гигиенических и эпидемиологических исследований, в частности при мониторинге параметров качества и безопасности воды поверхностных водоемов совместно со специалистами Ростовского НИИ микробиологии и паразитологии.

Добрый день! Спасибо за интересный доклад! Возможно ли использовать данный метод для прогнозирования заболеваемости ХНИЗ, в частности онкозаболеваемости?

Уважаемая Татьяна Владимировна, спасибо за Ваш ваопрос. Да, нами успешно апробировано применение искусственных нейронных сетей в целях прогнозирования заболеваемости городского населения злокачественными новообразованиями шести приоритетных локализаций - желудок, ободочная кишка, легкое, кожа (базилома), молочная железа и тело матки, а также общей онкологической заболеваемости. С результатами апробации Вы можете ознакомиться в нашей статье, опубликованной в 2021 году в 11 номере "ЗНиСО".

Уважаемые коллеги, Благодарим за представленные материалы. У меня тот же вопрос. Почему ретроспективный анализ?

Уважаемая Елена Михайловна, благодарим Вас за уточняющий вопрос. Фактически в докладе рассмотрены результаты апробации применения ИНС при проведении проспективного эпидемиологического анализа - экстраполяционного среднесрочного прогнозирования, базирующегося на результатах ретроспективного анализа многолетней динамики заболеваемости гепатитом А.

Спасибо за доклад! Уважаемые Борис Игоревич и Олеся Александровна, существуют ли ограничение в использовании искусственных нейронных сетей? Если да, то какие?

Уважаемая Дарья Геннадьевна, спасибо Вам за интересный вопрос. Естественно, как и любой другой метод искусственные нейронные сети имеют как массу достоинств, так и недостатки. К последним, накладывающим определенные ограничения на использование ИНС, традиционно относят, в частности, "проблему переобучения" (ИНС «запоминает» ответы вместо того, чтобы выводить закономерности во входных данных) и "проблему поиска настоящих аномалий в обучающей выборке". Еще одна проблема ИНС состоит в том, что они, по сути, являются "черными ящиками" - кроме результата, из ИНС нельзя получить никакую информацию, даже статистические данные. Несмотря на недостатки, ИНС остаются мощным инструментом, который при правильном применении способен решать задачи, которые невозможно решить классическими программными алгоритмами. Поэтому, с нашей точки зрения, широкое внедрение ИНС в исследования гигиенического и эпидемиологического профиля является перспективным для решения актуальные задач существенного повышения эффективности информационно-аналитического обеспечения социально-гигиенического мониторинга в свете «Концепции развития системы государственного социально-гигиенического мониторинга в Российской Федерации на период до 2030 года».

Уважаемые коллеги! Могут ли подобного рода ИНС в дальнейшем быть применены к факторному анализу?

Уважаемый Марк Захарович, благодарим Вас за интересный вопрос. Вопросом применимости искусственных нейронных сетей к факторному анализу мы пока не занимались. Многомерные статичтические методы - факторный анализ и кластерный анализ интеркорреляций мы применяли в целях упрощения факторной структуры за счет выделения, количественной характеристики и качественной интерпретации групповых (латентных, скрытых) факторов риска заболеваемости злокачественными новообразованиями легкого, желудка и ободочной кишки, объединяющих разнородные, но тесно коррелирующие между собой первичные регистрируемые факторы. С указанной целью использованы сведения специализированной персонифицированной базы данных о случаях заболеваний ЗН, зарегистрированных за период с 1988 года, сформированной на основе информации, содержащейся в «Картах расследования случая злокачественного новообразования с впервые установленным диагнозом». Извлечение групповых факторов проводилось методом главных компонентов, их число определялось на основе критериев Кайзера и Кеттелла. Вращение факторов осуществлялось по методу Varimax. Приемлемость исходных данных для процедуры факторного анализа оценивалась по критериям адекватности выборки Кайзера-Мейера-Олкина и сферичности Барлетта. Извлеченные групповые факторы объединяли в себе регистрируемые факторы риска с наибольшими значениями факторных нагрузок, которые отражают степень их долевого участия. Как высокоинформативные и значимые учитывались регистрируемые факторы риска с величинами факторных нагрузок 0.500 и более.

P.S. Нами применялся профессиональный пакет статистических программ IBM SPSS Statistics («Statistical Package for Social Science») version 19.0 (факторный анализ и иерархический кластерный анализ интеркорреляций).