Нейросетевое моделирование как актуальное направление совершенствования аналитического обеспечения социально-гигиенического мониторинга
Вы здесь
Настоящее исследование посвящено решению актуальной задачи интеграции наукоемких аналитических технологий, инструментов прогнозирования и ситуационного моделирования в практику социально-гигиенического мониторинга. Целью работы являлась апробация применения нейросетевого моделирования для прогнозирования заболеваемости населения злокачественными новообразованиями, зарегистрированной среди жителей города Таганрога Ростовской области за 39-летний период с применением рекуррентных нейронных сетей типа LSTM (Long Short-Term Memory), реализованных в среде Matlab2024b с использованием пакета Deep Learning Toolbox. По результатам исследования установлено, что прогнозные значения, полученные в результате нейросетевого моделирования, демонстрируют высокую точность и эффективность применения апробированной нейронной сети для целей проспективного анализа заболеваемости населения.
Комментарии - 6
Добрый день, Коллеги!
Спасибо за перспективную статью. В ходе прочтения статьи возникло несколько вопросов.
1. Каким именно образом осуществлялась предобработка временных рядов перед подачей на вход нейронной сети?
2. Проводился ли анализ важности признаков или анализ чувствительности модели для определения ключевых факторов, в наибольшей степени влияющих на прогноз для каждой локализации?
3. Позволяет ли построенная модель делать достоверные прогнозы не на 1-2 года, а на более длительный период (например, 5-10 лет), и если нет, то какие методологические сложности возникают при таком прогнозировании?
Добрый день, Владимир Михайлович! Благодарим Вас за интерес к нашей статье. Этап подготовки данных включал в себя загрузку исследуемой выборки в Matlab с визуализацией динамики и последующей проверкой временного ряда на стационарность с применением теста Дики-Фуллера.
В случае нестационарности ряда применялось дифференцирование первого порядка (d=1) для устранения тренда, затем нормализация данных методом z-score.
В рамках настоящего исследования, основанного на использовании одномерных временных рядов, традиционный анализ важности признаков, предназначенный для оценки вклада различных факторов, объективно не применим в силу природы данных. Вместо этого был выполнен анализ чувствительности модели к ретроспективному горизонту данных (lag sensitivity analysis), направленный на установление оптимальной глубиныLook-back окна (параметр numTimesteps) — ключевого временного интервала, необходимого LSTM-сети для формирования точного прогноза.
С нашей точки зрения оптимальный срок среднесрочного прогнозирования заболеваемости населения и показателей качества среды обитания составляет 1-2 года. При гигиенических и эпидемиологических исследованиях точность прогнозов на период 5-10 лет значительно снижается и становится недостаточной для определения и обоснования содержания и объемов оптимизационных мероприятий.
Добрый день, уважаемая Олеся Александровна! Спасибо за интересный материал. Скажите, пожалуйста, в чем заключается принципиальное, качественное преимущество нейросетевого моделирования перед традиционными статистическими методами в решении конкретных аналитических задач социально-гигиенического мониторинга?
Добрый день, уважаемая Анна Алексеевна! Благодарю Вас за интерес к нашей статье.
Принципиальное качественное преимущество нейросетевого моделирования при работе с одномерными временными рядами в контексте социально-гигиенического мониторинга заключается в его способности автоматически выявлять сложные нелинейные зависимости без необходимости априорного задания структуры временных взаимосвязей. В отличие от традиционных статистических методов, требующих строгого соблюдения предположений о стационарности и ручного подбора параметров авторегрессии и скользящего среднего, нейросетевое моделирование на основе архитектур LSTM способно адаптивно обучаться релевантным временным лагам и долгосрочным зависимостям. Это особенно значимо для анализа эпидемиологических процессов. Нейросетевое моделирование демонстрирует повышенную устойчивость к шуму и пропускам в данных, что характерно для реальных систем наблюдения в здравоохранении. Способность извлекать скрытые паттерны из единственного временного ряда переводит анализ от верификации гипотез к исследованию сложных временных закономерностей. Данное свойство позволяет строить более адекватные прогнозные модели для поддержки управленческих решений в условиях неполной исходной информации.
Олеся Александровна, добрый день! Тема вашей публикации крайне актуальна в текущих реалиях.
Скажите, пожалуйста, какие преимущества и возможные ограничения применения рекуррентных нейронных сетей LSTM были установлены в рамках выполненной Вами работы?
Добрый день, Кристина Владимировна! Благодарю Вас за интерес к нашей статье!
В рамках проведенного исследования были систематизированы ключевые преимущества и ограничения применения рекуррентных нейронных сетей LSTM для прогнозирования одномерных временных рядов. К принципиальным преимуществам отнесена способность LSTM выявлять сложные нелинейные зависимости и долгосрочные временные взаимосвязи без априорной спецификации модели, что особенно значимо для данных социально-гигиенического мониторинга. Также выявлено такое существенное ограничение, как чувствительность к гиперпараметрам. Подчеркнута требовательность модели к объему исторических данных. Отмечена необходимость оптимизации архитектуры сети для задач с ограниченной длиной рядов. Результаты свидетельствуют о перспективности LSTM для задач прогнозирования при условии учета выявленных ограничений и разработки соответствующих методических адаптаций.