Использование искусственных нейронных сетей для прогнозирования положительной динамики при лечении больных туберкулезом
Представлена разработанная с помощью искусственных нейронных сетей модель, прогнозирующая динамику процесса выздоровления больных при стационарном лечении в туберкулезном диспансере. Точность (accuracy) представленной модели на тестовой выборке.
Рубрика | Медицина |
Вид | статья |
Язык | русский |
Дата добавления | 10.10.2021 |
Размер файла | 687,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://allbest.ru
Размещено на http://allbest.ru
ИСПОЛЬЗОВАНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ПРОГНОЗИРОВАНИЯ ПОЛОЖИТЕЛЬНОЙ ДИНАМИКИ ПРИ ЛЕЧЕНИИ БОЛЬНЫХ ТУБЕРКУЛЕЗОМ
М.З. Ермолицкая, канд. биол. наук
(Институт автоматики и процессов управления ДВО РАН, Владивосток)
C использованием программы RStudio разработана нейросетевая модель, прогнозирующая положительную динамику при лечении больных в стационаре туберкулезного диспансера. Точность (accuracy) представленной модели на тестовой выборке составляет 99.4%, значение среднеквадратической ошибки - 0.013.
Ключевые слова: статистический анализ данных, искусственная нейронная сеть, больные туберкулезом.
искусственный нейронный прогноз выздоровление туберкулезный
Введение
Применение современных методов статистического моделирования и машинного обучения дает возможность разрабатывать и модифицировать прогностические модели, способные существенно помочь при решении сложных задач в здравоохранении и медицине [1]. Существуют разные подходы к прогнозированию инфекционных заболеваний, их применение зависит от количества и качества исходных данных [2 - 5]. Поэтому предварительно следует изучить имеющиеся данные и определить степень их влияния на исследуемый процесс. Для этого чаще всего используют корреляционный анализ. Поиск подходящей модели, как правило, сводится к построению нескольких отдельных моделей, выбору из них оптимальной либо созданию на их основе комбинаторной модели. Отдельно следует выделить применение искусственных нейронных сетей (ИНС), которые могут быть использованы в качестве диагностического инструмента для прогнозирования заболевания и поддержки в расширении роли компьютерных технологий в диагностике для оперативного лечения [6, 7]. Основное преимущество ИНС является их способность извлекать скрытые линейные и нелинейные связи даже в больших и сложных наборах данных.
Для прогнозирования распространенности туберкулеза и моделирования лечения больных туберкулезом эффективны такие традиционные методы как регрессионный анализ (полиномиальная, экспоненциальная модели [8], логистическая модель [9] и др. [10, 11]) и современные методы интеллектуального анализа - искусственные нейронные сети [12 - 14]. Сравнение моделей, полученных с помощью этих методов, позволяет с высокой степенью точности выделить наиболее качественную модель, пригодную для практического применения.
В данной работе представлена разработанная с помощью искусственных нейронных сетей модель, позволяющая предсказать наличие положительной динамики процесса выздоровления больных туберкулезом при стационарном лечении в диспансере. Проведено сравнение ранее полученной регрессионной модели с нейросетевой моделью на основе рассчитанных оценок качества и среднеквадратической ошибки.
Статистическая обработка и анализ данных
Исходная выборка данных по лечению больных туберкулезом в Приморском краевом противотуберкулезном диспансере (ГЗУБ «ПКТД») состояла из 507 наблюдений и 78 показателей, характеризующих образ жизни людей (вредные привычки), диагноз, сопутствующие заболевания, дополнительное обследование, медикаментозное лечение, приобретенные заболевания, динамику лечения. В ходе разведочного анализа категориальные данные были кодированы. Показатели с большим количеством отсутствующих наблюдений исключены из рассмотрения. Для выявления значимых показателей, существенно влияющих на положительную динамику выздоровления пациентов, были использованы следующие критерии: критерий Шапиро - Уилка, согласно которому распределение данных не является нормальным; критерий Манна - Уитни для выявления различий по категории пол (процесс выздоровления протекает одинаково у мужчин и женщин) и метод Тау Кендалла для определения зависимостей между показателями. В результате было выделено 20 показателей (495 наблюдений), которые в разной степени влияют на процесс выздоровления больных туберкулезом. Значимые коэффициенты корреляции показателя «положительная динамика» с другими показателями представлены в табл. 1. Эти показатели использовали для построения прогностических моделей. Результаты первичной обработки и анализа исходных данных представлены в работе [15].
Таблица 1
Построение нейросетевой модели
Искусственные нейронные сети - это мощный метод моделирования, позволяющий воспроизводить чрезвычайно сложные зависимости. Пользователь нейронной сети отбирает и подготавливает данные, выбирает нужную архитектуру сети, а затем запускает алгоритм обучения, который автоматически воспринимает структуру данных. Решение в сети формируется множеством простых нейроноподобных элементов, образующих граф со взвешенными синаптическими связями, которые совместно и целенаправленно работают на получение общего результата. Главным строительным блоком такой сети, согласно модели математического нейрона Мак-Каллока - Питтса, является искусственный нейрон, основная функция которого - сформировать выходной сигнал y в зависимости от входных сигналов xj.xn. Значения входных сигналов могут усиливаться или ослабляться в зависимости от знака синаптических весов w1,... ,wn [16]
где S - линейная комбинация входных сигналов (адаптивный сумматор).
Выходной сигнал сумматора поступает в нелинейный преобразователь F с функцией активизации. Здесь функция активизации имеет логистический вид (сигмоид), так как зависимая переменная, отражающая эффективность лечения больных туберкулезом, является бинарной переменной:
После преобразования результат подается на выход (рис. 1).
В общем случае искусственная нейронная сеть состоит из трех основных компонент: входного слоя, скрытого (вычислительного) слоя и выходного слоя. Для всех искусственных нейронных сетей присущ принцип параллельной обработки сигналов, выполняемый путем объединения большого числа нейронов различной конфигурации в скрытом слое и их последующей обработке.
Рис. 1. Структура искусственного нейрона.
При построении сети для решения задач классификации взвешенные комбинации Y выходного слоя представляют собой прогноз, который указывает на принадлежность распознаваемого объекта к определенной группе. Если распознаются только два класса, то в выходном слое персептрона находится только один элемент, который обладает двумя реакциями - положительной и отрицательной, т.е. на выходе значение сигмоидального нейрона лежит в интервале [0,1].
Для обучения искусственной нейронной сети в программе RStudio использовали функцию neuralnet() из пакета neuralnet, позволяющую создавать множество внутренних слоев в сети. В качестве входных сигналов (предикторов модели) рассматривали 20 показателей, выделенных на основе корреляционного анализа (табл. 1). Предварительно исследуемая выборка была поделена на обучающую и тестовую в стандартном соотношении: 3/4 наблюдений для обучающей выборки и 1/4 - для тестовой.
Настройка искусственной нейронной сети осуществлялась экспериментально. Рассматривали одно- и двухуровневые структуры, с числом нейронов на каждом слое от 2 до 12. Коэффициенты матрицы весов на первом шаге обучения сети инициализировались случайным образом. Поиск оптимальной сети осуществлялся в цикле с изменением случайного числа (seed.current) в диапазоне от 1 до 50000. Обучение сводилось к оптимальному подбору коэффициентов матрицы весов для минимизации функции ошибок (функции потерь). Функция ошибок используется для расчета ошибки между реальными и полученными данными. Основная цель - минимизировать эту ошибку.
В качестве функции ошибок рассчитывали среднеквадратическую ошибку (MSE и RMSE):
где yi - наблюдаемые значения; у і - предсказанные значения.
Чем ближе значение среднеквадратической ошибки к нулю, тем лучше построенная модель.
В итоге получили наилучшую нейросетевую модель с минимальной среднеквадратической ошибкой (MSE = 0.013, RMSE = 0.1140175) на тестовой выборке, состоящую из пяти нейронов в одном слое при случайном числе seed.min = 13 (рис. 2).
На рис. 2 видно, что на выходной слой сети, состоящий из одного элемента, обладающего двумя реакциями (положительной и отрицательной), поступает 5 сигналов, представляющих собой комбинацию значений исходных переменных. Эта взвешенная комбинация и есть прогноз, указывающий на принадлежность распознаваемого объекта к определенной группе - с наличием положительной динамики лечения или ее отсутствием.
В программе RStudio при использовании функции neuralnet() прогноз строится с помощью функции compute().
Для построения матрицы неточностей (Confusion Matrix) на тестовой выборке использовали функцию table(y,я). Результат представлен в табл. 2.
Таблица 2
Наблюдаемые значения |
Прогноз |
||
0 |
1 |
||
0 |
25 |
0 |
|
1 |
1 |
114 |
Один объект тестовой выборки предсказан неверно.
Точность модели (accuracy) рассчитывалась как доля правильно классифицированных объектов (количество правильно классифицированных объектов к общему числу объектов):
Полученное значение точности модели (accuracy) на тестовой выборке высоко и составляет 99,4%. При этом чувствительность модели (Sensitivity) равна проценту верно предсказанных позитивных исходов
(114/(114 + 1))*100% = 99.1%.
Специфичность модели (Specificity) показывает процент верно предсказанных негативных исходов
(25/(25 + 0))*100% = 100%.
Построенная нейросетевая модель адекватно описывает процесс выздоровления больных туберкулезом. Высокое качество модели говорит о правильности выбора структуры сети и значимых предикторов.
В результате анализа исходных данных выделения двадцати значимых показателей были построены две прогностические модели - логистическая регрессионная и нейросетевая. В процессе создания логит-модели предикторы с коэффициентами регрессии, уровень значимости для которых по критерию Стьюдента больше 0.05 (p-value > 0.05), постепенно были удалены из рассмотрения. Конечная модель включает девять значимых предикторов, характеризующих дополнительное обследование, медикаментозное лечение и приобретенные заболевания.
Построенная нейросетевая модель состоит из пяти нейронов в одном слое и содержит двадцать предикторов на входе. Для определения качества моделей на тестовой выборке были рассчитаны следующие оценки: среднеквадратические ошибки и точность предсказания (табл. 3).
Таблица 3
Тип модели |
Среднеквадратическая ошибка (MSE) |
Квадратный корень из среднеквадратической ошибки (RMSE) |
Точность (accuracy), % |
Чувствительность (Sensitivity), % |
Специфичность (Specificity), % |
|
Логистическая регрессионная |
0.01428 |
0.11952 |
98.57 |
98.26 |
100 |
|
Нейросетевая |
0.013 |
0.1140175 |
99,4 |
99.1 |
100 |
Полученные оценки свидетельствуют о высоком качестве разработанных моделей и при сравнении позволяют выделить наилучшую, адекватную модель с наименьшей ошибкой и наибольшим значением точности, т.е. построенную с помощью искусственных нейронных сетей. При этом количество предикторов в логистической регрессионной модели значительно меньше, что бывает очень важным при выборе вида модели для построения прогноза в медицине.
Заключение
Применение двух классических методов машинного обучения для решения задачи прогнозирования положительной динамики при лечении больных туберкулезом дает возможность с помощью разных подходов к моделированию значений бинарного отклика разрабатывать модели, оценивать их и, сравнивая полученные результаты, выбирать наилучшую. При использовании методов множественной логистической регрессии и искусственных нейронных сетей для определения качества построенных моделей рассчитывались одинаковые оценки: среднеквадратическая ошибка (MSE) и точность предсказания (accuracy, Sensitivity, Specificity). Полученные значения этих оценок позволяют на основе их сравнения выделить наиболее эффективную модель.
«Увы, универсального способа прогнозирования заболеваемости не существует - оптимальный подход следует выбирать, сравнивая результаты, полученные с помощью различных техник на основе эмпирических данных. Зачастую сложно отдать предпочтение одному методу прогнозирования - несколько подходов дают результаты сопоставимого качества», - отмечал М.А. Кондратьев [2]. Поэтому подобные исследования подразумевают использование различных методов прогнозирования, с предварительным выбором значимых показателей и последующим сравнением полученных моделей посредством построения матрицы неточностей и расчета ошибок прогнозирования.
В нашем случае наилучший прогноз получен с помощью нейросетевой модели. Поскольку ошибки прогнозирования ничтожно малы и лишь один объект тестовой выборки предсказан неверно, можно считать полученную модель эффективной и пригодной для использования в качестве вспомогательного инструмента для оперативного лечения больных туберкулезом в условиях стационара.
ЛИТЕРАТУРА
1. Sidey-Gibbons Jenni A. M., Sidey-Gibbons Chris J. Machine learning in medicine: a practical introduction // BMC Medical Research Methodology. - 2019. - Vol. 19(1). - P. 1-18.
2. Кондратьев М.А. Методы прогнозирования и модели распространения заболеваний // Компьютерные исследования и моделирование. - 2013. - Т. 5, № 5. - C. 863-882.
3. Azeez A., Obaromi D., Odeyemi A., Ndege J., Muntabayi R.M. Seasonality and Trend Forecasting of Tuberculosis Prevalence Data in Eastern Cape, South Africa, Using a Hybrid Model // Environmental Research and Public Health. - 2016. - № 13(8).
4. Brookspollock E., Cohen T., Murray M. The impact of realistic age structure in simple models of tuberculosis transmission // PLoS ONE. - 2010. - Vol. 5(1). URL: https://doi.org/10.1371/journal.pone.0008479 (accessed 12.05.2020)
5. Menzies N.A., Wolf E., Connors D. Progression from latent infection to active disease in dynamic tuberculosis transmission models: A systematic review of the validity of modelling assumptions // Lancet Infect. Dis. - 2018. - Vol. 18(8). - P. 226-236.
6. Волчек Ю.А., Шишко О.Н., Спиридонова О.С., Мохорт Т.В. Положение модели искусственной нейронной сети в медицинских экспертных системах // Медицинские науки. - 2017. - № 9. - С. 4-9.
7. Smith L. An Introduction to Neural Networks // Unpublished draft, University of Stirling, 2001. URL: http://www.cs.stir.ac.uk/~lss/NNIntro/InvSlides.html (accessed 12.05.2020)
8. Wang J., Wang C., Zhang W. Data analysis and forecasting of tuberculosis prevalence rates for smart healthcare based on a novel combination model // Applied sciences. - 2018. - 8(9). URL: https://doi.org/10.3390/app8091693 (accessed 12.05.2020)
9. Mello F.C.Q., Bastos L.G.V., Soares S.L.M., Rezende V.M., Conde M.B., Chaisson R.E. Predicting smear negative pulmonary tuberculosis with classification trees and logistic regression: a cross-sectional study // BMC Public Health. - 2006. - Vol. 6(43). URL: https://doi.org/10.1186/1471-2458-6-43 (accessed 12.05ю2020)
10. Мун С.А., Глушов А.Н., Штернис Т.А., Ларин С.А., Максимов С.А. Регрессионный анализ в медико-биологических исследованиях. - Кемерово: КемГМА, 2012.
11. Aguiar F.S., Almeida L.L., Ruffino-Netto A., Kritski A.L., Mello F.C., Werneck G.L. Classification and regression tree (CART) model to predict pulmonary tuberculosis in hospitalized patients // BMC Pulm. Med, 2012. URL: http://doi: 10.1186/1471-2466-12-40 (accessed 12.05.2020)
12. Dande P., Samant P. Acquaintance to artificial neural networks and use of artificial intelligence as a diagnostic tool for tuberculosis: a review // Tuberculosis. - 2018. - Vol.108. - P.1-9.
13. Fojnica A., Osmanovice A., Badnjevice A. Dynamical model of tuberculosis-multiple strain prediction based on artificial neural network // 5th Mediterranean Conference on Embedded Computing (MECO), (Piscataway, NJ: IEEE). - 2016. - P. 290-293.
14. Khan M.T., Kaushik A.Ch., Ji L., Malik S.I., Ali S., Wei D. Artificial neural networks for prediction of tuberculosis disease // Front. Microbiol, 2019. URL: https://doi.org/10.3389/ fmicb.2019.00395 (accessed 12.05.2020)
15. Ермолицкая М.З. Перспективы вылечиться от туберкулеза. Анализ данных средствами программы RStudio // Информатика и системы управления. - 2020. - 1(63). - С. 5058.
16. Шитиков В.К., Мастицкий С.Э. Классификация, регрессия и другие алгоритмы DataMining с использованием R, 2017. URL: https://github.com/ranalytics/data-mining. (дата обращения 12.05.2020)
Размещено на Allbest.ru
...Подобные документы
Клиническое течение туберкулеза при ВИЧ-инфицировании. Лечение больных туберкулезом в сочетании с вирусом иммунодефицита человека антимикобактериальными препаратами в субмаксимальных дозах. Особенности сестринского ухода при лечении больных туберкулезом.
реферат [445,9 K], добавлен 25.03.2017Клиническая картина, течение туберкулеза у больных, его диагностика у ВИЧ-положительных пациентов. Мероприятия для выделения лиц с высоким риском заболевания туберкулёзом на фоне ВИЧ-инфекции. Роль медицинской сестры в лечении больных туберкулезом легких.
реферат [162,1 K], добавлен 26.06.2017Исследование и отражение в научных трудах особенностей легочного кровотечения и кровохаркания у больных туберкулезом, предпосылки и этапы развития патологического процесса. Роль и значение бронхоскопии, использование лечебно-диагностического алгоритма.
научная работа [389,3 K], добавлен 03.12.2015Типы восприятия своей болезни у послеоперационных больных и взаимосвязь отношения пациента к болезни с особенностями процесса выздоровления. Рекомендации по ускорению процесса выздоровления прооперированных больных с учетом их психологического настроя.
дипломная работа [143,1 K], добавлен 16.12.2010Структура онкологической службы. Клинические группы онкологических больных. Общие принципы лечения онкологических больных: хирургическое лечение, лучевая терапия, биотерапия. Химиотерапия как важнейший метод лечения при злокачественных опухолях.
реферат [14,0 K], добавлен 04.10.2011Зависимость между тяжестью состояния и сроком пребывания в стационаре больных, которые были прооперированы по поводу раневого повреждения. Физиологический механизм боли при ранениях. Классификация ран. Физическая реабилитация в комплексном лечении ран.
контрольная работа [1,1 M], добавлен 09.02.2009Современные проблемы лечения артериальной гипертензии. Комбинированная терапия при лечении больных артериальной гипертензией. Фармакодинамические свойства. Фармакокинетические свойства: Фелодипин ER, метопролол CR/ZOK. Дозирование и прием логимакса.
методичка [119,8 K], добавлен 12.11.2005Исследование психологических особенносттей больных рассеянным склерозом. Принципы когнитивно-бихевиоральной терапии. Применение когнитивно-бихевиоральной терапии в виде гетеросуггестивной психомышечной релаксации в терапии больных рассеянным склерозом.
дипломная работа [2,6 M], добавлен 04.05.2011Особенности остротекущей и затяжной форм пневмонии. Роль физических факторов в лечении больных острой пневмонией. Аспекты применения аэрозолей. Рекомендации по реабилитации больных. Значение закаливания организма. Специфика лечения хронических пневмоний.
реферат [24,3 K], добавлен 06.07.2011Биохимические и клинические показатели сыворотки крови при заболеваниях почек. Динамика активности трансаминаз; концентрации креатинина, билирубина, электролитов и глюкозы у больных почечной недостаточностью в условиях применения метода гемосорбции.
дипломная работа [336,1 K], добавлен 03.11.2015Максимальное снижение риска развития осложнений артериальной гипертензии и смертности больных как основная цель лечения больных. Немедикаментозное лечение, принципы медикаментозной терапии. Побочные эффекты и противопоказания при лечении препаратами.
презентация [2,4 M], добавлен 12.02.2013Диета для восстановления здоровья у больных раком. Категории пищевых продуктов с точки зрения вреда и пользы. Методы выведения токсинов из организма. Набор продуктов, применяемый при лечении почти всех разновидностей злокачественных новообразований.
презентация [6,9 M], добавлен 25.02.2017Физиотерапия больных с хроническим панкреатитом на этапе санаторно-курортного лечения. Исследования и основные критерии оценки эффективности физических методов при заболеваниях поджелудочной железы. Принципы профилактики данных болезней и ее значение.
реферат [508,4 K], добавлен 30.06.2015Схема проведения обследования больных в клинике ортопедической стоматологии. Трудности при ортопедическом лечении больных. Получение представления о физическом и психическом состоянии больного и особенностях его челюстно-лицевой системы при обследовании.
презентация [473,1 K], добавлен 17.12.2014Виды съемных протезов. Анатомическое строение полости рта зубного ряда. Влияние съемных зубных протезов на ткани полости рта. Клинические и технологические ошибки при изготовлении съемных зубных протезов. Частота возникновения осложнений при лечении.
курсовая работа [74,9 K], добавлен 04.06.2015Использование новейших хирургических технологий и современной аппаратуры при лечении катаракты. Оценка глазного статуса у пациентов. Прогнозирование ранних послеоперационных осложнений при одномоментном лечении катаракты и открытоугольной глаукомы.
статья [20,3 K], добавлен 18.08.2017Современные подходы к физиотерапии доброкачественной гиперплазии предстательной железы в сочетании с сопутствующим хроническим простатитом. Физиотерапия больных на этапе санаторно-курортного лечения. Применение методики домашней физиотерапии и массажа.
реферат [524,7 K], добавлен 30.06.2015Лечебно-профилактическая работа врача-фтизиатра противотуберкулезного диспансера Канавинского района. Анализ статистических показателей среди впервые выявленных больных туберкулезом. Эффективность лечения больных деструктивным и бациллярным туберкулезом.
отчет по практике [40,5 K], добавлен 05.04.2012Искусственные нейронные сети как математические модели и их программные реализации, строящиеся по образу биологических нейронных сетей. Знакомство с основными особенностями применения экспертных систем в медицине. Общая характеристика методов Data Mining.
презентация [141,0 K], добавлен 17.05.2014Теоретические аспекты психофизической реабилитации больных с инфарктом миокарда. Клиника, патогенез, этиология, классификация ибс и им. Исследование эффективности применения средств афк в комплексной реабилитации больных с инфарктом миокарда.
дипломная работа [56,3 K], добавлен 12.06.2005