Прогнозирование заболеваемости раком молочной железы с применением обобщенной аддитивной модели
Разработка на основе статистического анализа данных обобщенной аддитивной модели, позволяющей прогнозировать заболеваемость раком молочной железы с учетом показателей качества жизни. Расчет коэффициента детерминации и среднеквадратической ошибки.
Рубрика | Медицина |
Вид | статья |
Язык | русский |
Дата добавления | 19.03.2023 |
Размер файла | 482,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Прогнозирование заболеваемости раком молочной железы с применением обобщенной аддитивной модели
М.З. Ермолицкая,
канд. биол. наук
Аннотация
На основе статистического анализа данных разработана обобщенная аддитивная модель, позволяющая прогнозировать заболеваемость раком молочной железы с учетом показателей качества жизни населения. Значение коэффициента детерминации составило 0.96, среднеквадратической ошибки - 0.0046.
Ключевые слова: обобщенная аддитивная модель, критерий отношения правдоподобия, стандартизованные показатели заболеваемости раком молочной железы.
Основная часть
Методы математического моделирования и машинного обучения получили широкое распространение во всех областях человеческой деятельности, в том числе и в биостатистике. Любые виды исследований в биологии, медицине и здравоохранении неразрывно связаны со сбором данных, их статистической обработкой, анализом, визуальным представлением и интерпретацией полученных результатов. Поиск различий, изучение взаимосвязей между совокупностями, выявление закономерностей необходимо проводить с учетом особенностей конкретного исследования, а также свойств изучаемых признаков [1, 2].
Прогнозирование зависимого признака сопровождается построением статистической модели - упрощенного представления процесса, который приводит к генерации наблюдаемых значений изучаемой переменной. При этом предполагается, что предсказанные значения будут обладать свойствами реальных данных. Одним из методов построения таких моделей является регрессионный анализ, который позволяет посредством линейной математической функции (уравнения регрессии) определить зависимость между одной зависимой переменной (откликом) и одной или более независимыми переменными (предикторами). Учет нелинейного характера влияния предикторов на отклик можно осуществить путем замены предикторов в уравнении на их нелинейные преобразования [3].
Расширением класса общих линейных и нелинейных моделей регрессии являются обобщенные аддитивные модели, в которых зависимость между откликом и предикторами задается с помощью гладких функций (например, полиномиальной функции и сглаживающих сплайнов). При этом для каждой переменной вид лучшей преобразующей функции может быть найден по результатам мета-анализа или подобран в ходе исследований.
Для прогнозирования заболеваемости раком молочной железы используют разные подходы, в том числе и методы регрессионного анализа [4 - 8]. Исследования различаются набором показателей, территориальной принадлежностью и временным интервалом. В качестве предикторов, помимо генетических нарушений, используют внешние факторы, такие как физическая активность, потребление продуктов питания, курение, потребление алкоголя, загрязнение окружающей среды и др. [9, 10].
В данной работе представлена разработанная обобщенная аддитивная модель заболеваемости раком молочной железы на основе показателей качества жизни населения Приморского края. Оценка адекватности модели дает возможность использовать ее для прогнозирования заболеваемости с учетом выявленных взаимосвязей на региональном уровне.
Статистическая обработка и анализ данных
Предварительный анализ данных с выявлением значимых показателей, влияющих на заболеваемость раком молочной железы, описан в статье [11], где на основе 40 показателей качества жизни населения были выделены четыре главные компоненты, объясняющие 71% общей вариации исходных данных. Первые две компоненты (РСц и РС12) содержат показатели, характеризующие социально-экономические условия жизни населения; вторая компонента (РС2) связана с социально-гигиеническими показателями, с учетом загрязнения окружающей среды; третья компонента (РС3) содержит показатели потребления продуктов питания.
При этом показатель заболеваемости имеет обратную умеренную зависимость с компонентами РС1 (РС1 = РС11 + РС12) и РС2 (коэффициенты корреляции равны -0.401 и -0.544 соответственно) и прямую умеренную зависимость с третьей компонентой (0.456). В качестве показателя заболеваемости взяты стандартизованные показатели заболеваемости раком молочной железы (РМЖ) в Приморском крае за период с 2007 г. по 2019 г. Проверка нулевых гипотез осуществлялась на уровне значимости 0.05.
При использовании линейной регрессии по методу наименьших квадратов получить качественную статистическую модель с учетом всех выделенных компонент не удалось. Для построения прогнозной модели применили обобщенные аддитивные модели регрессии (GAM), являющиеся более гибким инструментом аппроксимации, чем линейные модели.
Аддитивные модели связывают зависимую переменную произвольного распределения с предикторами посредством задаваемой функции связи:
где Y - зависимая переменная; о - свободный коэффициент регрессии; qi(xi) - произвольные функции нелинейного преобразования независимых переменных хг-; е - остатки, представляющие собой отклонения наблюдаемых значений зависимой переменной от предсказанных значений данной переменной, вычисленных по уравнению регрессии.
В качестве функции qi(xi) может быть использована любая гладкая функция, но наиболее эффективны непараметрические модели сглаживания локальной регрессией или сплайны.
При построении аддитивных моделей в программе RStudio (Version1.0.153) использовали функцию gam {gam}, где для оценивания параметров модели применяется метод максимального правдоподобия с расчетом квадратичной функции ошибки модели [12].
Были построены модели на натуральных и сглаживающих сплайнах. При подборе степени сглаживания каждого предиктора использовали функцию anova{stats} для сравнения качества моделей посредством таблиц дисперсионного анализа и анализа отклонений. Получили наилучшую модель на сглаживающих сплайнах степени 3 для предиктора РС1 и степени 4 для предиктора РС3:
где Y - стандартизованные показатели заболеваемости РМЖ; РСі, РС2, РСз - главные компоненты.
Все коэффициенты регрессии в уравнении значимы (таблица).
s (PCi, 3) |
РС2 |
s (PC3,4) |
||
Коэффициенты |
- 0.049 |
- 0.208 |
- 0.195 |
|
Уровень значимости (p-value) |
0.0106 |
0.0075 |
0.0497 |
Наибольший вклад в предсказание вносят вторая и третья главные компоненты, объединяющие социально-гигиенические показатели и показатели потребления продуктов питания. Корреляция между зависимой переменной и предикторами обратная.
Графическое изображение результатов представлено на рис. 1.
рак железа статистический
Рис. 1. Сглаживание предикторов в аддитивной модели (сплошная линия - зависимости, пунктирная линия - доверительные интервалы)
Согласно графикам взаимосвязь между зависимой переменной и первым и третьим предикторами нелинейная, со вторым предиктором - линейная. Предсказанные значения зависимой переменной сглажены по сравнению с наблюдаемыми значениями (рис. 2).
Рис. 2. График наблюдаемых и предсказанных значений
Статистика критерия отношения правдоподобия рассчитывалась как разница между остаточным и нулевым девиансами и составила 45.2 с числом степеней свободы 8. Критическая область включает интервал (15.507, го) на уровне значимости 0.05. Статистика критерия попадает в критическую область, что позволяет отвергнуть нулевую гипотезу о статистической незначимости построенного уравнения регрессии.
Дополнительно рассчитали среднеквадратическую ошибку (MSE) икоэффициент детерминации (R2):
где yi - наблюдаемые значения; у - предсказанные значения; у - среднее арифметическое наблюдаемых значений.
Полученное значение MSEравно 0.0046, близкое к нулю, что указывает на модель, предсказанные значения которой очень близки к наблюдаемым. Коэффициент детерминации 0.96 - показывает долю дисперсии зависимой переменной, объясняемую разработанной моделью. Значение критерия Акаике (АІС) - 13.053. Данные оценки свидетельствуют о высоком качестве построенной модели.
Валидация модели не проводилась в связи с коротким временным интервалом исследуемых данных.
В результате проведенного исследования разработана обобщенная аддитивная модель на сглаживающих сплайнах, позволяющая прогнозировать заболеваемость раком молочной железы на основе показателей качества жизни населения Приморского края, сгруппированных в три главные компоненты. Согласно параметрам модели, наибольшее влияние на заболеваемость оказывают социально-гигиенические показателями и показатели потребления продуктов питания. Проверка адекватности модели посредством расчета статистики критерия отношения правдоподобия, среднеквадратической ошибки и коэффициента детерминации позволяет использовать ее в качестве вспомогательного инструмента при проектировании мероприятий по снижению заболеваемости населения за счет повышения качества жизни на региональном уровне.
Литература
1. Мун С.А., Глушов А.Н., Штернис Т.А. и др. Регрессионный анализ в медико-биологических исследованиях. - Кемерово: КемГМА, 2012.
2. Кондратьев М.А. Методы прогнозирования и модели распространения заболеваний // Компьютерные исследования и моделирование. - 2013. - Т.5, №5. - С. 863-882.
3. Мастицкий С.Э., Шитиков В.К. Статистический анализ и визуализация данных с помощьюR. - Creative Commons, 2014.
4. Tyrer J., Duffy S.W., Cuzick J. A breast cancer prediction model incorporating familial and personal risk factors // Stat. Med. - 2004. - №23. - Р.1111-1130.
5. Asghari Jafarabadi M., Iraji Z., Dolatkhah R., Jafari Koshki T. Modeling the Factors Associated with Mortality in Patients with Breast Cancer: A Machine Learning Approach. URL: https://www.researchsquare.com/article/rs-57685/v1 (дата обращения: 06.07.2022).
6. Jie Xu, Yong Lin, Mu Yang, Lanjing Zhang J. Statistics and pitfalls of trend analysis in cancer research: a review focused on statistical packages // Cancer. - 2020. - Vol. 11, №10. - P. 2957-2961.
7. J. Mark Elwood, Essa Tawfiq, Sandar TinTin, et al. Development and validation of a new predictive model for breast cancer survival in New Zealand and comparison to the Nottingham prognostic index // BMC Cancer. - 2018. - Vol.18, №1. - P. 897.
8. Sekeroglu B., Tuncal K. Prediction of cancer incidence rates for the European continent using machine learning models // Health Informatics Journal. - 2021. - Vol. 27, №1:1460458220983878.
9. Французова И.С. Анализ факторов риска развития рака молочной железы // Международный научно-исследовательский журнал. - 2019. - №3 (81). - С. 68-74.
10. Синкина Т.В., Петрова В.Д., Лазарев А.Ф. Современные представления о факторах риска рака молочной железы // Российский биотерапевтический журнал. - 2009. - №1 (8). - С. 87-93.
11. Ермолицкая М.З. Выявление взаимосвязи между показателями качества жизни населения и заболеваемости раком молочной железы на территории Приморского края // Информатика и системы управления - 2022. - №2 (72). - С. 13-23.
12. Шитиков В.К., Мастицкий С.Э. Классификация, регрессия и другие алгоритмы DataMiningс использованием R. - 2017. Режим доступа: https://github.com/ranalytics/data-mining (дата обращения: 06.07.2022).
Размещено на Allbest.ru
...Подобные документы
Статистика заболеваемости раком молочной железы, основные причины его развития. Типы рака молочной железы по анатомической форме роста. Клинические признаки фиброзно-кистозной мастопатии. Симптомы фиброаденомы, ее виды. Самообследование молочной железы.
презентация [365,3 K], добавлен 14.07.2015Изучение особенностей психологических реакций на наличие онкологического заболевания и способы его лечения. Определение основных проблем пациенток с раком молочной железы. Рекомендации по организации ухода за пациентками с раком молочной железы.
презентация [1,1 M], добавлен 13.12.2017Распространенность заболевания раком молочной железы (злокачественная опухоль железистой ткани молочной железы). Структура онкологической заболеваемости у женщин. Зависимость возникновения заболевания от возраста. Первичная профилактика рака груди.
презентация [2,1 M], добавлен 03.05.2015Структура онкологической заболеваемости женского населения. Особенности раковой опухоли. Современные методы диагностики РМЖ. Виды рака молочной железы, симптомы. Риск развития рецидива. Эффективность лучевой терапии рака молочных желез (менее сантиметра).
реферат [20,0 K], добавлен 30.05.2013Морфогенез молочной железы. Особенности строения лактирующей и нелактирующей молочной железы в норме. Морфоколичественный анализ компонентов молочной железы. Оценка удельного объема структурных компонентов молочной железы с помощью сетки Автандилова.
курсовая работа [722,1 K], добавлен 08.02.2011Патогенез и классификация рака молочной железы. Факторы риска его развития. Цитологические особенности отдельных форм рака молочной железы. Особенности, присущие протоковому раку. Заболеваемость рака молочной железы в Гомельской области и Беларуси.
дипломная работа [2,8 M], добавлен 20.09.2012Установление диагноза злокачественной опухоли ткани молочной железы. Структура онкологической заболеваемости у женщин. Профилактика и факторы риска рака молочной железы. Комплексное, комбинированное и хирургическое лечение заболевания. Скрининг РМЖ.
презентация [1,4 M], добавлен 22.12.2014Постоянное ощущение чувства тяжести и ограничение движений в суставе, снижение мышечного тонуса - одни из основных клинических признаков лимфодемы. Хирургическое восстановление - важный элемент комплексной реабилитации больных раком молочной железы.
курсовая работа [315,2 K], добавлен 13.12.2017Анатомия молочных желез. Устройства, методы диагностики рака молочной железы. Физикальное и ультразвуковое исследования, маммография. Магнитно резонансная томография и радионуклидная диагностика. Использование метода акустической резонансной визуализации.
дипломная работа [2,0 M], добавлен 06.11.2012Строение молочной железы. Лимфатическое метастазирование при раке молочной железы. Плюсы и минусы методики лоскута широчайшей мышцы спины. Виды хирургических операций. Секторальная резекция молочной железы. Радикальная мастэктомия по Холстеду-Майеру.
презентация [1,8 M], добавлен 21.12.2011Факторы риска развития рака молочной железы, связанные с репродуктивной функцией. Первые симптомы и жалобы пациентов при раке молочной железы. Диагностика и лечение рака молочной железы на фоне беременности. Возможные метастазы в плаценту и ткани плода.
презентация [6,8 M], добавлен 06.10.2016Структура онкологической заболеваемости женского населения, факторы риска рака молочной железы. Эндокринные и метаболические факторы, связанные с сопутствующими заболеваниями. Проведение цитологической и гистологической диагностики рака молочной железы.
презентация [3,6 M], добавлен 25.10.2016Факторы риска, цитологическая диагностика рака молочной железы. Критерии злокачественности рака молочной железы. Интраоперационная цитологическая диагностика рака молочной железы. Аспекты дифференциальной цитологической диагностики рака молочной железы.
реферат [27,6 K], добавлен 05.11.2010Распространенность доброкачественных и злокачественных опухолей молочной железы, их виды. Эпителиальная опухоль, исходящая из протоков или долек железы (рак груди), причины ее возникновения и типичные симптомы. Клиническая картина течения заболевания.
презентация [1,6 M], добавлен 19.03.2017Факторы риска развития рака молочной железы (РМЖ). Порядок осмотра и пальпации молочных желез. Дифференциальная диагностика между доброкачественной опухолью молочной железы и РМЖ. Методы лечения данного заболевания, условия назначения лучевой терапии.
презентация [6,2 M], добавлен 20.09.2016Этиологические факторы рака молочной железы, его разновидности и характеристика. Локализация рака молочной железы, методы самообследование и диагностики. Обзор способов лечения и профилактики заболевания. Рекомендации женщинам, перенесших мастэктомию.
презентация [5,7 M], добавлен 31.05.2013Применение для уточнения диагноза и выбора лечебной тактики при раке поджелудочной железы тонкоигольной аспирационной биопсии. Резектабельность. Дифференциальная диагностика между раком головки поджелудочной железы и раком большого дуоденального сосочка.
реферат [17,6 K], добавлен 12.02.2009Классификация мастопатий, их клинические проявления. Доброкачественные опухоли молочной железы. Истинная и ложная гиникомастия. Злокачественная опухоль у женщин, патогенетические факторы риска. Гистологическая классификация рака молочной железы.
презентация [198,7 K], добавлен 10.04.2015Незрелая злокачественная опухоль из железистого эпителия. Факторы, которые увеличивают вероятность возникновения рака молочной железы. Эндокринные и метаболические факторы, связанные с сопутствующими заболеваниями. Рак молочной железы и беременность.
презентация [23,6 M], добавлен 25.01.2015Клиническая картина, осложнения, лечение рака молочной железы. Факторы, снижающие риск возникновения. Важнейшие факторы риска. Преимущества и недостатки маммографии. Участие медицинской сестры в проведении реабилитационных мероприятий после мастэктомии.
реферат [679,0 K], добавлен 11.04.2017