Разработка программной системы для нейросетевого исследования феномена депрессии
Обзор современных способов диагностики и исследований социобиологических факторов развития депрессии. Проектирование, реализация и тестирование информационной системы. Принципы создания, исследование и оценка нейросетевой модели диагностики депрессии.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 18.07.2020 |
Размер файла | 197,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Для классов модуля Field тесты разработаны по принципу юнит-тестирования, так как они в большинстве случаев не имеют подобных эффектов. В то же время для модулей Calc и Main были разработаны сценарии тестирования, покрывающие основные варианты использования. Покрытие кода было проверено при помощи библиотеки coverage и составила 98%
Глава 5.
Глава 6. 5.Оценка и изучение нейросетевой модели
В данной главе описываются характеристики полученных нейро-сетевых моделей, сравниваются качества моделей в зависимости от конфигурации входных данных, выполняется прогнозный анализ модели с наибольшим качеством и делаются выводы об уровне влияния факторов на развитие депрессии.
5.1Характеристики моделей относительно конфигураций входных данных
В ходе работы модуля генерации моделей было просмотрено 80 конфигураций входных данных. Подробное описание принципа их составления описано в 3.2. Ввиду ограничения количества доступного машинного времени на платформе Google Colab, для каждой конфигурации были рассмотрены 5 случайных конфигураций нейронной сети и обучение производилось до эпохи 10000. Подробное описание параметров, определяющих конфигурацию нейронной сети, расположено в 3.2.
Рисунок 4.1. Типовые графики изменения ошибок обучения и тестирования
Во время обучения графики изменения ошибок обучения и тестирования по эпохам (Рисунок 4.1) имеют два типа: широкие и узкие. Факт, что в большинстве случаев график ошибки тестирования выглядит «широко» означает, что ошибка тестирования имеет большую дисперсию и очень сильно зависит от конкретных значений нейронной сети. Также это могло бы быть индикатором, что данные тестовой и обучающей выборки слабо связаны между собой, если бы отсутствовали случаи, когда график выглядит «плоско». Графики обучения всех конфигураций расположены в Приложении Е.
Несмотря на различия графиков обучения, итоговые качества моделей, рассчитанные по функции абсолютной ошибки, лежат в диапазоне от 0.784857 до 0.829820. В контексте данной задачи, данная метрика говорит о том, что в среднем модели ошибается на более чем три четверти уровня депрессии, что не является практически применимым качеством.
В результате самой наименьшей ошибкой обладают модели, имеющие полную информацию о возрасте, факторах жизненного цикла (семейное положение, образование, зарплата) и кодирующие информацию о семейном положении как One hot encoding, что может свидетельствовать, что связь возраста и семейного положения, образования и зарплаты не достаточна для полного игнорирования, а также зависимость депрессии от семейного положения и образования сложна по своей природе и не подлежит простому линейному кодированию. Также согласовано предположению, что включение коррелирующих переменных может привести к снижению качества, наибольшим качеством обладает модель, имеющая индекс массы тела без массы тела и роста. Однако следует отметить, что количество нейронных сетей, обученных для конкретных конфигураций входных данных весьма мало, поэтому данные выводы имеют весьма слабую силу. Большей силой обладают выводы, сделанные в ходе прогнозного анализа модели.
5.2Прогнозный анализ модели с наибольшим качеством
Для повышения качества анализа была обучена новая нейронная сеть с использованием набора факторов предыдущей лучшей модели и большим количеством попыток и эпох, а именно 25 попыток и 20000 эпох. В результате получилась модель с ошибкой тестирования равной 0.815, что подтверждает низкую силу утверждений, основанных на качестве получаемых нейронных сетей.
Была произведена выборка из 20 случайных примеров. Для каждого фактора итоговой нейронной сети были созданы искусственные примеры, в которых изменяется только рассматриваемый фактор. Для каждого фактора выбирается до 20 случайных уникальных значений, либо все уникальные значения, если таких меньше. Для каждого уникального значения создадим 20 искусственных примеров с данным значением и посчитаем среднюю оценку. Диаграммы полученных распределений средних значений расположены в Приложении Ж.
Факторы ранней утраты родителей, наличия близких и родственников с депрессией и тяжёлого детства, отсортированные по разности средних значений, закономерно увеличивают уровень депрессии. Данные факторы представляют разность в размере до 0.6 уровня депрессии.
Следует отметить, что некоторые факторы показали зависимость, которая была противоречива привычному представлению. Во-первых, в среднем у мужчин значение депрессии выше, чем у женщин. Данное несоответствие объясняется предвзятостью, связанному с использованием анкетирования для сбора информации: мужчины, прошедшие данную анкету, возможно были более заинтересованы в её прохождении из-за имеющегося депрессивного состояния.
Во-вторых, уровень депрессии у занятых творчеством или умственным трудом оказался ниже. В случае с творчеством количество примеров с данным фактором слишком мало: соотношение между творческими и нетворческими работниками слишком велико. При этом разница в оценке при изменении умственного или физического труда составил лишь 0.005 уровня депрессии, что можно сопоставить с погрешностью и низкой силой зависимости.
В-третьих, уровень депрессии при увеличении возраста сильно уменьшается. На самом деле, если учесть, что в среднем возраст анкетируемого колебался от 20 до 50, то уменьшение уровня депрессии к среднему возрасту является ожидаемым результатом [18]. Значимость данного фактора также высока: уровень депрессии падает практически линейно на 0.4 уровня депрессии между крайними значениями.
В-четвёртых, уровень депрессии падёт с ростом образования: от среднего -0.15 при основном общем образовании до -0.4 при высшем образовании. Причина, возможно, кроется во взаимозависимости уровня образования и уровня дохода.
Итого, наибольшей зависимостью по разности средних показателей депрессии при прогнозном анализе имеют трудности в детстве, возраст, родственники с депрессией.
Заключение
В результате преддипломной практики были выполнены поставленные задачи:
· Был проведён анализ методов диагностики депрессии и выделены основные преимущества данного подхода, в частности анонимность и низкий уровень страха пациента при сравнительно средних временных издержках, стоимости и точности прогнозирования.
· Спроектированы функциональные возможности программной системы, которые были изложены в форме диаграммы прецедентов и технического задания, а также спроектирована реализация данных возможностей в форме диаграммы классов и диаграммы компонентов.
· Реализована информационная система для диагностики депрессии в форме веб-сервера, а также код системы был практически полностью покрыт тестами.
· Была создана нейронная сеть, позволяющая производить диагностику депрессии с точностью около 0.815 уровней депрессии по шкале Бэка, а также выявлены закономерности в факторах возникновения депрессии, в частности факторов, связанных с жизненными обстоятельствами и возрастом.
Цель данной работы была достигнута. Реализованная система способна выполнять поставленную задачу диагностики депрессии на уровне прототипа, однако достаточно низкая точность модели является значительным ограничением для использования данной системы на практике.
Но несмотря на низкое качество исходной модели, программная система может быть применена для разработки и эксплуатации более качественных нейросетевых моделей диагностики депрессии. Хотя компонент генерации нейронных сетей был разработан специально для конкретного набора данных, собранных предыдущим исследованием [8], на основании которых также возможно создание более качественных моделей, компонент эксплуатации был разработан с учётом универсальности моделей диагностики: конфигурации нейронной сети и входных данных, что означает применимость компонента для иных источников данных, которые могут рассматривать иные факторы депрессии. Эксплуатация данной системы может привести не только к повышению доступности диагностики депрессии, но и к разработке моделей, предсказывающих не уровень депрессии, который был бы получен при использовании стандартных тестов вроде шкалы Бэка [5], а реальный уровень депрессии пациентов - для этого потребуется использование реальных медицинских данных пациентов.
Библиографический список
депрессия нейросетевой информационный
1. World Health Organization. Depression and Other Common Mental Disorders: Global Health Estimates, 2017
2. Marcus M., Taghi Yasamy M., M. van Ommeren, Chisholm D. and Saxena S. Depression: a global public health concern // World Health Organization Paper on Depression, pp. 6-8, Jan. 2012
3. Ениколопов С.Н. Стигматизация и проблема психического здоровья // Медицинская (клиническая) психология: традиции и перспективы (К 85-летию Юрия Федоровича Полякова).
4. Линделл Дада, Губернаторов Егор, Тарасенко Евгений. Сокращения вошли во врачебную практику // Газета РБК URL: https://www.rbc.ru/newspaper/2019/11/08/5dc2842f9a79472a93e695b1 (дата обращения: 15.05.2020)
5. Beck A. T. et al. An Inventory for Measuring Depression // Archives of general psychiatry, vol. 4, num 6, pp. 561-671, 1961, doi: 10.1001/archpsyc.1961.01710120031004
6. Acharya U.R., Sudarshan V.K., Adeli H., Santhosh J., Koh J.E.W. and Adeli A. Computer-Aided Diagnosis of Depression Using EEG Signals // Eur Neurol, vol. 73, pp. 329-336, May 2015, doi: 10.1159/000381950.
7. Gong J., Simon G.E., Liu S. Machine learning discovery of longitudinal patterns of depression and suicidal ideation // PLoS ONE 14(9):e0222665, 2019, doi: 10.1371/0222665.
8. Левченко Е. В., Митрофанов И.А., Ясницкий Л.Н. Нейросетевое моделирование феномена депрессии // Искусственный интеллект в решении актуальных социальных и экономических проблем XXI века, Пермь, Россия, Май 14-18, 2018
9. Tsugawa, Sho & Kikuchi, Yusuke & Kishino, Fumio & Nakajima, Kosuke & Itoh, Yuichi & Ohsaki, Hiroyuki. Recognizing Depression from Twitter Activity // CHI '15: Proceedings of the 33rd Annual ACM Conference on Human Factors in Computing Systems, pp. 3187-3196, doi: 10.1145/2702123.2702280.
10. Черепанов Ф.М., Ясницкий Л.Н. Нейросимулятор 5.0 // Свидетельство о государственной регистрации программы для ЭВМ № 2014618208. Заявка Роспатент № 2014614649. Зарегистрировано в Реестре программ для ЭВМ 12 августа 2014г.
11. Schmidt H. D., Shelton R. C. and Duman R. S. Functional Biomarkers of Depression: Diagnosis, Treatment, and Pathophysiology // Neuropsychopharmacology, 2011, vol. 36, pp. 2375-2394.
12. Demirci N. Does Depression Cause Obesity or Does Obesity Prompt Depression? // Int J Disabil Sports Health Sci, 2019, vol. 2(1), pp. 25-29. doi:10.33438/ijdshs.581209
13. Eknoyan G. Adolphe Quetelet (1796-1874)--the average man and indices of obesity. // Nephrology, Dialysis, Transplantation. 23 (1): 47-51. doi:10.1093/ndt/gfm517. PMID 17890752.
14. Devine B. J. Gentamicin therapy // Drug Intelligence and Clinical Pharmacy, vol. 8, no. 11, pp. 650-655, 1974.
15. Singg S, Lewis JL. Depression and blood types. // Psychol Rep. 2001;88(3 Pt 1):725-726. doi:10.2466/pr0.2001.88.3.725
16. Yadav K, Solanki J, Dileep CL, Adyanthaya BR, Mishra P, Yadav O. Association between different blood groups, depression and oral health status of dental students. // Clujul Med. 2018;91(3):317-321. doi:10.15386/cjmed-830
17. Guffanti, Guia & Kumar, Poornima & Admon, Roee & Treadway, Michael & Hall, Mei & Mehta, Malavika & Douglas, Samuel & Arulpragasam, Amanda & Pizzagalli, Diego. Depression genetic risk score is associated with anhedonia-related markers across units of analysis. // Translational Psychiatry. 9. 10.1038/s41398-019-0566-7.
18. Mirowsky J, Ross CE. Age and depression. // J Health Soc Behav. 1992;33(3):187-212.
Размещено на Allbest.ru
...Подобные документы
Разработка информационной системы для автоматизации логистики в управлении архивом документов компании "Айрон Маунтен". Обзор рынка аналогов программных продуктов. Тестирование разработанной программной системы. Даталогическая и физическая модели данных.
дипломная работа [7,3 M], добавлен 04.05.2014Базовые принципы правового регулирования трудовых отношений. Проектирование автоматизированной информационной системы "Отдел кадров", программная реализация, тестирование. Состав базы данных, методы анализа надежности системы, руководство пользователя.
дипломная работа [3,6 M], добавлен 11.03.2010Задачи, функции и структура филиала университета. Оценка информационных потоков и UML-моделирование. Анализ структуры информационной системы и системы навигации. Проектирование базы данных, физическая реализация и тестирование информационной системы.
дипломная работа [6,0 M], добавлен 21.01.2012Исследование методов и способов разработки информационных систем. Автоматизация деятельности продовольственного магазина. Проектирование логической схемы информационной системы. Разработка модели базы данных и структуры вычислительно-локальной сети.
курсовая работа [389,2 K], добавлен 16.03.2017Диагностические программы операционной системы. Обзор утилит диагностики и тестирования ПК. Расчет общей стоимости годового обслуживания офисного компьютера при выполнении всех еженедельных, ежемесячных и полугодовых ремонтно-профилактических работ.
дипломная работа [2,3 M], добавлен 19.06.2014Выбор, обоснование и особенности работы СУБД. Характеристика языков программирования. Разработка структурной и функциональной модели информационной системы аптеки. Проектирование программной среды АИС и ее интерфейса. Построение модели базы данных.
курсовая работа [442,3 K], добавлен 21.04.2012Схематическое представление сигмоидной функции. Слой как группа нейронов, на которые входной сигнал приходит одновременно. Характеристика специфических особенностей кохоненоподобной нейросетевой модели. Описание модели работы самоорганизующихся карт.
курсовая работа [1,6 M], добавлен 30.06.2017Анализ процессов диагностики повреждений трубопровода. Разработка модели продукционной базы знаний: обзор методов представления знаний, описание создания базы знаний и разработки механизма логического вывода. Экономическое обоснование концепции проекта.
дипломная работа [3,0 M], добавлен 16.04.2017Технико-экономические показатели разработки. Функциональные модели информационной системы и ее объектно-ориентированное проектирование. Анализ вариантов использования. Тестирование программного продукта, а также исследование технической документации.
курсовая работа [175,2 K], добавлен 14.09.2015Организационная структура и процессы сети поликлиник "Семейный доктор". Описание проблем и формирование концепции информационной системы. Концептуальная и логическая модели информационной системы. Разработка и реализация модели в среде CASE-средства.
курсовая работа [970,6 K], добавлен 14.11.2010Исследование современных технологий и средств разработки. Выявление и оценка информационных потоков и структуры информации. Выбор необходимой информации для информационной системы. Проектирование и анализ системы навигации. Проектирование базы данных.
дипломная работа [2,8 M], добавлен 21.01.2012Понятие офтальмологии, виды и методы ее диагностики. Глазные заболевания и их симптомы. Применимость экспертных систем. Проектирование модели байесовской сети. Разработка инфологической модели базы данных. Руководство пользователя и тестирование системы.
дипломная работа [1,4 M], добавлен 13.11.2015Тестирование информационной системы учета протоколов несоответствия учебно-тренировочного подразделения АЭС. Формирование функциональных возможностей информационной системы. Построение структурно-функциональной модели по стандарту IDEF0, методологии SADT.
дипломная работа [1,1 M], добавлен 11.03.2012Проектирование функциональной и информационной моделей приложения с помощью AllFusion Process Modeler 7. Декомпозиция контекстной диаграммы "Обучение и тестирование". Логическая модель обучающей информационной системы. Тестирование программного продукта.
курсовая работа [2,9 M], добавлен 18.01.2017Анализ уровня технической и программной оснащенности ЗАГСа. Обзор языков программирования для создания информационной системы. Моделирование структуры реляционной базы данных в составе ИС. Диаграммы кооперации, классов, компонентов, развертывания.
курсовая работа [424,2 K], добавлен 12.02.2016Специфика функционирования Луганского университета имени Владимира Даля, организационная структура и работа различных подразделений. Особенности программной и технической характеристик информационной системы. Проектирование модели системы аналитики.
отчет по практике [65,6 K], добавлен 12.05.2015История развития, применение искусственных нейронных сетей. Распознавание образов в сети. Сжатие данных и ассоциативная память. Проектирование экспертной системы, позволяющей диагностировать заболевания органов пищеварения. Программная реализация системы.
курсовая работа [744,0 K], добавлен 05.02.2016Методы диагностики производительности запросов. Выбор инструментов для front-end разработки. Проектирование архитектур программной системы. Реализация системы регистрации и авторизации пользователей на сайте. Причины неэффективности SQL-запросов в Oracle.
дипломная работа [1,0 M], добавлен 09.11.2016Выбор методологии проектирования и разработка информационной системы "Расчёт зарплаты" для предприятия ОАО РТП "Авторемонтник". Архитектурное проектирование базы данных информационной системы и разработка её интерфейса. Тестирование программного модуля.
дипломная работа [2,3 M], добавлен 25.05.2014Разработка информационно-логической модели проектируемой информационной системы. Алгоритм функционирования информационной системы. Описание базы данных. Описание входной, промежуточной и выходной информации. Техническое и программное обеспечение.
реферат [28,1 K], добавлен 09.01.2009