Медицинские калькуляторы на основе гибридных нейросетевых технологий и виртуальных потоков

Знакомство с гибридными решающими модулями с виртуальными потоками, предназначенными для реализации медицинских калькуляторов. Рассмотрение особенностей нелинейных моделей виртуальных потоков и подвектора латентных переменных неограниченной размерности.

Рубрика Коммуникации, связь, цифровые приборы и радиоэлектроника
Вид статья
Язык русский
Дата добавления 01.02.2019
Размер файла 123,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Медицинские калькуляторы на основе гибридных нейросетевых технологий и виртуальных потоков

Для реализации медицинских калькуляторов предложены гибридные решающие модули с виртуальными потоками, которые отражают скрытые системные связи между наблюдаемыми и не наблюдаемыми данными. При этом вектор информативных признаков на входе гибридного решающего модуля состоит из двух подвекторов, первый из которых соответствует реальным потокам, а второй - виртуальным потокам.

Нелинейные модели виртуальных потоков формируются посредством метода, основанного на использовании МГУА-моделирования. Метод позволяет получить нейросетевые структуры, построенные на основе МГУА-моделей и нелинейных адалинов, позволяющие формировать подвектор латентных переменных неограниченной размерности.

Совокупное использование инструментария теории нечетких множеств и нечеткой логики, а также теории нейросетевого анализа дает возможность создавать качественно новые интеллектуальные системы для медицинского прогнозирования и медицинской диагностики - медицинские калькуляторы, позволяющие решать большой круг задач практической медицины [1, 2]. При этом при принятии прогностических и диагностических решений необходимо учитывать латентные переменные, которые не входят в исследуемый комплекс параметров системы, на основе которого строится пространство информативных признаков. Эти дополнительные информативные признаки, несут информацию о скрытых связях между исходными признаками [3, 4]. Вектор, соответствующий этим информативным признакам, назовем виртуальным потоком. Для учета этих переменных медицинский калькулятор необходимо обеспечить соответствующей надстройкой, формирующей и анализирующей виртуальные потоки.

Материалы и методы. Идея построения такой надстройки состоит в следующем. Если данные в системе носят поточный характер, сущность которого заключается в том, что каждый поток формируется множеством источников данных (рисунок 1), сгруппированных по некоторому принципу, а затем сжатых, вплоть до скаляра, по некоторому формальному алгоритму, то к имеющимся потокам может быть добавлен еще один поток - виртуальный поток, представленный своим выходом, то есть агрегированными данными, которые смоделированы тем или иным методом на основе того или иного закона распределения вероятностей.

Если имеется функционал качества классификатора, то меняя закон распределения вероятностей или его параметры в таком дополнительном потоке, можно добиться улучшения показателей качества принимаемых решений. Получив модель виртуального потока, можем генерировать данные в этом потоке, после чего их можно объединить с данными в других потоках, которые были получены посредством экспериментальных исследований на натуральных объектах (рисунок 1).

Рисунок 1. Структура гибридного решающего модуля с поточными данными

виртуальный латентный поток

Для построения системной надстройки, реализующей работу с виртуальными потоками данных и интеграцию их в данные натурного эксперимента, необходим как соответствующий инструментарий, так и методы и алгоритмы, позволяющие реализовать модель виртуального потока. В качестве инструментария для формирования виртуальных потоков используем гибридные решающие модули. Экспертные знания интегрируются в гибридный решающий модуль в виде нечеткого решающего модуля. На выходе нечеткого решающего модуля имеем скалярную величину, которую принято называть коэффициентом уверенности по данному сегменту информативных признаков или частным коэффициентом уверенности [2, 3]. Агрегирование частных коэффициентов уверенности осуществляется на основе обучаемого классификатора, в качестве которого выступает нейронная сеть.

При использовании в качестве входов нейронной сети коэффициентов уверенности, получаемых в результате нечетких операций в нечетком решающем модуле, построенном на основе алгоритмов нечеткого вывода, возникают трудности с получением требуемой точности классификации нейронной сети, используемой на входе решающего модуля (рисунок 1). Это связано с тем, что признаки, формируемые на входе нейронной сети, получены на основе экспертных заключений и гипотез, которые могут неадекватно отражать внутренние процессы в исследуемой системе. Кроме, того, полнота признакового пространства и релевантность самих признаков в нем определяется только экспертом (ЛПР). Эти признаки поступают на вход обучаемой нейронной сети, которая вносит свои искажения в интерпретацию признакового пространства. Особенно опасен здесь эффект переобучения, так как в случае прогнозирования заболеваний выборки достаточно большого объема сформировать весьма проблематично. Поэтому в структуру рисунок 1 целесообразно внести дополнительные связи, которые бы позволили придать больший вес статистическим данным в общем процессе формирования гибридного решающего модуля.

Моделирование. Идея метода, позволяющего выполнить такую процедуру, состоит в следующем. Присутствующие на входе нейронной сети признаки - коэффициенты уверенности по сегментам информативных признаков - не отражают полностью свойства исследуемого объекта или системы, которые входят в область интересов ЛПР. Это утверждение справедливо хотя бы потому, что у ЛПР нет доказательств, что в N сегментах признаков на входе гибридного решающего модуля рисунок 1 собраны все релевантные признаки, характеризующие исследуемый объект, относящиеся к области интереса решаемой задачи или у ЛПР нет уверенности, что в гибридный решающий модуль включены все релевантные потоки.

Следовательно, можем выдвинуть гипотезу, что есть хотя бы один сегмент информативных признаков N+1, который включает хотя бы один информативный признак, коэффициент уверенности по которому (по сегменту N+1) KУN+1, существенно влияет на качество принимаемых решений. Следовательно, необходима процедура, которая позволит сформировать вектор

для обучающей выборки

,

где

M - число образцов в обучающей выборке, N - число входов нейронной сети на рис. 1, i - номер образца в обучающей выборке, j - номер входа агрегирующей нейронной сети

Так как в (3) , то .

В общем случае у нейронной сети рис. 1 может быть введено неограниченное число дополнительных входов (имеется неограниченное число виртуальных информационных потоков), но в данном случае рассматривается только один дополнительный вход.

Метод и модели. Для двухальтернативных выборок необходимо построить две модели виртуальных потоков. Скрытые связи определяются аппроксимирующей функцией, построенной по данным, извлеченным из обучающей выборки (независимым переменным) и зависимым переменным, полученным посредством вероятностного программирования [4]. Если такая аппроксимирующая функция будет построена, то по данным неизвестного образца может быть найден дополнительный признак как функция этих входных данных.

Полагаем, что неизвестный образец характеризуется вектором наблюдаемых информативных признаком X с компонентами x1, x2,…,xm. Необходимо получить функциональную зависимость латентной переменной Y от наблюдаемого вектора X, то есть

полагая, что присутствие на входе классифицирующей подели этого информативного признака улучшит качество классификации.

Модель нейросетевой структуры с виртуальным потоком показана на рисунке 2.

При этом в обучающую выборку для аппроксиматоров входят не только экспериментальные данные, полученные на соответствующем интервале наблюдения, но и данные, полученные в результате имитационного моделирования на предшествующей нейросетевой модели. То есть, каждый нейросетевой модуль (НС на рисунке 2) в этой модели, кроме первого и последнего, является не только анализатором латентного параметра X, но источником данных для настройки параметров (обучения) последующего модуля.

Таким образом, необходимо решить задачу, состоящую в обнаружении и моделировании некоторой закономерности (4). Проблемы, возникающие при восстановлении функциональных зависимостей в условиях коротких выборок, являются типичными проблемами, возникающими при применении индуктивных методов, и существенно отличаются от классических проблем восстановления по выборкам большого объема. Особенность состоит в том, что при ограничении объема выборки качество восстановления зависит не только от качества аппроксимации в точках yj, но еще и от таких факторов, как сложность аппроксимирующей функции и размерности пространства m.

Рисунок 2. Структура нейросетевой модели с виртуальными потоками

Эта особенность заставляет сосредоточить внимание на правильном соотнесении сложности приближающей функции с объемом обучающей выборки, так как имеющейся информации может не хватить даже для восстановления функции только в точках yj. Тем более этой информации может не хватить для удовлетворительного восстановления в любой точке ее существования.

Среди немногих методов, в которых особое внимание уделяется поиску такого соотнесения, выделяются метод группового учета аргументов (МГУА) [4]. Рассмотрим метод синтеза модели оптимальной сложности более подробно.

Сложная зависимость (4) заменяется множеством простых функций:

…,

где причем функция повсюду одинакова.

В качестве функции выбираются простые зависимости

связывающие только две переменные. Коэффициенты этих зависимостей можно определить по МНК, имея соответственно 4 или 6 точек наблюдений в обучающей последовательности. Среди моделей первого ряда выбираются несколько, например, наилучших, показавших хорошие результаты на проверочной выборке. Полученные на обучающей выборке значения соответствующие отобранным моделям, рассматриваются в качестве аргументов нового ряда:

Здесь функция остаются прежними и соответствуют соотношениям (5), но аргументами этих функций выступают переменные Коэффициенты новых моделей (7) находятся по МНК на точках той же обучающей последовательности. Новые модели проверяются на точках проверочной последовательности, и среди них выбирается наилучших, которые используются в качестве аргументов следующего третьего ряда и т.д. Сложность полиномов возрастает от ряда к ряду.

Входные аргументы и промежуточные переменные сопрягаются попарно, и сложность комбинаций на каждом ряду обработки информации возрастает (как при массовой селекции), пока не будет получена единственная модель оптимальной сложности.

Каждое частное описание является функцией только двух аргументов. Поэтому его коэффициенты легко определить по данным обучающей последовательности при малом числе узлов интерполяции. Исключая промежуточные переменные (если это удается), можно получить аналог полного описания. Например, по десяти узлам интерполяции можно получить в результате оценки коэффициентов полинома сотой степени и т.д.

Из ряда в ряд селекции пропускается только некоторое количество самых регулярных переменных. Степень регулярности оценивается по величине среднеквадратичной ошибки (средней для всех выбираемых в каждом поколении переменных или для одной самой точной переменной) на отдельной проверочной последовательности данных. Иногда в качестве показателя регулярности используется коэффициент корреляции.

Ряды селекции наращиваются до тех пор, пока регулярность повышается. Как только достигнут минимум ошибки, селекцию, во избежание «инцухта», следует остановить. Практически рекомендуется остановить селекцию даже несколько раньше достижения полного минимума, как только ошибка начинает падать слишком медленно. Это приводит к более простым и более достоверным уравнениям [3, 4].

Среди множества МГУА - моделей выбираем L наилучших, которые могут быть представлены в виде множества

,

где , X=(x1, x2,…,xm) - множество информативных признаков используемых решающими модулями; .

Рассмотрим метод формирования множества (13). Метод должен синтезировать множество аппроксимирующих связей между элементами входного вектора X и позволить выбрать из этого множества L функциональных связей, которые формируют L дополнительных признаков, включение которых во входной вектор приводит к повышению качества классификации решающего модуля.

В случае вырождения нелинейных моделей в линейные многомерные аппроксиматоры блок нелинейных моделей включает множество пар (в случае двухальтернативной классификации) классифицирующих функций (аппроксиматоров), каждый из которых выдает число, соответствующее состоянию входного вектора. При необходимости, эти два числа могут быть агрегированы в одно посредством агрегаторов [2].

Включение в множество моделей очередной, -й, модели, осуществляется по рекуррентной схеме, представленной на рисунке 2. Эта схема позволяет оценить вклад в показатели качества принятия решений -го дополнительного информативного признака при наличии дополнительных признаков.

Блок нелинейных моделей виртуальных потоков составляет основу классифицирующего модуля рисунок 2. Блок нелинейных моделей состоит из двух слоев. Первый слой формирует множество моделей . Для каждого виртуального потока посредством МГУА - моделирования получено свое подмножество моделей . Каждое подмножество моделей , где Ki - число МГУ - моделей для i-го виртуального потока, полученных на основе МГУА-моделирования, которые предполагается использовать для описания взаимного влияния известных информативных признаков (реальных потоков) в системе простых комбинаций реальных и виртуальных потов. Множество статических моделей получается не посредством усложнения МГУА-моделей, а посредством МГУА-нейронной сети [4]. Отличие предлагаемой МГУА-нейронной сети от рассмотренной в [4] состоит в том, что каждый блок модели виртуального потока (второй слой модели) является МГУА-нейронной сетью, на входы которой поступают полученные путем МГУА-моделирования модели, включающие множество реальных и виртуальных потоков.

Процесс обучения МГУА - модели виртуального потока состоит в конфигурации нейронных сетей. После обучения нейронной сети посредством любого из известных алгоритмов обучение оценивается точность моделирования, например, с помощью дисперсии ошибки предсказания для каждого нейрона и формируется группа нейронов, дающих ошибку ниже некоторого априорно заданного порога [4].

Выводы

виртуальный латентный поток

1. Для прогнозирования состояния сложных систем предложены нейронные сети с виртуальными потоками, которые отражают скрытые системные связи между реальными и виртуальными потоками. При этом вектор информативных признаков состоит из двух подвекторов, первый из которых соответствует реальным потокам, а второй - виртуальным потокам.

2. Моделирование процессов классификации в разработанной программной среде позволили оценить влияние на качество классификации искусственно введенных виртуальных потоков. Введение виртуальных потоков в гибридный решающий модуль позволяет организовать «движок», осуществляющий управление качеством классификации нейросетевой структуры.

3. Разработана модель универсального нейросетевого аппроксиматора, отличающаяся двумя скрытыми слоями, в первом из которых проводится разбиение обучающей выборки на кластеры посредством многомерных линейных аппроксиматров, а во втором скрытом слое вычисляется функция принадлежности к заданному кластеру на основе численного значения многомерной аппроксимирующей функции, позволяющая формировать виртуальные потоки различной размерности.

4. Разработан метод формирования нелинейных моделей виртуальных потоков, отличающийся использованием метода МГУА-моделирования для получения моделей влияния реальных потоков на виртуальные потоки, поучаемых посредством нелинейных адалинов, позволяющий формировать подвектор латентных переменных неограниченной размерности.

Список литературы

1.Филист, С.А. Универсальные сетевые модели для задач классификации биомедицинских данных/ С.А. Филист, Р.А. Томакова, Яа Зар До // Известия ЮЗГУ. - Курск: Изд-во ЮЗГУ, 2012. - № 4 (43). - Ч. 2. - С. 44-50.

2.Филист, С.А. Использование гибридных нейросетевых моделей для многоагентных систем классификации в гетерогенном пространстве информативных признаков С.А. Филист, А.Г. Курочкин, В.В. Жилин, и др.// Прикаспийский журнал: управление и высокие технологии. Научно-технический журнал. - 2015. № 3 (31).-C.85-95.

3.Позин, А.О. Тестирующие гибридные системы с дополнительным пространством информативных признаков / А.О. Позин, С.А. Филист, А.Н. Шуткин // Современные информационные технологии в управлении качеством: сборник статей V Международной научно-прикладной конференции. - Пенза: Приволжский Дом знаний, 2016. - С.46-50.

4.Позин, А.О. МГУА-нейронные сети для прогнозирования состояния сложных систем с временными лагами /А.О. Позин, Е.А. Старцев, В.В. Уварова//Нейроинформатика, ее приложения и анализ данных: Материалы XXIV Всероссийского семинара. - Красноярск: Институт вычислительного моделирования СО РАН. - 2016. - С. 50-55.

Размещено на Allbest.ru

...

Подобные документы

  • Рассмотрение коммутируемых (SVC) и постоянных (PVC) каналов виртуальных соединений. Характеристика структуры и размеров пакетов, протоколов передачи и алгоритмов маршрутизации сетей стандарта Х.25, Frame RELAY, АТМ и определение их преимуществ.

    реферат [54,3 K], добавлен 17.03.2010

  • Знакомство с основными особенностями широкополосного усилителя переменных сигналов, общая характеристика частотных и нелинейных искажений отдельных каскадов. Анализ видов построения схем усилителей. Рассмотрение схем, используемых в усилительной технике.

    дипломная работа [643,1 K], добавлен 24.06.2013

  • Совмещение преимущества гибридных технологий с дешевизной традиционного поверхностного монтажа. Применение в современном приборостроении сверхбыстродействующих многоканальных бескорпусных микросхем. Технологический процесс изготовления микросборок.

    контрольная работа [1,0 M], добавлен 21.08.2010

  • Характеристика плановых, диспетчерских и исполнительных информационных логистических систем. Принципы организации массивов информации, ее потоков, процессов транспортирования данных. Пути компьютеризации управления материальными потоками на предприятии.

    контрольная работа [34,5 K], добавлен 06.11.2010

  • Назначение и структура автоматизированной системы, предназначенной для выдачи диаграммы распределения тепловых потоков в домах, производственных складах и других помещениях. Практическое освоение методики оптимизации логических схем и оценки надежности.

    контрольная работа [91,1 K], добавлен 11.03.2012

  • Общая характеристика основных методов исследования информационных потоков. Особенности документооборота ОАО "Центральный телеграф". Анализ управления информационными потоками предприятия. Локально-вычислительные сети (ЛВС), их классификация и топология.

    курсовая работа [81,9 K], добавлен 05.07.2010

  • Общественные сети передачи данных: общее понятие, виды и краткая характеристика. Радио и телевизионные сети, их особенности. Разновидности виртуальных частных сетей. Назначение и структура сотовой радиосвязи, принципы действия мобильной коммуникации.

    презентация [1,7 M], добавлен 10.05.2013

  • Исследование обычной схемы Wi-Fi сети. Изучение особенностей подключения двух клиентов и их соединения. Излучение от Wi-Fi устройств в момент передачи данных. Описания высокоскоростных стандартов беспроводных сетей. Пространственное разделение потоков.

    лекция [139,5 K], добавлен 15.04.2014

  • Конструкция, принцип работы, достоинства коммуникационной системы HiPath 3800. Специальные функции и услуги консоли телефониста. Организация корпоративных и виртуальных сетей. Функциональные возможности IP телефона Siemens. Проектирование телефонной сети.

    курсовая работа [88,8 K], добавлен 10.01.2016

  • Проектирование локальной сети для фирмы ОАО Росэнерго. Исследование информационных потоков компании. Выбор топологии сети, технологий и сетевых протоколов. Распределение адресного пространства. Разработка архитектуры сети. Экономическая оценка проекта.

    дипломная работа [1,5 M], добавлен 28.08.2016

  • Выбор топологии сети, ступени иерархии и типа мультиплексора на основе расчета групповой скорости потоков. Выбор типа оптического кабеля. Определение пропускной способности. Определение суммарных потерь в оптическом тракте. Расчет полного запаса системы.

    курсовая работа [983,0 K], добавлен 22.05.2015

  • Методика конструирования и технология толстопленочных гибридных интегральных микросхем, характеристика основных технологических операций и принципы выбора материала. Порядок расчета конденсаторов разрабатываемых микросхем, выбор и характеристика корпуса.

    курсовая работа [261,9 K], добавлен 08.03.2010

  • Информация, подлежащая защите, определение источников информации. Рассмотрение нормативной базы в области построения комплексной системы защиты информации. Анализ информационных потоков и ресурсов. Анализ защищаемого помещения и каналов утечки.

    отчет по практике [410,6 K], добавлен 17.10.2013

  • Сущность корпоративной сети. Информационное обследование программных средств для управления документами. Системы организации абонентского доступа. Организация корпоративной сети на основе технологий хDSL с применением базовых телекоммуникационных модулей.

    дипломная работа [1,4 M], добавлен 11.06.2014

  • Оптическое волокно как самая совершенная физическая среда для передачи информации и больших потоков информации на значительные расстояния. Знакомство с основными этапами проектирования волоконно-оптической линий связи между городами Омск-Новосибирск.

    дипломная работа [2,1 M], добавлен 28.12.2015

  • Разработка проекта объединения двух локальных сетей в корпоративную на основе цифровых технологий передачи данных. Характеристика производства и оборудования ADSL, HDSL и VDSL, их применение. Настройка сетевого соединения и безопасности ресурсов.

    курсовая работа [930,3 K], добавлен 01.04.2011

  • Рассмотрение основных особенностей разработки микропроцессорного устройства охраны дома, этапы расчета параметров. Общая характеристика микросхемы К561ТМ2. Знакомство с принципиальной схемой двухтактного D-триггера на двух однотактных D-триггерах.

    курсовая работа [241,2 K], добавлен 07.02.2016

  • Коммутация как процесс соединения абонентов коммуникационной сети через транзитные узлы. Знакомство с общими принципами организации ЭВМ. Рассмотрение основных особенностей каналообразующего оборудования. Характеристика основных функций узлов связи.

    курсовая работа [232,7 K], добавлен 16.04.2014

  • Ознакомление с историей развития цифровой фототехники. Рассмотрение качества и конкурентоспособности продукции компании Pentax. Создание компактных, влагозащищенных, гибридных, зеркальных камер. Описание линейки фотокамер и объективов данной марки.

    реферат [1,5 M], добавлен 05.12.2014

  • Кремний как материал современной электроники. Способы получения пористых полупроводников на примере кремния. Анализ процесса формирования, методов исследования, линейных и нелинейных процессов в неоднородных средах на основе пористых полупроводников.

    дипломная работа [6,3 M], добавлен 18.07.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.