Диагностика заболеваний по ЭКГ с помощью сверточных нейронных сетей

Электрокардиография – простой неинвазивный метод регистрации и исследования электрических полей, образующихся при работе сердца. Сердечнососудистые заболевания - одна из причин смертности людей. Автоэнкодеры - нейронные сети прямого распространения.

Рубрика Программирование, компьютеры и кибернетика
Вид диссертация
Язык русский
Дата добавления 17.07.2020
Размер файла 3,9 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

Размещено на http://www.allbest.ru

Введение

На сегодняшний день применение алгоритмов машинного обучения затрагивает все сферы человеческой жизни, начиная с маркетинга и экономики и заканчивая моделированием физических процессов. Одно из значимых мест в данном списке занимает использование методов машинного обучение в медицинской диагностике.

Сердечнососудистые заболевания вот уже несколько десятков лет являются одной из главных причин смертности людей во всем мире [19]. Диагностика этой группы заболеваний в первую очередь начинается с проведения достаточной простой неинвазивной процедуры - электрокардиографии (ЭКГ), которая представляет собой тест, предназначенный для выявления проблем с электрической активностью сердца и графического воспроизведения показателей работы сердца на бумажной ленте ЭКГ.

Очень важной частью электрокардиографии является расшифровка результатов записи, которая обычно производится врачом на основании его медицинского опыта без применения какого-либо дополнительного технического вмешательства. Также на основании заключений врача по ЭКГ ставится и последующий предварительный диагноз. Причем результаты диагностики данного вида могут свидетельствовать не только о проблемах сердечнососудистой системы, но и о многих других заболеваниях [28] Диагностика может производиться как по общим характеристикам кардиограммы, так и в соответствии с показателем электрической оси сердца, который может быть рассчитан математически исходя из динамики записи. В соответствии с этим очень важным становится точность и правильность предварительной оценки и постановки диагноза врачом, что может быть значительно упрощено при помощи автоматизации данного процесса, внедрения технологий машинного обучения и искусственного интеллекта и исключении возможной ошибки в диагностике посредством «человеческого фактора». В свою очередь существует обширный ряд алгоритмов обработки одномерных сигналов с использованием глубокого обучения, а также их предварительного преобразования (извлечения признаков) для наилучшего обучения моделей в дальнейшем.

Именно поэтому целью данной работы является сравнение подходов к анализу ЭКГ с применением различных алгоритмов извлечения признаков и сверточных нейронных сетей и построение на основании этого наиболее точной модели, способной определять направление электрической оси сердца по данным электрокардиограммы.

Для достижения поставленной цели необходимо выполнить следующие задачи:

- проанализировать возможные подходы к извлечению признаков из записей ЭКГ;

- ознакомится с различными архитектурами сверточных нейронных сетей, подходящих для решения задачи;

- собрать актуальные данные с записями ЭКГ;

- провести сравнительный анализ с использованием различных архитектур сверточных нейронных сетей и различных методов извлечения признаков для построения наиболее точной модели для диагностики.

Данная работа имеет следующую структуру:

· в первой главе будет проведен детальное описание медицинской задачи, которую необходимо решить, а также обзор актуальных исследований, основанных на применении технологий машинного обучения для решения аналогичных медицинских задач.

· во второй главе будет приведено подробное сравнение существующих подходов для первичной предобработки данных ЭКГ (извлечения значимых признаков) и описание архитектур сверточных нейронных сетей, подходящих для обучения модели, способной определять электрическую ось сердца.

· в третьей главе работы будут описаны результаты проведения вычислительных экспериментов по использованию описанных в главе 2 методов извлечения признаков из кардиограмм в сочетании с различными архитектурами нейронных сетей. Кроме того, будут предложены направления дальнейших исследований по данной тематике.

По итогу исследования разработана нейронная сеть, способная делать предсказание электрической оси сердца (или классифицировать запись как результат диагностики пациента с кардиостимулятором), на основании чего в дальнейшем предполагается ведение диагностики.

1. Постановка и исследование задачи использования сверточных нейронных сетей для диагностики заболеваний по ЭКГ

1.1 Постановка и описание медицинской задачи

Для начала определим, что же представляет собой электрокардиография и каким образом возможно использование алгоритмов машинного обучения для предсказания электрической оси сердца по аппаратной записи сигнала и дальнейшая диагностика.

Электрокардиография - достаточно простой неинвазивный метод регистрации и исследования электрических полей, образующихся при работе сердца.

Рассмотрим само понятие электрической оси сердца (ЭОС). Электрической осью сердца называется проекция результирующего вектора возбуждения желудочков во фронтальной плоскости. ЭОС - это суммарное направление электрической волны, которая проходит по желудочкам в момент сокращения. Электрическая ось сердца может отклоняться от своего нормального положения либо влево, либо вправо. Точное отклонение электрической оси сердца определяют по углу . Формула приблизительного расчета угла альфа записывается следующим образом:

(1.1)

где Q, R, S - численные значения высоты и глубины зубцов различных отведений.

ЭОС формируется волной деполяризации миокарда желудочков. Если волна прошла сверху вниз - это вертикальная ЭОС. Если справа налево - горизонтальная. Если справа-снизу влево-вверх - отклонение ЭОС влево и т.д. То есть, нас интересует,в какую сторону движется электричество. Направление электрической оси сердца показывает суммарную величину биоэлектрических изменений, протекающих в сердечной мышце при каждом ее сокращении. Сердце - трёхмерный орган, и для того, чтобы рассчитать направление ЭОС, кардиологи представляют грудную клетку в виде системы координат. И всё же основной причиной смещения ЭОС является гипертрофия миокарда. [27]

Определение электрической оси сердца само по себе является лишь первичной диагностикой, по результатам которой невозможно однозначно поставить диагноз, а наличие смещения не является диагнозом. Несмотря на это, существует ряд заболеваний, при которых наблюдается смещение оси сердца. Например, к значительным изменениям электрической оси сердца приводят:

· Ишемическая болезнь сердца;

· Кардиомиопатии различного генеза (особенно дилатационная кардиомиопатия);

· Хроническая сердечная недостаточность;

· Врождённые аномалии строения сердца.

Сама по себе электрокардиография является методикой регистрации и исследования электрических полей, образующихся при работе сердца. Для измерения разности потенциалов на различные участки тела накладываются электроды. Каждая из измеряемых разностей потенциалов в электрокардиографии называется отведением. Стандартная кардиограмма включает в себя 12 отведений. По каждому отведению строится график. В момент сокращения разные ЭКГ-отведения запишут разной формы комплекс, но те электроды, в сторону которых прошла волна, запишут самый высокий положительный зубец R, а те электроды, от которых эта волна удалялась, - самый глубокий S. Электроды, к которым волна сначала приближалась, а затем отдалялась, запишут сначала положительную, а затем отрицательную фазу QRS (рис.1).

Рис. 1. Визуализация QRS-комплекса

Как видно из рисунка 2, на сегодняшний день в медицинской диагностике чаще всего выделяют четыре основных положения ЭОС:

Рис. 2. Положения ЭОС

· Отклонение влево (от -90° до 0°)

· Горизонтальное положение (от 0° до 30°)

· Нормальное положение (от 30° до 70°)

· Вертикальное положение (от 70° до 90°)

Также в некоторых источниках выделяется более детальная классификация электрических осей, при которой наблюдаются следующие положения:

· Крайнее отклонение влево;

· Отклонение влево;

· Горизонтальное положение;

· Нормальное положение;

· Вертикальное положение;

· Отклонение вправо;

· Крайнее отклонение вправо.

При проведении электрокардиографии сигнал снимается с использованием различных отведений - записей разностей потенциалов между двумя электродами, расположенными на поверхности тела. Выделяется 12 отведений электрокардиограммы, которые делятся на две группы:

· 6 отведений от конечностей (3 униполярных и 3 биполярных), регистрирующих потенциалы во фронтальной плоскости тела (3 стандартных отведения и 3 усиленных отведения);

· 6 грудных отведений, записывающих потенциалы в горизонтальной плоскости.

Первые шесть отведений также подразделяются на две группы - стандартные и отведения усиленного характера. Стандартные отведения регистрируются следующим образом:

ь 1 отведение - при этом положительный электрод фиксируют на левой руке, отрицательный на правой руке (обозначение I);

ь 2 отведение - датчик со значением плюс на левой ноге, отрицательный электрод на правой руке (обозначение II);;

ь 3 отведение - на левой ноге прикрепляют положительный электрод, на левой руке - отрицательный (обозначение III);.

Данные по отведениям усиленного характера фиксируются благодаря получению разницы между электрическим потенциалом одной из конечностей, в область которой прикрепляется положительный электрод, и средними показателями потенциалов других конечностей. Такие отведения обозначаются сочетанием букв aVF, aVL и aVR.

ь усиленное отведение от правой руки(обозначениеаVR),

ь усиленное отведение от левой руки(обозначениеаVL),

ь усиленное отведение от левой ноги(обозначениеаVF).

Наконец, грудные отведения:

ь область четвертого межреберного отдела справа от грудной клетки - (обозначение V1);

ь область четвертого межреберного отдела слева от грудной клетки - (обозначение V2);

ь область между V2 и V4 - (обозначение V3);

ь средняя линия ключицы и пятое межреберное пространство - (обозначение V4);

ь передняя подмышечная линия и область пятого межреберья - (обозначение V5);

ь средняя часть подмышечной области и пространство шестого межреберья - (обозначение V6).

1.2 Обзор актуальных исследований

Тема применения методов машинного обучения для диагностики заболеваний сердца с использованием данных, получаемых после проведения электрокардиографии, достаточно часто встречается в новейших научных исследованиях.

Как уже было сказано ранее, из медицинской практики известно, что ЭКГ-сигнал может включать в себя множество информации не только о состоянии сердечнососудистой системы человека, но и о функционировании всего организма в целом. Таким образом, проведение электрокардиографии - прекрасная возможность для ранней диагностики многих серьезных заболеваний. Необходимо отметить, чтовсе подходы, рассмотренные далее, решают абсолютно разные задачи. Подходов, решающих именно задачу определения электрической оси сердца, в литературе рассмотрено не было.

Одной из наиболее важных работ в данной области, вышедшей совсем недавно - в апреле 2020 года, является статья, опубликованная HongS., ZhouY., ShangJ., XiaoC., SunJ. [4] В данной работе полностью освещаются все возможные подходы к работе с данными электрокардиографии (задачи, которые решаются с использованием анализа ЭКГ, методы получения данных и модели для диагностики).На рисунке 3 представлены все основные аспекты работы с ЭКГ:

Рис. 3 Обзор анализа, основанного на аспектах задач, моделей и данных ЭКГ

Основные задачи, которые чаще всего описываются в работах, по анализу ЭКГ, делятся на 5 типов: диагностика заболеваний (задача, которая решается в данной исследовательской работе), распознавание QRS-комплекса, исследование фаз сна, идентификация личности человека по данным ЭКГ, очистка от шума. Данные по ЭКГ могут быть получены как со специального медицинского аппарата, так и с любого «умного» устройства (часы, фитнес-браслет и тд). Помимо этого, в статье рассматривается широкий спектр возможных моделей для анализа ЭКГ - это сверточные нейронные сети [7], рекуррентные [12], сверточно-рекуррентные [18], полносвязные архитектуры. Необходимо отметить, что в данной статье отсутствует описание возможных вариантов извлечения признаков из данных.

Основные подходы к применению алгоритмов машинного обучения для определения электрической оси сердца по ЭКГ и извлечению признаков из данных, которые в дальнейшем будут апробированы в работе, визуализированы в блок-схеме на рис.4:

Рис. 4. Основные подходы к исследованиям по диагностике с использованием результатов ЭКГ

На схеме видно, что существует широкий спектр подходов перехода от первичных результатов ЭКГ к постановке диагноза. Все подходы можно разделить на три категории: подходы с предварительным извлечением признаков из сигнала с аппарата ЭКГ, которые в дальнейшем подаются на вход нейронным сетям, подходы, при которых на вход сетям подаются необработанные данные сигнала с аппарата, и подходы, основанные на прямых методах диагностики без использования машинного обучения. Рассмотрим каждый из подходов подробнее, а также работы, где они описываются подробнее. Стоит сразу отметить, что во всех работах, перечисленных ниже, решаются разные задачи (определение наличия каких-либо заболеваний у пациента, уменьшение размерности данных с максимальным сохранением информации), а также для оценки моделей использовались различные метрики качества. Именно поэтому сравнивать результаты этих исследований между собой будет некорректно, необходимо лишь рассмотреть и проанализировать используемые подходы.

Первая группа подходов к извлечению признаков включает в себя методы, основанные на машинном обучении. Первый из них - метод кодограмм профессора В.М.Успенского, который занимался исследованиям, связанными с определением различных заболеваний, не связанных с сердечнососудистой системой, но диагностируемых именно с применением электрокардиографии. [16] [17]Данная методика будет описана подробнее в следующей главе. Второй подход к извлечению признаков на основе машинного обучения - это применение сверточного автоэнкодера. Данный подход помогает значительно уменьшить размерность данных, и подробнее его применение будет также описано в следующей главе. Идея использования автоэнкодера для извлечения признаков описана в работе [17].

Вторая группа подходов к извлечению признаков - это применение различных математических и статистических методов выделения признаков из данных ЭКГ. В данную группу входит в первую очередь преобразование Фурье, как наиболее известный метод, используемый при работе с одномерными цифровыми сигналами (например, анализ аудио, распознавание речи и тд). Использование данного метод для обработки цифрового сигнала ЭКГ описано в работе [5], где о нем говориться, как о наиболее эффективном варианте понижения размерности данных и извлечения признаков. В данной работе описывается применение быстрого преобразования Фурье, как наиболее эффективного способа извлечения признаков, который, помимо прочего хорошо подходит для очистки данных от шума.

Следующий подход к извлечению признаков при помощи математического аппарата - быстрое Вейвлет-преобразование, рассмотренный в работе [23]. Наилучший полученный результат при классификации кардиограмм в работе составляет около 87%.

Кроме того, для извлечения признаков в работе [13] рассматривается использование мел-частотных кепстральных коэффициентов. Отличие данного исследования от предыдущих рассматриваемых также состоит в том, что для предсказания целевой переменной используются не нейронные сети различных архитектур, а алгоритм KNN, что достаточно странно для исследований, связанных с обработкой сигнала. В работе используется сравнительно небольшая обучающая выборка (датасет) - всего 100 записей ЭКГ, параметры MFCCподбирались вручную. Несмотря на это, данный подход действительно может быть использован для извлечения признаков в подобных задачах, что и будет протестировано в дальнейшем.

Еще один подход к работе с цифровым сигналом ЭКГ - это перевод сигнала в изображение. Здесь в исследованиях представлено два основных метода - это работа со спектрограммами, а также работа со стандартными двумерными графиками, представляющими зависимость интенсивности сигнала от времени. Использование спектрограмм рассмотрено в работе [6]. Построение спектрограммы по сути представляет собой визуализацию преобразования Фурье, где по осям отложены время и частота сигнала, а интенсивность цвета в определенной частоте и времени представляет собой амплитуду сигнала. Помимо этого, в работе [14] используются двумерные графики для определения наличия аритмии у пациентов, то есть в качестве входных данных применяются двумерные графики зависимости интенсивности сигнала ЭКГ от времени. Данные подходы не будут рассматриваться в рамках этой работы.

Прямые методы работы с признаками заключаются в основном уменьшении дискретизации сигнала, например, такой способ рассматривается в работе [19]. Также возможно использование «окон», длительность 60-80% от первоначальной длины сигнала в качестве входных данных.

Что же касается различных вариантов архитектур - для анализа ЭКГ сигналов используются, как полносвязные, так и сверточные сети. В исследовании [22] рассматривается применение нейронной сети для анализа электрокардиограмм посредством использования необработанных аппаратных записей ЭКГ. В работе была использована полносвязная двухслойная нейронная сеть, итоговая ошибка на тестовом подмножестве данных в итоге составила 10%. Нейронные сети с большим многообразием архитектур рассмотрены в работе [20]. Также в ней представлены результаты исследования влияния случайности на результат обучения для различного количества нейронов на скрытом слое.

Еще одно значимое исследование на тему применения нейронных сетей для анализа ЭКГ было проведено в Стенфордской университете под руководством профессора Андрю Нг. Цель данного исследования - определение аритмии у пациентов по 30-секундной записи электрокардиографии у пациента. Авторами использовалась сверточная нейронная сеть, включающая в себя 33 слоя. Входными данными являются последовательности сигналов ЭКГ частотой 200 Гц длиной 30 секунд без предобработки и извлечения признаков. Архитектура сети представлена на рисунке 5.

Рис. 5 Архитектура модели из работы

Датасет, на котором обучалась модель, достаточно большой и включает в себя около 65000 записей, но его нет в открытом доступе. По итогам была получена модель, точность которой около 75%. [12]

Прямые методы диагностики по ЭКГ применяются врачами на практике на сегодняшний день и включают в себя экспертный анализ QRS-комплекса, оценку высоты пиков и ширину комплекса, частоту его появления.

Таким образом, выявлено большое количество актуальных исследований и методик, посвященных диагностике различных заболеваний на основании данных электрокардиографии. Исследований, посвященных теме определения электрической оси сердца по ЭКГ, практически нет, в то время как градусная мера электрической оси сердца также является важнейшим маркером наличия различных заболеваний, не связанных с сердечнососудистой системой.

Далее будет рассмотрено использование нескольких подходов к сегментации данных и выделении признаков, а также различные архитектуры сетей.

2. Сравнение подходов к работе с данными ЭКГ

2.1 Описание возможных подходов к извлечению признаков

В предыдущей главе были рассмотрены основные подходы к извлечению признаков, используемые в исследованиях для уменьшения размерности цифрового сигнала ЭКГ. Далее будет подробнее описана суть этих алгоритмов.

В первую очередь стоит отметить, что существует множество эвристических подходов, в которых предполагается использование признаков, основанных на описании кардиоциклов (высота R, длина PR, STинтервалов и т.д.). Такие подходы зачастую используются во врачебной практике для определения электрической оси сердца и являются экспертными характеристиками. Они могут быть классифицированы [21] на статистические характеристики (такие как вариабельность сердечного ритма, энтропия выборки, коэффициенты вариации и гистограммы плотности), характеристики частотной области и характеристики временной области.

2.1 Методы, основанные на машинном обучении

- Методика кодограмм профессора В.М, Успенского. Он заключается в том, чтобы по характеристикам зубцов PQRST-комплекса строится набор букв из 6-символьного алфавита. При помощи различных алгоритмов машинного обучения по данному сочетанию букв стоится модель, которая в дальнейшем помогает в постановке диагноза. Для предварительной обработки необходимо проведение демодуляции (вычисления амплитуд, интервалов и углов PQRST-комплекса на записи длиной 600 кардиоциклов Tn+1 Tn, Rn+1 Rn, Rn+1 /Tn+1 Rn /Tn), дискретизация (перевод полученных сочетаний знаков приращения в кодограмму - 599-символьную строку в 6-символьном алфавите), векторизация (перевод в векторчастот k-грамм размерностью 6k). В методе Успенского рассматриваются триграммы, совместная встречаемость которых свидетельствует о наличии в организме какого-либо заболевания или предрасположенности к заболеванию (рисунок 5). Данный числовой вектор и подается, в конечном счете, на вход алгоритму машинного обучения.

Рис. 5. Векторизация данных по методике Успенского

Учитывается частота встречаемости каждого из буквенных сочетаний. Данный подход можно сравнивать с подходом из компьютерной лингвистики - тематическим моделированием. Выдвигалось предположение о том, что каждое заболевание может быть описано одной темой - вероятностным распределением на множестве слов.

- Автоэнкодеры. Автоэнкодеры, или автокодировщики, -- это нейронные сети прямого распространения, которые восстанавливают входной сигнал на выходе. Внутри у них имеется скрытый слой, который представляет собой код, описывающий модель. Автоэнкодеры конструируются таким образом, чтобы не иметь возможность точно скопировать вход на выходе (рисунок 6).

Рис. 6 Визуализация работы автоэнкодера

Входной сигнал восстанавливается с ошибками из-за потерь при кодировании, но, чтобы их минимизировать, сеть вынуждена учиться отбирать наиболее важные признаки и откидывать второстепенные детали.

Автоэнкодеры состоят из двух частей: энкодера g и декодера f. Энкодер переводит входной сигнал в его представление (код): h = g(x), а декодер восстанавливает сигнал по его коду: x=f(h).

Автоэнкодер, изменяя f и g, стремится выучить тождественную функцию x = f(g(x)), минимизируя какой-то функционал ошибки.

L(x, f(g(x))) (2.1)

При этом семейства функций энкодера g и декодера f как-то ограничены, чтобы автоэнкодер был вынужден отбирать наиболее важные свойства сигнала. [2]

Для задачи извлечения признаков из сигнала ЭКГ будет использоваться способность автоэнкодеров сжимать данные. Например, данные изначальной размерности 5000 на 12 (12 отведений)могут быть сжаты до размерности 625 на 12.В данной работе будет произведено сравнение использования простого сверточного автоэнкодерови вариационного сверточного автоэнкодеров. Классический сверточный автоэнкодер будет состоять из нескольких сверточных слоев, его архитектура представлена на рисунке 7.

Рис. 7. Архитектура сверточного автоэнкодера

Автоэнкодер обучается с использованием оптимизатора Adadeltaс бинарнойкросэнтропией в 50 эпох.

Первые 8 слоев модели будут заморожены после обучения, а затем полученные слои будут входными слоями для классической сверточной нейронной сети, подробное описание слоев которой будет представлено в следующей главе.

В свою очередь вариационный автоэнкодер - это автоэнкодер, который учатся отображать данные в заданное скрытое пространство и, соответственно, генерировать новые образцы из него (генерирует закодированные данные, пригодные для восстановления входных данныхиз непрерывного скрытого пространства).Именно поэтому вариационные автоэнкодеры относят также к семейству генеративных моделей.Если пространство имеет разрывы, и модель пытается сгенерировать образец на основе закодированных данных из этого промежутка, то декодер выдаст нереалистичный образец, потому что не имеет представления о том, что делать с этой областью скрытого пространства.Вариационный автоэнкодер (VAE) имеет одно уникальное свойство, которое отличает его от стандартного сверточного автоэнкодера - их скрытое пространство по построению является непрерывным, позволяя выполнять случайные преобразования и интерполяцию. Непрерывность скрытого пространства достигается тем, энкодер выдаёт не один вектор размера n (который в дальнейшем может использоваться как новые латентные признаки), а два вектора размера n - вектор средних значений µ и вектор стандартных отклонений у. Таким образом, вариационные автоэнкодеры формируют параметры вектора длины n из случайных величин Xi, причем i-е элементы векторов µ и у являются средним и стандартным отклонением i-й случайной величины Xi. Вместе эти величины образуют n-мерный случайный вектор, который посылается на декодер для восстановления данных [24]. Именно поэтому входному объекту соответствует уже не одна точка в скрытом пространстве, а некоторая непрерывная область, описываемая µ и у. Архитектура вариационного автоэнкдера представлена на рисунке 8.

Рис. 8. Стандартная архитектура вариационного автоэнкодера

Для того чтобы области в скрытом пространстве были как можно ближе друг к другу, но при этом оставались различимыми как отдельные составляющие, в качестве функции потерь в вариационном автоэнкодере используется Kullback-Leiblerdistance (несимметричное расстояние между двумя распределениями). Она определяет, насколько сгенерированный образец похож на входной.

DKL(P||Q) =(2.2)

где p - первоначальное распределение,

q - новое распределение.

Минимизация данной величины означает оптимизацию параметров распределения µ и у таким образом, что они становятся близки к параметрам целевого распределения, в котором области пространства разделяются оптимально. Минимум достигается, когда µi = 0 и уi = 1. Таким образом, на каждом шаге обучения модель пытается приблизить те µ и у, которые генерирует энкодер, к 0 и 1 соответственно.

Использование вариационного автоэнкодера для генерации данных (кардиоциклов) из ЭКГ описано в статье [11].

Несмотря на все возможности подобной архитектуры в данной работе будет использоваться лишь ее способность сжимать данные для дальнейшего извлечения признаков. Архитектура модели, используемая в работе, представлена на рисунке 9:

Рис. 9. Архитектура сверточного вариационного автоэнкодера

При обучении модели также использовался оптимизатор Adam.

Как и в случае с простым сверточным автоэнкодером первые 15 слоев вариационной модели будут заморожены после обучения, а затем полученные слои будут входными слоями для классической сверточной нейронной сети. В данном случае будут заморожены все слои, включая Lambda-слой, который производит сэмплированиеизµ и у.

Далее перейдем к описанию статистических и математических методов извлечения признаков из сигналов. Сигнал - это физический процесс во времени, параметры которого изменяются в соответствии с передаваемым сообщением. В теории цепей и сигналов все сигналы по способу представления можно разделить на 4 группы:

§ аналоговые -- описываются непрерывными во времени функциями,

§ дискретные -- прерываются во времени с шагом заданным дискретизации,

§ квантованные -- имеют набор конечных уровней (как правило, по амплитуде),

§ цифровые -- комбинация свойств дискретных и квантованных сигналов.

Сигнал, полученный с аппарат ЭКГ, как уже было сказано ранее, является цифровым. Далее будут рассмотрены методы обработки и сжатия именно цифрового сигнала.

- Дискретное преобразование Фурье. Преобразование позволяет перейти из временной области в частотную, то есть избавиться от сдвигов сигнала во времени. Преобразование Фурье позволяет представить любую функцию в виде набора гармонических сигналов. ДПФ задается следующей формулой:

, 0 ? k ? N - 1 (2.2)

Дискретный цифровой сигнал следует разбивать на маленькие фрагменты, чтобы характеристики каждого фрагмента можно было считать стационарными и не зависящими от времени. Вычисление ДПФ от всего сигнала ЭКГ приводит к потере локальных особенностей сигнала (конкретных кардиоциклов). Чтобы сохранить данную информацию, а также получить возможность независимо от длины сигнала получать векторное описание кардиограммы фиксированной длины используется оконное ДПФ. Для получения оконного ДПФ фиксируется определённая ширина окна, равная длине кардиоцикла. Затем к данному скользящему окну применяется оконная функция (обычно это гауссиан, окно Хемминга, окно Ханна или окно Кайзера). Затем вычисляются модули коэффициентов ДПФ. Это повторяется для всего сигнала с движением окна. Для агрегирования показателей по всему сигналу ЭКГ коэффициенты, полученные с помощью оконного ДПФ, можно усреднять по соответствующим частотам. Тем самым и будет получено векторное описание кардиограммы фиксированной длины, которые будут служить признаками для машинного обучения дальнейшем.

Основной проблемой использования оконного ДПФ является принцип неопределенности Гейзенберга, который возникает для параметров времени и частоты сигнала. В основе принципа неопределенности лежит тот факт, что невозможно сказать точно, какая частота присутствует в сигнале в данный момент времени (можно говорить только про диапазон частот) и невозможно сказать, в какой точно момент времени частота присутствует в сигнале (можно говорить лишь про период времени). Для решения проблемы этой неопределенности было создано Вейвлет-преобразование.

- Вейвлет-преобразование. Преобразование служит альтернативой ДПФ. Оно представляет собой свертку вейвлет-функции с сигналом и перевод сигнал из временного представления в частотно-временное. Вейвлет-преобразование для дискретного сигнала используется путем применения набора вейвлет-фильтров. Низкочастотный фильтр, через который пропускается сигнал на первом шаге, имеет следующий вид:

(2.3)

Этот фильтр дает нам детализирующие коэффициенты. После этого сигнал раскладывается с помощью высокочастотного фильтра. В результате этого разложения получаются коэффициенты аппроксимации. Эти разложения можно повторить несколько раз с прореживанием коэффициентом (прореживание в 2 раза на каждой итерации). Полученные коэффициенты разложения в дальнейшем будут признаками для моделей машинного обучения.

Таким образом, вейвлет-преобразования, в отличии от оконного преобразования Фурье, которое имеет постоянный масштаб в любой момент времени для всех частот, имеет лучшее представление времени и худшее представление частоты на низких частотах сигнала и лучшее представление частоты с худшим представлением времени на высоких частотах сигнала.

- MFCC - мел-частотные кепстральные коэффициенты. Данный способ извлечения признаков часто используется для работы со звуком и распознаванием речи в качестве характеристик речевых сигналов. Алгоритм преобразования состоит из следующих шагов:

1) Получение спектра исходного сигнала при помощи преобразования Фурье по всей временной оси;

2) Полученный спектр раскладывается по мел-шкале с использованием окон, равномерно расположенных на мел-оси. Окна собираются в области низких частот при этом обеспечивая более высокое “разрешение” там, где оно необходимо для распознавания;

3) Нахождение энергии сигнала, которая попадает на каждое окно путем перемножения вектора спектра сигнала и оконной функции;

4) Возведение коэффициенты в квадрат и логарифмируем;

5) Применение дискретного косинусного преобразования.

- Спектральные центроиды. Еще одним способом извлечения признаков из цифрового сигнала является использование спектральных центроидов, применяемых для извлечения характеристик спектра. Они указывают на то, где находится «центр масс» сигнала. Они рассчитываются как взвешенное среднее частот, присутствующих в сигнале, определяются с использованием преобразования Фурье, с их величинами как весов. [26]Каждый кадр спектрограммы величины нормализуется и рассматривается как распределение по частотным ячейкам, из которых извлекается среднее значение (центроид) за кадр. [8] Центроид в кадре tопределяется по следующей формуле:

(2.4)

где S-спектрограмма величины,

freq-массив частот (например, частоты БПФ вГц) строк S.

- Ансамбль признаков. Суть данного подхода заключается в предположении о том, что если классификатор, решающий задачу машинного обучения по определению электрической оси сердца, будет работать поверх всех признаков, то ему будет достаточно сложно. В то же время использование в качестве признаков лишь дискретное преобразование Фурье, MFCCи тд. может быть недостаточно для точности классификатора. Поэтому из спектрограмм из спектрограмм будут браться только некоторые характеристики, кроме того добавятся характеристики и других преобразований. Ниже приведен список всех признаков, а в скобках указано количество признаков по данному преобразованию:

- Мел-частотные спектральные коэффициенты (26);

- Максимальная и минимальная нормализованная энергия цветности (2);

- Мел-спектрограмма (26);

- Хромограмма (12);

- Манитуды (65);

- Центр тяжести тона (6).

Необработанные сигналы также можно подавать на вход сверточным нейронным сетям. Также можно уменьшать дискретизацию признаков, при этом учитывая то, что сигнал должен передаваться без потерь [10].

Кроме перечисленных выше вариантов извлечения признаков можно использовать простую аугментацию признаков. Способ заключается в том, чтобы пройти по сигналу длительностью 10 сек и частотой 500 Гц окном длительностью 6-8 сек и частотой 500 Гц. Данное окно будет продвигаться с каждой эпохой обучения, тем самым на каждой эпохе будет видеть новые данные.

2.2 Описание возможных подходов к обучению сверточных сетей

Теперь рассмотрим подробнее различные подходы к построению оптимальной модели машинного обучения для решения задачи автоматизации диагностики по ЭКГ. В данной работе будет рассмотрено применение архитектур нейронных сетей со сверочными слоями.

Рассмотрим вариант использования классической сверточной нейронной сети для решения поставленной задачи. Основным отличием сверточного слоя (Conv1D) нейронной сети от полносвязного является то, что в сверточном слое к каждому фрагменту входных данных применяется одна и та же свертка (поэлементное умножение матрицы свертки с числовыми значениями фрагмента и алгебраическое суммирование полученных результатов). Полученный результат записывается в соответствующую позицию выходных данных.

Помимо сверточных слоев в архитектуру нейронной сети включаются субдискретизирующие слои (MaxPooling и AvgPooling) для уменьшения размерности слоя. При их применении каждый фрагмент входных данных заменяется на максимальное или среднее значение по всем данным для этого фрагмента. Также используется GlobalMaxPooling и GlobalAvgPooling для операции уменьшения размерности не на отдельно взятом фрагменте, а на всей сети в целом. Еще один слой, который используется в сверточной нейронной сети - BatchNormalization. Данный слой обычно используется перед функцией активации и предполагается что, чтобы нормализовать входные данные таким образом, чтобы получить нулевое матожидание и единичную дисперсию, то есть нормализовать таким образом каждый батч. Кроме того, в сверточной сети могут также использоваться полносвязные слои и слои Dropout. В качестве функции активации -Relu. Визуализация описанной архитектуры представлена на рисунке 10.

Рис. 10 Архитектура сверточной нейронной сети

При обучении сверточного автоэнкодера для извлечения признаков и последующего использования замороженных весов энкодера в качестве входных данных для сверточной сети будет использоваться архитектура, представленная на рисунке 11.

Рис. 11. Архитектура сети с использованием замороженных слоев сверточного автоэнкодера

Для вариационного сверточного автоэнкодера архитектура выглядит следующим образом:

Рис. 12. Архитектура сети с использованием замороженных слоев вариационного автоэнкодера

Еще одна классическая сверточная архитектура для работы с одномерными сигналами называется WaveNet. Первоначально данная модель использовалась для распознавания речи и музыки. Данная архитектура отличается от описанной выше тем, что сверточные сои в ней имеют различные факторы дилатации (скорость расширения количества нейронов на следующем слое, с которым связан данный нейрон) и позволяют ее рецептивному полю расти экспоненциально с глубиной и покрывать тысячи временных отрезков. Пример представлен на рисунке 13.

Рис. 13. Визуализация работы сети WaveNet

Архитектура WaveNet, используемая в работе, представлена на рисунке 11. Данная архитектура будет использоваться при обучении моделей без извлечения признаков, так как первоначально она выступала моделью для работы со звуком также без извлечения признаков.

Рис. 14. Архитектура WaveNet

Еще одна архитектура, которая будет использована в работе, аналогична первой архитектуре с использование классических сверточных блоков, но данная модель будет иметь два выхода. Один выход отвечает за классификацию на 3 класса (кардиостимулятор, шум и определенная электрическая ось). Второй выход решает задачу регрессии и определяет конкретную электрическую ось сердца. В данной архитектуре используется две функция потерь - для первого выхода sparse_categorical_crossentropy, для выхода с регрессией - mse, которая рассчитывается лишь на примерах, в которых y_true- это определенная электрическая ось. Архитектура представлена на рисунке 15.

Рис. 15. Архитектура сверточной сети с двумя выходами

3. Вычислительные эксперименты и результаты

3.1 Обучающая выборка

В качестве фрэймворка для создания нейронных сетей использовался Kerasс бэкэндом Tensorflow, а также библиотеки Sklearn, Pandas, Numpy, для извлечения некоторых групп признаков - Librosa. Обучение производилось при помощи сервиса Collaboration от Google, размер используемой RAM 16 Gb.

При обучении сверточных нейронных сетей в качестве оптимизатора предполагается использование оптимизатора Adam с логарифмической функцией потерь, в качестве целевой метрики -accuracy.

В ходе эксперимента будет использован датасет, который представляет собой 2034 12-канальные записи ЭКГ длительностью по 10 секунд. Каждая ЭКГ характеризуется вектором признаков размерности 60000 - 10-секундный сигнал ЭКГ в микровольтах с частотой приема 500 Гц по каждому из 12 отведений. В качестве зависимой переменной выступают6различных положенияээлектрической оси сердца, наличие у пациента кардиостимулятора, шум в наблюдении:

· 0 - Крайнее отклонение влево;

· 1 - Отклонение влево;

· 2 - Горизонтальное положение;

· 3 - Нормальное положение;

· 4 - Вертикальное положение;

· 5 - Отклонение вправо;

· 6 - Ось не определена (шум);

· 7 - Кардиостимулятор.

Все данные изначально были разбиты на обучающее и тестовое подмножество, обучающее подмножество также было разбито на валидационное и тестовое. При классификации все классы были сбалансированы при помощи дублирования наблюдений для классов, в которых недоставало данных и уменьшения количества примеров там, где данных было слишком много.

Данные для обучения автоэнкодера имеют аналогичные характеристики. Это 10000 10-минутных неразмеченных записей ЭКГ с частотой 500 Гц.

3.2 Результаты обучения

В таблице 1 представлены основные результаты проведения вычислительных экспериментов по всем вариантам описанных выше архитектур и методам извлечения признаков.

Таблица 1. Результаты вычислений

Model

CNN

WaveNet

CNN (2 outputs)

FeatureExtraction

TimeSeries

0.6132

0.5672

0.3941

Augment

0.6487

0.5938

0.4367

CAE

0.4520

-

0.4432

VAE

0.6931

-

0.5327

STFT

0.5895

-

0.5173

Wavelet

0.5671

-

0.5093

MFCC

0.5184

-

0.4562

SpectralCentroid

0.5438

-

0.4082

FeaturesEnsemble

0.2943

-

0.2709

Наилучшие результаты показала архитектура классической сверточной нейронной сети с одним выходом (классификация на 7 классов) и извлечением признаков при помощи вариационного автоэнкодера.

Далее подроблее приведены все результаты обучения всех возможных вариантов архитектур.

Начнем с модели, основанной на отсутствии первичной обработки сигнала, в которой на вход подаются записи ЭКГ размером 5000 (500 Гц на 10 сек) на 12 каналов. На рисунке 16 представлены графики обучения этой модели.

Рис. 16. Обучение модели без предобработки сигнала

Оптимальное количество эпох обучения - 10-12 эпох, после этого точность модели начинает ухудшаться, а потери увеличиваться.

После обучения другой сверточной архитектуры WaveNet графики обучения выглядят следующим образом:

Рис. 17. Обучение модели без предобработки сигнала (WaveNet)

Оптимальное количество эпох для обучения - около 30. Результаты данной модели получились чуть хуже предыдущем модели - 56.7%.

График обучения третьей рассматриваемой архитектуры с двумя выходам представлен на рисунке 19.

Рис. 18. Обучение модели с двумя выходами без предобработки сигнала

Видно, что первый выход модели, отвечающий за классификацию на три класса, на валидации показывает точность более 92%, в то время как второй выход, отвечающий за регрессию и определение электрической оси сердца по метрике MSEпоказал не очень высокие результаты. В итоге точность всей модели на тестовом датасете составила лишь 39%.

Далее приведены результаты экспериментов со сдвигом рабочего окна во время обучения модели. Таким образом, происходит аугментация данных - из каждого отрезка по 10 секунд получается столько новых отрезков по 8 секунд, сколько эпох в обучении используется.

Рис. 19. Обучение модели без предобработки сигнала с аугментацией

Оптимальное количество эпох обучения - 40 эпох, после этого точность модели начинает ухудшаться, а потери увеличиваться.

При использовании аугментации для другой архитектура WaveNet график обучения выглядит следующим образом:

Рис. 20. Обучение модели WaveNet с аугментацией

Оптимальное количество эпох - 25. Результаты обучения получились также на уровне около 60% точности.

При обучении модели с двумя выходами MSE на втором выходе оказался достаточно высоким - более 1.69. Общая точность также не превысила 44%.

Рис. 20. Обучение модели с двумя выходами с аугментацией

Далее рассмотрим результаты обучения моделей, извлечение признаков которых происходит за счет предварительного обучения сверточного автоэнкодера и заморозки его первых 15 слоев, то есть энкодера. На рисунке 21 представлены графики обучения данной модели.

Рис. 21. Обучение модели на основе сверточного автоэнкодера

Оптимальное количество эпох для обучения - 50-55. При этом количестве целевая метрика получается на уровне 45%, что достаточно низко по сравнению с предыдущими результатами.

Модель с двумя выходами на основе сверточного автоэнкодера точность менее 90% на первом выходе и MSE 1.65 на втором выходе. В среднем данный вариант архитектура также уступает классической сверточной сети с одним выходом, как и в предыдущем случае.

Рис. 22. Обучение модели с двумя выходами на основе сверточного автоэнкодера

Результаты обучения вариационного автоэнкодера представлены на рисунке 23. При этом также замораживались веса первых 15 слоев, включая Lambda-слой, на котором образуют n-мерный случайный вектор, включающий µ и у.

Оптимальное количество эпох обучения - 30. При этом модель достигает точность около 70%.

Рис. 23. Обучение модели на основе вариационного автоэнкодера

Модель нейронной сети с двумя выходами демонстрирует уже привычно высокий уровень Accuracy на первом выходе, а также минимальный MSE1.66. Итоговая точность модели получилась не более, чем с использованием сети с одним выходом - 53%.

Рис. 24. Обучение модели с двумя выходами на основе вариационного автоэнкодера

Теперь рассмотрим применение математических и статистических методов извлечения признаков из данных. Начнем с мел-частотных кепстральных коэффициентов. В ходе экспериментов было выбрано оптимальное количество коэффициентов - 500. Для обучения модели, использующей в качестве входных признаков MFCC,ее архитектуру пришлось значительно изменить и сделать сверточные слой 2D, а также значительно уменьшить количество сверток. На рисунке 25 представлены два варианта архитектур модели:

Рис. 25. Архитектура моделей 2D для MFCC

График обучения данной модели представлен на рисунке 22. Точность модели на тестовой выборке при использовании первого варианта архитектуры оказалась на уровне 51%.

Рис. 26. Обучение модели на основе MFCC

Графики обучения модели с двумя выходами говорят о том, что, как и в предыдущие разы, первый выход обучился достаточно хорошо - до 94%, в то время как потери второго выхода составили 1.68. Несмотря на это данная модель имеет достаточно высокий уровень точности для данной архитектуры - более 51%.

Рис. 27. Обучение модели с двумя выходами на основе MFCC

Следующий вариант извлечения признаков, рассмотренный в данной работе - это использование оконное дискретного преобразования Фурье. В ходе проведения экспериментов выявлено, что наиболее точные результаты получаются при использовании длины окна равной 1024. Для него также будут протестирована модель, представленная на рисунке 25b, а также модель, представленная ниже:

Рис. 28. Архитектура моделей 2D для STFT

В соответствии с графиком обучения на рисунке 25 видно, что оптимальное количество эпох - 5-8. При этом точность модели составляет около 60%.

Рис. 29. Обучение модели на основе STFT

Из рисунка видно, что при обучении модель была сильно переобучена, так как после 5-6 эпохи lossначинает сильно увеличиваться.

Архитектура с двумя выходами, примененная совместно с оконным преобразованием Фурье дала результаты точности, схожие с MFCC-около 51%.

Рис. 30. Обучение модели с двумя выходами на основе STFT

Еще один способ извлечения признаков, рассмотренный в работе - это применение Вейвлет-преобразования. Преобразование подразумевает под собой поэтапную свертку сигнала, в данном случае будет применяться свертка до размерности 2500. Архитектура модели, применяемой для классификации, аналогично архитектуре на рисунке 28. График обучения представлен на рисунке 31.

Оптимальное количество эпох обучения - 10-12, на этом этапе модель способна дать результат на уровне 56% точности. После этого модель начинает переобучаться, а loss увеличиваться с каждой эпохой.

Рис. 31. Обучение модели на основе Вейвлет-преобразования

Использование Вейвлет-преобразования для извлечения признаков для сети с двумя выходами демонстрирует интересный процесс обучения второго выхода модели - показатель опускается до 1.64. Несмотря на это при обучении данной модели более чем в 50 эпох она начинает переобучаться и MSE вновь растет. Результат точности модели - 45%.

Рис. 32. Обучение модели с двумя выходами на основе Вейвлет-преобразования

Следующий метод извлечения признаков - нахождение спектральных центроидов. Для него также будет использована архитектура нейронной сети, представленная на рисунке 28. Размер окна FFTбыл выбран 1024. График обучения модели представлен на рисунке 33. Точность данной модели находится на уровне 54%, что не превышает полученные ранее значения.

Рис. 33. Обучение модели на основе спектральных центроидов

График обучения модели с двумя выходами на основе спектральных центроидов аналогичен использованию Вейвлет-преобразования. Accuracy первого выхода ведет себя достаточно странной, в итоге своя модель дает точность менее 41%.

Рис. 34. Обучение модели с двумя выходами на основе спектральных центроидов

График обучения модели, использующей ансамбль признаков в качестве входных данных, представлен на рисунке 35. Данный подход не продемонстрирован высоких результатов в предсказании. Максимальное значение метрики точности не превышает 30%.

Рис. 35. Обучение модели на основе ансамбля признаков

Для сети с двумя выходами использование ансамбля статистических признаков также не дает хороших результатов, как и для сверточной архитектуры с одним выходом.MSEне меняется за весь период обучения, а итоговая точность 27%.

Рис. 36. Обучение модели с двумя выходами наансамбля признаков

Таким образом, проследив все возможные варианты сочетания архитектур и методов извлечения признаков, можно сделать следующие выводы:

· В целом использование классической сверточной нейронной сети оказалось эффективнее, чем применение аналогичной архитектуры, но с двумя выходами, которая зачастую переобучалась, а также имела высокийMSEна втором выходе;

· Использование автоэнкодера в качестве метода извлечения признаков продемонстрировало хорошие результаты по сравнению с другими алгоритмами;

· Составление ансамбля статистических признаков не дает высокого результата, который планировался изначально. Возможно, причина здесь кроется в неверной комбинации выделенных признаков, а также отсутствии из взвешенного голосования.

Заключение

электрокардиография сердечнососудистый нейронный

В данной работе была рассмотрена задача применения сверточных нейронных сетей для диагностики и определения электрический оси сердца по записям электрокардиографии.

Целью работы было сравнение подходов к анализу ЭКГ с применением различных алгоритмов извлечения признаков и различных архитектур сверточных нейронных сетей и построение на основании этого наиболее точной модели, способной определять направление электрической оси сердца по данным электрокардиограммы. В рамках работы были выполнены следующие задачи:

- проведено сравнение использования различных способов извлечения признаков из данных, основанных как на математических и статистических методах, так и использовании машинного обучения;

- проведено сравнение различных архитектур сверточных нейронных сетей для определения электрической оси сердца.

Наилучшие результаты показало использование классической сверточной нейронной сети с одним выходом и использованием вариационного автоэнкодера в качестве способа извлечения признаков.

Дальнейшим направлением исследования в данной области может быть рассмотрение различных дополнительных методов извлечения признаков из ЭКГ, таких как перевод сигнал ЭКГ в изображение.усложнение используемых архитектур, их тестирование на большем количестве данных. Кроме того, возможно использование полученных результатов для анализа не только электрической оси сердца, но и диагностики других заболеваний как сердечно-сосудистой системы, так и других органов. Также важным вопросом в исследовании данной темы остается ограниченное количество размеченных данных для тренировки моделей. Здесь возможно рассмотреть как различные способы генерации записей (например, использование уже упомянутых выше вариационных автоэнкодеров и генеративно-состязательных нейронных сетей), так и применение алгоритмов обучения без учителя для детектирования выбросов в данных (записей ЭКГ, которые по тем или иным причинам значительно отличаются от остальных, могут свидетельствовать о наличии отклонений и заболеваний).

Литература

1) AcharyaU., Fujita H. Deep Convolutional Neural Network for the Automated Diagnosis of Congestive Heart Failure Using ECG Signals. Applied Intelligence. 2018

...

Подобные документы

  • Прогнозирование на фондовом рынке с помощью нейронных сетей. Описание типа нейронной сети. Определение входных данных и их обработка. Архитектура нейронной сети. Точность результата. Моделирование торговли. Нейронная сеть прямого распространения сигнала.

    дипломная работа [2,7 M], добавлен 18.02.2017

  • Общие сведения о принципах построения нейронных сетей. Искусственные нейронные системы. Математическая модель нейрона. Классификация нейронных сетей. Правила обучения Хэбба, Розенблатта и Видроу-Хоффа. Алгоритм обратного распространения ошибки.

    дипломная работа [814,6 K], добавлен 29.09.2014

  • Возможности программ моделирования нейронных сетей. Виды нейросетей: персептроны, сети Кохонена, сети радиальных базисных функций. Генетический алгоритм, его применение для оптимизации нейросетей. Система моделирования нейронных сетей Trajan 2.0.

    дипломная работа [2,3 M], добавлен 13.10.2015

  • Понятие и свойства искусственных нейронных сетей, их функциональное сходство с человеческим мозгом, принцип их работы, области использования. Экспертная система и надежность нейронных сетей. Модель искусственного нейрона с активационной функцией.

    реферат [158,2 K], добавлен 16.03.2011

  • Особенности нейронных сетей как параллельных вычислительных структур, ассоциируемых с работой человеческого мозга. История искусственных нейронных сетей как универсального инструмента для решения широкого класса задач. Программное обеспечение их работы.

    презентация [582,1 K], добавлен 25.06.2013

  • Принципы организации и функционирования биологических нейронных сетей. Система соединенных и взаимодействующих между собой простых процессоров. Нейронные сети Маккалока и Питтса. Оценка качества кластеризации. Обучение многослойного персептрона.

    курсовая работа [1,1 M], добавлен 06.12.2010

  • Искусственные нейронные сети как вид математических моделей, построенных по принципу организации и функционирования сетей нервных клеток мозга. Виды сетей: полносвязные, многослойные. Классификация и аппроксимация. Алгоритм обратного распространения.

    реферат [270,4 K], добавлен 07.03.2009

  • Искусственные нейронные сети как одна из широко известных и используемых моделей машинного обучения. Знакомство с особенностями разработки системы распознавания изображений на основе аппарата искусственных нейронных сетей. Анализ типов машинного обучения.

    дипломная работа [1,8 M], добавлен 08.02.2017

  • Преимущества нейронных сетей. Модели нейронов, представляющих собой единицу обработки информации в нейронной сети. Ее представление с помощью направленных графов. Понятие обратной связи (feedback). Основная задача и значение искусственного интеллекта.

    реферат [1,2 M], добавлен 24.05.2015

  • Простейшая сеть, состоящая из группы нейронов, образующих слой. Свойства нейрокомпьютеров (компьютеров на основе нейронных сетей), привлекательных с точки зрения их практического использования. Модели нейронных сетей. Персептрон и сеть Кохонена.

    реферат [162,9 K], добавлен 30.09.2013

  • Рождение искусственного интеллекта. История развития нейронных сетей, эволюционного программирования, нечеткой логики. Генетические алгоритмы, их применение. Искусственный интеллект, нейронные сети, эволюционное программирование и нечеткая логика сейчас.

    реферат [78,9 K], добавлен 22.01.2015

  • Нейронные сети как средство анализа процесса продаж мобильных телефонов. Автоматизированные решения на основе технологии нейронных сетей. Разработка программы прогнозирования оптово-розничных продаж мобильных телефонов на основе нейронных сетей.

    дипломная работа [4,6 M], добавлен 22.09.2011

  • Характеристика моделей обучения. Общие сведения о нейроне. Искусственные нейронные сети, персептрон. Проблема XOR и пути ее решения. Нейронные сети обратного распространения. Подготовка входных и выходных данных. Нейронные сети Хопфилда и Хэмминга.

    контрольная работа [1,4 M], добавлен 28.01.2011

  • Сущность и функции искусственных нейронных сетей (ИНС), их классификация. Структурные элементы искусственного нейрона. Различия между ИНС и машинами с архитектурой фон Неймана. Построение и обучение данных сетей, области и перспективы их применения.

    презентация [1,4 M], добавлен 14.10.2013

  • Обучение простейшей и многослойной искусственной нейронной сети. Метод обучения перцептрона по принципу градиентного спуска по поверхности ошибки. Реализация в программном продукте NeuroPro 0.25. Использование алгоритма обратного распространения ошибки.

    курсовая работа [1019,5 K], добавлен 05.05.2015

  • Модели оценки кредитоспособности физических лиц в российских банках. Нейронные сети как метод решения задачи классификации. Описание возможностей программы STATISTICA 8 Neural Networks. Общая характеристика основных этапов нейросетевого моделирования.

    дипломная работа [1,4 M], добавлен 21.10.2013

  • Задача анализа деловой активности, факторы, влияющие на принятие решений. Современные информационные технологии и нейронные сети: принципы их работы. Исследование применения нейронных сетей в задачах прогнозирования финансовых ситуаций и принятия решений.

    дипломная работа [955,3 K], добавлен 06.11.2011

  • Механизм работы нервной системы и мозга человека. Схема биологического нейрона и его математическая модель. Принцип работы искусственной нейронной сети, этапы ее построения и обучения. Применение нейронных сетей в интеллектуальных системах управления.

    презентация [98,6 K], добавлен 16.10.2013

  • Теоретические основы сверточных нейронных сетей. Исследование зависимости качества работы сети от изменения различных характеристик. Сравнение результатов работы сетей типа многослойный персептрон в определении пола и возраста человека по фотографии лица.

    курсовая работа [2,5 M], добавлен 18.07.2014

  • Анализ применения нейронных сетей для прогнозирования ситуации и принятия решений на фондовом рынке с помощью программного пакета моделирования нейронных сетей Trajan 3.0. Преобразование первичных данных, таблиц. Эргономическая оценка программы.

    дипломная работа [3,8 M], добавлен 27.06.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.