Анализ алгоритмов обучения нейронных сетей

Нейронная сеть – система связанных и взаимодействующих друг с другом искусственных нейронов. В статье проведен анализ алгоритмов обучения нейронных сетей. Приведены последовательность действий при обучении этими алгоритмами, их достоинства и недостатки.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 23.01.2021
Размер файла 109,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Анализ алгоритмов обучения нейронных сетей

Манукян А.К., магистрант

2 курс, факультет "Информатика и вычислительная техника" Донской Государственный Технический Университет Россия, г. Ростов-на-Дону

Научный руководитель: Жуков Александр Игоревич, кандидат технических наук, доцент кафедры "Кибербезопасность информационных систем" Донской Государственный Технический Университет Россия, г. Ростов-на-Дону

Аннотации

В данной статье будет проведен анализ алгоритмов обучения нейронных сетей. Будут приведены последовательность действий при обучении этими алгоритмами, а также их достоинства и недостатки.

Ключевые слова: нейронная сеть, алгоритм обратного распространения ошибок, многослойная нейронная сеть.

Annotation: This article will analyze algorithms of neural networks training. The sequence of actions during training by these algorithms, and also their advantages and disadvantages will be given.

Keywords: Neural network, algorithm of reverse propagation of errors, multilayer neural network сеть нейронный алгоритм

В настоящее время информационные технологии развиваются невероятной скоростью. Основной тенденцией последнего десятилетия является разработка в области искусственного интеллекта. Данная сфера активно продвигается в современном обществе. Такие крупные IT компании как Google, Apple ведут свои разработки в части распознавания текста, голоса, образа.

Одна из технологий, позволяющих проводить обнаружение и распознавание образов, построена на нейронных сетях.

Актуальность темы нейронных сетей заключается в решении задач на оптимизацию процессов. Благодаря чему, система нейронной сети и процесс обучения позволяют найти оптимальное и эффективное решение.

Нейронная сеть - это система связанных и взаимодействующих друг с другом искусственных нейронов. Нейронная сеть сходна с мозгом с двух точек зрения:

1. знания поступают в нейронную сеть из окружающей среды и используются в процессе обучения;

2. для накопления знаний применяются связи между нейронами, называемые синаптическими весами.

Для накопления знаний и корректных вычислений, сеть должна пройти этап обучения. Существует два типа обучения:

1. обучение с учителем;

2. обучение без учителя.

Процесс обучения сети осуществляется по-разному в зависимости от поставленного алгоритма обучения.

В настоящее время используют несколько вариантов алгоритмов обучения нейронных сетей:

- сопряженных градиентов;

- обратное распространение;

- Квази-Ньютоновский;

- псевдо-обратный;

- обучение Кохонена;

- Левенберга-Маркара;

- векторный квантователь;

- метод К-ближайших соседям (ККЫ);

- установка явных отклонений.

В рамках статьи будут рассмотрены три алгоритма обучения: обратного распространения ошибки, обучение Кохонена и метод К-ближайших соседям (КЩ).

Обучение Кохонена, называют также сетями Кохонена, решают задачи обучения без учителя, когда задаются только сами объекты хг-, и требуется выделить обособленные "плотные сгустки" объектов - кластеры, и научиться относить новые объекты к этим кластерам.

При обучении Кохонена на вход подается входной вектор и вычисляются его скалярные произведения с векторами весов, связанными со всеми нейронами Кохонена. Нейрон с максимальным значением скалярного произведения объявляется "победителем" и его веса подстраиваются [1].

Алгоритм обучения сети Кохонена выглядит следующим образом, приведен на рисунке 1:

1. Подаются исходные данные на входы.

2. Нахождение выхода каждого нейрона

3. Определение нейрона-победителя, т.е. веса которого в меньшей степени отличаются от соответствующих компонентов входного вектора

4. Корректировка весов нейрона-победителя по правилу Кохонена

где х - входной вектор, к - номер цикла обучения, (к)- коэффициент скорости обучения і-го нейрона в к-ом цикле обучения

5. Перейти в пункт 1, если обучение не завершено

Рисунок 1 - Алгоритм обучения Кохонена

Достоинства алгоритма:

- устойчивость к зашумленным данным;

- быстрое обучение.

Недостатки алгоритма:

- эвристичность алгоритма обучения;

- предопределенность числа кластеров.

Алгоритм обратного распространения ошибки - градиентный алгоритм обучения многослойной нейронной сети, основанный на минимизации среднеквадратичной ошибки на выходах сети.

Обучение алгоритмом обратного распространения ошибки предполагает два прохода по всем слоям сети: прямого и обратного. При прямом проходе входной вектор подается на входной слой нейронной сети, после чего распространяется по сети от слоя к слою. В результате генерируется набор выходных сигналов, который и является фактической реакцией сети на данный входной образ. Во время прямого прохода все синаптические веса сети фиксированы. Во время обратного прохода все синаптические веса настраиваются в соответствии с правилом коррекции ошибок, а именно: фактический выход сети вычитается из желаемого, в результате чего формируется сигнал ошибки. Этот сигнал впоследствии распространяется по сети в направлении, обратном направлению синаптических связей. Синаптические веса настраиваются с целью максимального приближения выходного сигнала сети к желаемому [2].

Последовательность действий алгоритма обратного распространения ошибки выглядит следующим образом, изображена на рисунке 2:

1. инициализировать синаптические веса;

2. выбрать очередную обучающую пару из обучающего множества, подать входной вектор на вход сети;

3. вычислить выход сети;

4. вычислить разность между выходом сети и требуемым выходом;

5. подкорректировать веса сети так, чтобы минимизировать ошибку;

6. повторять шаги с 2 по 5 для каждого вектора обучающего множества до тех пор, пока ошибка на всем множестве не достигнет приемлемого уровня.

Рисунок 2 - Алгоритм обратного распространения ошибки

Достоинства:

- является самым применяемым в обучении НС;

- имеет простую реализацию.

Недостатки:

- длительный процесс обучения;

- возможность быстрой сходимости, т.е. попадание в локальный оптимум.

Метод ближайших соседей (kNN - k Nearest Neighbours) - метод решения задач классификации и задач регрессии, основанный на поиске ближайших объектов с известными значения целевой переменной [3]. Является одним из самых простых алгоритмов классификации, приведен на рисунке 3:

1. подается обучающая выборка

2. вычислить расстояние до каждого из объектов обучающей выборки

3. отобрать k объектов обучающей выборки, расстояние до которых минимально

4. расчет и возвращение наиболее часто встречающегося среди k ближайших соседей класса.

Рисунок 3 - Метод ближайших соседей

Достоинства алгоритма:

- простота реализации;

- параметр k можно оптимизировать по критерию скользящего контроля.

Недостатки алгоритма:

- высокая сложность одного прогноза;

- проклятие размерности.

Нейронные сети применяются в огромном количестве развивающихся автоматизированных технологиях. В данной статье были рассмотрены три алгоритма обучения нейронной сети. В результате обзора выделены достоинства и недостатки этих алгоритмов. Для дальнейшего анализа и реализации были выбраны обучение Кохонена и алгоритм обратного распространения ошибки

Список литературы

1. Зяенцев Я. Нейронные сети: основные модели. Учебное пособие. Воронежский государственный университет, 1999.

2. С. Хайкин. Нейронные сети: полный курс, 2е издание.: Пер. с англ. М. Издательский дом "Вильямс", 2006. 1104 с.: ил. Парал. тит. англ.

Bishop C. M. Neural Networks for Pattem Recognition. Oxford University Press Inc., 2003

Размещено на Allbest.ru

...

Подобные документы

  • Диагностический анализ изучения алгоритмов обучения нейронных сетей "с учителем". Сбор входных и выходных переменных для наблюдений и понятие пре/пост процессирования. Подготовка и обобщение многослойного персептрона, модель обратного распространения.

    курсовая работа [249,3 K], добавлен 22.06.2011

  • Рост активности в области теории и технической реализации искусственных нейронных сетей. Основные архитектуры нейронных сетей, их общие и функциональные свойства и наиболее распространенные алгоритмы обучения. Решение проблемы мертвых нейронов.

    реферат [347,6 K], добавлен 17.12.2011

  • Понятие и свойства искусственных нейронных сетей, их функциональное сходство с человеческим мозгом, принцип их работы, области использования. Экспертная система и надежность нейронных сетей. Модель искусственного нейрона с активационной функцией.

    реферат [158,2 K], добавлен 16.03.2011

  • Простейшая сеть, состоящая из группы нейронов, образующих слой. Свойства нейрокомпьютеров (компьютеров на основе нейронных сетей), привлекательных с точки зрения их практического использования. Модели нейронных сетей. Персептрон и сеть Кохонена.

    реферат [162,9 K], добавлен 30.09.2013

  • Искусственные нейронные сети как одна из широко известных и используемых моделей машинного обучения. Знакомство с особенностями разработки системы распознавания изображений на основе аппарата искусственных нейронных сетей. Анализ типов машинного обучения.

    дипломная работа [1,8 M], добавлен 08.02.2017

  • Способы применения технологий нейронных сетей в системах обнаружения вторжений. Экспертные системы обнаружения сетевых атак. Искусственные сети, генетические алгоритмы. Преимущества и недостатки систем обнаружения вторжений на основе нейронных сетей.

    контрольная работа [135,5 K], добавлен 30.11.2015

  • Нейрокомпьютеры и их применение в современном обществе. Некоторые характеризующие нейрокомпьютеры свойства. Задачи, решаемые с помощью нейрокомпьютеров. Типы искусственных нейронов. Классификация искусственных нейронных сетей, их достоинства и недостатки.

    курсовая работа [835,9 K], добавлен 17.06.2014

  • Понятие искусственного нейрона и искусственных нейронных сетей. Сущность процесса обучения нейронной сети и аппроксимации функции. Смысл алгоритма обучения с учителем. Построение и обучение нейронной сети для аппроксимации функции в среде Matlab.

    лабораторная работа [1,1 M], добавлен 05.10.2010

  • Способы применения нейронных сетей для решения различных математических и логических задач. Принципы архитектуры их построения и цели работы программных комплексов. Основные достоинства и недостатки каждой из них. Пример рекуррентной сети Элмана.

    курсовая работа [377,4 K], добавлен 26.02.2015

  • Обзор и анализ распространенных искусственных нейронных сетей. Функциональное назначение слоев сети, алгоритмы обучения. Описание функциональных возможностей разработанной программной системы. Анализ исследовательской эксплуатации и возможных применений.

    дипломная работа [1,3 M], добавлен 19.05.2011

  • Особенности нейронных сетей как параллельных вычислительных структур, ассоциируемых с работой человеческого мозга. История искусственных нейронных сетей как универсального инструмента для решения широкого класса задач. Программное обеспечение их работы.

    презентация [582,1 K], добавлен 25.06.2013

  • Нейронные сети как средство анализа процесса продаж мобильных телефонов. Автоматизированные решения на основе технологии нейронных сетей. Разработка программы прогнозирования оптово-розничных продаж мобильных телефонов на основе нейронных сетей.

    дипломная работа [4,6 M], добавлен 22.09.2011

  • Общие сведения о принципах построения нейронных сетей. Искусственные нейронные системы. Математическая модель нейрона. Классификация нейронных сетей. Правила обучения Хэбба, Розенблатта и Видроу-Хоффа. Алгоритм обратного распространения ошибки.

    дипломная работа [814,6 K], добавлен 29.09.2014

  • Анализ применения нейронных сетей для прогнозирования ситуации и принятия решений на фондовом рынке с помощью программного пакета моделирования нейронных сетей Trajan 3.0. Преобразование первичных данных, таблиц. Эргономическая оценка программы.

    дипломная работа [3,8 M], добавлен 27.06.2011

  • Описание технологического процесса напуска бумаги. Конструкция бумагоделательной машины. Обоснование применения нейронных сетей в управлении формованием бумажного полотна. Математическая модель нейрона. Моделирование двух структур нейронных сетей.

    курсовая работа [1,5 M], добавлен 15.10.2012

  • Изучение методов разработки систем управления на основе аппарата нечеткой логики и нейронных сетей. Емкость с двумя клапанами с целью установки заданного уровня жидкости и построение нескольких типов регуляторов. Проведение сравнительного анализа.

    курсовая работа [322,5 K], добавлен 14.03.2009

  • Технологии решения задач с использованием нейронных сетей в пакетах расширения Neural Networks Toolbox и Simulink. Создание этого вида сети, анализ сценария формирования и степени достоверности результатов вычислений на тестовом массиве входных векторов.

    лабораторная работа [352,2 K], добавлен 20.05.2013

  • Исследование эффективности применения нейронных сетей в рамках отношений между людьми. Принцип работы с нейросимулятором. Составление обучающей выборки и проектирование персептронов. Анализ выбора супружеской пары с использованием нейросетевых технологий.

    презентация [150,8 K], добавлен 19.08.2013

  • Задача анализа деловой активности, факторы, влияющие на принятие решений. Современные информационные технологии и нейронные сети: принципы их работы. Исследование применения нейронных сетей в задачах прогнозирования финансовых ситуаций и принятия решений.

    дипломная работа [955,3 K], добавлен 06.11.2011

  • Механизм работы нервной системы и мозга человека. Схема биологического нейрона и его математическая модель. Принцип работы искусственной нейронной сети, этапы ее построения и обучения. Применение нейронных сетей в интеллектуальных системах управления.

    презентация [98,6 K], добавлен 16.10.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.