Методика синтеза рекуррентных нейронных сетей для распознавания динамических образов
Описание разработанной методики синтеза импульсных рекуррентных нейронных сетей в составе машины неустойчивых состояний для решения задачи распознавания динамических образов в рамках парадигмы резервуарных вычислений. Входные данные и их предобработка.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 15.01.2019 |
Размер файла | 242,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Методика синтеза рекуррентных нейронных сетей для распознавания динамических образов
Никитин К.В., ассистент кафедры компьютерных систем и программных технологий СПбГПУ, execiter@mail.ru
Аннотация
импульсный нейронный сеть распознавание
В работе приводится описание разработанной методики синтеза импульсных рекуррентных нейронных сетей в составе машины неустойчивых состояний для решения задачи распознавания динамических образов в рамках парадигмы резервуарных вычислений.
Среди множества различных моделей нейронных сетей (НС) наибольшими вычислительными возможностями обладают НС с обратными связями или рекуррентные нейронные сети (РНС) [1]. РНС можно рассматривать как сложные нелинейные динамические системы, функционирующие как в устойчивых, колебательных и неустойчивых (хаотических) режимах. Однако платой за все преимущества РНС является значительное усложнение алгоритма их настройки или обучения.
Сложность и неэффективность существующих алгоритмов обучения РНС вынудила исследователей искать новые подходы, стратегии для использования их вычислительных возможностей. Одним из таких подходов стало новое направление - резервуарные вычисления (РВ).
Направление по РВ на данный момент развивается довольно динамично, но проблема синтеза резервуара под конкретную задачу является актуальной и нерешенной [4]. В работе была разработана методика синтеза резервуара - импульсной РНС в составе машины неустойчивых состояний (МНС) [3] - одной из основных моделей РВ, максимально приближенной к биологическому прототипу.
Модель машины неустойчивых состояний
Основная идея РВ заключается в использовании РНС как резервуара с богатой динамикой и мощными вычислительными возможностями. При этом резервуар формируется случайным образом, что исключает необходимость проводить его обучение [4]. При подаче на вход резервуара непрерывного сигнала он попадает в определенный динамический режим или состояние. Это состояние зависит от входного сигнала. Выход резервуара соединен со специальными устройствами - считывателями, которые выделяют из состояния резервуара полезную информацию и таким образом решают поставленную. Схема РВ в общем и МНС в частности, показана на рисунке 1.
Рисунок 1: Схема машины неустойчивых состояний
Резервуар в МНС является импульсной РНС [2] со случайной 3-х-мерной структурой, в которой импульсные нейроны соединены с помощью химических синапсов. Вероятность связи между двумя нейронами определяется по формуле [3]:
,
где буквами a и b обозначаются два нейрона, D(a,b) - евклидово расстояние между нейронами, л - средняя длина связи между нейронами, С(a,b) характеризует плотность связей.
Обобщенная методика синтеза импульсных РНС
Анализ результатов экспериментального исследования позволил построить обобщенную методику синтеза импульсных РНС и встроить ее в схему решения задачи распознавания динамических образов. Соответствующая схема представлена на рисунке 2.
Далее рассмотрим подробно каждый шаг методики.
Входные данные и их предобработка
Входные данные представлены набором примеров динамических образов в виде пар «входной сигнал-соответствующий ему выходной сигнал». Входной и выходной сигнал в общем случае являются многомерными функциями времени, размерность входного сигнала nin, выходного - nout. Возможны два способа задания - непрерывная и импульсная. В непрерывном случае каждая входная и выходная функция задаются аналитически (точно) либо численно (приближенно).
Рисунок 2: Методика синтеза импульсных РНС при решения задачи распознавания динамических образов с помощью МНС
При численном задании входная функция времени разбивается на набор интервалов и на каждом интервале задается значение этой функции. Количество интервалов определяет точность задания функции. Важными параметрами является количество и качество примеров.
После того, как определен набор примеров, необходимо выбрать способ их подачи на вход резервуара - импульсной РНС. Предпочтительной является импульсная форма представления входных сигналов. Поэтому если входной сигнал задан непрерывно, следует выполнить преобразование этого сигнала в импульсную форму. Среди всех алгоритмов преобразования из непрерывной в импульсную форму следует отдать предпочтение алгоритмам на основе пространственно-временного кодирования (п. 2.4.4), в частности, алгоритму на основе рецептивных полей. Этот алгоритм автоматически выполняет нормировку входных данных, поэтому никакая дополнительная предобработка не требуется. Ключевыми параметрами этого алгоритма являются kx - во сколько импульсных входов преобразуется каждый непрерывный вход и Tmin - минимальный период импульсов.
При выборе их значений следует руководствоваться соображениями, что чем сложнее форма непрерывного сигнала, тем больше значение kx следует задавать). Следует начинать со значения kx, равного 8 и далее увеличивая до 16, 32 и т.д. Минимальный период Tmin следует задавать не меньше чем 1мс и не больше, чем постоянная времени нейрона (20-30 мс).
Если входной сигнал подается напрямую в непрерывной форме, то необходимо произвести его нормирование, так чтобы значения, которые он принимает, лежали в диапазоне от 0 до 1.
Помимо проблемы представления входных данных в импульсной форме существует проблема, связанная с временем представления входных образов. Это время не должно превышать глубину памяти резервуара - в противном случае часть информации о входном сигнале будет «забыта». Для решения этой проблемы может быть использована техника нормализации сигналов во временном диапазоне. Средняя глубина памяти импульсной РНС равна 0.1-0.5 с. Если время представления входного образа превышает эти значения, следует сжать входной образ во времени до tnorm (например, до 0.25 с).
Синтез резервуара
Вначале определяется количество входов nvh РНС. Если преобразования из непрерывной в импульсную форму не происходит, то оно равно количеству входных сигналов nin, если преобразование выполняется, то количество входов равно произведению количества входных сигналов на коэффициент размножения по входам kx.
Вероятность связи между входами и нейронами резервуара pvh следует задать равной 10_20 %.
Количество нейронов nnrn резервуара определяется сложностью задачи распознавания и количеством входов. Чем выше сложность и чем больше количество входов, тем больше должно быть нейронов. Минимально-допустимое значение числа нейронов равно 125 и соответствует трехмерной решетке 5х5х5.
Процент подавляющих нейронов pinh задается равным 20_30 % для любых типов нейронов.
Средняя длина связей л вначале задается равной 2. Затем можно будет скорректировать это значение, немного увеличив его (предельное значение равно 3).
Плотность связей задается матрицей C размерности 2x2 (С[i,j] - плотность связей между нейронами типа i и нейронами типа j, где тип 1 - подавляющий, тип 2 - возбуждающий). Возможные значения матрицы C:
, .
На основании значений nnrn, nvh, pvh, pinh, С, л и формулы (2.36) случайным образом генерируется структура РНС, содержащая информацию о наличии/отсутствии связей между входами и нейронами и между нейронами. Формально структуру можно описать с помощью матриц Hvh, Hint: Hvh[i,j] = 1, если связь между i входом и j входом есть; Hvh[i,j] = 0, если связь отсутствует; Hint[i,j] = 1, если связь между i и j нейроном есть; Hint[i,j] = 0, если связь между i и j нейроном отсутствует.
Тип нейронов. В качестве нейронов могут использоваться как простые нейроны типа «интегрирование и возбуждение», так и более сложные нейроны - Ижикевича, Ходжкина-Хаксли, Морриса-Лекара. Выбор той или иной модели зависит от сложности задачи. Для простых задач можно обойтись более простыми моделями «интегрирование и возбуждение», для более сложных задач - модели нейронов с более сложной динамикой (Ижикевича и др.). Выбор более сложной модели нейрона позволяет увеличить память резервуара за счет более длительной и уникальной реакции в ответ на входной изменяющийся сигнал.
При использовании нейронов типа «интегрирование и возбуждение» следует инициализировать их базовые параметры следующими значениями: vrest=vreset=0, и=15мВ, Trefrac=3мс, ф=30мс, утечка есть.
При использовании нейронов Ижикевича в качестве возбуждающих нейронов следует использовать модель RS с параметрами: a=0.02, b=0.2, c=-65, d=8, а в качестве подавляющих нейронов модель FS с параметрами: a=0.1, b=0.2, c= -65, d=2.
Тип связей - синапсов так же, как и тип нейронов определяется сложностью задачи, а также типом связи. Для связей, передающих входные непрерывные сигналы, используются электрические синапсы. Для связей, передающих импульсные входные сигналы, а также для всех связей между импульсными нейронами используются химические синапсы. Для увеличения вычислительных возможностей (нелинейность, глубина памяти) используются динамические синапсы с кратковременной памятью. Для адаптации РНС к входному импульсной сигналу используются синапсы с пластичностью, обладающие долговременной памятью.
Сила связей для всех синапсов вначале может быть задана детерминированной.
Сила связей между входами и нейронами для электрических синапсов задается вектором Wvh(el) из двух значений (1-е - для подавляющих нейронов, 2-е - для возбуждающих нейронов). Для нейронов «интегрировании и возбуждение» возможные значения Wvh(el) следующие:
, ,
а для нейронов Ижикевича:
, .
При этом значения непрерывного входного сигнала должны быть нормализованы и приведены к диапазону от 0 до 1.
Сила связей между входами и нейронами для химических синапсов задается вектором Wvh(chem) из двух значений (1-е - для подавляющих нейронов, 2-е - для возбуждающих нейронов). Для нейронов «интегрирование и возбуждение» (а) и нейронов Ижикевича (б) возможные значения Wvh(chem) следующие:
а) , б) .
Сила связей между нейронами (для химических синапсов) задается матрицей Wint размерности 2x2 (Wint[i,j] - сила связи между нейроном типа i и нейроном типа j, где тип 1 - подавляющий, тип 2 - возбуждающий). Для нейронов «интегрирование и возбуждение» (а) и нейронов Ижикевича (б) матрица Wint задается следующим образом:
а) , б) .
В дальнейшем силы связей можно сделать случайными - распределенными нормально с МО, равными приведенным выше значениям и СКО, равными 10-30% от значений математических ожиданий.
Постоянная времени затухания фsyn импульсного тока задается для химических синапсов от входов и возбуждающих нейронов равной 3 мс и для подавляющих нейронов - 6 мс.
Задержки фdelay для химических синапсов задаются равными 1 мс.
Выбор считывающих модулей
Последовательность выбора считывателей можно представить следующим образом:
· определение времени считывания - лучшие результаты получаются при времени считывании, соответствующем подаче ѕ входного образа;
· выбор алгоритма преобразования из импульсной формы в непрерывную - рекомендуемым является алгоритм, основанный на замене каждого импульса экспоненциально затухающим сигналом с постоянной времени фwindow=5-20 мс;
· выбор алгоритма сокращения размерности числа признаков - могут быть использованы как «фильтр» (PCA, LDA, Relieff, ISOMAP и др.), так и «враппер» методы; количество компонент - от 5 до 20;
· выбор алгоритма решения конечной задачи: классификация - НСПР, SVM, PNN, LVQ, k-NN, аппроксимация - НСПР, РБФ-НС, кластеризация - k-means, GMM.
Оценка качества распознавания
После того, как пройдены все предыдущие этапы, можно приступать непосредственно к решению поставленной задачи распознавания динамических образов и оценивать качество распознавания. Для этого лучше всего подходит процедура кросс-валидации.
Для расчета ошибки классификатора лучше всего вначале посчитать матрицу неточностей и по ней уже определить вероятности ошибок 1-го, 2-го родов для каждого из m классов. В качестве ошибки аппроксимации можно использовать усредненную (максимальную) абсолютную или относительную ошибки по всему множеству тестовых примеров. При решении задачи кластеризации качество анализируется с помощью специальных показателей - индекса Дэвиса-Болдуина, индекса Дана и др.
В случае, если полученное качество распознавания не устраивает, можно вернуться на один из предыдущих этапов. В итоге выполнения всех описанных выше действий (шагов) и рекомендаций задача распознавания динамических образов будет решена с требуемым качеством.
Заключение
Разработанная методика синтеза импульсных РНС в составе МНС отличается от известных подходов системностью, универсальностью, большей детализацией, что позволяет проводить целенаправленный синтез резервуара с требуемыми показателями, снизить трудоемкость разработки систем распознавания динамических образов и использовать новую модель МНС в системах резервуарных вычислений для задач распознавания динамических образов.
Применение методики для решения с помощью МНС задачи обработки реальных данных - электрокардиограмм с различными формами аритмии позволило повысить качество распознавания на 5-7 % по сравнению с известными классическими подходами. Таким образом, предложенная методика синтеза импульсных РНС может дополнить существующие подходы в системах обработки информации и распознавания динамических образов для повышения качества и скорости их работы.
Список литературы
1. Хайкин, С. Нейронные сети: полный курс: [пер. с англ.] / С. Хайкин, 2-е изд. - М. : Вильямс, 2000. - 1104 с.
2. Gerstner, W. Spiking Neuron Models. Single Neurons, Populations, Plasticity / W. Gerstner, W. M Kistler. - Cambridge : Cambridge University Press, 2002. - 480 p.
3. Maass, W. Real-time computing without stable states: a new framework for neural computations based on perturbations / W. Maass, T. Natschlдger, H. Markram // Neural Computation. - 2002. Vol. 11. - P. 2531-2560.
4. Schrauwen, B. An overview of reservoir computing theory, applications and implementations / B. Schrauwen, D. Verstraeten, J. V. Campenhout // Proc. of the 15th European Symposium on ANN. - 2007. - P. 471-482.
Размещено на Allbest.ru
...Подобные документы
Создание программного средства, осуществляющего распознавание зрительных образов на базе искусственных нейронных сетей. Методы, использующиеся для распознавания образов. Пандемониум Селфриджа. Персептрон Розенблатта. Правило формирования цепного кода.
дипломная работа [554,8 K], добавлен 06.04.2014Основные понятия теории распознавания образов и ее значение. Сущность математической теории распознавания образов. Основные задачи, возникающие при разработке систем распознавания образов. Классификация систем распознавания образов реального времени.
курсовая работа [462,2 K], добавлен 15.01.2014Первое систематическое изучение искусственных нейронных сетей. Описание элементарного перцептрона. Программная реализация модели распознавания графических образов на основе перцептрона. Интерфейс программы, основные окна. Составление алгоритма приложения.
реферат [100,5 K], добавлен 18.01.2014Теоретические основы распознавания образов. Функциональная схема системы распознавания. Применение байесовских методов при решении задачи распознавания образов. Байесовская сегментация изображений. Модель TAN при решении задачи классификации образов.
дипломная работа [1019,9 K], добавлен 13.10.2017Принципы и система распознавание образов. Программное средство и пользовательский интерфейс. Теория нейронных сетей. Тривиальный алгоритм распознавания. Нейронные сети высокого порядка. Подготовка и нормализация данных. Самоорганизующиеся сети Кохонена.
курсовая работа [2,6 M], добавлен 29.04.2009Искусственные нейронные сети как одна из широко известных и используемых моделей машинного обучения. Знакомство с особенностями разработки системы распознавания изображений на основе аппарата искусственных нейронных сетей. Анализ типов машинного обучения.
дипломная работа [1,8 M], добавлен 08.02.2017Описание структурной схемы искусственного нейрона. Характеристика искусственной нейронной сети как математической модели и устройств параллельных вычислений на основе микропроцессоров. Применение нейронной сети для распознавания образов и сжатия данных.
презентация [387,5 K], добавлен 11.12.2015Описание технологического процесса напуска бумаги. Конструкция бумагоделательной машины. Обоснование применения нейронных сетей в управлении формованием бумажного полотна. Математическая модель нейрона. Моделирование двух структур нейронных сетей.
курсовая работа [1,5 M], добавлен 15.10.2012Обзор задач, возникающих при разработке систем распознавания образов. Обучаемые классификаторы образов. Алгоритм персептрона и его модификации. Создание программы, предназначенной для классификации образов методом наименьшей среднеквадратической ошибки.
курсовая работа [645,2 K], добавлен 05.04.2015Выбор типа и структуры нейронной сети. Подбор метода распознавания, структурная схема сети Хопфилда. Обучение системы распознавания образов. Особенности работы с программой, ее достоинства и недостатки. Описание интерфейса пользователя и экранных форм.
курсовая работа [3,0 M], добавлен 14.11.2013Технологии решения задач с использованием нейронных сетей в пакетах расширения Neural Networks Toolbox и Simulink. Создание этого вида сети, анализ сценария формирования и степени достоверности результатов вычислений на тестовом массиве входных векторов.
лабораторная работа [352,2 K], добавлен 20.05.2013Методы распознавания образов (классификаторы): байесовский, линейный, метод потенциальных функций. Разработка программы распознавания человека по его фотографиям. Примеры работы классификаторов, экспериментальные результаты о точности работы методов.
курсовая работа [2,7 M], добавлен 15.08.2011Особенности нейронных сетей как параллельных вычислительных структур, ассоциируемых с работой человеческого мозга. История искусственных нейронных сетей как универсального инструмента для решения широкого класса задач. Программное обеспечение их работы.
презентация [582,1 K], добавлен 25.06.2013Анализ применения нейронных сетей для прогнозирования ситуации и принятия решений на фондовом рынке с помощью программного пакета моделирования нейронных сетей Trajan 3.0. Преобразование первичных данных, таблиц. Эргономическая оценка программы.
дипломная работа [3,8 M], добавлен 27.06.2011Появление технических систем автоматического распознавания. Человек как элемент или звено сложных автоматических систем. Возможности автоматических распознающих устройств. Этапы создания системы распознавания образов. Процессы измерения и кодирования.
презентация [523,7 K], добавлен 14.08.2013Способы применения технологий нейронных сетей в системах обнаружения вторжений. Экспертные системы обнаружения сетевых атак. Искусственные сети, генетические алгоритмы. Преимущества и недостатки систем обнаружения вторжений на основе нейронных сетей.
контрольная работа [135,5 K], добавлен 30.11.2015Основные цели и задачи построения систем распознавания. Построение математической модели системы распознавания образов на примере алгоритма идентификации объектов военной техники в автоматизированных телекоммуникационных комплексах систем управления.
дипломная работа [332,2 K], добавлен 30.11.2012Понятие системы распознавания образов. Классификация систем распознавания. Разработка системы распознавания формы микрообъектов. Алгоритм для создания системы распознавания микрообъектов на кристаллограмме, особенности его реализации в программной среде.
курсовая работа [16,2 M], добавлен 21.06.2014Способы применения нейронных сетей для решения различных математических и логических задач. Принципы архитектуры их построения и цели работы программных комплексов. Основные достоинства и недостатки каждой из них. Пример рекуррентной сети Элмана.
курсовая работа [377,4 K], добавлен 26.02.2015Нейронные сети как средство анализа процесса продаж мобильных телефонов. Автоматизированные решения на основе технологии нейронных сетей. Разработка программы прогнозирования оптово-розничных продаж мобильных телефонов на основе нейронных сетей.
дипломная работа [4,6 M], добавлен 22.09.2011