Компьютерное зрение: распознавание человека по изображению лица с помощью нейросетевых технологий

Основные классы задач в распознавании человека по изображению лица. Поиск изображения в больших базах данных, задача контроля доступа. Нейросетевые методы распознавания человека по изображению лица. Архитектура нейронных сетей, разработка алгоритма.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 06.06.2013
Размер файла 2,1 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Компьютерное зрение: распознавание человека по изображению лица с помощью нейросетевых технологий

Оглавление

  • Введение
  • 1. Аналитическая часть
  • 1.1 Основные классы решаемых задач в распознавании человека по изображению лица
  • 1.1.1 Поиск изображения в больших базах данных
  • 1.1.2 Задача контроля доступа
  • 1.1.3 Задача контроля фотографии в документах
  • 1.2 Нейросетевые методы распознавания человека по изображению лица
  • 2. Конструкторская часть
  • 2.1 Архитектура нейронных сетей
  • 2.2 Разделение пространства признаков на области и извлечение ключевых признаков
  • 2.2.1 Многослойные нейронные сети
  • 2.2.2 Нейронные сети высокого порядка и моментные НС
  • 2.2.3 Радиально-базисные нейронные сети
  • 2.3 Распознавание с учётом топологии пространства
  • 2.3.1 Когнитрон
  • 2.3.2 Неокогнитрон
  • 2.3.3 Свёрточные нейронные сети
  • 3. Технологическая часть
  • 3.1 Алгоритм
  • 3.2 Результаты
  • 3.2.1 Архитектура и обучение
  • 3.3 Руководство пользователя
  • Заключение
  • Список литературы
  • Приложение

Введение

Компьютерное зрение - вид деятельности, в которой для извлечения данных применяются статистические методы и используются модели, построенные с помощью геометрии, физики и теории обучения. Компьютерное зрение применяется довольно широко как в относительно старых областях (например, управление мобильными роботами, военные приложения, промышленные средства наблюдения), так и в сравнительно новых (взаимодействие человек/компьютер, поиск изображения в библиотеках, анализ медицинских изображений и реалистичная передача смоделированных сцен в компьютерной графике).

Отличительная черта компьютерного зрения - это извлечение описаний из изображений или последовательности изображений. Например, такой аспект компьютерного зрения, как определение структуры по движению, позволяет из серии изображений получить представление о том, как движется камера и что изображено на рисунке. В индустрии развлечений подобные методы применяются для отсеивания движения и построения трехмерных компьютерных моделей здания с сохранением структуры. С помощью небольшого числа фотографий можно получить хорошие, простые, точные и удобные модели. Рассмотрим другую ситуацию: люди, желающие контролировать работу мобильных роботов. В этом случае сведения об области, где используется робот, обычно не представляют значительного интереса, важно лишь нахождение робота в этой области. Таким образом, здесь отсеивается информация о структуре и отслеживается движение, что позволяет определить точное местонахождение робота.

Есть еще целый ряд других важных областей применения компьютерного зрения. Это, например, работа с медицинскими изображениями: создание программных систем, которые могут улучшать набор изображений, выявлять на них важные моменты или события либо визуализировать информацию, полученную из изображений. Другая важная область - различные технические проверки, когда по изображениям объектов определяется, соответствуют ли объекты спецификации. Третья сфера применения компьютерного зрения - интерпретация фотографий, сделанных со спутника, как в военных целях, так и в гражданских. Четвертая область - это упорядочение и структурирование коллекций картин. Обработка библиотек статических или движущихся изображений на сегодняшний день имеет ряд серьезных, нерешенных вопросов.

Компьютерное зрение сейчас находится в особой точке своего развития. Только сравнительно недавно появилась возможность создания практичных программ, использующих идеи компьютерного зрения. Быстродействие современных цифровых устройств и возможность параллельных вычислений делают возможной реализации многих алгоритмов работы с библиотеками цифровых изображений. Таким образом, проводить серьезные исследования и решать многие повседневные задачи (например, упорядочить коллекцию фотографий, создать трехмерную модель окружающего мира, управлять и вносить изменения в коллекцию видеозаписей) теперь можно с помощью методов компьютерного зрения.

1. Аналитическая часть

1.1 Основные классы решаемых задач в распознавании человека по изображению лица

В настоящее время всё более широкое распространение получают биометрические системы идентификации человека. Традиционные системы идентификации требуют знания пароля, наличия ключа, идентификационной карточки либо иного идентифицирующего документа, который можно забыть, потерять или подделать. В отличие от них биометрические системы основываются на уникальных биологических характеристиках человека, которые трудно подделать и которые однозначно определяют конкретного человека. К таким характеристикам относятся отпечатки пальцев, форма ладони, узор радужной оболочки, изображение сетчатки глаза. Лицо, голос и запах каждого человека также индивидуальны.

Распознавание человека по изображению лица выделяется среди биометрических систем тем, что, во-первых, не требует специального дорогостоящего оборудования. Для большинства приложений достаточно персонального компьютера и обычной видеокамеры. Во-вторых, отсутствует физический контакт человека с устройствами. Не надо ни к чему прикасаться или специально останавливаться и ждать срабатывания системы. В большинстве случаев достаточно просто пройти мимо или задержаться перед камерой на несколько секунд.

К недостаткам распознавания человека по изображению лица следует отнести то, что сама по себе такая система не обеспечивает 100% -ной надёжности идентификации. Там, где требуется высокая надёжность, применяют комбинирование нескольких биометрических методов.

На данный момент проблеме распознавания человека по изображению лица посвящено множество работ, однако в целом она ещё далека от разрешения. Основные трудности состоят в том, чтобы распознать человека по изображению лица независимо от изменения ракурса и условий освещённости при съёмке, а также при различных изменениях, связанных с возрастом, причёской и т.д.

Распознавание изображений пересекается с распознаванием образов. Такие задачи не имеют точного аналитического решения. При этом требуется выделение ключевых признаков, характеризующих зрительный образ, определение относительной важности признаков путём выбора их весовых коэффициентов и учёт взаимосвязей между признаками. Изначально эти задачи выполнялись человеком-экспертом вручную, путём экспериментов, что занимало много времени и не гарантировало качества. В новых методах выделение ключевых признаков осуществляется путём автоматического анализа обучающей выборки, но тем не менее большая часть информации о признаках задаётся вручную. Для автоматического применения таких анализаторов выборка должна быть достаточно большой и охватывать все возможные ситуации

Нейросетевые методы предлагают иной подход к решению задачи распознавания образов. Архитектура и функционирование нейронных сетей (НС) имеют биологические прообразы. Веса в нейронной сети не вычисляются путём решения аналитических уравнений, а подстраиваются различными локальными методами (например, разновидностями градиентного спуска) при обучении. Обучаются нейронные сети на наборе обучающих примеров. В процессе обучения НС происходит автоматическое извлечение ключевых признаков, определение их важности и построение взаимосвязей между ними. Обученная НС может успешно применять опыт, полученный в процессе обучения, на неизвестные образы за счёт хороших обобщающих способностей.

Таким образом, применение нейронных сетей для задачи распознавания человека по изображению лица является перспективным направлением, на что и направлено основное внимание проекта.

архитектура нейронный распознавание изображение

В данной работе исследованы методы распознавания человека по изображению лица и возможности использования их совместно с нейросетевыми методами: дан обзор нейросетевых методов распознавания изображений и их применения к распознаванию человека по изображению лица, описаны различные способы представления изображения и учёта его свойств.

Задачи распознавания человека по изображению лица делятся на три больших класса: поиск в больших базах данных, контроль доступа и контроль фотографий в документах. Они различаются как по требованиям, предоставляемым к системам распознавания, так и по способам решения, и поэтому представляют собой отдельные классы.

Различны и требования, предъявляемые к ошибкам первого и второго рода для таких классов. Ошибкой первого рода (тип I ошибки, misdetection) называется ситуация, когда объект заданного класса не распознаётся (пропускается) системой. Ошибка второго рода (тип II ошибки, ложные тревоги) происходит, когда объект заданного класса принимается за объект другого класса.

Следует также отметить различие понятий верификации и распознавания (идентификации). В задаче верификации неизвестный объект заявляет, что он принадлежит к некоторому известному системе классу. Система подтверждает или опровергает это заявление. В системах верификации ошибкой первого рода является ситуация, когда объект, принадлежащий к известным системе классам, принимается за объект, относящийся к неизвестным системе классам, и в доступе ему отказывают. Ошибка второго рода совершается, когда объект неизвестного класса принимается за объект, относящийся к известным системе классам, и ему разрешается доступ. При распознавании требуется отнести объект к одному из N известных классов или выдать заключение о том, что этот объект не относится к известным классам.

1.1.1 Поиск изображения в больших базах данных

Сравнение типа "один со многими". Высокие требования к ошибке первого рода - распознавания система должна находить изображения, соответствующие данному человеку, по возможности не пропустив ни одного такого изображения. При этом допустимо, если в результирующей выборке будет присутствовать небольшое число других людей.

Обычно в большой базе данных (10t-10?изображений) требуется найти изображения, наиболее похожие на заданное. Поиск должен быть произведён за разумное время. Одно из решений состоит в хранении в базе данных небольших наборов заранее извлечённых ключевых признаков, максимально характеризующих изображение. При этом требования к точности не столь критичны, как в задачах контроля доступа и документного контроля.

К данному классу прежде всего относится метод главных компонент (метод "собственных лиц"). Коэффициенты, полученные разложением входного изображения на главные компоненты, использовались для сравнения изображений путём вычисления Евклидова расстояния.

1.1.2 Задача контроля доступа

Сравнение типа "один с несколькими". Критическими являются требования к ошибкам второго рода. Система распознавания не должна распознавать незнакомых людей как знакомых, возможно даже за счёт увеличения ошибок первого рода (отказов в доступе знакомым людям).

Имеется небольшая группа лиц (5-50 человек), которых система должна распознавать по изображению лица и открывать им доступ в некоторое помещение. Людей, не входящих в эту группу, система не должна пропускать. Возможны варианты, когда требуется установить конкретную личность по изображению лица. При этом от системы требуется высокая достоверность распознавания, возможно даже за счёт увеличения числа отказов на знакомые объекты.

В качестве тренировочных изображений обычно для каждого человека доступны несколько изображений лица, полученных при различных условиях. Это могут быть, например, изменения ракурса, условий освещённости, причёски, мимики, наличие или отсутствие очков и т.п.

Система должна работать в реальном масштабе времени, а процесс настройки может занимать больше времени и выполняться предварительно. В процессе эксплуатации система должна дообучаться на вновь поступающих изображениях по возможности быстрее.

Ограничений на применяемые методы здесь нет, но все методы сходятся в том, что имеется обучающий набор изображений лиц заданной группы людей (возможно при различных условиях съёмки). К этому набору система обращается в процессе распознавания или настраивается на него в процессе обучения.

Одним из распространённых подходов к решению такой задачи является использование нейронных сетей, которые после обучения обладают хорошей обобщающей способностью.

1.1.3 Задача контроля фотографии в документах

Сравнение типа "один с одним". Формулировать требования к ошибкам первого и второго рода как к системе верификации или распознавания здесь будет некорректно, поскольку система распознавания никогда не имела дело с поступающими на вход классами. Но желательно, чтобы система не совершала ошибок при сравнении.

Требуется сравнить изображение лица человека, полученное в данный момент, с фотографией из какого-либо документа. Системе надо ответить, принадлежат ли эти лица одному человеку или нет. Данный класс задач наиболее сложен, поскольку, во-первых, система никогда раньше не сталкивалась с изображением лица данного человека. Система сравнивает всегда отличающиеся изображения, учёт всех возможных различий в процессе обучения или настройки системы затруднителен.

Во-вторых, здесь большое влияние оказывают возрастные и другие изменения лица. В-третьих, качество и контраст отсканированной фотографии, как правило, хуже, чем изображение лица, снятого камерой.

Большинство методов для данного класса задач неприменимы без специальной адаптации.

1.2 Нейросетевые методы распознавания человека по изображению лица

Нейросетевые методы, основанные на применении различных типов искусственных нейронных сетей (ИНС, в дальнейшем просто нейронные сети, НС), в последнее время получили широкое распространение.

Основные задачи, решаемые при помощи нейронных сетей:

· Разбиение пространства признаков на области, соответствующие классам (классификация, распознавание, кластеризация);

· Извлечение ключевых характеристик, сжатие и реконструкция образов;

· Аппроксимация функции многих переменных с любой заданной точностью;

· Прогнозирование временных рядов;

· Ассоциативная память;

· Решение оптимизационно-комбинаторных задач;

· Топологически упорядоченное преобразование пространства;

· Распознавание с учётом топологии пространства.

Большинство из этих задач прямо или косвенно связаны с распознаванием изображений.

Основные преимущества, которыми обладают нейронные сети, следующие.

Настройка нейронной сети для решения определённой задачи производится в процессе обучения на наборе тренировочных примеров. Таким образом, не требуется вручную определять параметры модели (выбирать ключевые признаки, учитывать их взаимоотношение и т.п.) - НС извлекает параметры модели автоматически наилучшим образом в процессе обучения. Остаётся только построить тренировочную выборку. В задачах классификации при этом происходит неявное выделение ключевых признаков внутри сети, определение значимости признаков и системы взаимоотношений между ними. В настоящее время разработаны мощные, гибкие и универсальные механизмы обучения различных типов НС. Кроме того, архитектура НС и процедуры обучения позволяют выполнить гибкую настройку на конкретную решаемую задачу.

Для большинства НС процедура обучения является эвристическим алгоритмом, что, с одной стороны, обеспечивает приемлемость получаемых решений, а с другой стороны, не требует непомерных вычислительных ресурсов.

Нейронные сети обладают хорошей обобщающей способностью. Это значит, что опыт, полученный в процессе обучения на конечном наборе образов, НС может успешно распространять на всё множество образов. Кроме интерполяционных обобщающих способностей, НС (многослойные персептроны, например) могут хорошо экстраполировать, т.е. применять свой опыт на качественно иные образы, чем те, которые встречались в обобщающей выборке.

Архитектура НС реализуется на параллельных вычислительных средствах: специализированных микросхемах, оптических и квантовых компьютерах. Это открывает широкие перспективы применения НС в будущем. НС характеризуется нечётким и распределённым хранением информации, т.е. нет отдельного нейрона, отвечающего за какое-либо понятие или признак, и удаление или искажение работы этого нейрона не приведёт к фатальным последствиям.

Но несмотря на все достоинства, применение НС к изображениям требует специальных усилий. Это связано в первую очередь со сложным характером изображений, особенно изображений трёхмерных объектов реального мира, какими и являются лица людей. Изображение должно быть предобработано - приведено к некоторым стандартным условиям.

Кроме того, выбор начального представления изображения (это могут быть, например, частотные коэффициенты, главные компоненты и т.п.) является отдельной обширной темой. Двумерный характер изображения, изменение условий освещённости, топологические искажения изображения при смене ракурса и прочих воздействиях не позволяют ограничиться простейшими архитектурами НС для достижения оптимального результата.

Кроме различных способов применения нейронных сетей к распознаванию человека по изображению лица, существует множество работ, посвящённых применению нейронных сетей к распознаванию и обработке изображений других видов объектов.

2. Конструкторская часть

2.1 Архитектура нейронных сетей

Большинство нейронных сетей состоят из формальных нейронов (рис.1)

Здесь х?. хn - значения, поступающие на входы (синапсы) нейрона,

W1. Wn - веса синапсов (могут быть как тормозящими, так и усиливающими), S - взвешенная сумма входных сигналов:

где T - порог нейрона (во многих моделях обходятся без него), F - функция активации нейрона, преобразующая взвешенную сумму в выходной сигнал . Взвешенная сумма входных сигналов может быть интерпретирована как проекция входного вектора на вектор весов, где б - угол между этими векторами.

Формальный нейрон моделирует некоторые свойства биологического нейрона. Набор связанных формальных нейронов представляет собой искусственную нейронную сеть. Искусственные нейронные сети способны выполнять любые логические операции и вообще любые преобразования, реализуемые дискретными устройствами с конечной памятью (другой вопрос в том, как настроить веса такой сети). Нейроны в естественных нейронных сетях намного сложнее, их функционирование является сложным процессом, протяжённым во времени. Кроме того, существует мнение, что мозг обладает квантовой структурой, а процесс мышления основан на квантовых эффектах. Мозг человека состоит из 10 триллионов нейронов, связанных между собой 10+е14 синапсами. Такие вычислительные мощности современной вычислительной технике пока недоступны. Структура мозга определена генетически от рождения, а связи между нейронами развиваются и модифицируются на протяжении всей жизни, т.е. свой интеллектуальный опыт человек получает в процессе обучения. Это говорит о перспективности развития искусственных нейронных сетей.

По характеру связей нейронные сети могут быть полносвязными, когда каждый нейрон связан со всеми остальными, и слоистыми, когда нейроны последующего слоя связаны только со всеми нейронами предыдущего слоя. Эти две архитектуры являются базовыми, но возможны и различные вариации.

По характеру функционирования нейронные сети могут быть однопроходными, когда выход сети рассчитывается за один проход сети, и релаксационными, когда функционирование сети продолжается до достижения стабильного состояния, это состояние и является результатом работы.

По характеру формирования связей нейронные сети могут быть следующих видов

Обучение с учителем. Связи настраиваются в процессе обучения, причём эталонные значения результатов работы известны.

Самообучение (обучение без учителя). Эталонные результаты неизвестны (не нужны), сеть в процессе обучения должна организовать входные образы на основе их подобия.

Фиксированные связи. Определяются характером решаемой задачи (например, в оптимизационных задачах).

Нейронные сети могут также отличаться типом входной информации (двоичная, аналоговая и т.п.) и методом обучения.

2.2 Разделение пространства признаков на области и извлечение ключевых признаков

Для решения данных задач предназначены многослойные нейронные сети, нейронные сети высокого порядка и радиально-базисные нейронные сети.

Поскольку такие сети оперируют в исходном пространстве изображений (признаков), то для них является критическим требование предобработки изображения. Это приведение изображения к стандартному виду (положение, масштаб, ориентация, выравнивание яркости), снижение размерности данных, выбор ключевых характеристик.

Следующим следствием оперирования в исходном пространстве является невозможность учёта искажения изображения (например, при изменении ракурса, эмоций), и поэтому тренировочная выборка должна содержать репрезентативный набор примеров, представляющих собой наборы изображений объектов в том диапазоне ракурсов и условий освещения, в которых планируется применение системы распознавания.

2.2.1 Многослойные нейронные сети

Архитектура многослойной нейронной сети (МНС, другое название. - многослойный персептрон, по-английски Multilayer Perceptron, MLP) состоит из последовательно соединённых слоёв, где нейрон каждого слоя своими входами связан со всеми нейронами предыдущего слоя, а выходами - следующего (рис.2).

Активационными функциями для таких нейронов служат разновидности линейных, пороговых и сигмоидных функций

НС с одним решающим слоем способна формировать линейные разделяющие поверхности, что сильно сужает круг решаемых задач, в частности, такая сеть не сможет решить задачу типа "исключающее или". НС с нелинейной функцией активации и двумя решающими слоями позволяет формировать любые выпуклые области в пространстве решений, а с тремя решающими слоями - области любой сложности, в том числе и невыпуклой формы [6]. При этом МНС не теряет своей обобщающей способности. С помощью двухслойной НС можно с любой точностью аппроксимировать любую многомерную функцию на отрезке [0; 1]. Обучаются МНС при помощи алгоритма обратного распространения ошибки, являющегося разновидностью градиентного спуска в пространстве весов с целью минимизации суммарной ошибки сети:

где t - эталонное значение выходов сети. При этом ошибки (точнее, величины коррекции весов) распространяются в обратном направлении от входов к выходам, сквозь веса, соединяющие нейроны. Алгоритм обратного распространения ошибки является трудным, поэтому время обучения сети увеличивается экспоненциально с ростом размерности данных.

Так как эталонные значения выходов известны, алгоритм является обучением с учителем. Но в применении к извлечению ключевых признаков, когда рециркуляционная сеть обучается реконструировать поданное на вход изображение, а на скрытых нейронах формируется его сжатое представление, алгоритм обучения может быть назван и самообучением.

МНС, как и большинство других типов НС, перед началом обучения инициализируется случайными весами. Поэтому две разные обученные НС, имеющие одинаковый показатель ошибки, часто представлены совершенно различными разделяющими поверхностями, не сводимыми друг к другу. На этом основан метод коллективов (ансамблей) нейронных сетей, часто применяемый в распознавании человека по изображению лица Суть его заключается в том, что имеется набор (коллектив) сетей, обученных решать одну и ту же задачу, но различными способами (различная начальная инициализация весов, архитектура, порядок следования примеров при обучении и т.п.). Обобщённое решение такого коллектива как правило точнее (и надёжнее), чем решение единственной нейронной сети.

Одними из главных проблем МНС (и некоторых других типов НС) являются следующие:

1. Проблема локального минимума. Как и для всех градиентных методов, проблема локального минимума заключается в том, что при итерационном спуске может наступить момент, когда решение заходит в локальный минимум, из которого вследствие малой величины шага не может выбраться. И такой локальный минимум не всегда обеспечивает приемлемое решение. Выход заключается в применении стохастических методов.

2. Выбор архитектуры сети (количество нейронов, слоёв, характер связей). С этим также связана проблема переобучения, которая заключается в том, что сеть с избыточным числом элементов теряет обобщающую способность и хорошо работает только на тренировочной выборке. В настоящее время разработаны различные априорные оценки выбора архитектуры, методы прореживания обученных сетей, методы "растущих" сетей.

3. Выбор шага (скорости) обучения. Такая проблема связана с тем, что при малом шаге время обучения будет большим и сеть может застревать в локальных минимумах, а при больших шагах возможно расхождение процесса обучения или паралич сети. Проблема эффективно решается адаптивным шагом, который для каждой итерации позволяет сделать шаг, минимизирующий ошибку сети на данной итерации.

Существуют методы, которые на каждом тренировочном цикле (называемом эпохой) анализируют всю тренировочную выборку и выбирают оптимальное значение и направление шага. Одним из наиболее перспективных методов, применяемых на этапе обучения НС, является генетический алгоритм (ГА, по-английски Genetic Algorithm, GA), относящийся к эволюционным методам.

Генетический алгоритм представляет собой параллельный асинхронный оптимизационный метод. Поиск решения в нём осуществляется одновременно целой популяцией хромосом (хромосома - единичное закодированное решение задачи). Хромосомы могут как обмениваться опытом друг с другом, улучшая свою пригодность (оператор скрещивания), так и осваивать новые области решения (оператор мутации). Оптимизационный критерий задаёт функцию оценки пригодности хромосом, и процесс эволюции популяции представляет собой улучшение решения задачи. Главным преимуществом ГА является то, что при линейном увеличении размера популяции скорость поиска решения возрастает экспоненциально (так называемый скрытый параллелизм). Это позволяет достичь лучших субоптимальных решений.

Поскольку обучение сети - это оптимизационный процесс, генетический алгоритм естественным образом вкладывается в алгоритм обучения НС. При этом для ускорения ГА может быть введён оператор локального (градиентного) спуска, представляющий собой метод обратного распространения в применении к отдельной хромосоме, каждая из которых является самостоятельной нейронной сетью.

Закодировав в хромосому структуру сети и введя в оценочный критерий ГА штраф за избыточность архитектуры, можно добиться синтеза НС с минимально необходимой архитектурой, обладающей хорошими обобщающими способностями.

Применение многослойных нейронных сетей к распознаванию человека по изображению лица.

Простейшее применение однослойной НС (называемой автоассоциативной памятью) заключается в обучении сети восстанавливать подаваемые изображения. Подавая на вход неизвестное изображение и вычисляя качество реконструированного изображения, можно оценить, насколько сеть распознала входное изображение. Положительные свойства этого метода заключаются в том, что сеть может восстанавливать искажённые и зашумленные изображения, но для более серьёзных целей он не подходит.

МНС также используется для непосредственной классификации изображений - на вход подаётся или само изображение в каком-либо виде, или набор ранее извлечённых ключевых признаков изображения, на выходе нейрон с максимальной активностью указывает принадлежность к распознанному классу (см. рис.2). Если эта активность ниже некоторого порога, то считается, что поданный образ не относится ни к одному из известных классов. Процесс обучения устанавливает соответствие подаваемых на вход образов с принадлежностью к определённому классу. Это называется обучением с учителем. В данном проекте на тестовой базе ORL такой подход позволил достичь стабильной 93% - ной точности распознавания (98% -ной максимальной). В применении к распознаванию человека по изображению лица такой подход хорош для задач контроля доступа небольшой группы лиц. Он обеспечивает непосредственное сравнение сетью самих образов, но с увеличением числа классов время обучения и работы сети возрастает экспоненциально. Поэтому такие задачи, как поиск похожего человека в большой базе данных, требуют извлечения компактного набора ключевых характеристик, на основе которых можно производить поиск.

НС применяется также для извлечения ключевых характеристик изображения, которые затем используются для последующей классификации. Суть подобного метода - метода главных компонент заключается в получении максимально декореллированных коэффициентов, характеризующих входные образы. Такие коэффициенты называются главными компонентами и используются для статистического сжатия и реконструкции изображений. При этом небольшое число коэффициентов используется для представления всего образа. Каждое изображение разлагается на линейную комбинацию собственных векторов. Для набора изображений лиц собственные векторы могут быть представлены в виде изображений, такие изображения похожи на лица и называются собственными лицами (eigenfaces). Сумма собственных векторов, умноженных на соответствующие им главные компоненты, представляет собой реконструкцию изображения.

НС с одним скрытым слоем, содержащим m нейронов, число которых много меньше, чем размерность изображения m<<n, обученная по методу обратного распространения ошибки восстанавливать на выходе изображение, поданное на вход, формирует на выходе скрытых нейронов коэффициенты первых m главных компонент, которые и используются для сравнения изображений. Архитектура такой сети, называемой рециркуляционной нейронной сетью (РНС), показана на рис.4.

Обычно используется от 10 до 200 главных компонент. С увеличением номера компоненты её репрезентативность сильно понижается, и использовать компоненты с большими номерами не имеет смысла. Использование линейных активационных функций в НС позволяет получить на выходе скрытого слоя именно m первых главных компонент, аналогичных получаемым при решении матричных уравнений. При использовании нелинейных активационных функций нейронных элементов возможна нелинейная декомпозиция на главные компоненты. Нелинейность позволяет более точно отразить вариации входных данных, однако при этом выходы скрытых нейронов будут только похожи на главные компоненты. Веса, сформировавшиеся при таком обучении на входном и выходном слое, также будут похожи на собственные лица, которым присуще полезное свойство - существуют компоненты, которые в основном отражают такие существенные характеристики лица, как пол, раса, эмоции. Первые компоненты отражают наиболее общую форму лица, последние - различные мелкие отличия между лицами. Такой метод хорошо применим для поиска похожих изображений лиц в больших базах данных. Этот метод также используется в задаче обнаружения лица на изображении. Оценивая качество реконструкции входного изображения, можно очень точно определять его принадлежность к классу лиц. Для изображений, не являющихся лицами, реконструкция будет невысокого качества.

Преимущества применения РНС для извлечения главных компонент перед решением матричных уравнений:

· алгоритм обучения РНС прост и универсален;

· нелинейная активационная функция позволяет точнее реконструировать изображение;

· при решении матричных уравнений возможны проблемы, если примеры очень похожи друг на друга, РНС лишена такого недостатка;

· не требуется вычислять все собственные векторы. Таким образом, время обучения сети линейно зависит от количества извлекаемых главных компонент;

· для предварительных экспериментов можно использовать меньшее число обучающих циклов, что снижает время обучения.

Показана возможность дальнейшего уменьшения размерности главных компонент при помощи НС. Суть её заключается в использовании большего количества скрытых слоёв, отвечающих за сжатие и реконструкцию изображения. Такое сжатие позволяет уловить более сложные закономерности в наборе образов и, следовательно, представить их точнее и меньшим числом компонент.

2.2.2 Нейронные сети высокого порядка и моментные НС

Нейронные сети высокого порядка (НСВП, по английски High Order Neural Network) отличаются от МНС тем, что у них только один слой, но на входы нейронов поступают также члены высокого порядка, являющиеся произведением двух или более компонент входного вектора, например:

Такие сети также могут формировать сложные разделяющие поверхности.

Многослойные НС в общем случае эффективнее, но существует ряд приложений, в которых сети высокого порядка лучше, чем МНС.

2.2.3 Радиально-базисные нейронные сети

Радиально-базисные нейронные сети (РБНС, по английски Radial Basis Function Network, RBF) состоят из двух слоёв

Первый слой имеет радиально-базисную активационную функцию:

где у - среднеквадратичное отклонение, характеризующее ширину функции (размер кластера). S определяется как расстояние между входным и весовым вектором:

являющимся по сути расстоянием до центра кластера, определяемым конкретным нейроном. Таким образом, скрытый слой представляет собой набор кластеров в пространстве образов и выполняет первый этап кластеризации входного образа - значение активационной функции каждого нейрона быстро уменьшается с удалением от центра кластера. Второй слой нейронов имеет линейную активационную функцию и выполняет второй этап кластеризации - распределяет кластеры по классам.

РБНС также способна строить сложные разделяющие области и аппроксимировать многомерные функции. По сравнению с многослойной нейронной сетью, радиально-базисная сеть обучается на порядок быстрее, однако обладает намного худшей экстраполирующей способностью, т.е. не способна работать на образах, лежащих далеко от образов - примеров. Размеры РБСН больше, чем МНС для аналогичных задач, и РБНС становятся малоэффективны с ростом размерности входных данных.

Обучается такая сеть в два этапа. Первый этап осуществляется без учителя, на нём первый слой выделяет компактно расположенные группы кластеров. При этом корректируются центры кластеров. В настоящее время разработаны эффективные алгоритмы, позволяющие также подбирать оптимальный размер кластеров для каждого нейрона и получать оптимальное количество нейронов в первом слое. На втором этапе обучения второй слой учится распределять входные образы, пропущенные через первый слой, по классам. Информация об эталонных значениях выходов известна, обучение выполняется с учителем. Такое обучение производиться или матричными методами, или алгоритмом обратного распространения ошибки.

2.3 Распознавание с учётом топологии пространства

Обученная сеть способна топологически упорядоченно отображать входное пространство в выходное - векторы, близкие в исходном пространстве, будут иметь близкие координаты нейронов в решётке. Это является особенно полезным при классификации данных, имеющих большое количество классов. Например, при классификации локальных участков изображений может существовать очень большое число классов, в которых переход от одного класса к другому практически непрерывен, что затрудняет определение границ классов.

Описываемые далее типы нейронных сетей позволяют учесть топологию пространства изображения. Ведь изображение - это не просто n - мерный вектор, составленный из яркостей пикселей. Изображение имеет топологию, определяемую через двумерное локальное соседство пикселей. Принципы работы таких сетей основываются на разбиении изображения на маленькие участки и иерархическом сопоставлении как взаимного их расположения, так и содержания. Такие сети являются наиболее перспективными для распознавания изображений.

2.3.1 Когнитрон

Когнитрон был разработан на основе анатомии и физиологии мозга, и своей архитектурой похож на строение зрительной коры. Каждый слой мозга реализует различные уровни обобщения: входной слой чувствителен к простым образам, таким, как линии и их ориентации в определенных областях визуальной области, в то время как реакция других слоев является более сложной, абстрактной и независимой от позиции образа. Аналогичные функции реализованы в когнитроне путем моделирования организации зрительной коры.

Главные архитектурные отличия когнитрона заключаются в том (рис.7), что каждый нейрон связан только с небольшой локальной областью предыдущего слоя, и такие области перекрываются друг с другом.

Слоёв в когнитроне обычно больше, чем в сетях других типов. Таким образом достигается иерархическая организация, когда на высших слоях когнитрон реагирует на более абстрактные образы. При этом когнитрон меньше реагирует на смещение и искажение образов. Обучается когнитрон при помощи конкурентного обучения (без учителя).

2.3.2 Неокогнитрон

В зрительной коре были обнаружены узлы, реагирующие на такие элементы, как линии и углы определенной ориентации. На более высоких уровнях узлы реагируют на более сложные и абстрактные образы, такие, как окружности, треугольники и прямоугольники. На еще более высоких уровнях степень абстракции возрастает до тех пор, пока не определятся узлы, реагирующие на лица и сложные формы. В общем случае узлы на более высоких уровнях получают вход от группы низкоуровневых узлов и, следовательно, реагируют на более широкую область визуального поля. Реакции узлов более высокого уровня менее зависят от позиции и более устойчивы к искажениям.

Неокогнитрон является дальнейшим развитием идеи когнитрона и более точно моделирует строение зрительной системы, позволяет распознавать образы независимо от их преобразований: смещения, вращения, изменения масштаба и искажения. Неокогнитрон может как самообучаться, так и обучаться с учителем. Неокогнитрон получает на входе двумерные образы, аналогичные изображениям на сетчатой оболочке глаза и обрабатывает их в последующих слоях аналогично тому, как это было обнаружено в зрительной коре человека.

Главное отличие неокогнитрона от когнитрона - это двумерная организация локальных участков и плоскостная иерархическая структура (рис.8).

Каждый слой состоит из плоскостей простых и сложных клеток. Каждый нейрон простой плоскости связан с локальным двумерным участком плоскостей предыдущего слоя, веса всех нейронов в пределах одной плоскости одинаковы, и таким образом плоскость реагирует на определённый образ, находящийся в участке. Положение активированного таким образом нейрона в простой плоскости отмечает участок, в котором найден этот образ, независимо от его искажения. Нейрон сложной плоскости связан с участком своей простой плоскости, и обнаруживает активность нейронов на этом участке, уменьшая таким образом чувствительность к позиции образа.

Таким образом достигается иерархическая обработка изображения, когда на последующих слоях неокогнитрон реагирует на более общие черты изображения, не сбиваясь на искажения, сдвиг и т.д. Классический неокогнитрон является мощным средством распознавания изображений, однако требует высоких вычислительных затрат.

2.3.3 Свёрточные нейронные сети

В классической многослойной нейронной сети межслойные нейронные соединения полносвязны, и изображение представлено в виде n - мерного вектора, не учитывающего ни двумерную локальную организацию пикселей, ни возможности деформации. Архитектура свёрточной НС (рис.9) направлена на преодоление этих недостатков и основывается на принципах архитектуры неокогнитрона, упрощённого и дополненного обучением по алгоритму обратного распространения ошибки.

В ней использовались локальные рецепторные поля (обеспечивают локальную двумерную связность нейронов), общие веса (обеспечивают детектирование некоторых черт в любом месте изображения) и иерархическая организация с пространственными подвыборками (spatial subsampling).

Свёрточная НС (СНС, Convolutional Neural Network) обеспечивает частичную устойчивость изменениям масштаба, смещениям, поворотам, смене ракурса и прочим искажениям. Архитектура СНС состоит из многих слоёв. Слои бывают двух типов: свёрточные (Convolutional) и подвыборочные (Subsampling), свёрточные и подвыборочные слои чередуются друг с другом.

В каждом слое имеется набор из нескольких плоскостей, причём нейроны одной плоскости имеют одинаковые веса, ведущие ко всем локальным участкам предыдущего слоя (как в зрительной коре человека), изображение предыдущего слоя как бы сканируется небольшим окном и пропускается сквозь набор весов, а результат отображается на соответствующий нейрон текущего слоя. Таким образом набор плоскостей представляет собой карты характеристик (feature maps) и каждая плоскость находит "свои" участки изображения в любом месте предыдущего слоя.

Следующий за свёрточным слоем подвыборочный слой уменьшает масштаб плоскостей путём локального усреднения значений выходов нейронов. Таким образом, достигается иерархическая организация. Последующие слои извлекают более общие характеристики, меньше зависящие от искажений изображения.

Обучается СНС стандартным методом обратного распространения ошибки. Сравнение МНС и СНС показало существенные преимущества последней как по скорости, так и по надёжности классификации. Полезным свойством СНС является и то, что характеристики, формируемые на выходах верхних слоёв иерархии, могут быть применимы для классификации по методу ближайшего соседа (например, вычисляя Евклидово расстояние), причём СНС может успешно извлекать такие характеристики и для образов, отсутствующих в обучающем наборе. Для СНС характерны высокая скорость обучения и работы. Тестирование СНС на базе данных ORL, содержащей изображения лиц с небольшими изменениями освещения, масштаба, пространственных поворотов, положения и различными эмоциями, показало 98% -ную точность распознавания. Такой результат делает эту архитектуру перспективной для дальнейших разработок в области распознавания изображений трёхмерных объектов, в частности человеческих лиц.

3. Технологическая часть

3.1 Алгоритм

Вычисление выходов нейронной сети:

где tanh - функция гиперболического тангенса; k - текущий слой, возрастает от 0 до L; p - количество нейронов в предыдущем (k-1) слое; i - индекс нейрона в текущем слое; j - индекс нейрона в предыдущем слое; xi - пиксель входного изображения; yki - значения выходов слоя k и входные значения следующего слоя); wkij - вес, соединяющий нейроныjk-1 и ik; L - индекс последнего слоя (здесь L=2).

Был использован гиперболический тангенс в качестве активационной функции, он имеет выходной диапазон [-1; +1] и производную, которая легко вычисляется. Вследствие этого изображение должно иметь нулевое среднее значение и значения пикселей должны быть отображены в диапазон [-0.01; +0.01], который уменьшается с увеличением разрешения изображения.

Обученная сеть на выходе скрытого слоя выдаёт первые m главных компонент, являющихся сжатым представлением изображения. Поскольку сеть инициализируется случайными значениями, соответствия между номерами компонент и нейронами нет. Для реконструкции изображения на выход нейронов скрытого слоя подают сжатое представление нужного изображения и рассчитывают значения выходного слоя.

Для обучения сети применяется алгоритм коррекции весов, называемый обратным распространением ошибки. Для последнего слоя вычисляется ошибка (разница между выходными yki и эталонными ti значениями) и распространяется обратно по сети сквозь веса скрытых нейронов. Величина коррекции ошибки:

где k уменьшается от L до 1; q - число нейронов в слое k+1, для РНС эталоном является входное изображение

Затем корректируются веса:

где б (t) - скорость (шаг) обучения; t - номер обучающего цикла. Для классического обратного распространения скорость фиксирована. Существуют эвристические подходы, в которых скорость изменяется от большой вначале до маленькой в конце обучения.

В данном методе использован адаптивный шаг, который рассчитывается индивидуально для каждого слоя на каждой итерации для того, чтобы сделать лучший шаг в направлении минимизации среднеквадратичной ошибки сети:

где r - число нейронов в слое k. Следует принимать при

и при

Адаптивный шаг избавляет от необходимости выбирать шаг вручную. Обучающий процесс сходится сравнительно быстро и стабильно. Для простоты не использовалось раздельное обучение.

Перед обучением веса сети инициализируются небольшими случайными значениями [-0.01; +0.01]. Обучающий процесс состоит из последовательности обучающих циклов и завершается, когда их число превышает допустимое значение или ошибка нейронной сети становится меньше заданной.

На каждом обучающем цикле на сеть подаются изображения из обучающего набора в случайном порядке. После этого вычисляется ошибка сети и корректируются веса. В процессе обучения сеть учится сжимать и реконструировать изображение через небольшой набор нейронов скрытого слоя.

Весь вышеприведённый алгоритм может быть использован и для обучения обычного многослойного персептрона для многих других задач.

Для извлечения главных компонент использовалась рециркуляционная нейронная сеть (РНС). Затем с помощью евклидовой метрики вычислялось расстояние от неизвестного изображения ко всем изображениям в обучающей выборке. В качестве координат использовались глав-ные компоненты (выходы скрытых нейронов РНС). Изображение с наименьшим расстоянием считалось наиболее похожим. Кластеризационные методы не использовались, вместо этого вычислялось расстояние до всех изображений каждого человека.

3.2 Результаты

База ORL содержит 400 изображений: 40 человек по 10 изображений каждого. Для каждого эксперимента база делилась случайным образом на две части, обучающую и тестовую, по пять изображений одного человека в каждой части.

Для обучения сети и сравнения с неизвестным изображением использовалась одна и та же обучающая выборка.

Исследовались возможности распознавания на основе полученных главных компонент и возможности реконструкции изображения в зависимости от следующих факторов:

количества обучающих циклов;

различной случайной разбивки на тестовую и тренировочную части.

Полученные результаты можно охарактеризовать следующим образом. Ошибка реконструкции быстро уменьшается в течение первых 10-20 шагов и дальше практически не изменяется (рис.10). Ошибка распознавания имеет похожую тенденцию. Обе эти величины слегка колеблются вследствие случайного порядка обучающих образов.

Средняя точность распознавания составляет 92% и не зависит от выбранного разрешения изображения. Но с увеличением разрешения время обучения увеличивается пропорционально числу пикселей.

На рис.11 показано изменение главных компонент и реконструкции по ним с увеличением числа тренировочных циклов.

Точность распознавания зависит ещё и от того, какие изображения попадут в обучающую выборку при очередном случайном разделении. Если в обучающей выборке нет изображения лица при аналогичных условиях (ракурса, например), то система имеет тенденцию ошибаться

Таким образом, рециркуляционные нейронные сети представляют собой перспективный механизм извлечения главных компонент и реконструкции по ним. Время обучения зависит от количества компонент, а соотношение время/качество можно варьировать, изменяя число обучающих циклов.

Но для самостоятельного применения в системе распознавания по изображениям лиц исследованного алгоритма недостаточно. Его следует комбинировать с более надёжными методами классификации и использовать обучающий набор, содержащий вариации изображений, которые будут встречаться в процессе функционирования системы.

3.2.1 Архитектура и обучение

Как и в предыдущем эксперименте, число входов сети равнялось количеству пикселей входного изображения. Число выходов всегда соответствовало числу классов (человек) в базе ORL - 40. Эталонные выходы сети имели значение +1 для своего класса и - 1 для всех остальных. Таким образом, если на вход сети подается изображение человека, принадлежащего третьему классу, то третий нейрон в последнем слое учился выдавать "+1", а все остальные - "-1".

После ряда экспериментов с различными способами инициализации оптимальными были признаны начальные случайные веса в диапазоне [-0.01; +0.01]. Для изображения с разрешением 23x28 значения яркостей пикселей масштабируются в аналогичный диапазон. Диапазон значений яркостей уменьшался с увеличением разрешения изображения.

В качестве оптимальной архитектуры была экспериментально подобрана двухслойная нейронная сеть приблизительно с 25 нейронами в скрытом слое.

Из способов обучения рассматривались фиксированный и адаптивный шаг. Для каждого нового начального представления изображения или других параметров архитектуры приходилось тщательно подбирать вручную оптимальное значение фиксированного шага, что, однако, не гарантировало сходимости. Адаптивный шаг стабильно работал при любых параметрах архитектуры и начальном представлении, всегда достигая 100% -ной точности на обучающей выборке приблизительно за 100 тренировочных циклов. При этом все выходы последнего слоя были близки к идеальным (рис.15).

Распознавание на тестовой выборке показало точность при различном делении обучающей выборки и других изменениях параметров от 90 до 98%, в среднем 94%. Главным образом это зависит от качества обучающей выборки, т.е. от того, каким образом выборка будет случайно разделена на обучающие и тестовые изображения.

Изменения точности в ±1% также можно было получить, выполнив несколько дополнительных обучающих циклов. Так как выходы сети после обучения всегда очень близки к идеальным, это можно связать со случайными отклонениями, которые, вероятно, не могут быть исправлены алгоритмом обучения.

Для большинства тестовых изображений выходы сети имели вид, как на рис.16, что говорит о высоком качестве обучения и хороших различающих способностях многослойных персептронов.

Веса нейронов входного слоя, представленные в виде изображений, имеют чётко различимую форму, похожую на изображение лица. Это наглядно демонстрирует принцип работы многослойной НС - разбиение пространства изображений на области-классы. Каждое входное изображение внутри сети представляется в виде нелинейной комбинации таких "весов-изображений". Выходы нейронов первого слоя являются сжатым представлением каждого изображения, а сам первый слой осуществляет извлечение признаков - разложение исходного изображения на "веса-изображения". Таким образом, становятся наглядно понятны ограничения многослойных нейронных сетей (и всех остальных методов, разделяющих исходное пространство на области) при распознавании изображений. На каждую вариацию изображения (ориентация, масштаб, освещение, ракурс, очки, эмоции) должен существовать "вес-изображение", учитывающий эту вариацию. И чем больше различных классов и их вариаций, тем больше должно быть нейронов в скрытом слое и в обучающей выборке требуется большее число примеров, учитывающих различные вариации. На практике это трудновыполнимо. Выход заключается в применении МНС к участкам изображений и анализе их взаимного расположения. Лучше всего для этого подходят архитектуры свёрточных сетей и неокогнитрона.

...

Подобные документы

  • Теоретические основы сверточных нейронных сетей. Исследование зависимости качества работы сети от изменения различных характеристик. Сравнение результатов работы сетей типа многослойный персептрон в определении пола и возраста человека по фотографии лица.

    курсовая работа [2,5 M], добавлен 18.07.2014

  • Распознавание образов - задача идентификации объекта или определения его свойств по его изображению или аудиозаписи. История теоретических и технических изменений в данной области. Методы и принципы, применяемые в вычислительной технике для распознавания.

    реферат [413,6 K], добавлен 10.04.2010

  • Общие требования к изображению отрезка с помощью цифрового дифференциального анализатора. Сравнительный анализ обычного и несимметричного алгоритмов и алгоритма Брезенхема для генерации векторов (соединения двух точек изображения отрезком прямой).

    презентация [65,3 K], добавлен 14.08.2013

  • Обзор существующих алгоритмов для обнаружения лиц. Выравнивание лица с помощью разнообразных фильтров. Использование каскадного классификатора Хаара для поиска лиц на изображении. Распознавание лиц людей с использованием локальных бинарных шаблонов.

    дипломная работа [332,4 K], добавлен 30.09.2016

  • Создание программного средства, осуществляющего распознавание зрительных образов на базе искусственных нейронных сетей. Методы, использующиеся для распознавания образов. Пандемониум Селфриджа. Персептрон Розенблатта. Правило формирования цепного кода.

    дипломная работа [554,8 K], добавлен 06.04.2014

  • Понятие визуальной системы ввода информации, ее сущность и особенности, место и роль в современном развитии интерфейсов между человеком и компьютером. Развитие технологии автоматического обнаружения и распознавания лица, контуров губ в видеопотоке.

    научная работа [94,3 K], добавлен 29.01.2009

  • Обзор основных алгоритмов и методов распознавания лиц. Архитектура средств динамического отслеживания лиц в видеопоследовательности. Результаты тестирования на больших объемах видеоданных. Разработка алгоритмов и методов динамического отслеживания лиц.

    дипломная работа [5,9 M], добавлен 20.07.2014

  • Анализ существующих алгоритмов распознавания режимов работы газотурбинного двигателя. Метод группового учета аргументов, метод Байеса. Применение технологий системного моделирования на этапе проектирования интеллектуальной системы распознавания режимов.

    курсовая работа [1,4 M], добавлен 11.04.2012

  • Принципы и система распознавание образов. Программное средство и пользовательский интерфейс. Теория нейронных сетей. Тривиальный алгоритм распознавания. Нейронные сети высокого порядка. Подготовка и нормализация данных. Самоорганизующиеся сети Кохонена.

    курсовая работа [2,6 M], добавлен 29.04.2009

  • Метод извлечения информации о личностных характеристиках пользователя с помощью технологии распознавания лица. Разработка алгоритма работы рекомендательной системы, основанной на психологическом портрете пользователя, хранилища баз данных и интерфейса.

    курсовая работа [815,2 K], добавлен 21.09.2016

  • Методы распознавания образов (классификаторы): байесовский, линейный, метод потенциальных функций. Разработка программы распознавания человека по его фотографиям. Примеры работы классификаторов, экспериментальные результаты о точности работы методов.

    курсовая работа [2,7 M], добавлен 15.08.2011

  • Загрузка интерфейса изображением формата хранения растровых изображений BMP. Программа осуществления отражения изображения по вертикали и горизонтали. Применение к изображению черно-белого, сглаживающего, подчеркивания границ и медианного фильтров.

    лабораторная работа [713,6 K], добавлен 26.04.2015

  • Понятие процесса биометрической аутентификации. Технология и вероятность ошибок аутентификации по отпечатку пальца, радужной оболочке или по сетчатке глаза, по геометрии руки и лица человека, по термограмме лица, по голосу, по рукописному почерку.

    презентация [1,2 M], добавлен 03.05.2014

  • Биометрические системы защиты от несанкционированного доступа к информации. Система идентификации личности по папиллярному рисунку на пальцах, голосу, радужной оболочке, геометрии лица, сетчатке глаза человека, рисунку вен руки. Пароли на компьютере.

    презентация [395,2 K], добавлен 28.05.2012

  • Исследование эффективности применения нейронных сетей в рамках отношений между людьми. Принцип работы с нейросимулятором. Составление обучающей выборки и проектирование персептронов. Анализ выбора супружеской пары с использованием нейросетевых технологий.

    презентация [150,8 K], добавлен 19.08.2013

  • Специфические особенности распознавания лиц. Взаимодействие компьютер - человек. Создание новой нейросистемы, разработанной в программе разработчиков Borland Delphi, которая будет состоять из поля захвата изображения и дальнейшим обучением нейросети.

    презентация [212,5 K], добавлен 14.08.2013

  • Анализ применения нейронных сетей для прогнозирования ситуации и принятия решений на фондовом рынке с помощью программного пакета моделирования нейронных сетей Trajan 3.0. Преобразование первичных данных, таблиц. Эргономическая оценка программы.

    дипломная работа [3,8 M], добавлен 27.06.2011

  • Первое систематическое изучение искусственных нейронных сетей. Описание элементарного перцептрона. Программная реализация модели распознавания графических образов на основе перцептрона. Интерфейс программы, основные окна. Составление алгоритма приложения.

    реферат [100,5 K], добавлен 18.01.2014

  • Искусственные нейронные сети как одна из широко известных и используемых моделей машинного обучения. Знакомство с особенностями разработки системы распознавания изображений на основе аппарата искусственных нейронных сетей. Анализ типов машинного обучения.

    дипломная работа [1,8 M], добавлен 08.02.2017

  • Построение векторной модели нейронной сети. Проектирование и разработка поискового механизма, реализующего поиск в полнотекстовой базе данных средствами нейронных сетей Кохонена с применением модифицированного алгоритма расширяющегося нейронного газа.

    курсовая работа [949,0 K], добавлен 18.07.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.