Разработка прототипа настольной автоматизированной программы, реализующей распознавание изображений пыльцевых зерен с помощью комбинаций функций OpenCV и метода голосования

Устранение шумовых помех методом Гауссова сглаживания как один из основных этапов предварительной обработки изображения. Требования, предъявляемые к пользовательскому интерфейсу программного приложения. Математическая модель задачи распознавания.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 30.06.2017
Размер файла 2,6 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

nTN=TN / Nn * 100%, (12)

nTP=TP / Np * 100%. (13)

Данные величины наглядно отражают вероятность верного распознавания, так как не зависят в явном виде от количества объектов в тестовой выборке.

Также рассчитаем меру точности (precision) и меру отзыва (recall). Мера точности измеряет долю верных обнаружений среди всех обнаруженных объектов. Мера отзыва измеряет долю верного распознавания среди всех объектов интересующего нас класса и совпадает с nTP.

Precision=TP / (TP+FP) * 100%, (14)

Recall=TP / (TP+FN) * 100%. (15)

Проведем 2 эксперимента для одного набора данных. В первом случае оценим производительность распознавания методом голосования без опорных множеств на 12 начальных признаках (см. табл 2.1). Во втором случае оценим производительность метода с учетом опорного множества, которое определим с помощью корреляционного анализа. Были получены следующие результаты корреляции (См. табл. 3.3).

Исходя из полученных результатов было решено исключить 2 признака эксцентриситет (E) и Rmax/Rmin. Остальные признаки были сформированы в опорные множества по два признака в каждом следующим образом:

1. Область (A) и диаметр (D).

2. Периметр (Р) и компактность (С).

3. Максимальный радиус (Rmax) и средний радиус (Rср).

4. Минимальный радиус (Rmin) и отношение между Rmin и Rd (Rmin/Rd).

5. Дисперсия радиуса (Rd) и отношение между Rmax и Rd (Rmax/Rd).

Результаты тестирования для первого эксперимента распознавания методом голосования без опорных множеств на 12 начальных признаках по приведенным формулам представлены в табл. 3.4.

Результаты тестирования для второго экспериментов распознавания методом голосования на опорном множестве по приведенным формулам представлены в табл. 3.5.

Можно сделать вывод, что формирование признаков в опорные множества для метода голосования показывает более высокие результаты. В среднем доля по количеству ошибок первого рода составляет 12%. Средняя доля правильно распознаваемых изображений составляет 88%.

Таблица 3.3. Корреляционный анализ признаков

Class

A

P

D

Rmax

Rmin

Rcp

Rd

Rmax/Rmin

Rmax/Rd

Rmin/Rd

C

Class

1,00

A

0,38

1,00

P

0,22

0,13

1,00

D

0,34

0,93

0,09

1,00

Rmax

0,26

0,82

0,35

0,77

1,00

Rmin

0,16

0,76

-0,20

0,71

0,62

1,00

Rcp

0,32

0,93

0,16

0,88

0,91

0,82

1,00

Rd

0,10

-0,11

0,55

-0,14

0,14

-0,60

-0,15

1,00

Rmax/Rmin

0,05

-0,31

0,47

-0,32

-0,12

-0,78

-0,39

0,91

1,00

Rmax/Rd

-0,13

-0,42

0,31

-0,48

-0,14

-0,65

-0,51

0,62

0,67

1,00

Rmin/Rd

-0,09

0,31

-0,51

0,29

0,11

0,82

0,35

-0,86

-0,93

-0,58

1,00

C

0,18

0,01

0,98

-0,02

0,21

-0,28

0,02

0,54

0,48

0,37

-0,51

1,00

E

0,00

-0,30

-0,22

-0,40

-0,58

-0,36

-0,57

-0,05

0,15

0,43

-0,07

-0,11

Таблица 3.4. Оценка качества работы распознавания для 1 эксперимента

Alder

Birch

Hazel

Mugwort

Sweet Grass

Весь набор данных

Количество зерен

12

12

12

12

12

60

Ошибка 1 рода (ложный пропуск, FN)

1

2

3

1

1

8

Ошибка 2 рода (ложное обнаружение, FP)

1

0

1

2

2

6

Количество «положительных» (Np)

8

8

8

8

8

40

Количество «отрицательных» (Nn)

4

4

4

4

4

20

Количество верных пропусков (TN)

3

4

3

2

2

14

Количество верных обнаружений (TP)

7

6

5

7

7

32

Нормированный уровень ошибок первого рода (nFN)

13%

25%

38%

13%

13%

20%

Нормированный уровень ошибок второго рода (nFP)

25%

0%

25%

50%

50%

30%

Доля верно распознаваемых пропусков (nTN)

75%

100%

75%

50%

50%

70%

Доля верно распознаваемых обнаружений (nTP)

88%

75%

63%

88%

88%

80%

Precision

88%

100%

83%

78%

78%

84%

Recall

88%

75%

63%

88%

88%

80%

Таблица 3.5. Оценка качества работы распознавания для 2 эксперимента

Alder

Birch

Hazel

Mugwort

Sweet Grass

Весь набор данных

Количество зерен

12

12

12

12

12

60

Ошибка 1 рода (ложный пропуск, FN)

0

2

2

1

0

5

Ошибка 2 рода (ложное обнаружение, FP)

1

0

1

2

0

4

Количество «положительных» (Np)

8

8

8

8

8

40

Количество «отрицательных» (Nn)

4

4

4

4

4

20

Количество верных пропусков (TN)

3

4

3

2

4

16

Количество верных обнаружений (TP)

8

6

6

7

8

35

Нормированный уровень ошибок первого рода (nFN)

0%

25%

25%

13%

0%

12%

Нормированный уровень ошибок второго рода (nFP)

25%

0%

25%

50%

0%

20%

Доля верно распознаваемых пропусков (nTN)

75%

100%

75%

50%

100%

80%

Доля верно распознаваемых обнаружений (nTP)

100%

75%

75%

88%

100%

88%

Precision

89%

100%

86%

78%

100%

90%

Recall

100%

75%

75%

88%

100%

88%

В данной главе описаны механизмы реализации системы: предобработка изображения, вычисления значений признаков и классификация объектов. Рассмотрены работа функций библиотеки компьютерного зрения OpenCV, производящих предварительную обработку изображений и вычисление некоторых значений признаков, а также работа метода голосования. Из всех имеющихся функций по обработке изображений для программы были выбраны в основном самые эффективные.

На этапе предобработки изображений на изображениях верно детектируются контуры 100% пыльцевых зерен.

На обучение на 120 изображениях уходит в среднем от 1,9 до 2 секунд.

На распознавание 10 изображений примерно 1 секунда.

Распознавание методом голосования показывает результаты выше среднего. В среднем, верно распознаются 88% пыльцевых зерен. Доля ошибок второго рода составляет 20%, доля ошибок первого рода - 12%.

Подавляющее большинство случаев неправильной классификации приходится на пыльцевые зерна имеющие схожую форму и размер.

Заключение

В работе проведено исследование возможности распознавания пыльцевых зерен методом голосования на фотографиях, сделанных под микроскопом, с целью их классификации.

В ходе работы были выполнены задачи, описанные ниже.

Анализ предметной области. Была описана предметная область - палинология, предмет изучения палинологии пыльцевые зерна и этапы их анализа. Были выделены наиболее важные таксономические признаки пыльцевых зерен, такие как форма, размер, цвет, апертуры и строение экзины и интины. Также в ходе анализа была сформулирована постановка задачи, которая заключалась в разработке программы классификатора для распознавания пыльцевых зерен. Описаны основные автоматизируемые бизнес процессы: распознавание пыльцевых зерен и формирование результатов распознавания. Сформулированы требования к системе и обоснована необходимость создания системы. А также проведен обзор наиболее значимых решений для распознавания пыльцевых зерен таких авторов как Н.Е. Ханжина и Е.Б. Замятина, M. Chica., C. Riley, F. Chung, R. Rendondo и V. Marcos.

Формализация описания решения задачи и проектирование системы. Описано решение основных этапов для распознавания пыльцевых зерен: предобработка изображения и классификация сегментированных пыльцевых зерен. Предобработка включает: устранение шумовых помех на изображении, пороговое преобразование, сегментацию контуров и вычисление значений признаков найденных пыльцевых зерен. Классификация содержит описание задачи распознавания методом голосования. При проектировании системы построены диаграммы прецедентов, деятельности, классов и архитектуры системы. А также спроектирован пользовательский интерфейс системы.

Реализация программной системы. В данной части работы описаны используемые инструменты, методы и данные; выполнен процесс реализации системы, тестирование системы, анализ результатов и оценка производительности распознавания методом голосования.

Предварительная обработка изображения велась с использованием функций библиотеки компьютерного зрения OpenCV. Были изучены и применены возможности OpenCV по удалению шумов на изображении и бинаризации. Подробно рассмотрены алгоритмы сегментации получения контуров и вычисления значений признаков. К результатам предобработки был применен метод голосования.

Такой подход дает следующие результаты: в среднем доля ошибок первого рода составляет 12%, второго рода - 20%. Соответственно, верно распознается около 88% пыльцевых зерен.

Подавляющее большинство случаев неправильной классификации приходится на пыльцевые зерна имеющие схожую форму и размер.

Одним из важных преимуществ применяемых методов является скорость обработки изображений -- она довольна высокая. В среднем требуется около 2 секунд на обучение на 120 изображениях и около 1 секунды на распознавание 10 изображений.

Итогом выпускной квалификационной работы стала настольная автоматизированная программа, реализующая распознавание изображений пыльцевых зерен с помощью комбинации функций OpenCV и метода голосования.

Литература

1. Вайнцвайг М.Н. Алгоритм обучения распознаванию образов «кора» // Алгоритмы обучения распознаванию образов. Под ред. В.Н. Вапник. -- М.: Советское радио, 1973. -- С. 110-116.

2. Журавлёв Ю.И., Никифоров В. В. Алгоритмы распознавания, основанные на вычислении оценок // Кибернетика. -- 1971. -- № 3.

3. Журавлёв Ю.И. Непараметрические задачи распознавания образов // Кибернетика. -- 1976. -- № 6.

4. Журавлёв Ю.И. Об алгебраическом подходе к решению задач распознавания или классификации // Проблемы кибернетики. -- 1978. -- Т. 33. -- С. 5-68.

5. Павлидис Т. Алгоритмы машинной графики и обработки изображений. Пер. С англ. М.: Радио и связь, 1986.

6. Полякова М.П., Вайнцвайг М.Н. Об использовании метода «голосования» признаков в алгоритмах распознавания // Моделирование обучения и поведения. -- М., 1975. -- С. 25-28.

7. Рязанов В.В., Сенько О.В. О некоторых моделях голосования и методах их оптимизации // Распознавание, классификация, прогноз. -- 1990. -- Т. 3. -- С. 106-145.

8. Сладков А.Н. Введение в спорово-пыльцевой анализ. -- М.: 1967.

9. Форсайт Д., Понс Ж. Компьютерное зрение. Современный подход -- М.: «Вильямс», 2004.

10. Ханжина Н.Е., Замятина Е.Б. Автоматизированное распознавание пыльцевых зерен с использованием нейронных сетей Хэмминга // Методы компьютерной диагностики в биологии и медицине. Материалы Всерос. школы-семинара - Саратов: Изд-во Саратовский источник, 2014. С. 137-140.

Размещено на Allbest.ru

...

Подобные документы

  • Фильтрация шумов изображения. Алгоритмы его бинаризации и поворота. Формирование информативных признаков для распознавания нот. Схема программного обеспечения. Описание классов, функций, методов, реализованных в программе. Тестирование приложения.

    курсовая работа [2,0 M], добавлен 17.12.2013

  • Метод главных компонент. Процесс распознавания. Ковариационная матрица, диагональная матрица собственных чисел. Использовании метрики Махаланобиса и Гауссовского распределения для оценки близости изображений. Входные вектора. Библиотека OpenCV.

    статья [22,1 K], добавлен 29.09.2008

  • Диаграмма прецедентов взаимодействия игрока и программного продукта. Требования к пользовательскому интерфейсу. Диаграмма состояний проектируемого приложения. Выбор инструментальных средств разработки. Проектирование алгоритмов и иерархии классов.

    дипломная работа [9,9 M], добавлен 20.03.2017

  • Теоретические основы распознавания образов. Функциональная схема системы распознавания. Применение байесовских методов при решении задачи распознавания образов. Байесовская сегментация изображений. Модель TAN при решении задачи классификации образов.

    дипломная работа [1019,9 K], добавлен 13.10.2017

  • Требования к пользовательскому интерфейсу программного продукта. Выбор инструментальных средств разработки программы. Описание функциональной схемы, модульной структуры, структурной схемы. Технология разработки справочной системы программного продукта.

    дипломная работа [2,7 M], добавлен 12.05.2016

  • Разработка приложения, целью которого ставится преобразование черно-белых полутоновых изображений в цветные. Обзор методики обработки изображения, способов преобразования изображения с помощью нейронной сети. Описания кластеризации цветового пространства.

    дипломная работа [6,3 M], добавлен 17.06.2012

  • Этапы разработки программного приложения, выполняющего синтаксический анализ программы на языке С и форматирование текста программы на языке С. Требования к программному обеспечению и интерфейсу. Конфигурация технических средств и оценка надежности.

    курсовая работа [1,6 M], добавлен 22.06.2011

  • Задачи цифровой обработки изображений. Методы пороговой сегментации. Создание программы представления рисунка в виде матрицы и применения к нему пороговой обработки. Разработка интерфейса программы загрузки и фильтрации изображения с выбранным порогом.

    курсовая работа [2,0 M], добавлен 12.11.2012

  • Создание программного средства, осуществляющего распознавание зрительных образов на базе искусственных нейронных сетей. Методы, использующиеся для распознавания образов. Пандемониум Селфриджа. Персептрон Розенблатта. Правило формирования цепного кода.

    дипломная работа [554,8 K], добавлен 06.04.2014

  • Оптическое распознавание символов как механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов. Компьютерные программы для оптического распознавания символов и их характеристика.

    презентация [855,2 K], добавлен 20.12.2011

  • Оптико-электронная система идентификации объектов подвижного состава железнодорожного транспорта. Автоматический комплекс распознавания автомобильных номеров. Принципы и этапы работы систем оптического распознавания. Особенности реализации алгоритмов.

    дипломная работа [887,3 K], добавлен 26.11.2013

  • Разработка приложения, которое будет выполнять функции показа точного времени и точной даты. Определение дополнительных функций разработанного приложения. Рассмотрение основных этапов создания программного продукта. Результаты тестирования приложения.

    курсовая работа [2,2 M], добавлен 14.04.2019

  • Исследование основных требований к пользовательскому интерфейсу. Краткая характеристика используемой операционной системы Windows 7 и языка программирования. Особенность создания удобного управления в игре. Главные требования к аппаратному обеспечению.

    курсовая работа [453,0 K], добавлен 02.06.2017

  • Задача пространственно-временной обработки изображений при наличии шумов и помех. Методы оптимизации при пространственно-временной обработке изображений. Структура специализированной программы, описание ее пользовательского интерфейса. Смета затрат.

    дипломная работа [957,2 K], добавлен 10.06.2013

  • Обзор математических методов распознавания. Общая архитектура программы преобразования автомобильного номерного знака. Детальное описание алгоритмов: бинаризация изображения, удаление обрамления, сегментация символов и распознавание шаблонным методом.

    курсовая работа [4,8 M], добавлен 22.06.2011

  • OpenCV – библиотека компьютерного зрения с открытым исходным кодом, предоставляющая набор типов данных, функций и численных алгоритмов для обработки изображений. Ее реализация на C/C++. Цели использования технологии. Основные модули библиотек 1-3.

    презентация [121,8 K], добавлен 14.12.2013

  • Разработка программного продукта "Автоматизация учета правонарушений в УВД Миноблисполкома". Требования к аппаратному обеспечению и конфигурации, пользовательскому интерфейсу. Принципы инсталляции программного средства, порядок проведения его испытаний.

    дипломная работа [1,1 M], добавлен 09.09.2010

  • Анализ основных аспектов технологии компьютерного зрения, необходимых для выполнения работы. Изучение характеристик библиотеки OpenCV, оценка актуальности работы по распознаванию жестов рук. Поэтапный отчет о работе над программным обеспечением.

    курсовая работа [669,9 K], добавлен 20.05.2017

  • Необходимость в системах распознавания символов. Виды сканеров и их характеристики. Оптимальное разрешение при сканировании. Программы распознавания текста. Получение электронного документа. FineReader - система оптического распознавания текстов.

    презентация [469,2 K], добавлен 15.03.2015

  • Методы распознавания образов (классификаторы): байесовский, линейный, метод потенциальных функций. Разработка программы распознавания человека по его фотографиям. Примеры работы классификаторов, экспериментальные результаты о точности работы методов.

    курсовая работа [2,7 M], добавлен 15.08.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.