Разработка прототипа настольной автоматизированной программы, реализующей распознавание изображений пыльцевых зерен с помощью комбинаций функций OpenCV и метода голосования
Устранение шумовых помех методом Гауссова сглаживания как один из основных этапов предварительной обработки изображения. Требования, предъявляемые к пользовательскому интерфейсу программного приложения. Математическая модель задачи распознавания.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 30.06.2017 |
Размер файла | 2,6 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
nTN=TN / Nn * 100%, (12)
nTP=TP / Np * 100%. (13)
Данные величины наглядно отражают вероятность верного распознавания, так как не зависят в явном виде от количества объектов в тестовой выборке.
Также рассчитаем меру точности (precision) и меру отзыва (recall). Мера точности измеряет долю верных обнаружений среди всех обнаруженных объектов. Мера отзыва измеряет долю верного распознавания среди всех объектов интересующего нас класса и совпадает с nTP.
Precision=TP / (TP+FP) * 100%, (14)
Recall=TP / (TP+FN) * 100%. (15)
Проведем 2 эксперимента для одного набора данных. В первом случае оценим производительность распознавания методом голосования без опорных множеств на 12 начальных признаках (см. табл 2.1). Во втором случае оценим производительность метода с учетом опорного множества, которое определим с помощью корреляционного анализа. Были получены следующие результаты корреляции (См. табл. 3.3).
Исходя из полученных результатов было решено исключить 2 признака эксцентриситет (E) и Rmax/Rmin. Остальные признаки были сформированы в опорные множества по два признака в каждом следующим образом:
1. Область (A) и диаметр (D).
2. Периметр (Р) и компактность (С).
3. Максимальный радиус (Rmax) и средний радиус (Rср).
4. Минимальный радиус (Rmin) и отношение между Rmin и Rd (Rmin/Rd).
5. Дисперсия радиуса (Rd) и отношение между Rmax и Rd (Rmax/Rd).
Результаты тестирования для первого эксперимента распознавания методом голосования без опорных множеств на 12 начальных признаках по приведенным формулам представлены в табл. 3.4.
Результаты тестирования для второго экспериментов распознавания методом голосования на опорном множестве по приведенным формулам представлены в табл. 3.5.
Можно сделать вывод, что формирование признаков в опорные множества для метода голосования показывает более высокие результаты. В среднем доля по количеству ошибок первого рода составляет 12%. Средняя доля правильно распознаваемых изображений составляет 88%.
Таблица 3.3. Корреляционный анализ признаков
Class |
A |
P |
D |
Rmax |
Rmin |
Rcp |
Rd |
Rmax/Rmin |
Rmax/Rd |
Rmin/Rd |
C |
||
Class |
1,00 |
||||||||||||
A |
0,38 |
1,00 |
|||||||||||
P |
0,22 |
0,13 |
1,00 |
||||||||||
D |
0,34 |
0,93 |
0,09 |
1,00 |
|||||||||
Rmax |
0,26 |
0,82 |
0,35 |
0,77 |
1,00 |
||||||||
Rmin |
0,16 |
0,76 |
-0,20 |
0,71 |
0,62 |
1,00 |
|||||||
Rcp |
0,32 |
0,93 |
0,16 |
0,88 |
0,91 |
0,82 |
1,00 |
||||||
Rd |
0,10 |
-0,11 |
0,55 |
-0,14 |
0,14 |
-0,60 |
-0,15 |
1,00 |
|||||
Rmax/Rmin |
0,05 |
-0,31 |
0,47 |
-0,32 |
-0,12 |
-0,78 |
-0,39 |
0,91 |
1,00 |
||||
Rmax/Rd |
-0,13 |
-0,42 |
0,31 |
-0,48 |
-0,14 |
-0,65 |
-0,51 |
0,62 |
0,67 |
1,00 |
|||
Rmin/Rd |
-0,09 |
0,31 |
-0,51 |
0,29 |
0,11 |
0,82 |
0,35 |
-0,86 |
-0,93 |
-0,58 |
1,00 |
||
C |
0,18 |
0,01 |
0,98 |
-0,02 |
0,21 |
-0,28 |
0,02 |
0,54 |
0,48 |
0,37 |
-0,51 |
1,00 |
|
E |
0,00 |
-0,30 |
-0,22 |
-0,40 |
-0,58 |
-0,36 |
-0,57 |
-0,05 |
0,15 |
0,43 |
-0,07 |
-0,11 |
Таблица 3.4. Оценка качества работы распознавания для 1 эксперимента
Alder |
Birch |
Hazel |
Mugwort |
Sweet Grass |
Весь набор данных |
||
Количество зерен |
12 |
12 |
12 |
12 |
12 |
60 |
|
Ошибка 1 рода (ложный пропуск, FN) |
1 |
2 |
3 |
1 |
1 |
8 |
|
Ошибка 2 рода (ложное обнаружение, FP) |
1 |
0 |
1 |
2 |
2 |
6 |
|
Количество «положительных» (Np) |
8 |
8 |
8 |
8 |
8 |
40 |
|
Количество «отрицательных» (Nn) |
4 |
4 |
4 |
4 |
4 |
20 |
|
Количество верных пропусков (TN) |
3 |
4 |
3 |
2 |
2 |
14 |
|
Количество верных обнаружений (TP) |
7 |
6 |
5 |
7 |
7 |
32 |
|
Нормированный уровень ошибок первого рода (nFN) |
13% |
25% |
38% |
13% |
13% |
20% |
|
Нормированный уровень ошибок второго рода (nFP) |
25% |
0% |
25% |
50% |
50% |
30% |
|
Доля верно распознаваемых пропусков (nTN) |
75% |
100% |
75% |
50% |
50% |
70% |
|
Доля верно распознаваемых обнаружений (nTP) |
88% |
75% |
63% |
88% |
88% |
80% |
|
Precision |
88% |
100% |
83% |
78% |
78% |
84% |
|
Recall |
88% |
75% |
63% |
88% |
88% |
80% |
Таблица 3.5. Оценка качества работы распознавания для 2 эксперимента
Alder |
Birch |
Hazel |
Mugwort |
Sweet Grass |
Весь набор данных |
||
Количество зерен |
12 |
12 |
12 |
12 |
12 |
60 |
|
Ошибка 1 рода (ложный пропуск, FN) |
0 |
2 |
2 |
1 |
0 |
5 |
|
Ошибка 2 рода (ложное обнаружение, FP) |
1 |
0 |
1 |
2 |
0 |
4 |
|
Количество «положительных» (Np) |
8 |
8 |
8 |
8 |
8 |
40 |
|
Количество «отрицательных» (Nn) |
4 |
4 |
4 |
4 |
4 |
20 |
|
Количество верных пропусков (TN) |
3 |
4 |
3 |
2 |
4 |
16 |
|
Количество верных обнаружений (TP) |
8 |
6 |
6 |
7 |
8 |
35 |
|
Нормированный уровень ошибок первого рода (nFN) |
0% |
25% |
25% |
13% |
0% |
12% |
|
Нормированный уровень ошибок второго рода (nFP) |
25% |
0% |
25% |
50% |
0% |
20% |
|
Доля верно распознаваемых пропусков (nTN) |
75% |
100% |
75% |
50% |
100% |
80% |
|
Доля верно распознаваемых обнаружений (nTP) |
100% |
75% |
75% |
88% |
100% |
88% |
|
Precision |
89% |
100% |
86% |
78% |
100% |
90% |
|
Recall |
100% |
75% |
75% |
88% |
100% |
88% |
В данной главе описаны механизмы реализации системы: предобработка изображения, вычисления значений признаков и классификация объектов. Рассмотрены работа функций библиотеки компьютерного зрения OpenCV, производящих предварительную обработку изображений и вычисление некоторых значений признаков, а также работа метода голосования. Из всех имеющихся функций по обработке изображений для программы были выбраны в основном самые эффективные.
На этапе предобработки изображений на изображениях верно детектируются контуры 100% пыльцевых зерен.
На обучение на 120 изображениях уходит в среднем от 1,9 до 2 секунд.
На распознавание 10 изображений примерно 1 секунда.
Распознавание методом голосования показывает результаты выше среднего. В среднем, верно распознаются 88% пыльцевых зерен. Доля ошибок второго рода составляет 20%, доля ошибок первого рода - 12%.
Подавляющее большинство случаев неправильной классификации приходится на пыльцевые зерна имеющие схожую форму и размер.
Заключение
В работе проведено исследование возможности распознавания пыльцевых зерен методом голосования на фотографиях, сделанных под микроскопом, с целью их классификации.
В ходе работы были выполнены задачи, описанные ниже.
Анализ предметной области. Была описана предметная область - палинология, предмет изучения палинологии пыльцевые зерна и этапы их анализа. Были выделены наиболее важные таксономические признаки пыльцевых зерен, такие как форма, размер, цвет, апертуры и строение экзины и интины. Также в ходе анализа была сформулирована постановка задачи, которая заключалась в разработке программы классификатора для распознавания пыльцевых зерен. Описаны основные автоматизируемые бизнес процессы: распознавание пыльцевых зерен и формирование результатов распознавания. Сформулированы требования к системе и обоснована необходимость создания системы. А также проведен обзор наиболее значимых решений для распознавания пыльцевых зерен таких авторов как Н.Е. Ханжина и Е.Б. Замятина, M. Chica., C. Riley, F. Chung, R. Rendondo и V. Marcos.
Формализация описания решения задачи и проектирование системы. Описано решение основных этапов для распознавания пыльцевых зерен: предобработка изображения и классификация сегментированных пыльцевых зерен. Предобработка включает: устранение шумовых помех на изображении, пороговое преобразование, сегментацию контуров и вычисление значений признаков найденных пыльцевых зерен. Классификация содержит описание задачи распознавания методом голосования. При проектировании системы построены диаграммы прецедентов, деятельности, классов и архитектуры системы. А также спроектирован пользовательский интерфейс системы.
Реализация программной системы. В данной части работы описаны используемые инструменты, методы и данные; выполнен процесс реализации системы, тестирование системы, анализ результатов и оценка производительности распознавания методом голосования.
Предварительная обработка изображения велась с использованием функций библиотеки компьютерного зрения OpenCV. Были изучены и применены возможности OpenCV по удалению шумов на изображении и бинаризации. Подробно рассмотрены алгоритмы сегментации получения контуров и вычисления значений признаков. К результатам предобработки был применен метод голосования.
Такой подход дает следующие результаты: в среднем доля ошибок первого рода составляет 12%, второго рода - 20%. Соответственно, верно распознается около 88% пыльцевых зерен.
Подавляющее большинство случаев неправильной классификации приходится на пыльцевые зерна имеющие схожую форму и размер.
Одним из важных преимуществ применяемых методов является скорость обработки изображений -- она довольна высокая. В среднем требуется около 2 секунд на обучение на 120 изображениях и около 1 секунды на распознавание 10 изображений.
Итогом выпускной квалификационной работы стала настольная автоматизированная программа, реализующая распознавание изображений пыльцевых зерен с помощью комбинации функций OpenCV и метода голосования.
Литература
1. Вайнцвайг М.Н. Алгоритм обучения распознаванию образов «кора» // Алгоритмы обучения распознаванию образов. Под ред. В.Н. Вапник. -- М.: Советское радио, 1973. -- С. 110-116.
2. Журавлёв Ю.И., Никифоров В. В. Алгоритмы распознавания, основанные на вычислении оценок // Кибернетика. -- 1971. -- № 3.
3. Журавлёв Ю.И. Непараметрические задачи распознавания образов // Кибернетика. -- 1976. -- № 6.
4. Журавлёв Ю.И. Об алгебраическом подходе к решению задач распознавания или классификации // Проблемы кибернетики. -- 1978. -- Т. 33. -- С. 5-68.
5. Павлидис Т. Алгоритмы машинной графики и обработки изображений. Пер. С англ. М.: Радио и связь, 1986.
6. Полякова М.П., Вайнцвайг М.Н. Об использовании метода «голосования» признаков в алгоритмах распознавания // Моделирование обучения и поведения. -- М., 1975. -- С. 25-28.
7. Рязанов В.В., Сенько О.В. О некоторых моделях голосования и методах их оптимизации // Распознавание, классификация, прогноз. -- 1990. -- Т. 3. -- С. 106-145.
8. Сладков А.Н. Введение в спорово-пыльцевой анализ. -- М.: 1967.
9. Форсайт Д., Понс Ж. Компьютерное зрение. Современный подход -- М.: «Вильямс», 2004.
10. Ханжина Н.Е., Замятина Е.Б. Автоматизированное распознавание пыльцевых зерен с использованием нейронных сетей Хэмминга // Методы компьютерной диагностики в биологии и медицине. Материалы Всерос. школы-семинара - Саратов: Изд-во Саратовский источник, 2014. С. 137-140.
Размещено на Allbest.ru
...Подобные документы
Фильтрация шумов изображения. Алгоритмы его бинаризации и поворота. Формирование информативных признаков для распознавания нот. Схема программного обеспечения. Описание классов, функций, методов, реализованных в программе. Тестирование приложения.
курсовая работа [2,0 M], добавлен 17.12.2013Метод главных компонент. Процесс распознавания. Ковариационная матрица, диагональная матрица собственных чисел. Использовании метрики Махаланобиса и Гауссовского распределения для оценки близости изображений. Входные вектора. Библиотека OpenCV.
статья [22,1 K], добавлен 29.09.2008Диаграмма прецедентов взаимодействия игрока и программного продукта. Требования к пользовательскому интерфейсу. Диаграмма состояний проектируемого приложения. Выбор инструментальных средств разработки. Проектирование алгоритмов и иерархии классов.
дипломная работа [9,9 M], добавлен 20.03.2017Теоретические основы распознавания образов. Функциональная схема системы распознавания. Применение байесовских методов при решении задачи распознавания образов. Байесовская сегментация изображений. Модель TAN при решении задачи классификации образов.
дипломная работа [1019,9 K], добавлен 13.10.2017Требования к пользовательскому интерфейсу программного продукта. Выбор инструментальных средств разработки программы. Описание функциональной схемы, модульной структуры, структурной схемы. Технология разработки справочной системы программного продукта.
дипломная работа [2,7 M], добавлен 12.05.2016Разработка приложения, целью которого ставится преобразование черно-белых полутоновых изображений в цветные. Обзор методики обработки изображения, способов преобразования изображения с помощью нейронной сети. Описания кластеризации цветового пространства.
дипломная работа [6,3 M], добавлен 17.06.2012Этапы разработки программного приложения, выполняющего синтаксический анализ программы на языке С и форматирование текста программы на языке С. Требования к программному обеспечению и интерфейсу. Конфигурация технических средств и оценка надежности.
курсовая работа [1,6 M], добавлен 22.06.2011Задачи цифровой обработки изображений. Методы пороговой сегментации. Создание программы представления рисунка в виде матрицы и применения к нему пороговой обработки. Разработка интерфейса программы загрузки и фильтрации изображения с выбранным порогом.
курсовая работа [2,0 M], добавлен 12.11.2012Создание программного средства, осуществляющего распознавание зрительных образов на базе искусственных нейронных сетей. Методы, использующиеся для распознавания образов. Пандемониум Селфриджа. Персептрон Розенблатта. Правило формирования цепного кода.
дипломная работа [554,8 K], добавлен 06.04.2014Оптическое распознавание символов как механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов. Компьютерные программы для оптического распознавания символов и их характеристика.
презентация [855,2 K], добавлен 20.12.2011Оптико-электронная система идентификации объектов подвижного состава железнодорожного транспорта. Автоматический комплекс распознавания автомобильных номеров. Принципы и этапы работы систем оптического распознавания. Особенности реализации алгоритмов.
дипломная работа [887,3 K], добавлен 26.11.2013Разработка приложения, которое будет выполнять функции показа точного времени и точной даты. Определение дополнительных функций разработанного приложения. Рассмотрение основных этапов создания программного продукта. Результаты тестирования приложения.
курсовая работа [2,2 M], добавлен 14.04.2019Исследование основных требований к пользовательскому интерфейсу. Краткая характеристика используемой операционной системы Windows 7 и языка программирования. Особенность создания удобного управления в игре. Главные требования к аппаратному обеспечению.
курсовая работа [453,0 K], добавлен 02.06.2017Задача пространственно-временной обработки изображений при наличии шумов и помех. Методы оптимизации при пространственно-временной обработке изображений. Структура специализированной программы, описание ее пользовательского интерфейса. Смета затрат.
дипломная работа [957,2 K], добавлен 10.06.2013Обзор математических методов распознавания. Общая архитектура программы преобразования автомобильного номерного знака. Детальное описание алгоритмов: бинаризация изображения, удаление обрамления, сегментация символов и распознавание шаблонным методом.
курсовая работа [4,8 M], добавлен 22.06.2011OpenCV – библиотека компьютерного зрения с открытым исходным кодом, предоставляющая набор типов данных, функций и численных алгоритмов для обработки изображений. Ее реализация на C/C++. Цели использования технологии. Основные модули библиотек 1-3.
презентация [121,8 K], добавлен 14.12.2013Разработка программного продукта "Автоматизация учета правонарушений в УВД Миноблисполкома". Требования к аппаратному обеспечению и конфигурации, пользовательскому интерфейсу. Принципы инсталляции программного средства, порядок проведения его испытаний.
дипломная работа [1,1 M], добавлен 09.09.2010Анализ основных аспектов технологии компьютерного зрения, необходимых для выполнения работы. Изучение характеристик библиотеки OpenCV, оценка актуальности работы по распознаванию жестов рук. Поэтапный отчет о работе над программным обеспечением.
курсовая работа [669,9 K], добавлен 20.05.2017Необходимость в системах распознавания символов. Виды сканеров и их характеристики. Оптимальное разрешение при сканировании. Программы распознавания текста. Получение электронного документа. FineReader - система оптического распознавания текстов.
презентация [469,2 K], добавлен 15.03.2015Методы распознавания образов (классификаторы): байесовский, линейный, метод потенциальных функций. Разработка программы распознавания человека по его фотографиям. Примеры работы классификаторов, экспериментальные результаты о точности работы методов.
курсовая работа [2,7 M], добавлен 15.08.2011