Розробка способу автоматичного моделювання бінарних зображень, які сформовані відрізками прямих
Процес моделювання бінарних зображень сканованих документів, що пройшли попередню обробку. Стан проблеми проектування підсистем розпізнавання. Спосіб, алгоритми і програма автоматичного моделювання бінарних зображень, сформованих відрізками прямих.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | автореферат |
Язык | украинский |
Дата добавления | 26.09.2015 |
Размер файла | 245,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ДОНЕЦЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ
Автореферат
Розробка способу автоматичного моделювання бінарних зображень, які сформовані відрізками прямих
Спеціальність 05.13.06 - Інформаційні технології
Вайсруб Наталя Володимирівна
Донецьк - 2009
Дисертацією є рукопис.
Робота виконана в Донецькому національному університеті Міністерства освіти і науки України на кафедрі прикладної математики і теорії систем управління.
Науковий керівник: доктор технічних наук, професор
Мишко Сергій Васильович
Донецький національний університет Міністерства освіти і науки України
завідувач кафедри прикладної математики і теорії систем управління
(м. Донецьк).
Офіційні опоненти: доктор технічних наук, професор
Соколова Надія Андріївна
Херсонський національний технічний університет Міністерства освіти і науки України, завідувач кафедри економічної кібернетики (м. Херсон);
доктор технічних наук, професор
Філатов Валентин Олександрович
Харківський національний університет радіоелектроніки Міністерства освіти і науки України, професор кафедри штучного інтелекту (м. Харків).
ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ
Актуальність теми. Системи електронного документообігу (СЕД) є важливим елементом організації фінансового, конструкторського і управлінського обліку на підприємствах. Потреба швидкої обробки щомісячних потоків вхідної і вихідної документації, акумуляція колосальних об'ємів паперових документів, необхідність підвищення надійності зберігання і передачі документів зумовили актуальність застосування інформаційних технологій для автоматизованої обробки інформації в системі документообігу підприємства.
Первинною проблемою автоматизації зберігання і обробки документів є введення інформації в електронний архів, тобто переведення документів з паперового виду в електронний. Дана процедура на практиці здійснюється шляхом ручного введення або сканування і розпізнавання графічної інформації. При цьому розпізнавання вмісту документів дозволяє використовувати інструменти повнотекстового пошуку і створення нових документів на основі тих, що існують.
Методи обробки зображень документів, що використовуються на даний час при проектуванні і впровадженні СЕД, засновані на принципах розпізнавання образів. Основними методами моделювання зображень є методи, що передбачають кількісний опис характеристик об'єктів (виділення характерних ознак), структурні (синтаксичні) методи, а також різні їх комбінації із застосуванням інструментарію теорії ймовірності і статистики, нейронних мереж, нечіткої логіки і генетичних алгоритмів. При цьому застосовуються різні методи передобробки для зменшення шумів, підвищення якості зображень, а також їхнього утоншення і скелетизації. В роботі розглядається клас бінарних зображень, які в результаті здійснення процедур передобробки представлені множиною відрізків прямих.
Проблемі проектування систем розпізнавання присвячені численні роботи таких провідних вчених, як Гонсалес Р., Лі К., Форсайт Д.А., Фу К., Хорн Б.К.П., Глушков В.М., Журавльов Ю.І., Сойфер В.О., Шлезінгер М.І. Проте ефективність існуючих систем розпізнавання зображень не завжди задовольняє сучасним вимогам, що обумовлено, зокрема, відсутністю спільного уніфікованого підходу до здійснення основних етапів розпізнавання. Актуальною залишається задача генерації підходу до обробки зображень, що допускає їхнє автоматичне моделювання і розпізнавання.
Таким чином, актуальними є дослідження, направлені на розробку способу автоматичного моделювання бінарних зображень з метою їх розпізнавання, за умови, що в результаті проведення процедур передобробки зображення представлене множиною відрізків прямих.
Зв'язок роботи з науковими програмами, планами, темами. Робота велася згідно з планом НДР кафедри прикладної математики і теорії систем управління математичного факультету Донецького національного університету.
Мета роботи і задачі дослідження. Метою дослідження даної роботи є підвищення ефективності роботи систем електронного документообігу шляхом розробки способу автоматичного моделювання бінарних зображень, сформованих відрізками прямих. Для досягнення мети в роботі вирішуються наступні основні задачі:
- дослідити сучасний стан проблеми проектування підсистем розпізнавання, що входять до контуру СЕД;
- розробити основні теоретичні положення способу автоматичного моделювання бінарних зображень, сформованих відрізками прямих;
- розробити математичні моделі бінарних зображень, сформованих відрізками прямих;
- розробити спосіб, алгоритми і програму автоматичного моделювання і розпізнавання бінарних зображень, сформованих відрізками прямих;
- провести апробацію системи автоматичного моделювання і розпізнавання, а також експертний аналіз вірогідності отриманих результатів.
Об'єктом дослідження є процес моделювання бінарних зображень сканованих документів, що пройшли попередню обробку і підлягають автоматизованому розпізнаванню в системах електронного документообігу.
Предмет дослідження - методи і алгоритми моделювання бінарних зображень.
Методи дослідження. При вирішенні поставлених задач в дисертаційній роботі використані методи математичного моделювання, теорії розпізнавання образів, автоматичного аналізу складних зображень, теорії інформації і кодування, сучасні методи програмування.
Наукова новизна отриманих результатів.
1. Вперше розроблена математична модель бінарного зображення, сформованого відрізками прямих, на основі нових понять множин і міри невизначеності, яка відрізняється від існуючих можливістю автоматичного формування моделі довільного зображення. Вказані множини і міра невизначеності допускають їхнє вживання для класифікації об'єктів довільної природи за значеннями деякої вимірної характеристики.
2. Вперше розроблені основні теоретичні положення способу автоматичного моделювання бінарних зображень, сформованих відрізками прямих, на основі валідної моделі зображення, що дозволяє використовувати автоматично сформовані валідні моделі зображень для розпізнавання.
3. Отримала подальший розвиток методика моделювання, що заснована на кількісному описі характеристик бінарних зображень, сформованих відрізками прямих, за рахунок використання способу автоматичного моделювання зображень.
4. Вдосконалено підхід до розпізнавання бінарних зображень, сформованих відрізками прямих, за рахунок використання валідної моделі зображення, яка генерується автоматично.
Практичне значення роботи.
1. Впровадження алгоритмів реалізації розробленого способу автоматичного моделювання і розпізнавання бінарних зображень, сформованих відрізками прямих, в СЕД, за рахунок автоматизації процесів моделювання зображень документів, дозволяє збільшити об'єм і якість оброблюваної документації, а також зменшити вплив людського чинника.
2. Використання розробленого способу автоматичного моделювання для розпізнавання бінарних зображень, сформованих відрізками прямих, дозволяє підвищити якість розпізнавання в середньому на 16,1% в порівнянні з існуючими аналогічними розпізнавальними системами.
3. Розроблений спосіб моделювання дозволив підвищити якість автоматизованого розпізнавання конструкторської, фінансової і технічної документації в СЕД ЗАТ «ДОНЕЦЬКСТАЛЬ» - МЕТАЛУРГІЙНИЙ ЗАВОД».
4. Впровадження алгоритмів моделювання і розпізнавання електронних копій документів в інформаційну систему страхової компанії «СПІЧ і К» дозволило підвищити швидкість і якість автоматизованої обробки документації.
5. Результати дисертаційної роботи використані в навчальному процесі в курсах «Узнавання і розпізнавання при проектуванні інтелектуальних робототехнічних систем», «Автоматичне моделювання бінарних зображень», а також в курсовому і дипломному проектуванні студентів спеціальностей «Прикладна математика» і «Інформатика» Донецького національного університету.
Особистий вклад пошукача. Всі основні ідеї, положення, теоретичні і практичні результати дисертаційної роботи, що виносяться на захист, отримані автором самостійно. У [1, 9] авторові належить визначення множин невизначеності, а також вивчення їхніх метричних властивостей; у [2, 8] досліджено бінарне зображення, сформоване відрізками прямих, введена семантична модель зображення; у [3, 7] - формалізована ознака валідності моделі, розроблений спосіб генерації зображень по моделі; у [4] - програмна реалізація і тестування способів і алгоритмів; у [6, 10] - визначення і формалізація властивостей підшляхів найкоротших шляхів.
Апробація результатів дисертації. Результати дисертаційної роботи доповідалися, обговорювалися і схвалені на наступних семінарах і конференціях: наукових семінарах кафедри прикладної математики і теорії систем управління Донецького національного університету (2005-2008 рр.); VIII Міжнародній конференції «Контроль і управління в складних системах» (Вінницький національний технічний університет, м. Вінниця, 2006 р.); VIII і IX Міжнародних науково-практичних конференціях «Сучасні інформаційні і електронні технології» (Одеський національний політехнічний університет, м. Одеса, 2007, 2008 рр.); науковій конференції професорсько-викладацького складу Донецького національного університету за підсумками науково-дослідної роботи за період 2007-2008 рр. (Донецький національний університет, м. Донецьк, 2009 р.); на розширеному науковому семінарі кафедри прикладної математики і теорії систем управління Донецького національного університету (м. Донецьк, 2009 р.); XI науково-практичній міжнародній конференції «Інформаційні технології в освіті та управлінні» (м. Нова Каховка, 2009 р.).
Публікації. По темі дисертації опубліковано 10 наукових робіт, з них 5 - в провідних спеціальних виданнях, що входять в перелік ВАК України.
Структура і обсяг дисертації. Дисертація складається із введення, чотирьох розділів, висновків, списку використаних літературних джерел з 127 найменувань, 7 додатків. Робота містить 67 малюнків, 2 таблиці. Загальний обсяг роботи складає 181 сторінку, з них 145 - основного тексту.
ОСНОВНИЙ ВМІСТ РОБОТИ
У введенні обґрунтована актуальність проблеми автоматичного моделювання бінарних зображень. Сформульовані мета і основні задачі дослідження, визначені методи дослідження, наведена загальна характеристика і структура дисертації, обґрунтована наукова новизна і практична значимість проведених досліджень.
Перший розділ «Сучасний стан проблеми автоматизованої обробки зображень в системах електронного документообігу. Постановка задачі дослідження» присвячений опису проблематики розробки СЕД, огляду існуючих систем розпізнавання зображень, що використовуються при проектуванні і впровадженні СЕД, а також аналізу сучасного стану проблеми автоматичного моделювання зображень при розпізнаванні документів в СЕД.
Описані сучасні технології проектування СЕД, особлива увага приділена використанню інформаційних технологій при розробці підсистем розпізнавання електронних копій документів.
Проведено огляд і аналіз ефективності функціонування існуючих систем розпізнавання зображень. Алгоритми обробки і розпізнавання сканованих документів базуються на методах розпізнавання зорових образів. При цьому, на думку багатьох дослідників, підвищенню ефективності розпізнавання зображень сприяє попереднє здійснення їхньої скелетизації, що особливо актуально при обробці сканованого рукописного тексту. Результатом скелетизації образу документа, залежно від вживаних алгоритмів, у багатьох випадках є бінарне зображення, сформоване відрізками прямих. Зображення даного класу розглядаються в роботі як об'єкт моделювання.
З метою визначення практичної значимості існуючих систем розпізнавання проведено ряд експериментів по розпізнаванню бінарних зображень, сформованих відрізками прямих, які відповідають текстам, складеним з цифр, букв російського і англійського алфавітів, розділових знаків і знаків спеціального виду. Тестовий приклад наведено на рис. 1.
Размещено на http://www.allbest.ru/
а) б)
Рис. 1. Початкове зображення (а), зображення, що результує скелетизацію і пред'явлене для розпізнавання (б)
Результати експериментів показали, що доля вірно розпізнаних символів не перевищує 69,5 % для 50 зображень. Приклад результатів розпізнавання зображення, наведеного на рис. 1, б), представлений на рис. 2.
Размещено на http://www.allbest.ru/
а) б)
Рис. 2. Результат розпізнавання тестового зображення системою CuneiForm v12 Master (а) і системою FineReader Professional 9.0 (б)
З метою встановлення причин помилок систем розпізнавання, в роботі проведений критичний аналіз сучасних підходів до моделювання і розпізнавання зображень, який дозволив обґрунтувати перспективні напрями досліджень в галузі автоматизації моделювання зображень з метою їх розпізнавання в СЕД.
Виявлено особливості постановки задачі розпізнавання і методів її вирішення, що істотно впливають на якість розпізнавання. Обґрунтовано, що для підвищення якості роботи систем розпізнавання необхідно розробити альтернативний підхід до розпізнавання, який передбачає автоматичне моделювання і класифікацію зображень. Даний факт зумовив необхідність розробки способу автоматичного моделювання бінарних зображень, сформованих відрізками прямих.
Проведені міркування дозволили сформулювати постановку задачі дисертаційної роботи у вигляді послідовності задач дослідження і обґрунтувати її актуальність з точки зору підвищення ефективності автоматизованої обробки документів в СЕД.
У другому розділі «Множини невизначеності для автоматичного моделювання бінарних зображень» проведено дослідження бінарних зображень, сформованих відрізками прямих. Представлені основні теоретичні положення про множини невизначеності, що розроблені з метою автоматизації генерації моделей бінарних зображень, сформованих відрізками прямих, і оцінки коректності моделей.
В результаті аналізу об'єкта моделювання введено визначення знака як впорядкованої зв'язної множини відрізків прямих , заданих в одній декартовій системі координат, де , - відрізки, що складають знак, - їхня кількість. Виявлено основні характеристики відрізків прямих, що формують знак, які доцільно враховувати при моделюванні: кількість відрізків; довжина відрізків; кут нахилу відрізків до горизонталі; взаємне розташування відрізків знаку.
Для обліку взаємного розташування відрізків введені поняття індикативної матриці перетинань і матриці відносних перетинань .
Знаку , що підлягає моделюванню, ставиться у відповідність множина значень його характеристик, яка називається представленням знаку:
де , - значення довжини і кута нахилу відрізку відповідно; ; , , - елементи матриці відносних перетинань відрізків знаку, що характеризують взаємне розташування -го і -го -го відрізків знаку . На рис. 3 наведений приклад знаку і його представлення.
Размещено на http://www.allbest.ru/
а) б)
Рис. 3. Знак , заданий в декартовій системі координат (а); індикативна матриця перетинань , матриця відносних перетинань і представлення знаку (б)
Виявлення основних характеристик відрізків зображення, які доцільно враховувати при моделюванні, зумовило задачу класифікації відрізків знаку за значеннями їхніх вказаних характеристик з метою подальшого формування моделі. Для вирішення цієї задачі введено поняття множин невизначеності , приклади яких представлені на рис. 4. Згідно введеним в роботі позначенням, значення індексу називається рівнем невизначеності.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Рис. 4. Множини невизначеності для
Множини невизначеності використані для введення відношення еквівалентності , яке дозволило визначити подібність елементів універсуму : об'єкти , , де , - індексна множина, називаються подібними на -тому рівні невизначеності, , за характеристикою на множині , якщо .
На рис. 5 наведений приклад встановлення подібності квадратів за розміром для рівня невизначеності .
Рис. 5. Приклад класифікації об'єктів: об'єкти, що підлягають класифікації (а); множини невизначеності рівня , побудовані для даних об'єктів (б); класи і подібних за розміром об'єктів (в)
Введення множин невизначеності дозволяє здійснювати класифікацію об'єктів довільного універсуму за значеннями деякої їхньої вимірної характеристики, що дає можливість застосовувати множини невизначеності для вирішення поставленої в дисертації задачі з розробки способу автоматичного моделювання бінарних зображень.
З метою вивчення властивостей множин невизначеності, введено поняття міри невизначеності як міри множин невизначеності, значення якої дорівнює довжині відповідних кінцевих інтервалів (напівінтервалів) числової вісі: , , .
Обґрунтовано, що значення міри невизначеності характеризує варіативність значень характеристики , за якої елемент універсуму може належати одній з підмножин фактор-множини . При цьому, якщо для значення належить одній з множин невизначеності при фіксованому , то моделювання значення можливо здійснювати будь-яким числом з даної множини невизначеності.
Доведено твердження про властивості множин і міри невизначеності, які обґрунтовують, що:
1) подібність об'єктів на -тому рівні невизначеності при означає тотожний збіг значень даної характеристики подібних об'єктів;
2) моделювання характеристик об'єктів можливо здійснювати з будь-яким наскільки завгодно малим значенням міри невизначеності.
Проведені міркування підтвердили доцільність використання множин невизначеності для розробки способу автоматичного моделювання бінарних зображень, сформованих відрізками прямих.
При моделюванні кожної характеристики відрізків знаку (довжини, кута нахилу, взаємного розташування) на рівні невизначеності задається відповідна множина можливих значень , формуються множин невизначеності з метою встановлення порядкових номерів множин невизначеності, яким належать значення даної характеристики кожного відрізку. Відповідно до проведених міркувань, при моделюванні довжини відрізків знаку , де , (рис. 6); при моделюванні кута нахилу відрізків знаку (рис. 7); при моделюванні взаємного розташування (рис. 8).
бінарний зображення розпізнавання сканований
Размещено на http://www.allbest.ru/
Рис. 6. Множини невизначеності для моделювання довжини відрізків
Размещено на http://www.allbest.ru/
а) б)
Рис. 7. Геометрична інтерпретація множин невизначеності для моделюванні кутів нахилу відрізків: (а), (б)
Размещено на http://www.allbest.ru/
Рис. 8. Моделювання взаємного розташування відрізків для рівня невизначеності
Використання множин невизначеності дозволило розробити модель бінарного зображення, сформованого відрізками прямих, яка включає в себе номери множин невизначеності, що містять значення характеристик відрізків зображення, яке моделюється. Моделлю знаку рівнів невизначеності називається множина = , де - кількість відрізків, що складають знак ; , , - рівні невизначеності при моделюванні довжини, кута нахилу і взаємного розташування відрізків відповідно; , , - множини, такі, що - номер відповідної множини невизначеності рівня , якому належить чисельне значення довжини відрізку , ; - номер відповідної множини невизначеності рівня , якому належить чисельне значення кута нахилу відрізку , ; - номер відповідної множини невизначеності рівня , якому належить чисельне значення характеристики відносного положення точки перетину відрізку з відрізком відносно відрізку , (якщо відрізки і не перетинаються, то ).
На рис. 9 наведений приклад знаку, що підлягає моделюванню, і його модель для рівнів невизначеності .
Размещено на http://www.allbest.ru/
а) б)
Рис. 9. Приклад знаку, що підлягає моделюванню (а); модель знаку для (б)
Запропоноване визначення моделі знаку дозволяє здійснювати генерацію нових знаків за моделлю. На рис. 10 представлені приклади знаків, що згенеровано за моделлю .
Размещено на http://www.allbest.ru/
Рис. 10. Приклади знаків, що згенеровано за моделлю
Введення моделі довільного знаку для заданого рівня невизначеності, а також аналіз знаків, що генеруються по моделі, зумовили проблему критеріальної оцінки якості моделі знаку, яка розглянута в роботі з точки зору однойменності знаків, що генеруються за моделлю, з початковим. Формалізація якості моделі знаку виражена в понятті валідної моделі.
Нехай Z - множина всіх знаків, що генеруються за моделлю знаку . Модель знаку називається валідною, якщо для будь-якого знаку Z виконується рівність , для всіх , що записується у вигляді .
Множина знаків Z, що генеруються за моделлю , необмежена, що обумовлює проблематичність перевірки валідності моделі в загальному випадку. Позначимо - множина всіх знаків, що генеруються для комбінацій значень характеристик відрізків, які визначаються граничними точками відповідних множин невизначеності. У роботі обґрунтована наступна ознака валідності моделі.
Ознака валідності. Модель знаку є валідною, якщо для будь-якого , , де , справедливо: .
Доведено твердження про існування для довільного заданого знаку мінімального рівня невизначеності, при якому його модель є валідною. Здійснена формалізація і обґрунтування ознаки валідності, а також доведені твердження допускають автоматизацію генерації валідної моделі для довільного знаку.
Сформульовані в розділі 2 результати складають основу для розробки способу автоматичного моделювання бінарних зображень, сформованих зв'язною множиною відрізків прямих.
Третій розділ «Спосіб автоматичного моделювання знаків бінарних зображень, сформованих відрізками прямих» присвячений розробці шуканого способу автоматичного моделювання бінарних зображень, сформованих відрізками прямих, а також розгляду використання автоматичного моделювання для вирішення задачі розпізнавання бінарних зображень, сформованих відрізками прямих.
На рис. 11 представлена схема послідовності етапів способу автоматичного моделювання знаків. У роботі описані функції, що реалізуються на кожному з етапів моделювання.
Размещено на http://www.allbest.ru/
Рис. 11. Схема послідовності етапів, що реалізують спосіб автоматичного моделювання знаків
Розроблений спосіб моделювання знаків передбачає можливість його автоматизації. При цьому результуюча валідна модель виду вимагає трактування на природній мові. Для інтерпретації чисельних значень складових валідної моделі знаку на природній мові (етап 5) введено семантичну модель знаку, що формується на основі запропонованих правил іменування величин характеристик відрізків знаку як висловів про належність чисельних значень вказаних характеристик відповідній множині невизначеності.
Проведена в розділі 3 деталізація етапів і алгоритмів розробленого способу автоматичного моделювання знаків підтверджує можливість автоматичної генерації валідної моделі заданого знаку. Обґрунтовано, що модель, яка генерується автоматично, дозволяє формувати за моделлю знаки, однойменні з початковим, що допускає використання розробленого способу моделювання при вирішенні задачі розпізнавання зображень.
У подальших міркуваннях під розпізнаванням за валідними моделями розуміється віднесення зображення до одного з класів, що формуються в автоматичному режимі, шляхом аналізу валідної моделі даного зображення, яка також генерується автоматично.
Нехай системою автоматичного моделювання згенеровано валідних моделей , , , різних знаків, експертно поіменованих іменами . Кожне ім'я , , визначає відповідний клас однойменних знаків, заданий моделлю .
Мета системи розпізнавання знаків полягає в тому, щоб на основі автоматично згенерованої моделі знаку визначити ім'я , , яким слід іменувати знак , або, в разі неможливості іменування знаку одним з імен , визначити нове ім'я , що визначає клас однойменних знаків , заданий валідною моделлю . Процедура іменування знаку здійснюється шляхом порівняння моделі даного знаку і моделі , що задає клас , , для чого в роботі введені визначення еквівалентності моделей і належності знаку деякому класу.
Проведені міркування дозволили розробити спосіб автоматизованого розпізнавання знаків, заснований на способі автоматичного моделювання. Даний спосіб розпізнавання може бути ефективно використаний при проектуванні підсистем розпізнавання зображень документів в СЕД.
Деталізація функцій етапів способів автоматичного моделювання і розпізнавання знаків за валідними моделями дозволила здійснити їхню програмну реалізацію з використанням середовища візуальної розробки доданків Visual Studio, мови програмування C++ і бібліотеки елементів інтерфейсу wxWidgets.
Четвертий розділ «Проектування системи автоматичного моделювання бінарних зображень, сформованих відрізками прямих» присвячений опису алгоритмів і програмної реалізації системи автоматичного моделювання і розпізнавання знаків, а також аналізу експериментальної апробації створеної системи.
Оскільки програмне забезпечення розроблялося з дослідницькою метою, реалізовано функції, які відображують всі проміжні етапи моделювання і розпізнавання, зокрема, формування моделі введеного зображення для заданого рівня невизначеності, генерацію зображень за моделлю, перевірку валідності моделі довільного рівня, генерацію валідної моделі введеного зображення.
На рис. 14 представлений приклад результату автоматичного формування валідної моделі для заданого знаку , на рис. 15 - приклади знаків, що згенеровано за моделлю . Експертний аналіз однойменності початкових знаків і відповідних знаків, які згенеровані за валідною моделлю, підтвердив, що в 100% випадків з 200 здійснених експериментів початкові знаки і відповідні множини згенерованих знаків можливо іменувати одним ім'ям.
Размещено на http://www.allbest.ru/
Рис. 14. Приклад роботи системи автоматичного моделювання і розпізнавання знаків: початковий знак (а), його валідна модель (б)
Размещено на http://www.allbest.ru/
Рис. 15. Приклад роботи системи автоматичного моделювання і розпізнавання: знаки, які згенеровані за моделлю
Проведені експерименти зумовили розробку адаптивного способу моделювання знаків, що допускає корегування експертом валідної моделі, яка автоматично згенерована, в інтерактивному режимі, що забезпечується додаванням етапів експертної оцінки коректності автоматично створеної моделі знаку і корегування моделі.
З метою аналізу доцільності використання розробленого способу розпізнавання знаків за валідними моделями при проектуванні підсистем розпізнавання в СЕД, було проведено 50 експериментів з розпізнавання зображень, аналогічних наведеним на рис. 1, б). Приклад результатів розпізнавання представлений на рис. 16. Достовірність розпізнавання розробленої системи складає 85,6%, що в середньому на 16,1% перевищує найкращий результат розпізнавання серед сучасних аналогічних систем.
Размещено на http://www.allbest.ru/
Рис. 16. Приклад функціонування розробленої системи ModelMaker: зображення, пред'явлене для розпізнавання (а), результат розпізнавання(б)
Отримані показники розпізнавання свідчать про перевагу розробленої системи в порівнянні з існуючими аналогами, за умови, що розпізнаванню підлягають бінарні зображення, які результують скелетизацію і представлені множинами відрізків прямих.
Проведений детальний аналіз помилок системи автоматизованого розпізнавання показав, що незадовільна робота системи у ряді випадків обумовлена конструктивними особливостями сучасної електронно-обчислювальної техніки, яка використовується при програмній реалізації системи.
Результати експериментальної апробації підтверджують достовірність розроблених теоретичних положень, свідчать про практичну значимість розроблених способу автоматичного моделювання і способу розпізнавання за валідними моделями, а також дозволяють сформулювати такі перспективні напрями досліджень, як модернізація способів автоматичного моделювання і розпізнавання з метою підвищення якості функціонування СЕД; розробка способів і методів автоматизованої обробки бінарних зображень, заданих дискретними відрізками прямих на множині атомарних елементів.
ВИСНОВКИ
У дисертації запропоновано рішення актуальної науково-практичної задачі моделювання бінарних зображень, сформованих відрізками прямих, при автоматизованій обробці зображень документів в системі електронного документообігу.
Основні результати дисертаційної роботи зводяться до наступного.
1. Досліджено сучасні принципи реалізації основних етапів автоматизованої обробки документації в СЕД, проаналізовано результати функціонування підсистем розпізнавання сканованих зображень документів, заснованих на класичних методах розпізнавання, що дозволило визначити способи підвищення ефективності функціонування підсистем розпізнавання, включених до контуру СЕД. Обґрунтовано необхідність розробки альтернативного підходу до моделювання зображень з метою підвищення ефективності функціонування СЕД.
2. Проведено аналіз бінарного зображення, сформованого зв'язною множиною відрізків прямих, який дозволив ввести визначення знаку зображення і виявити характеристики, значення яких доцільно використовувати при моделюванні знаку.
3. З метою розробки основних теоретичних положень способу автоматичного моделювання бінарних зображень, сформованих відрізками прямих, визначено множини і міру невизначеності, досліджено властивості введених об'єктів і розглянуто методологічні аспекти їхнього використання при моделюванні знаків.
4. Запропоновано математичну модель знаку бінарного зображення, сформованого відрізками прямих, що дозволило формалізувати поняття валідної моделі і обґрунтувати ознаку валідності моделі для автоматичного формування такої моделі заданого знаку, яка допускає генерацію знаків, однойменних з початковим.
5. Розроблено спосіб, алгоритми і програму автоматичного моделювання знаків бінарних зображень, сформованих відрізками прямих. Проведено апробацію програмної реалізації розробленого способу моделювання і експертну оцінку результатів моделювання, які підтвердили достовірність валідних моделей, що генеруються автоматично.
6. Для надання можливості опціонального корегування експертом валідної моделі знаку в інтерактивному режимі, розроблено адаптивний спосіб автоматичного моделювання знаків бінарних зображень, сформованих відрізками прямих.
7. Запропоновано здійснювати розпізнавання знаків за валідними моделями. Розроблено спосіб, алгоритми і програму автоматизованого розпізнавання знаків бінарних зображень, сформованих відрізками прямих. Проведено апробацію програмної реалізації і виконано аналіз функціонування розробленої системи, які свідчать про те, що запропоновані алгоритми дозволили підвищити якість розпізнавання в середньому на 16,1% в порівнянні з існуючими аналогічними системами.
8. Проведена експериментальна апробація способів моделювання і розпізнавання знаків виявила протиріччя між дискретністю модельованих знаків бінарних зображень, сформованих відрізками прямих, і об'єктами усюди щільних множин, які використовуються для їхнього моделювання. Зроблений висновок дозволив обґрунтувати доцільність адаптації розробленого способу автоматичного моделювання знаків до моделювання знаків зображень, заданих дискретними відрізками прямих на множині атомарних елементів.
На підставі отриманих результатів можна зробити наступні основні висновки.
Результати дисертаційної роботи є істотним вкладом в рішення актуальної науково-практичної задачі підвищення ефективності автоматизованої обробки документації в СЕД. Розроблений спосіб автоматичного моделювання знаків бінарних зображень, сформованих відрізками прямих, і запропонована постановка задачі розпізнавання за валідними моделями є новим альтернативним підходом до проектування підсистем автоматизованого розпізнавання сканованих зображень документів в системах електронного документообігу.
СПИСОК ОПУБЛІКОВАНИХ РОБІТ ЗА ТЕМОЮ ДИСЕРТАЦІЇ
1. Вайсруб Н.В. Множество минимальной меры неопределенности для автоматического моделирования бинарных изображений / Н.В. Вайсруб, С.В. Мышко, Д.В. Шевцов // Вісник Донецького національного університету (Серія А, Природничі науки). - Донецьк: ДонНУ, 2008 р. - № 2. - С.494-501.
2. Вайсруб Н.В. Основные теоретические положения способа автоматического моделирования бинарных изображений / Н.В. Вайсруб, С.В. Мышко, Д.В. Шевцов // Проблемы информационных технологий. - Херсон: ХНТУ, 2008 р. - № 2. - С. 43-52.
3. Вайсруб Н.В. Способ автоматического моделирования бинарных изображений, сгенерированных отрезками прямых / Н.В. Вайсруб, С.В. Мышко, Д.В. Шевцов // Вісник СНУ ім. В. Даля. - Луганськ: СНУ ім. В. Даля, 2009 р. - № 1 (131). - С. 19-29.
4. Вайсруб Н.В. Применение способа формирования GT-объектов и способа автоматического моделирования изображений при проектировании систем технического зрения / Н.В. Вайсруб, А.-В.В. Мельник, С.В. Мышко, Д.В. Шевцов // Інформаційно-керуючі системи на залізничному транспорті.- Харьков: УкрДАЗТ. - 2009. - № 2 (75). - С. 55-59.
5. Вайсруб Н.В. Система автоматического моделирования бинарных изображений, сформированных отрезками прямых / Н.В. Вайсруб // Проблемы информационных технологий. - Херсон: ХНТУ, 2009 р. - № 1 (34). - С. 453-459.
6. Вайсруб Н.В. Подпути кратчайших путей в системах автоматического опознавания знаков / Н.В. Вайсруб, С.В. Мышко, Д.В. Шевцов // Вісник Донецького національного університету (Серія А, Природничі науки). - Донецьк: ДонНУ, 2008 р. - № 2. - С. 481-489.
7. Вайсруб Н.В. Разработка метода автоматического моделирования бинарных изображений, заданных отрезками прямых / Н.В. Вайсруб, С.В. Мышко // Труды 8 международной научно-практической конференции «Современные информационные и электронные технологии».- Одесса, ОНПУ.- 2007. - Том 1. - С. 30.
8. Вайсруб Н.В. Разработка способа генерации языковой модели бинарного изображения, состоящего из отрезков прямых / Н.В. Вайсруб, С.В. Мышко, Д.В. Шевцов // Труды 9 международной научно-практической конференции «Современные информационные и электронные технологии».- Одесса, ОНПУ.- 2008. - С.
9. Вайсруб Н.В. Множества неопределенности и их применение для бесконстантной классификации объектов опознавания / Н.В. Вайсруб, С.В. Мышко, Д.В. Шевцов // Матеріали наукової конференції професорсько-викладацького складу, наукових співробітників і аспірантів Донецького національного університету за підсумками науково-дослідної роботи за період 2007-2008 рр. (Том 1. Природничі науки). - Донецьк, ДонНУ.- 2009. - С. 55.
10. Вайсруб Н.В. К вопросу об автоматическом моделировании изображений / Н.В. Вайсруб, С.В. Мышко, Д.В. Шевцов // Тези доповідей восьмої міжнародної науково-технічної конференції «Контроль і управління в складних системах». - Вінниця, УНІВЕРСУМ-Вінниця. - 2005. - С. 77.
АННОТАЦИЯ
Вайсруб Н.В. Разработка способа автоматического моделирования бинарных изображений, сформированных отрезками прямых. - Рукопись.
Диссертация на соискание ученой степени кандидата технических наук по специальности 05.13.06 - информационные технологии. - ДонНУ, Донецк, 2009.
В диссертации рассматривается актуальная научно-практическая задача моделирования бинарных изображений, сформированных отрезками прямых, при автоматизированной обработке изображений документов в системах электронного документооборота.
При осуществлении автоматизированной обработки документации в системах электронного документооборота важным этапом является распознавание содержимого электронных копий документов. В работе обосновано, что одним из путей повышения эффективности функционирования подсистем распознавания является разработка способа автоматического моделирования, так как субъективно-статистические предпосылки классических методов моделирования изображений снижают качество распознавания.
Проведенный анализ бинарных изображений, сформированных отрезками прямых, позволил ввести определение знака изображения и выявить характеристики, значения которых целесообразно использовать при его автоматическом моделировании. С целью разработки основных теоретических положений способа автоматического моделирования бинарных изображений, сформированных отрезками прямых, определены множества и мера неопределенности, множества минимальной меры неопределенности; исследованы свойства введенных объектов и рассмотрено их применение при моделировании знаков.
Предложена математическая модель знака бинарного изображения, сформированного отрезками прямых, формализовано понятие валидной модели, обоснован признак валидности модели для автоматического формирования такой модели заданного знака, которая допускает генерацию знаков, одноименных с исходным. Предложено осуществлять распознавание знаков на основе их валидных моделей.
Разработана программная реализация способов автоматического моделирования и распознавания бинарных изображений, сформированных отрезками прямых. Проведена апробация системы и критическая оценка результатов распознавания, которые свидетельствуют о том, что предложенные алгоритмы позволили повысить качество распознавания по сравнению с аналогичными системами в среднем на 16,1%.
Проведена апробация программного обеспечения на ЗАО «ДОНЕЦКСТАЛЬ» - МЕТАЛЛУРГИЧЕСКИЙ ЗАВОД» и в страховой компании «СПИЧ и К» с целью повышения эффективности функционирования подсистемы распознавания в составе системы электронного документооборота.
Ключевые слова: системы электронного документооборота, бинарные изображения, моделирование, распознавание, множества неопределенности, мера неопределенности.
Вайсруб Н. В. Розробка способу автоматичного моделювання бінарних зображень, які сформовані відрізками прямих. - Рукопис.
Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 - інформаційні технології. - ДонНУ, Донецьк, 2009.
У дисертації розглядається актуальна науково-практична задача моделювання бінарних зображень, які сформовані відрізками прямих, при автоматизованій обробці зображень документів в системі електронного документообігу.
При здійсненні автоматизованої обробки документації в системах електронного документообігу важливим етапом є автоматизоване розпізнавання електронних копій документів. Одним із способів підвищення ефективності функціонування підсистем розпізнавання є розробка способу автоматичного моделювання.
У роботі виявлено характеристики бінарних зображень, сформованих відрізками прямих, значення яких доцільно використовувати при моделюванні. З метою розробки основних теоретичних положень способу автоматичного моделювання визначено множини і міру невизначеності, досліджено властивості введених об'єктів і розглянуто їх використання для моделювання знаків. Запропоновано нову математичну модель знаку бінарного зображення, сформованого відрізками прямих, формалізовано поняття валідної моделі, обґрунтовано ознаку валідності моделі для автоматичного формування такої моделі заданого знаку, яка допускає генерацію знаків, однойменних з початковим. Запропоновано здійснювати розпізнавання знаків за валідними моделями.
Розроблено інструментальні засоби автоматичного моделювання і розпізнавання бінарних зображень, сформованих відрізками прямих. Проведена апробація системи свідчить про те, що запропонований спосіб розпізнавання за валідними моделями дозволив підвищити якість розпізнавання в середньому на 16,1% в порівнянні з існуючими аналогами. Проведена апробація програмного забезпечення на ЗАТ «ДОНЕЦЬКСТАЛЬ» - МЕТАЛУРГІЙНИЙ ЗАВОД» і в страховій компанії «СПІЧ і К» з метою підвищення ефективності функціонування підсистеми розпізнавання у складі системи електронного документообігу.
Ключові слова: системи електронного документообігу, бінарні зображення, моделювання, розпізнавання, множини невизначеності, міра невизначеності.
Vaysrub N.V. The means of automatic modeling of binary images which are formed with line segments. - Manuscript.
The dissertation for obtaining the academic degree of candidate of technical sciences. Speciality 05.13.06 - Information Technologies - Donetsk National University, Donetsk, 2009.
The dissertation is devoted to actual theoretical and practical problem of modeling of binary images, which are formed with line segments, at automated processing of documents images in the electronic workflow system.
During realization of the automated processing of documents in the electronic workflow system the important stage is automatic recognition of content of electronic copies of documents. The one of methods of increase of efficiency of functioning of subsystems of recognition is development of method of automatic modeling.
The analysis of binary images, which are formed with line segments, allowed detecting characteristics of sign, which is expedient to use for modeling. Sets and measure of vagueness are determined; properties of the determined objects are investigated and their application is considered at the modeling of signs. The mathematical model of sign of binary image, formed with line segments is offered, the concept of valid model is formalized, the criterion of valid model is grounded for the automatic forming of such model of the sign, which assumes the generation of signs, of the same name with initial. Solution of the problem of recognition of signs on valid models is offered.
Programmed realization of means of automatic modeling and recognition of signs is developed. Approbation of the system is confirmed that the offered means of recognition on valid models allowed to increase quality of recognition on the average on 16,1%. Approbation of the software on Joint-Stock Company «DonetskStal» - a metal works» and in the insurance company «Speech and C» is lead with the purpose of increase of efficiency of functioning of a subsystem of recognition in structure of system of electronic document circulation.
Key words: electronic workflow systems, binary images, modeling, recognition, sets of vagueness, measure of vagueness.
Размещено на Allbest.ru
...Подобные документы
Комп’ютерне моделювання системи сегментації та розпізнавання облич на зображеннях. Підвищення швидкодії моделювання за кольором шкіри та покращення якості розпізнавання при застосуванні робастних boosting-методів. Розробка алгоритмів функціонування.
дипломная работа [1,6 M], добавлен 02.07.2014Висвітлення та розкриття поняття 3д-моделювання, його видів та особливостей. Аналіз основних видів моделювання, їхнє практичне використання, переваги та недоліки кожного виду. Розгляд найпоширеніших програм для створення 3-д зображень та їх функції.
статья [801,7 K], добавлен 18.08.2017Використання CMY та CMYK для опису кольору при отриманні зображень методом поглинання кольорів. Субтрактивні кольори: блакитний (Cyan), пурпурний (Magenta) та жовтий (Yellow). Моделювання розповсюдження світла в об'ємі напівпрозорого середовища.
контрольная работа [3,5 M], добавлен 22.10.2009Поняття моделювання як процесу, що полягає у відтворенні властивостей тих чи інших предметів і явищ за допомогою абстрактних об’єктів та описів у вигляді зображень, планів, алгоритмів. Системи масового обслуговування. Модель роботи видавничого центру.
курсовая работа [255,8 K], добавлен 15.09.2014Сегментація і нормалізація зображень. Основні функціональні можливості та режими роботи комплексу розпізнавання письмового тексту. Розробка комплексу оптичного розпізнавання символів. Шрифтові та безшрифтові алгоритми розпізнавання друкованого тексту.
курсовая работа [1,7 M], добавлен 19.05.2014Сутність та особливості параметричного, воксельного, полігонального моделювання, моделювання сплайнами та скульптингу. Застосування 3D моделювання в науці, техніці, рекламі, маркетингу, дизайні інтер'єру, архітектурі, анімаці, кіно та медицині.
доклад [873,9 K], добавлен 04.05.2022Основні теоретичні відомості алгоритмів стиснення зображень: класи зображень та їх представлення в пам'яті, алгоритми та принципи групового кодування. Огляд та аналіз сучасних програмних засобів конвертування. Тестування, опис роботи програмного засобу.
курсовая работа [2,9 M], добавлен 15.03.2014Растрові формати зображень tiff, bmp, pcx, gif, jpeg, png, опис растрової графічної інформації. Зручність та недоліки векторних форматів. Зберігання і обробка зображень, що складаються з ліній, або можуть бути розкладені на прості геометричні об'єкти.
контрольная работа [2,5 M], добавлен 19.09.2009Методи проектування офісу мобільного зв’язку. Моделювання офісу, виходячи з кількості співробітників і заданого устаткування. Способи математичного моделювання за допомогою Excel та MathCAD. Розробка дизайну приміщень та оформлення прилеглої території.
курсовая работа [2,5 M], добавлен 20.06.2010Модель обробки файлів растрових зображень. Середній квадрат яскравості. Фільтри для виділення перепадів і границь. Опис та обґрунтування вибору складу технічних та програмних засобів. Опис інтерфейсу програми. Зображення діалогового вікна програми.
курсовая работа [664,3 K], добавлен 30.06.2009Особливості графічного моделювання плану офісу, який спеціалізується на ремонті комп’ютерної техніки. Розробка дизайну офісу і його плану виходячи з кількості працівників та устаткування. Способи математичного моделювання за допомогою Excel та MathCAD.
курсовая работа [2,2 M], добавлен 20.06.2010Технологія проектування та розробка об'єктно-орієнтованих програм. Використання автоматного підходу при реалізації прикладних програм. Програмні продукти для графічного моделювання кінцевих автоматів. Виконуваний UML та SWITCH-технологія, їх принципи.
курсовая работа [27,1 K], добавлен 23.12.2011Призначення та область застосування програм, які орієнтовані на перетворення зображень з плоского в об’ємне. Основні стадії формування тривимірного зображення. Класифікація моделей і методів візуалізації. Особливості створення карти глибин по пікселям.
курсовая работа [325,8 K], добавлен 04.06.2010Сутність і структурні елементи бінарного дерева, характеристика методів його обходу (в прямому, симетричному та зворотному порядку). Вибір мови програмування, середовища розробки та технічних засобів. Структура даних і модулів системи, порядок її роботи.
дипломная работа [1,4 M], добавлен 12.07.2013Загальна характеристика мови моделювання UML. Розробка діаграм UML з метою автоматизації продаж в магазині. Rational Rose як засіб візуального моделювання об'єктно-орієнтованих інформаційних систем. Зворотне проектування як головна перевага Rational Rose.
контрольная работа [1,7 M], добавлен 23.10.2014Характеристика основних методів сучасного викладання фізики. Моделювання як процес дослідження об’єктів пізнання за допомогою їх моделей. Розгляд особливостей використання табличного процесора EXCEL для обробки результатів лабораторних робіт з фізики.
лабораторная работа [1,6 M], добавлен 22.12.2012Розробка, дослідження та реалізація методів вирішення завдань аналізу, розпізнавання і оцінювання зображень як один із провідних напрямків інформатики. Класифікація та аналіз існуючих методів розпізнавання образів, переваги та недоліки їх застосування.
статья [525,8 K], добавлен 19.09.2017Політичне прогнозування як процес розробки науково обгрунтованого судження про ймовірносний розвиток політичних подій, шляхи і терміни його здійснення. Можливості комп'ютерного моделювання - системний підхід. Моделі та методи моделювання, їх використання.
контрольная работа [26,0 K], добавлен 13.03.2013Автоматизування розрахункових задач проектування (рішення систем рівнянь, побудова графіків залежності, оптимізація, моделі об'єктів) і графічне проектування офісу на підставі вихідних даних. Графічне моделювання офісу Сапр-хімія. Математичне моделювання.
курсовая работа [6,8 M], добавлен 22.11.2010Опис основних етапів розробки архітектури програмної системи: структурування системи, моделювання управління, декомпозиція підсистем. Ознайомлення із кроками створення інтерфейсу користувачів як однієї із фаз проектування програмного забезпечення.
реферат [20,7 K], добавлен 24.11.2010