Идентификация типов и моделей самолетов путем аск-анализа их силуэтов (контуров) (обобщение, абстрагирование, классификация и идентификация)
Особенности применения автоматизированного системно-когнитивного анализа (АСК-анализа). Эффективность математической модели (интеллектуальной системы "Эйдос") для идентификации типов, моделей самолетов, как по их силуэтам снизу, так и по внешним контурам.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 22.05.2017 |
Размер файла | 2,6 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Идентификация типов и моделей самолетов путем аск-анализа их силуэтов (контуров) (обобщение, абстрагирование, классификация и идентификация)
Данная статья может рассматриваться как продолжение серии работ [1, 2, 3, 4, 5, 6], посвященных применению автоматизированного системно-когнитивного анализа (АСК-анализ) [7, 8] и его программного инструментария - системы «Эйдос» [9, 11, 12] См. сайт автора АСК-анализа и системы «Эйдос»: http://lc.kubagro.ru/ для интеллектуальной обработки изображений, т.е. для их оцифровки, создания математических моделей конкретных изображений, формирования обобщенных изображений на основе ряда конкретных, относящихся к одной категории (классу), абстрагирования, идентификации, классификации обобщенных изображений и решения ряда других задач.
В частности, в работах [4, 5, 6] описаны основы АСК-анализа изображений по их внешним контурам. В этих работах описаны возможности применения АСК-анализа для решения задачи синтеза обобщенных контурных изображений на основе ряда конкретных примеров. При этом в результате обобщения выясняется ценность признаков изображений для их дифференциации по классам, а также степень характерности тех или иных признаков для конкретных классов изображений. Это позволяет без ущерба для адекватности модели удалить из нее малоценные признаки, т.е. осуществить абстрагирование обобщенных изображений, что обеспечивает в последующем сокращение затрат различных видов ресурсов на сбор и обработку графической информации. Над обобщенными изображениями возможны операции классификации, объединения наиболее сходных из них в кластеры и формирования систем наиболее сильно отличающихся друг от друга кластеров, т.е. конструктов. Можно также количественно оценивать степень сходства конкретных изображений с обобщенными, т.е. идентифицировать эти конкретные изображения, что и является основной задачей данной работы. Смысл решения задачи идентификации состоит в том, что когда какой-либо конкретный объект идентифицирован, т.е. отнесен к определенным обобщающим категориям или классам, то о нем становится известно все, что известно об этом классе.
Все это позволяет ставить и решать ряд важных задач:
1) оцифровка сканированных изображений самолетов и создание их математических моделей;
2) формирование математических моделей конкретных самолетов с применением теории информации;
3) формирование моделей обобщенных образов самолетов различных типов и моделей и их наглядная визуализация;
4) сравнение образа конкретного самолета с обобщенными образами самолетов различных типов и моделей и определение количественной степени сходства -различия между ними, т.е. идентификация типа и модели самолета по его силуэту (контуру) снизу;
5) количественное определение сходства-различия обобщенных образов самолетов друг с другом, т.е. кластерно-конструктивный анализ обобщенных образов самолетов различных типов и моделей.
Идея решения задач
Предлагается новый подход к оцифровке изображений самолетов, основанный на использовании полярной системы координат, центра тяжести изображения и его внешнего контура. Перед оцифровкой изображений могут применяться их преобразования, стандартизирующие положение изображений, их размеры (разрешение, расстояние) и угол поворота (ракурс) в трех плоскостях (в т.ч. дающие эффект зеркального отражения относительно различных плоскостей). Поэтому результаты оцифровки и АСК-анализа изображений могут быть инвариантны (независимы) относительно их положения, размеров и поворотов. Форма контура конкретного самолета рассматривается как зашумленное информационное сообщение о типе и модели самолета, включающее как информацию об истинной форме самолета данного типа и модели (чистый сигнал), так и шум, искажающий эту истинную форму, обусловленный зашумляющими воздействиями как средств противодействия обнаружению и идентификации, так и окружающей среды. Программный инструментарий АСК-анализа - интеллектуальная система «Эйдос» обеспечивает подавление шума и выделение сигнала об истинной форме самолета каждого типа и модели на основе ряда зашумленных конкретных примеров изображений самолетов.
Таким образом создается один образ формы самолета каждого типа и каждой модели, независящий от их конкретных реализаций, т.е. «Эйдос» этих изображений (в смысле Платона [13]) - прототип или архетип (в смысле Юнга [14]) изображений.
Рассмотрим на конкретном численном примере решение сформулированных выше задач в АСК-анализе и системе «Эйдос-Х++» версии от 20.12.2015 и выше.
Задача 1: оцифровка сканированных изображений самолетов и создание их математических моделей
Система «Эйдос» имеет программные интерфейсы с внешними источниками данных различных типов: текстовые данные в форме текстовых файлов и значений полей Excel-таблиц, табличными данными dbf, xls и xlsx форматов, графическими объектами, анализируемыми по пикселям и внешним контурам (рисунок 1):
Рисунок 1. Программные интерфейсы системы «Эйдос» с внешними источниками данных различных типов
Для решения поставленных задач используем программный интерфейс с изображениями, которые анализируются по их внешним контурам в полярной системе координат. Программная реализация и алгоритмы данного интерфейса разработаны Д.К. Бандык по постановке и алгоритмам проф. Е.В. Луценко [4, 6]. Отметим, что авторами уже решались очень сходные задачи, но не с изображениями самолетов различных типов и моделей, а с листьями винограда различных сортов [5]. Ясно, что аналогичным образом могут быть решены задачи этого типа и для изображений объектов из других самых различных предметных областей: от силуэтов символов [4], до силуэтов гражданских и военных кораблей (судов), силуэтов зданий, людей, снежинок, бабочек или жужелиц.
Запишем в папку ..\AID_DATA\Inp_data\ изображений силуэтов самолетов (вид снизу) (рисунок 2):
Рисунок 2. Экранная форма, поясняющая расположение и структуру исходных данных: силуэтов самолетов различных типов и моделей
Изображения силуэтов самолетов различных типов и моделей помещены в папку «Силуэт» (рисунок 3):
Рисунок 3. Изображения силуэтов самолетов различных типов и моделей, использованные в упрощенном численном примере
Чтобы получить изображения, приведенные на рисунке 2, в качестве исходных были использованы изображения силуэтов с сайта: http://il2-sturmovik.ru/siluets.html.
Из исходных файлов путем кадрирования в графическом редакторе Adobe PhotoShop, были выделены силуэты самолетов вид снизу. Затем наименования моделей самолетов были исключены из графических файлов, а сами файлы записаны с именами, приведенными на рисунках 1 и 2. Тип самолета был определен по его модели с использованием поиска в Internet. Имена файлов состоят из имени типа самолета и краткого наименования его модели.
При этом в именах файлов не используются символы тире «-» и точка «.», т.к. они используются как разделители между наименованием класса и номером реализации объекта этого класса. В рассматриваемом упрощенном примере в обучающей выборке используются изображения силуэтов 24 различных модели самолета трех типов: бомбардировщики (5), истребители (18) и штурмовик (1).
Упрощение заключается в том, что:
- рассматривается довольно мало примеров обучающей выборки;
- используются только силуэты самолетов в ракурсе: «вид снизу» направление движения «север».
Как показывает опыт подобных исследований в системе «Эйдос» [4, 5] количество объектов обучающей выборки не сказывается существенно на достоверности создаваемых моделей.
Здесь возникает две идеи решения:
1) идентифицировать не только тип и модель самолета, но и его ракурс;
2) создать на основе проекций такую трехмерную модель самолета, которая бы наилучшим образом позволяла воспроизводить эти проекции.
Для реализации 1-й идеи остаточно увеличить количество объектов обучающей выборки. А обсуждению и анализу 2-й идеи посвящена статья [14] и некоторые другие статьи, на которые из нее есть ссылки. В данной работе мы рассматриваем именно упрощенный вариант решения задачи, т.е. такой вариант, который мог бы использоваться в качестве лабораторной работы по дисциплинам, связанным с искусственным интеллектом [15, 16].
Рисунок 4. Изображения силуэтов самолета в различных ракурсах (источник: http://il2-sturmovik.ru/siluets.html)
Итак, после скачивания и инсталляции системы «Эйдос» запустим режим: 2.3.2.4. Оцифровка изображений по их внешним контурам (рисунок 5):
Рисунок 5. Начальная экранная форма режима 2.3.2.4. Оцифровка изображений по их внешним контурам
Вместо описания данного режима приведем Help данного режима (рисунок 6):
Рисунок 6. Help режима 2.3.2.4. Оцифровка изображений по их внешним контурам
В результате появляется главная экранная форма, отображающая процесс оцифровки сканов листьев, расположенных в виде файлов в указанных выше папках (рисунок 7):
Рисунок 7. Экранная форма с отображением стадии процесса оцифровки изображений силуэтов самолетов по их внешним контурам
Данный режим:
1. Находит все поддиректории в папке: ..\AID_DATA\Inp_data\ и все графические файлы jpg и bmp в поддиректориях.
2. Находит контуры в этих графических файлах и их центры тяжести.
3. Записывает в папку: ..\AID_DATA\Out_data\ графические файлы, состоящие только из контуров с изображенными на них точками, которые были оцифрованы. Необходимо особо отметить, что при этом используется полярная система координат с центром в центре тяжести изображения, а результатами оцифровки являются расстояния от центров тяжести изображений до точек их контура при различных углах поворота радиуса-вектора (эта идея, а также математическая модель и алгоритм ее реализации предложены проф. Е.В.Луценко в 2014 и реализованы в модуле 2.3.2.4 и режиме 4.7 системы «Эйдос» в 2015 году ). При этом структура поддиректорий и имена файлов в папках: ..\AID_DATA\Inp_data\ и ..\AID_DATA\Out_data\ совпадают. Сформированные по силуэтам контурные изображения самолетов приведены на рисунке 8:
Рисунок 8. Контурные изображения самолетов, полученные по силуэтам обучающей выборки: c:\Aidos-X\AID_DATA\Out_data\. Первое изображение показано также в увеличенном виде
4. Затем режим 2.3.2.4 формирует Excel-таблицу с именем: ..\AID_DATA\Inp_data\inp_data.xlsx, в которой содержаться результаты оцифровки изображений. Кроме того, он формирует таблицу: ..\AID_DATA\Inp_data\inp_data_avr.xlsx с усредненными данными по классам. Пояснение по структуре этой таблицы дано в Help режима 2.3.2.4 (рисунок 3). Структура этой таблицы полностью соответствует требованиям универсального программного интерфейса системы «Эйдос» с внешними базами данных (режим 2.3.2.2 рисунок 1), которые приведены в Help этого режима и представлены на рисунке 9:
Рисунок 9. Help универсального программного интерфейса системы «Эйдос» с внешними базами данных (режим 2.3.2.2)
В таблице 1 приведен фрагмент сформированного режимом 2.3.2.4 файла ..\AID_DATA\Inp_data\inp_data.xlsx с результатами оцифровки изображений после небольшой модификации:
Таблица 1 - Файл c:\Aidos-X\AID_DATA\Inp_data\inp_data.xlsx с результатами оцифровки изображений (фрагмент) В полной таблице колонки описательных шкал по градусам идут до 360°.
В таблице 1 классификационные шкалы выделены светло-желтым цветом, а описательные - светло-зеленым. Модификация заключалась в том, что внесено наименование столбца: «Модель самолета» и добавлен столбец: «Тип самолета» и в него внесена соответствующая информация из столбца «Модель самолета».
Итак, в результате работы режима 2.3.2.4 создается Excel-файл обучающей выборки (таблица 1), в строках которого содержатся следующие количественные данные об изображениях, представляющие собой их математическую модель (при заданных параметрах оцифровки):
Колонки с 1-й по 7:
1. Объект обучающей выборки
2. Тип самолета
3. Модель самолета
4. X центра тяжести
5. Y центра тяжести
6. Площадь (пикс.)
7. Среднее
8. Ср.кв.откл.
Колонки с 9-й по 68: содержат длины радисус-вектора от центра тяжести силуэта самолета до его контура при заданном угле поворота радиус-вектора:
В этом и состоит решение задачи 1.
Сам этот программный интерфейс вызывается из главного меню системы «Эйдос» (режим 2.3.2.2), либо из режима: 4.7. АСК-анализ изображений. Главная экранная форма режима 2.3.2.2 приведена на рисунке 10, причем на ней показаны нужные параметры, которые формируются режимом 2.3.2.4 как параметры по умолчанию и немного модифицированы, т.к. нами был добавлена еще одна классификационная шкала и соответствующий столбец.
После запуска процесса ввода данных из файла: ..\AID_DATA\Inp_data\inp_data.xlsx в базы данных системы «Эйдос» определяется количество заданных текстовых и числовых классификационных и описательных шкал и градаций [17] и выводится окно внутреннего калькулятора данного режима, в котором мы можем задать число интервальных значений в числовых шкалах (рисунок 11).
После клика по кнопке «Выйти на создание модели» начинается процесс импорта данных оцифровки изображений из файла ..\AID_DATA\Inp_data\inp_data.xlsx в базы данных системы «Эйдос». При этом по сути происходит нормализация базы исходных данных, т.е. создаются справочники классификационных и описательных шкал и градаций и исходные данные кодируются с их использованием, в результате чего формируется обучающая выборка и база событий (эвентологическая база данных) (рисунок 12):
Рисунок 10. Главная экранная форма универсального программного интерфейса системы «Эйдос» с внешними базами данных (режим 2.3.2.2)
Рисунок 11. Экранная форма внутреннего калькулятора универсального программного интерфейса системы «Эйдос» с внешними базами данных
Рисунок 12. Экранная форма, отображающая этапы импорта данных из внешней базы данных в систему «Эйдос»
Здесь можно обратить внимание на то, что процесс импорта данных из внешней базы данных занял 2 секунды.
Сами справочники классификационных и описательных шкал и градаций, обучающая выборка и эвентологическая база данных могут быть просмотрены в режимах 2.1, 2.2, 2.3.1, 2.4 системы «Эйдос». В результате работы программного интерфейса с внешними базами данных 2.3.2.2 также формируется таблица ..\AID_DATA\Inp_data\inp_davr.xls с усредненными данными по классам.
Задача 2: формирование математических моделей конкретных самолетов с применением теории информации и Задача 3: формирование моделей обобщенных образов самолетов различных типов и моделей и их наглядная визуализация
Обе эти задачи решаются путем запуска режима 3.5, обеспечивающий синтез и верификацию (оценку достоверности) моделей (рисунок 13). Запускаем этот режим с параметрами по умолчанию, приведенными на рисунке 13.
Рисунок 13. Экранная форма режима синтеза и верификации статистических и системно-когнитивных моделей системы «Эйдос» (режима 3.5)
При очень большом количестве объектов обучающей выборки для оценки достоверности моделей может быть использован бутстрэпный метод [18], параметры работы которого могут быть заданы в окне: «Параметры копирования обучающей выборки в распознаваемую». В результате работы данного режима создаются и верифицируются 3 статистических модели (корреляционная матрица, матрицы условных и безусловных процентных распределений) и 7 системно-когнитивных моделей (моделей знаний) (рисунки 14 и 15). Подробнее преобразование исходных данных в информацию, а ее в знания, и использование этих знаний для решения задач идентификации, принятия решений и исследования моделируемой предметной области путем исследования ее модели описано в ряде работ по АСК-анализу, например в [18], а также в режиме 6.4 системы «Эйдос».
Рисунок 14. Этапы последовательного повышения степени формализации модели от данных к информации, а от нее к знаниям
Рисунок 15. Экранная форма отображения стадии исполнения режима синтеза и верификации моделей
Из рисунка 15 видно, что процесс синтеза и верификации моделей занял 2 минуты 22 секунды.
В результате выполнения режима 3.5. «Синтез и верификация моделей», создано 3 статистических модели и 7 системно-когнитивных моделей исследуемой предметной области. Наименования этих моделей приведены на рисунке 18, а подробнее они описаны в работе [17] и других работах, посвященных АСК-анализу Ссылки на многие из них есть на сайте: http://lc.kubagro.ru/ и здесь их описывать нецелесообразно.
В таблице 2 приведен фрагмент базы знаний модели INF1:
Таблица 2 - Системно-когнитивная модель типов и моделей и самолетов INF1 (миллибиты) (фрагмент)
Код |
Наименование шкалы и градации |
Бомбарди-ровщик |
Истре-битель |
Штур-мовик |
Бомбарди-ровщик A 20 G 20 |
Истребитель Buffalo F2A 2 |
|
1 |
000°-1/10-{14.8908710, 30.8999315} |
172 |
|||||
2 |
000°-2/10-{30.8999315, 46.9089920} |
172 |
|||||
3 |
000°-3/10-{46.9089920, 62.9180524} |
172 |
1068 |
||||
4 |
000°-4/10-{62.9180524, 78.9271129} |
429 |
-162 |
734 |
|||
5 |
000°-5/10-{78.9271129, 94.9361734} |
172 |
|||||
6 |
000°-6/10-{94.9361734, 110.9452339} |
935 |
|||||
7 |
000°-7/10-{110.9452339, 126.9542944} |
521 |
-242 |
||||
8 |
000°-8/10-{126.9542944, 142.9633548} |
1896 |
|||||
9 |
000°-9/10-{142.9633548, 158.9724153} |
||||||
10 |
000°-10/10-{158.9724153, 174.9814758} |
172 |
|||||
11 |
006°-1/10-{15.0871391, 21.0177425} |
172 |
|||||
12 |
006°-2/10-{21.0177425, 26.9483459} |
172 |
935 |
||||
13 |
006°-3/10-{26.9483459, 32.8789493} |
279 |
-70 |
||||
14 |
006°-4/10-{32.8789493, 38.8095527} |
172 |
|||||
15 |
006°-5/10-{38.8095527, 44.7401562} |
172 |
|||||
16 |
006°-6/10-{44.7401562, 50.6707596} |
172 |
|||||
17 |
006°-7/10-{50.6707596, 56.6013630} |
763 |
1068 |
1068 |
|||
18 |
006°-8/10-{56.6013630, 62.5319664} |
||||||
19 |
006°-9/10-{62.5319664, 68.4625698} |
172 |
|||||
20 |
006°-10/10-{68.4625698, 74.3931732} |
521 |
-242 |
||||
21 |
012°-1/10-{14.3107233, 20.1902360} |
-135 |
63 |
826 |
|||
22 |
012°-2/10-{20.1902360, 26.0697487} |
172 |
|||||
23 |
012°-3/10-{26.0697487, 31.9492614} |
||||||
24 |
012°-4/10-{31.9492614, 37.8287741} |
172 |
|||||
25 |
012°-5/10-{37.8287741, 43.7082868} |
521 |
1482 |
||||
26 |
012°-6/10-{43.7082868, 49.5877994} |
||||||
27 |
012°-7/10-{49.5877994, 55.4673121} |
935 |
|||||
28 |
012°-8/10-{55.4673121, 61.3468248} |
521 |
-242 |
1482 |
|||
29 |
012°-9/10-{61.3468248, 67.2263375} |
||||||
30 |
012°-10/10-{67.2263375, 73.1058502} |
||||||
31 |
018°-1/10-{13.6948805, 18.6011268} |
-135 |
63 |
826 |
|||
32 |
018°-2/10-{18.6011268, 23.5073731} |
172 |
|||||
33 |
018°-3/10-{23.5073731, 28.4136193} |
172 |
|||||
34 |
018°-4/10-{28.4136193, 33.3198656} |
-70 |
1240 |
||||
35 |
018°-5/10-{33.3198656, 38.2261119} |
935 |
|||||
36 |
018°-6/10-{38.2261119, 43.1323582} |
||||||
37 |
018°-7/10-{43.1323582, 48.0386045} |
||||||
38 |
018°-8/10-{48.0386045, 52.9448507} |
935 |
|||||
39 |
018°-9/10-{52.9448507, 57.8510970} |
935 |
1482 |
||||
40 |
018°-10/10-{57.8510970, 62.7573433} |
172 |
|||||
41 |
024°-1/10-{14.4171963, 19.4113020} |
-307 |
93 |
654 |
|||
42 |
024°-2/10-{19.4113020, 24.4054077} |
172 |
|||||
43 |
024°-3/10-{24.4054077, 29.3995135} |
-135 |
-70 |
826 |
|||
44 |
024°-4/10-{29.3995135, 34.3936192} |
693 |
-484 |
||||
45 |
024°-5/10-{34.3936192, 39.3877249} |
||||||
46 |
024°-6/10-{39.3877249, 44.3818306} |
||||||
47 |
024°-7/10-{44.3818306, 49.3759363} |
||||||
48 |
024°-8/10-{49.3759363, 54.3700421} |
||||||
49 |
024°-9/10-{54.3700421, 59.3641478} |
935 |
1896 |
||||
50 |
024°-10/10-{59.3641478, 64.3582535} |
172 |
|||||
51 |
030°-1/10-{14.3007908, 20.4811228} |
-227 |
80 |
320 |
|||
52 |
030°-2/10-{20.4811228, 26.6614548} |
-26 |
-133 |
935 |
|||
53 |
030°-3/10-{26.6614548, 32.8417868} |
279 |
-70 |
||||
54 |
030°-4/10-{32.8417868, 39.0221188} |
||||||
55 |
030°-5/10-{39.0221188, 45.2024508} |
||||||
56 |
030°-6/10-{45.2024508, 51.3827827} |
||||||
57 |
030°-7/10-{51.3827827, 57.5631147} |
||||||
58 |
030°-8/10-{57.5631147, 63.7434467} |
935 |
1896 |
Всего в этой базе знаний 600 записей, т.е. в таблице 2 приведено 9,7% ее объема.
Колонки приведенной базы знаний соответствуют классам, в данной работе это типы и модели самолетов.
Строки приведенной базы знаний представляют собой градации описательных шкал, в данной работе это интервальные значения расстояний от центра тяжести силуэта самолета до его контура в пикселях при различных углах поворота радиуса-вектора.
Значения на пересечениях строк и колонок в модели INF1 представляют собой количество информации по А.Харкевичу [17] в элементе контура о принадлежности конкретного самолета с данным элементом контура в силуэте к данному типу и модели самолета (классу). Это количество информации выражено в миллибитах, т.е. тысячных долях бита с целью экономии знакомест в таблице (т.к. все значения в ней начинаются с нуля и запятой). Знак и модуль значения отражают степень характерности или не характерности соответствующего элемента контура для данного типа и модели самолета. Положительные значения говорят о том, что данный элемент контура характерен для данного типа и модели самолета, а отрицательные - о том, что он не характерен. Степень характерности или не характерности выражается модулем значения. Пустые значения соответствуют случаю, когда данный элемент контура силуэта самолета никогда не встречался у самолетов данного типа и модели по данным обучающей выборки. Положительные значения получаются, если данный элемент контура встречается у данного типа и модели самолета с более высокой вероятностью, чем в среднем по выборке, а отрицательные - если реже, чем в среднем по выборке. Подробнее о способах расчета статистических и когнитивных моделей в АСК-анализе и системе «Эйдос» можно ознакомится в работе [17] и других работах по этой проблематике.
Модели конкретных самолетов с применением теории информации представляют собой структуры данных, содержащие количество информации в элементах их контуров о том, что эти самолеты относятся к определенным типам и моделям. В соответствии с подходом, развиваемым в АСК-анализе и реализованным в системе «Эйдос», считается, что самолет относится к тому типу и модели, о принадлежности к которым в элементах его контура суммарно содержится больше всего информации, т.е. используется аддитивный интегральный критерий [17].
Достоверность моделей оценивается в этом же режиме 3.5 в соответствии с предложенной проф. Е.В. Луценко метрикой, сходной по смыслу с известным F-критерием, но не основанной на предположении о нормальности распределения, независимости и аддитивности факторов и линейности объекта моделирования (рисунки 16 и 17).
Рисунок 16. Оценка достоверности моделей с помощью непараметрической метрики, сходной с F-критерием
Рисунок 17. Help режима 4.1.3.6: пояснение смысла непараметрической метрики, сходной с F-критерием
Из рисунка 16 мы видим, что наиболее достоверная модель INF3, основанная на частном критерии хи-квадрат, дает среднюю достоверность определения типа и модели самолета по его силуэту около 90%, причем достоверность правильной идентификации составляет 96%, а правильной не идентификации - 83%.
Модели обобщенных образов типов и моделей самолетов содержатся в системно-когнитивных моделях INF1 - INF7, фрагмент одной из которых приведен в таблице 2. Такая модель представляет собой вектор, координатами которого являются частные критерии, в частности в моделях INF1 и INF2 - количество информации [17]. Синтез и верификация этих моделей осуществляется в режиме 3.5 и подробно описаны в данной работе выше. Наименования этих моделей приведены на рисунке 18, а подробнее они описаны в работе [17] и других работах, посвященных АСК-анализу Ссылки на многие из них есть на сайте: http://lc.kubagro.ru/ .
В системе «Эйдос» реализован режим 4.7. «АСК-анализ изображений», в котором можно выполнить практически все операции по оцифровке и анализу изображений, описанные в данной работе (рисунок 18). Вместо описания возможностей данного режима приведем его Help (рисунок 19). Экранная форма режима задания параметров формируемых и отображаемых информационных портретов приведена на рисунке 20.
Рисунок 18. Экранная форма режима 4.7. АСК-анализ изображений
Рисунок 19. Help режима 4.7. АСК-анализ изображений
Рисунок 20. Экранная форма режима задания параметров формируемых и отображаемых информационных портретов обобщенных изображений
На рисунках 21 в наглядной графической форме приведена система описательных шкал и градаций, используемая для оцифровки оригинальных изображений силуэтов самолетов, причем цветом обозначена ценность градаций описательных шкал для решения задачи идентификации типа и модели самолета по элементам контура.
Рисунок 21. Система описательных шкал и градаций, используемая для оцифровки оригинальных изображений листьев
На верхнем рисунке 21 выделена область наиболее значимых элементов контура, на нижнем указаны они все. Для каждого угла поворота радиус-вектора диапазон от минимального до максимального его значений для конкретных самолетов обучающей выборки разделен на 10 интервальных значений - градаций (число интервальных значений задано в диалоге в режиме 2.3.2.2). Решение о количестве интервальных значений задается с учетом объема выборки таким образом, чтобы все они были достаточно широко представлены в ней (по крайней мере по 5 попаданий в каждое интервальное значение каждой шкалы) и не было вообще не представленных. Это значит, что при небольшом объеме выборки корректно выбирать небольшое количество интервальных значений и соответственно точность модели будет не очень высока, а при увеличении объема выборки есть возможность повысить точность модели. Это одно из следствий известной теоремы Котельникова об отсчетах.
Из сравнения шкал и градаций на рисунке 21 хорошо видно, на сколько в действительности различаются изображения самолетов различных типов и моделей и на сколько велик уровень вариабельности их формы.
На рисунках 22 приведена наглядная визуализация (средствами системы «Эйдос») информационных портретов обобщенных образов самолетов различных типов и моделей с указанием количества информации в элементах контура о том, что самолет с данным элементом принадлежит определенным типу и модели. Количество информации в элементе контура кодируется цветом спектра: максимальное количество информации отображается красным цветом, а минимальное - фиолетовым.
Рисунок 22. Информационные портреты обобщенных образов листьев различных сортов (классов)
Из портретов на рисунках 22 видно какое количество информации о принадлежности самолета к каждому из типов и моделей содержат различные элементы контура, а из рисунков 21 видно в какой степени эти элементы контура вносят различие между различными типами и моделями самолетов, т.е. в какой степени они вообще полезны для дифференциации самолетов по типам и моделям.
По сути это означает, что на рисунках 22 приведены редуцированные и нередуцированные когнитивные функции, причем редуцированные когнитивные функции по сути представляют нам вид идеального, т.е. не зашумленного средствами противодействия и случайным воздействием окружающей среды, контура самолета каждого типа и модели [21].
Различные варианты частных и интегральных критериев, применяемых в системе «Эйдос», описаны в работе [17] и других работах по АСК-анализу [7, 8]. По-видимому, при решении задачи идентификации типа и модели самолета по его силуэту есть смысл обращать основное внимание именно на эти наиболее информативные и значимые элементы контуров. В системе «Эйдос» реализован фильтр, в результате действия которого на изображениях будут показаны лишь те элементы контуров изображений, которые имеют значимость не менее заданной пользователем величины. Примеры изображений шкал и информационных портретов с фильтром, ограничивающим отображение градаций шкал с низким уровнем значимости, в данной работе не приводятся из-за ограниченности ее объема, но подобные изображения приведены в статье [5].
Задача 4: сравнение образа конкретного самолета с обобщенными образами самолетов различных типов и моделей и определение количественной степени сходства-различия между ними, т.е. идентификация типа и модели самолета по его силуэту (контуру) снизу.
В соответствии со схемой, приведенной на рисунке 14, и информацией по достоверности моделей, приведенной на рисунке 16, в режиме 5.6 системы «Эйдос» зададим системно-когнитивную модель INF3 в качестве текущей (рисунок 23) и проведем в ней пакетную идентификацию в режиме 4.1.2 (рисунок 24):
Рисунок 23. Экранная форма, позволяющая задать любую модель (но обычно наиболее достоверную) в качестве текущей
Рисунок 24. Экранная форма с отображением этапов и стадии решения задачи идентификации типа и модели самолета
Из данной экранной формы видно, что идентификация 24 самолета выполнена за 6 секунд.
Результаты идентификации самолетов с обобщенными образами типов и моделей самолетов приводятся в многочисленных выходных формах (рисунок 25), из которых мы в связи с ограниченностью объема работы приведем лишь первые 2 (рисунки 26 и 27):
Рисунок 25. Выходные формы системы «Эйдос» с результатами идентификации (распознавания и прогнозирования)
Рисунок 26. Экранная форма с результатами идентификации типа самолетов с силуэтами конкретных самолетов
Рисунок 27. Экранная форма с результатами идентификации конкретного самолета с обобщенными образами различных типов и моделей самолетов
«Птичками» отмечены результаты достоверной идентификации. Из рисунков 26 и 27 видно, что в результатах идентификации есть ошибки ложного срабатывания (и не идентификации), но объект, относящийся к классу, практически всегда имеет максимальный уровень сходства с ним, по сравнению с другими объектами. Мы видим, что эти результаты весьма разумные и по своей достоверности соответствуют уровню эксперта в данной предметной области.
При идентификации возникают ошибки неидентификации и ложной идентификации, снижающие достоверность модели. В системе «Эйдос» есть много различных средств повышения качества моделей, в частности за счет улучшения качества обучающей выборки. Для этого может быть применен режим: 3.7.6. Разделение классов на типичную и нетипичную части. Этот режим был реализован еще в DOS-версии системы «Эйдос» [19, 20], а недавно в несколько усовершенствованном виде и в новой версии системы «Эйдос-Х++» [9, 10, 11]. На рисунке 28 приведена экранная форма этого режима:
Рисунок 28. Экранная форма режима: 3.7.6. Разделение классов на типичную и нетипичную части
Вместо описания данного режима приведем его Help (рисунок 29):
Рисунок 29. Help режима: 3.7.6. Разделение классов на типичную и нетипичную части
Но в данной статье мы этот режим применять не будем из-за того, в что в обучающей выборке очень мало объектов. Подробнее его применение описано в работе [3].
Задача 5: количественное определение сходства-различия обобщенных образов самолетов друг с другом, т.е. кластерно-конструктивный анализ обобщенных образов самолетов различных типов и моделей.
Для решения этой задачи необходимо запустить режим 4.2.2.1, а затем 4.2.2.2 (рисунки 30 и 31):
Рисунок 30. Экранная форма запуска режима кластерно-конструктивного анализа
При кластерном анализе наиболее сходные классы объединяются в группы, которые называются кластерами. При конструктивном анализе наиболее сильно отличающиеся кластеры рассматриваются как смысловые полюса конструкта, а другие классы и кластеры с промежуточными смысловыми градациями образуют смысловой спектр между полюсами. Кластерно-конструктивный анализ предложен проф. Е.В. Луценко в 2002 году как одна из возможностей АСК-анализа и реализован в системе «Эйдос» [7, 9]. На рисунке 31 приведена табличная экранная форма с результатами кластерно-конструктивного анализа типов и моделей самолетов в системно-когнитивной модели INF3:
Рисунок 31. Табличная экранная форма с результатами кластерно-конструктивного анализа типов и моделей самолетов в системно-когнитивной модели INF3
На рисунке 32 результаты сравнения друг с другом обобщенных образов самолетов различных типов и моделей приведены в графической форме когнитивной диаграммы. Из рисунков 31 и 32 видно, что:
- бомбардировщики похожи друг на друга значительно больше, чем истребители друг на друга;
- бомбардировщики образуют один кластер, а истребители второй кластер;
- кластеры бомбардировщиков и истребителей образуют полюса конструкта;
- штурмовики находятся вблизи середины конструкта и не имеют ярко выраженного сходства ни с бомбардировщиками, ни с истребителями.
Все эти результаты кластерно-конструктивного анализа разумны и соответствуют ожиданиям экспертов, основанных на их интуиции, опыте и профессиональной компетентности.
Парето-оптимизация (абстрагирование). Не все описательные шкалы и градации имеют одинаковую ценность для идентификации изображений самолетов. Наиболее ценные могут использоваться для решения задач, а наименее ценные вообще могут не учитываться в моделях практически без ущерба для их достоверности (рисунок 33).
Рисунок 32. Результаты сравнения друг с другом обобщенных образов классов (самолетов различных типов и моделей)
Расшифровка наименований градаций описательных шкал, ранжированных в порядке убывания их ценности, дается в дополнительных таблицах, которые в данной статье приводить нецелесообразно. Отметим лишь, что в системе «Эйдос» есть выходные формы, в которых градации описательных шкал и сами описательные шкалы расположены в порядке убывания их ценности для дифференциации объектов обучающей выборки по классам.
Рисунок 33. Общий вид Парето-кривой ценности градаций описательных шкал (элементов контуров изображений) для идентификации конкретных изображений с обобщенными образами классов
Отметим, что 50% градаций описательных шкал содержат более 80% суммарной ценности всех градаций для дифференциации объектов по классам.
Выводы
когнитивный математический эйдос самолет
В статье рассматривается применение автоматизированного системно-когнитивного анализа (АСК-анализ), его математической модели - системной теории информации и программного инструментария - интеллектуальной системы «Эйдос» для решения задач, связанных с идентификацией типов и моделей самолетов по их силуэтам снизу, точнее, по внешним контурам: 1) оцифровка сканированных изображений самолетов и создание их математических моделей; 2) формирование математических моделей конкретных самолетов с применением теории информации; 3) формирование моделей обобщенных образов самолетов различных типов и моделей; 4) сравнение образа конкретного самолета с обобщенными образами самолетов различных типов и моделей и определение количественной степени сходства -различия между ними, т.е. идентификация типа и модели самолета по его силуэту (контуру) снизу; 5) количественное определение сходства-различия обобщенных образов самолетов друг с другом, т.е. кластерно-конструктивный анализ обобщенных образов самолетов различных типов и моделей. Предлагается новый подход к оцифровке изображений самолетов, основанный на использовании полярной системы координат, центра тяжести изображения и его внешнего контура. Перед оцифровкой изображений могут применяться их преобразования, стандартизирующие положение изображений, их размеры (разрешение, расстояние) и угол поворота (ракурс) в трех плоскостях. Поэтому результаты оцифровки и АСК-анализа изображений могут быть инвариантны (независимы) относительно их положения, размеров и поворотов. Форма контура конкретного самолета рассматривается как зашумленное информационное сообщение о типе и модели самолета, включающее как информацию об истинной форме самолета данного типа и модели (чистый сигнал), так и шум, искажающий эту истинную форму, обусловленный зашумляющими воздействиями как средств противодействия обнаружению и идентификации, так и окружающей среды. Программный инструментарий АСК-анализа - интеллектуальная система «Эйдос» обеспечивает идентификацию типа и модели самолета по его силуэту, что продемонстрировано на упрощенном численном примере.
Материалы данной статьи могут быть использованы при преподавании дисциплин: интеллектуальные системы; инженерия знаний и интеллектуальные системы; интеллектуальные технологии и представление знаний; представление знаний в интеллектуальных системах; основы интеллектуальных систем; введение в нейроматематику и методы нейронных сетей; основы искусственного интеллекта; интеллектуальные технологии в науке и образовании; управление знаниями; автоматизированный системно-когнитивный анализ и интеллектуальная система «Эйдос»; которые автор ведет в настоящее время http://lc.kubagro.ru/My_training_schedule.doc, а также и в других дисциплинах, связанных с преобразованием данных в информацию, а ее - в знания и применением этих знаний для решения задач идентификации, прогнозирования, принятия решений и исследования моделируемой предметной области (а это практически все дисциплины во всех областях науки). В частности с применением предложенной технологии АСК-анализа изображений по их контурам могут быть модифицированы лабораторные работы 1 и 3 [15, 16].
Этим и другим применениям должно способствовать и то, что система «Эйдос» находится в полном открытом бесплатном доступе (причем с подробно комментированными открытыми исходными текстами) на сайте автора по адресу: http://lc.kubagro.ru/aidos/_Aidos-X.htm.
Запланировано совершенствование методологии, технологии, методики и программного инструментария АСК-анализа изображений путем развития, применения и обобщения описанного в данной работе подхода.
Размещено на Allbest.ru
...Подобные документы
Общий анализ технологического процесса, реализуемого агрегатом, целей и условий его ведения. Разработка структурной схемы объекта управления. Идентификация моделей каналов преобразования координатных воздействий. Реализация моделей и их адекватность.
курсовая работа [2,0 M], добавлен 29.09.2013Анализ современного состояния общей проблемы синтеза моделей многофакторного оценивания и подходов к ее решению. Разработка математической модели метода компараторной идентификации модели многофакторного оценивания. Описание генетического алгоритма.
дипломная работа [851,7 K], добавлен 11.09.2012Подсистема анализа изображения отпечатка пальца в составе системы идентификации личности по отпечаткам пальцев на основе папиллярного узора для дальнейшего распознавания личности. Характеристика функциональных возможностей системы и код програмы.
дипломная работа [3,1 M], добавлен 01.07.2008Идентификация объектов методом наименьших квадратов, построение линейной модели для неравноточных измерений входной величины. Численные процедуры оценивания параметров нелинейной регрессии; аналитическая модель химического реактора; линеаризация.
курсовая работа [1,2 M], добавлен 12.12.2010Содержание активного и пассивного методов идентификации динамических объектов. Проведение полного факторного эксперимента, в котором реализуются все возможные сочетания уравнений факторов. Применение метода наименьших квадратов и регрессионного анализа.
контрольная работа [140,1 K], добавлен 05.11.2011Идентификация моделей каналов преобразования координатных воздействий объекта управления. Реализация моделей на ЦВМ и их адекватность. Формулирование задач управления, требований к их решению и выбор основных принципов построения автоматических систем.
курсовая работа [1,4 M], добавлен 10.04.2013Проведение идентификации модели по схеме МНК. Запись исходной модели в дискретной форме. Сравнение параметров модели и результатов идентификации. Анализ графиков модельного выходного сигнала и оценки выходного сигнала, восстановленных по схеме МНК.
лабораторная работа [461,0 K], добавлен 19.02.2015Обзор разнообразных методов теории линейных систем: методов корреляционного и регрессионного анализа, косинор-анализа. Особенности применения факторного анализа. Программная реализация метода главных компонент. Разработка нелинейных регрессионных моделей.
дипломная работа [390,2 K], добавлен 03.09.2016Обзор веб-приложений для реализации онлайн фитнес-системы поддержания физической формы человека. Диаграммы вариантов использования. Построение логической модели данных. Способы идентификации классов анализа. Разработка сценариев и макетов экранных форм.
дипломная работа [1,2 M], добавлен 02.08.2016Типология свойств объекта, его связей и моделей представления информации. Изображение предметной области в виде логических и физических моделей. Требования к системам баз данных. Достоинства трехуровневой архитектуры. Процесс идентификации объектов.
лекция [60,0 K], добавлен 19.08.2013Основные понятия и элементы ER-модели в нотации CASE-средства ERwin. Жизненный цикл программного изделия и его этапы. Понятие структурного анализа. Физический уровень представления БД. Уникальные идентификаторы типов сущности. Построение моделей в ERwin.
методичка [269,7 K], добавлен 08.02.2012Основы теории классификаторов. Идентификация, четкая и нечеткая классификация. Обучающие и тестовые последовательности наборов данных. Популярные метрики (меры) оценки расстояния между образами. Дискриминантный анализ. Деревья решений. Логический вывод.
лекция [596,5 K], добавлен 28.12.2013Рассмотрение основных способов идентификации объектов: реккурентного; с использованием степенных полиномов; ортогональных полиномов Чебышева; методом наименьших квадратов для авторегрессионной модели. Алгоритм построения простых диагностических тестов.
курсовая работа [1,9 M], добавлен 14.06.2012Предмет и этапы когнитивного анализа задач, его основные методы и их реализация на псевдокодовом языке. Виды факторов, использующихся при когнитивном моделировании систем. Предъявляемые к библиотеке требования, оценка ее экономической эффективности.
дипломная работа [1,3 M], добавлен 29.01.2013Основы биометрической идентификации. Возможность использования нейросетей для построения системы распознавания речи. Разработка программного обеспечения для защиты от несанкционированного доступа на основе спектрального анализа голоса пользователя.
дипломная работа [2,8 M], добавлен 10.11.2013Назначение, классификация и состав системы контроля управления доступом. Основные характеристики биометрических средств идентификации личности. Идентификация пользователя по радужной оболочке глаз. Разработка алгоритма функционирования устройства.
дипломная работа [1,1 M], добавлен 25.11.2014Автоматическое обнаружение и классификация образов самолетов на аэрокосмических снимках, использование их трехмерных сгенерированных моделей. Разработка программно-математического обеспечения с аппаратной реализацией расчетов на графических процессорах.
статья [1,6 M], добавлен 08.10.2014Поведение идентификации термического объекта исследования, компьютерного моделирования объекта по полученной математической модели. Расчет переходных характеристик замкнутой системы автоматического управления, а также анализ ее устойчивости и качества.
дипломная работа [1,8 M], добавлен 17.09.2011Состав и принцип работы аппаратуры. Выбор параметров корреляционного анализа и Фурье-анализа. Разработка и применение алгоритма корреляционного анализа. Реализация алгоритма Фурье-анализа на языке С++ и алгоритма корреляционного анализа на языке С#.
дипломная работа [4,6 M], добавлен 30.11.2016Особенности применения средств криптографической защиты информации в сетях и системах защищенной связи. Уровни реализации, структура, классификация VPN. Процесс подключении удалённого пользователя, идентификация и аутентификация на сервере доступа.
курсовая работа [434,0 K], добавлен 30.05.2016