Проблема референтного класса и ее концептуальное, математическое и инструментальное решение в системно-когнитивном анализе
Понятие когнитивного конфигуратора и необходимость естественнонаучной когнитивной концепции. Формирование матрицы условных и безусловных вероятностей. Цели и основные функции системы Эйдос. Синтез содержательной информационной модели предметной области.
Рубрика | Философия |
Вид | статья |
Язык | русский |
Дата добавления | 26.04.2017 |
Размер файла | 1,9 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
.
Здесь можно провести очень интересную и важную аналогию между способом формирования матрицы абсолютных частот и работой многоканальной системы выделения полезного сигнала из шума. Представим себе, что все объекты, предъявляемые для формирования обобщенного образа некоторого класса в действительности являются различными реализациями одного объекта - "Эйдоса" (в смысле Платона), по-разному зашумленного различными случайными обстоятельствами. И наша задача состоит в том, чтобы подавить этот шум и выделить из него то общее и существенное, что отличает объекты данного класса от объектов других классов. Учитывая, что шум чаще всего является "белым" и имеет свойство при суммировании с самим собой стремиться к нулю, а сигнал при этом наоборот возрастает пропорционально количеству слагаемых, то увеличение объема обучающей выборки приводит ко все лучшему отношению сигнал/шум в матрице абсолютных частот, т.е. к выделению полезной информации из шума. Примерно так мы начинаем постепенно понимать смысл фразы, которую мы сразу не расслышали по телефону и несколько раз переспрашивали. При этом в повторах шум не позволяет понять то одну, то другую часть фразы, но в конце-концов за счет использования памяти и интеллектуальной обработки информации мы понимаем ее всю. Так и объекты, описанные признаками, можно рассматривать как зашумленные фразы, несущие нам информацию об обобщенных образах классов: "Эйдосах" [5, 9], к которым они относятся. И эту информацию мы выделяем из шума при синтезе модели.
Выразим относительные частоты ("вероятности") Pij, Pj и Pi через абсолютные частоты наблюдения признаков по классам (см. таблица 1). Вероятности с одним и тем же обозначением для разных выражений рассчитываются по-разному.
Для выражения (11) получим:
( 14 )
Для выражений (12) и (13):
( 15 )
Для выражений (11), (12) и (13):
( 16 )
В (16) использованы обозначения:
Nij - суммарное количество наблюдений в исследуемой выборке факта: "действовало i-е значение фактора и объект перешел в j-е состояние";
Nj - суммарное количество встреч различных факторов у объектов, перешедших в j-е состояние;
Ni - суммарное количество встреч i-го фактора у всех объектов исследуемой выборки;
N - суммарное количество встреч различных факторов у всех объектов исследуемой выборки.
Формирование матрицы относительных частот (условных и безусловных вероятностей).
На основе анализа матрицы частот (таблица 1) классы можно сравнивать по наблюдаемым частотам признаков только в том случае, если количество объектов по всем классам одинаково, как и суммарное количество признаков по классам. Если же они отличаются, то корректно сравнивать классы можно только по условным и безусловным вероятностям наблюдения признаков, посчитанных на основе матрицы частот (таблица 1) в соответствии с выражениями (14) и (15), в результате чего получается матрица условных и безусловных процентных распределений (таблица 2).
При расчете матрицы условных и безусловных вероятностей Nj из таблицы 1 могут браться либо из предпоследней, либо из последней строки. В 1-м случае Nj представляет собой "Суммарное количество признаков у всех объектов, использованных для формирования обобщенного образа j-го класса", а во 2-м случае, это "Суммарное количество объектов обучающей выборки, использованных для формирования обобщенного образа j-го класса", соответственно получаем различные, хотя и очень сходные семантические информационные модели, которые мы называем СИМ-1 и СИМ-2 [9, 17]. Оба этих вида моделей поддерживаются системой "Эйдос".
Таблица 3 - МАТРИЦА ОТНОСИТЕЛЬНЫХ ЧАСТОТ (УСЛОВНЫХ И БЕЗУСЛОВНЫХ ВЕРОЯТНОСТЕЙ)
Классы |
Безусловная вероятность признака |
|||||||
1 |
... |
j |
... |
W |
||||
Значения факторов |
1 |
|||||||
... |
||||||||
i |
||||||||
... |
||||||||
M |
||||||||
Безусловная вероятность класса |
Эквивалентность выражений (11) и (12) устанавливается, если подставить в них выражения вероятности Pij, Pj и Pi через частоты наблюдения признаков по классам из (14), (15) и (16). В обоих случаях из выражений (11) и (12) получается одно и тоже выражение (17):
( 17 )
А из (13) выражение (18), с которым мы и будем далее работать.
( 18 )
При взаимно-однозначном соответствии классов и признаков в равновероятном детерминистском случае имеем (таблица 3):
Таблица 4 - МАТРИЦА ЧАСТОТ В РАВНОВЕРОЯТНОМ ДЕТЕРМИНИСТСКОМ СЛУЧАЕ
Классы |
Сумма |
|||||||
1 |
... |
j |
... |
W |
||||
Значения факторов |
1 |
1 |
1 |
|||||
... |
1 |
1 |
||||||
i |
1 |
1 |
||||||
... |
1 |
1 |
||||||
M |
1 |
1 |
||||||
Сумма |
1 |
1 |
1 |
1 |
1 |
N |
В этом случае к каждому классу относится один объект, имеющий единственный признак. Откуда получаем для всех i и j (19):
( 19 )
Таким образом, обобщенная формула А.Харкевича (18) с учетом (19) в этом случае приобретает вид:
( 20 )
откуда:
( 21 )
или, учитывая выражение для коэффициента эмерджентности Хартли (8):
( 22 )
Подставив коэффициент эмерджентности А.Харкевича (21) в выражение (18), получим:
или окончательно:
( 23 )
Отметим, что 1-я задача получения системного обобщения формул Хартли и Харкевича и 2-я задача получения такого обобщения формулы Харкевича, которая удовлетворяет принципу соответствия с формулой Хартли - это две разные задачи. 1-я задача является более общей и при ее решении, которое приведено выше, автоматически решается и 2-я задача, которая является, таким образом, частным случаем 1-й.
Однако, представляет самостоятельный интерес и частный случай, в результате которого получается формула Харкевича удовлетворяющая в равновероятном детерминистском случае принципу соответствия с классической формулой Хартли (1), а не с ее системным обобщением (2) и (3). Ясно, что эта формула получается из (23) при =1.
( 24 )
Из выражений (21) и (22) видно, что в этом частном случае, т.е. когда система эквивалентна множеству (M=1), коэффициент эмерджентности А.Харкевича приобретает вид:
( 25 )
На практике для численных расчетов на удобнее пользоваться не выражениями (23) или (24), а формулой (26), которая получается непосредственно из (18) после подстановки в него выражения (25):
( 26 )
В классическом анализе Шеннона идет речь лишь о передаче символов по одному информационному каналу от одного источника к одному приемнику. Его интересует прежде всего передача самого сообщения.
В данной статье ставится другая задача: идентифицировать или распознать информационный источник по сообщению от него. Поэтому метод Шеннона был обобщен путем учета в математической модели возможности существования многих источников информации, о которых к приемнику по зашумленному каналу связи приходят не отдельные символы-признаки, а сообщения, состоящие из последовательностей символов (признаков) любой длины.
Следовательно, ставится задача идентификации информационного источника по сообщению от него, полученному приемником по зашумленному каналу. Метод, являющийся обобщением метода К.Шеннона, позволяет применить классическую теорию информации для построения моделей систем распознавания образов и принятия решений, ориентированных на применение для синтеза адаптивных АСУ сложными объектами.
Для решения поставленной задачи необходимо вычислять не средние информационные характеристики, как в теории Шеннона, а количество информации, содержащееся в конкретном i-м признаке (символе) о том, что он пришел от данного j-го источника информации. Это позволит определить и суммарное количество информации в сообщении о каждом информационном источнике, что дает интегральный критерий для идентификации или прогнозирования состояния объекта.
Логично предположить, что среднее количество информации, содержащейся в системе признаков о системе классов
( 27 )
является ничем иным, как усреднением (с учетом условной вероятности наблюдения) "индивидуальных количеств информации", которые содержатся в конкретных признаках о конкретных классах (источниках), т.е.:
( 28 )
Это выражение определяет так называемую "плотность информации", т.е. количество информации, которое содержится в одном отдельно взятом факте наблюдения i-го символа (признака) на приемнике о том, что этот символ (признак) послан j-м источником.
Если в сообщении содержится M символов, то суммарное количество информации о принадлежности данного сообщения j-му информационному источнику (классу) составляет:
( 29 )
Необходимо отметить, что применение сложения в выражении (29) является вполне корректным и оправданным, так как информация с самого начала вводилась как аддитивная величина, для которой операция сложения является корректной.
Преобразуем выражение (29) к виду, более удобному для применения на практике для численных расчетов. Для этого традиционным для теории информации Шеннона способом выразим вероятности встреч признаков через частоты их наблюдения:
( 30 )
Подставив (30) в (29), получим:
( 31 )
Если ранжировать классы в порядке убывания суммарного количества информации о принадлежности к ним, содержащейся в данном сообщении (т.е. описании объекта), и выбирать первый из них, т.е. тот, о котором в сообщении содержится наибольшее количество информации, то мы получим обоснованную статистическую процедуру, основанную на классической теории информации, оптимальность которой доказывается в фундаментальной лемме Неймана-Пирсона [2, 3].
Подставим значения вероятностей из (30) в (28) и получим выражением для плотности информации Шеннона, выраженное не через вероятности, а через частоты наблюдения символов, которые рассматриваются как признаки объектов, т.е. количество информации, содержащееся в отдельном i-м признаке о том, что другом конце канала связи находится j-й объект (32):
( 32 )
Сравнивая выражения (23) и (32) видим, что в системном обобщении формулы Харкевича 1-е слагаемое практически тождественно выражению Шеннона для плотности информации, а 2-е слагаемое представляющем собой плотность информации по Хартли.
Различия состоят в том, что в выражении (23) это слагаемое возведено в степень, имеющую смысл коэффициента эмерджентности Харкевича. Поэтому вполне оправданным называть это слагаемое не коэффициентом эмерджентности Харкевича, а коэффициентом эмерджентности Шеннона-Харкевича. Необходимо отметить также, что значения частот в этих формулах связаны с вероятностями несколько различным образом (выражения 14-16 и 30).
Из этого следует также, что полученное выражение (23) представляет собой нелинейную суперпозицию выражений для плотности информации Шеннона и Хартли, и, таким образом, является обобщающим выражением для плотности информации, которое при различных условиях асимптотически переходит в классические выражения Хартли и Харкевича, а от выражения Шеннона отличается лишь константой, т.е. 2-м слагаемым, характеризующим мощность множества состояний объекта в модели.
Это позволяет нам обоснованно высказать гипотезу о том, что системная теория информации (СТИ), базирующаяся на выражении (23) для плотности информации, является более общей, чем теории Хартли, Шеннона и Харкевича и асимптотически связана с ними через принцип соответствия (рисунок 1).
Таблица 5. Генезис системной (эмерджентной) теории информации
Получение матрицы знаний (информативностей).
На основе анализа матрицы условных и безусловных вероятностей (таблица 3) наблюдений признаков по классам и всей выборке можно сравнивать признаки друг с другом по их роли для сравнения классов друг с другом и конкретных объектов с обобщенными классами. При этом существует 3 основных группы признаков:
Группа 1-я. Которые в одном классе встречаются, а в других нет. Это детерминистские признаки, обнаружение такого признака у объекта однозначно определяет его принадлежность к соответствующему классу.
Группа 2-я. Которые в одном классе встречаются чаще, чем в других. Это статистические признаки, обнаружение такого признака у объекта несет некоторую информацию о его принадлежности к соответствующему классу.
Группа 3-я. Которые в разных классах встречаются одной и той же вероятностью. Это признаки, обнаружение которых у объекта не несет никакой информации о его принадлежности к тем или иным классам.
Таким образом мы видим, что если используя таблицу 3 анализировать условные вероятности (или процентные распределения) признаков по классам, то можно вынести правдоподобные суждения о принадлежности объектов, обладающих этими признакам к тем или иным классам.
Однако в таком методе сравнения есть по крайней мере два существенных недостатка:
1. Для того, чтобы отнести признак к одной из вышеперечисленных групп необходимо сравнивать вероятности его наблюдения по классам, т.е. каждый раз при таком сравнении выполнять соответствующую необходимую для этого работу.
2. При отнесении признака ко 2-й группе этого самого по себе еще недостаточно для его использования с целью идентификации объекта, а необходимо еще оценить количество информации, которое содержится в факте обнаружения у объекта этого признака о принадлежности этого объекта к каждому из классов, а для этого необходим соответствующий математический и численный метод.
Что касается 1-го недостатка, то о нем можно сказать, что для реальных задач большой размерности выполнение этого сравнения вручную практически невозможно, а значит тем более невозможно и использование результатов этого сравнения для решения задач идентификации, прогнозирования и поддержки принятия решений, а тем более для исследования предметной области путем исследования ее модели. Все это обусловлено тем, что результат сравнения вероятностей встречи признака по классам не представляется при ручной обработке в количественной форме некоторого одного числа: частного критерия, величина и знак которого отражали бы результат такого сравнения.
2-й недостаток преодолевается методом, который предложен А.Харкевичем в выражениях (11) и (12) и уточнен нами в системном обобщении этих выражений (18). В этом методе предложено сравнивать не условные вероятности наблюдения признаков по различным классам друг с другом, а условную вероятность наблюдения признака по классу с безусловной вероятностью его наблюдения по всей выборке.
Это предложение по своей сути полностью соответствует известному статистическому методу отклонений от средних и нормативному подходу, когда в качестве базы сравнения выбирается норма, т.е. среднее по всей группе. На основе этого подхода формируются и критерии сравнения, т.е. можно сказать, что критериальный подход изначально основан на нормативном.
Если такое сравнение провести по всем признакам и классам, то получится матрица, снимающая оба указанных недостатка: используя выражение (18) и данные таблицы 1 непосредственно прямым счетом получаем матрицу знаний (таблица 6):
Таблица 6 - МАТРИЦА ЗНАНИЙ (ИНФОРМАТИВНОСТЕЙ)
Классы |
Значимость фактора |
|||||||
1 |
... |
j |
... |
W |
||||
Значения факторов |
1 |
|||||||
... |
||||||||
i |
||||||||
... |
||||||||
M |
||||||||
Степень редукции класса |
1 |
j |
W |
Здесь - это среднее количество знаний в i-м значении фактора:
При расчете матрицы знаний Nj из таблицы 1 могут браться либо из предпоследней, либо из последней строки. В 1-м случае Nj представляет собой "Суммарное количество признаков у всех объектов, использованных для формирования обобщенного образа j-го класса", а во 2-м случае, это "Суммарное количество объектов обучающей выборки, использованных для формирования обобщенного образа j-го класса", соответственно получаем различные, хотя и очень сходные семантические информационные модели, которые мы называем СИМ-1 и СИМ-2 [9, 17]. Оба этих вида моделей поддерживаются системой "Эйдос".
Количественные значения коэффициентов Iij таблицы 4 являются знаниями о том, что "объект перейдет в j-е состояние" если "на объект действует i-е значение фактора".
Принципиально важно, что эти весовые коэффициенты не определяются экспертами на основе опыта интуитивным неформализуемым способом, а рассчитываются непосредственно на основе эмпирических данных на основе теоретически обоснованной модели, хорошо зарекомендовавшей себя на практике при решении широкого круга задач в различных предметных областях.
Когда количество информации Iij>0 - i-й фактор способствует переходу объекта управления в j-е состояние, когда Iij<0 - препятствует этому переходу, когда же Iij=0 - никак не влияет на это. В векторе i-го фактора (строка матрицы информативностей) отображается, какое количество информации о переходе объекта управления в каждое из будущих состояний содержится в том факте, что данный фактор действует. В векторе j-го состояния класса (столбец матрицы информативностей) отображается, какое количество информации о переходе объекта управления в соответствующее состояние содержится в каждом из факторов.
Таким образом, матрица информативностей (таблица 4) является обобщенной таблицей решений, в которой входы (факторы) и выходы (будущие состояния объекта управления) связаны друг с другом не с помощью классических (Аристотелевских) импликаций, принимающих только значения: "Истина" и "Ложь", а различными значениями истинности, выраженными в битах и принимающими значения от положительного теоретически-максимально-возможного ("Максимальная степень истинности"), до теоретически неограниченного отрицательного ("Степень ложности").
Фактически предложенная модель позволяет осуществить синтез обобщенных таблиц решений для различных предметных областей непосредственно на основе эмпирических исходных данных и продуцировать на их основе прямые и обратные правдоподобные (нечеткие) логические рассуждения по неклассическим схемам с различными расчетными значениями истинности, являющимся обобщением классических импликаций.
Таким образом данная модель позволяет рассчитать какое количество информации содержится в любом факте о наступлении любого события в любой предметной области, причем для этого не требуется повторности этих фактов и событий. Если же эти повторности осуществляются и при этом наблюдается некоторая вариабельность значений факторов, обуславливающих наступление тех или иных событий, то модель обеспечивает многопараметрическую типизацию, т.е. синтез обобщенных образов классов или категорий наступающих событий с количественной оценкой степени и знака влияния на их наступление различных значений факторов. Причем эти значения факторов могут быть как количественными, так и качественными и измеряться в любых единицах измерения, в любом случае в модели оценивается количество информации которое в них содержится о наступлении событий, переходе объекта управления в определенные состояния или просто о его принадлежности к тем или иным классам.
Математическая модель СТИ позволяет прогнозировать поведение объекта управления при воздействии на него не только одного, но и целой системы факторов:
( 33 )
В теории принятия решений скалярная функция Ij векторного аргумента называется интегральным критерием. Основная проблема состоит в выборе такого аналитического вида функции интегрального критерия, который обеспечил бы эффективное решение сформулированной выше задачи АСУ.
Учитывая, что частные критерии (26) имеют смысл количества информации, а информация по определению является аддитивной функцией, предлагается ввести интегральный критерий, как аддитивную функцию от частных критериев в виде:
( 34 )
В выражении (34) круглыми скобками обозначено скалярное произведение, т.е. свертка. В координатной форме это выражение имеет вид:
, ( 35 )
где: - вектор j-го класса-состояния объекта управления;
- вектор состояния предметной области, включающий все виды факторов, характеризующих объект управления, возможные управляющие воздействия и окружающую среду (массив-локатор), т.е.:
В реализованной модели значения координат вектора состояния предметной области принимались равными либо 1 (фактор действует), либо 0 (фактор не действует).
Таким образом, интегральный критерий представляет собой суммарное количество информации, содержащееся в системе значений факторов различной природы (т.е. факторах, характеризующих объект управления, управляющее воздействие и окружающую среду) о переходе объекта управления в то или иное будущее состояние или о его принадлежности к некоторому обобщенному классу.
В многокритериальной постановке задача прогнозирования состояния объекта управления, при оказании на него заданного многофакторного управляющего воздействия Ij, сводится к максимизации интегрального критерия:
( 36 )
т.е. к выбору такого состояния объекта управления, для которого интегральный критерий максимален.
Результат прогнозирования поведения объекта управления, описанного данной системой факторов, представляет собой список его возможных будущих состояний, в котором они расположены в порядке убывания суммарного количества информации о переходе объекта управления в каждое из них.
Результат идентификации состояния конкретного объекта, описанного данной системой признаков, представляет собой список обобщенных образов классов, ранжированный в порядке убывания суммарного количества информации, содержащейся в системе признаков объекта о его принадлежности к этим классам.
В работах [2, 9] показано, что результат идентификации объекта с классами в СТИ можно рассматривать как его разложение вряд по профилям классов.
В данной работе показано, что предложенная информационная мера обеспечивает сопоставимость индивидуальных количеств информации, содержащейся в факторах о классах, а также сопоставимость интегральных критериев, рассчитанных для одного объекта и разных классов, для разных объектов и разных классов.
Когда количество информации Iij>0 - i-й фактор способствует переходу объекта управления в j-е состояние, когда Iij<0 - препятствует этому переходу, когда же Iij=0 - никак не влияет на это. В векторе i-го фактора (строка матрицы информативностей) отображается, какое количество информации о переходе объекта управления в каждое из будущих состояний содержится в том факте, что данный фактор действует. В векторе j-го состояния класса (столбец матрицы информативностей) отображается, какое количество информации о переходе объекта управления в соответствующее состояние содержится в каждом из факторов.
Таким образом, матрица информативностей (таблица 4) является обобщенной таблицей решений, в которой входы (факторы) и выходы (будущие состояния активного объекта управления (АОУ)) связаны друг с другом не с помощью классических (Аристотелевских) импликаций, принимающих только значения: "Истина" и "Ложь", а различными значениями истинности, выраженными в битах и принимающими значения от положительного теоретически-максимально-возможного ("Максимальная степень истинности"), до теоретически неограниченного отрицательного ("Степень ложности").
Фактически предложенная модель позволяет осуществить синтез обобщенных таблиц решений для различных предметных областей непосредственно на основе эмпирических исходных данных и продуцировать на их основе прямые и обратные (т.е. индуктивные и дедуктивные) правдоподобные (нечеткие) логические рассуждения по неклассическим схемам с различными расчетными значениями истинности, являющимся обобщением классических импликаций (таблица 7).
Таблица 7 - Прямые и обратные (индуктивные и дедуктивные) правдоподобные логические высказывания с расчетной (в соответствии с сти) степенью истинности импликаций
Приведем пример более сложного (опосредованного) высказывания, которое может быть рассчитано непосредственно на основе матрицы информативностей - обобщенной таблицы решений (таблица 7):
Если A, со степенью истинности (A,B) детерминирует B, и если С, со степенью истинности (C,D) детерминирует D, и A совпадает по смыслу с C со степенью истинности (A,C), то это вносит вклад в совпадение B с D, равный степени истинности (B,D).
При этом в прямых рассуждениях как предпосылки рассматриваются факторы, а как заключение - будущие состояния АОУ, а в обратных - наоборот: как предпосылки - будущие состояния АОУ, а как заключение - факторы. Степень истинности i-й предпосылки - это просто количество информации Iij, содержащейся в ней о наступлении j-го будущего состояния АОУ. Если предпосылок несколько, то степень истинности наступления j-го состояния АОУ равна суммарному количеству информации, содержащемуся в них об этом. Количество информации в i-м факторе о наступлении j-го состояния АОУ, рассчитывается в соответствии с выражением (26) СТИ.
Прямые правдоподобные логические рассуждения позволяют прогнозировать степень достоверности наступления события по действующим факторам, а обратные - по заданному состоянию восстановить степень необходимости и степень нежелательности каждого фактора для наступления этого состояния, т.е. принимать решение по выбору управляющих воздействий на АОУ, оптимальных для перевода его в заданное целевое состояние.
Это и есть (на наш взгляд) математическое решение проблемы референтного класса в СТИ.
Необходимо отметить, что предложенная модель, основывающаяся на теории информации, обеспечивает также автоматизированное формирования системы нечетких правил по содержимому входных данных, как и комбинация нечеткой логики Заде-Коско с нейронными сетями Кохонена. Принципиально важно, что качественное изменение модели путем добавления в нее новых классов не уменьшает достоверности распознавания уже сформированных классов. Кроме того, при сравнении распознаваемого объекта с каждым классом учитываются не только признаки, имеющиеся у объекта, но и отсутствующие у него, поэтому предложенной моделью правильно идентифицируются объекты, признаки которых образуют множества, одно из которых является подмножеством другого (как и в Неокогнитроне К.Фукушимы) [2, 3].
Задача принятия решения о выборе наиболее эффективного управляющего воздействия является обратной задачей по отношению к задаче максимизации интегрального критерия (идентификации и прогнозирования), т.е. вместо того, чтобы по набору факторов прогнозировать будущее состояние объекта, наоборот, по заданному (целевому) состоянию объекта определяется такой набор факторов, который с наибольшей эффективностью перевел бы объект управления в это состояние.
Предлагается еще одно обобщение фундаментальной леммы Неймана-Пирсона, основанное на косвенном учете корреляций между информативностями в векторе состояний при использовании средних по векторам. Соответственно, вместо простой суммы количеств информации предлагается использовать корреляцию между векторами состояния и объекта управления, которая количественно измеряет степень сходства этих векторов:
( 37 )
где: - средняя информативность по вектору класса;
- среднее по вектору идентифицируемой ситуации (объекта).
- среднеквадратичное отклонение информативностей вектора класса;
- среднеквадратичное отклонение по вектору распознаваемого объекта.
Выражение (37) получается непосредственно из (35) после замены координат перемножаемых векторов их стандартизированными значениями:
Необходимо отметить, что выражение для интегрального критерия сходства (37) по своей математической форме является корреляцией двух векторов, т.е. нормированной сверткой в координатной форме. Это означает, что если эти вектора являются суммой двух сигналов: полезного и белого шума, то при расчете интегрального критерия белый шум практически не будет играть никакой роли, т.е. его корреляция с самими собой равна нулю по определению. Поэтому интегральный критерий сходства объекта со случным набором признаков с любыми образами классов, или реального объекта с образами классов, сформированными случайным образом, будет равен нулю. Это означает, что выбранный интегральный критерий сходства является высокоэффективным средством подавления белого шума и выделения полезной информации из шума, который неизбежно присутствует в эмпирических данных.
Важно также отметить неметрическую природу предложенного интегрального критерия сходства, благодаря чему его применение является корректным и при неортонормированном семантическом информационном пространстве, каким оно в подавляющем количестве случае и является, т.е. в общем случае.
Сравнение, идентификация и прогнозирование как разложение векторов объектов в ряд по векторам классов (объектный анализ)
Выше были введены неметрические интегральные критерии сходства объекта, описанного массивом-локатором Li с обобщенными образами классов Iij (выражения 40-42).
Для непрерывного случая выражение (42) принимает вид:
. ( 38 )
Таким образом, выражение (38) представляет собой обобщение интегрального критерия сходства конкретного объекта и обобщенного класса (42) для непрерывного случая в координатной форме.
Отметим, что коэффициенты ряда Фурье (39) по своей математической форме и смыслу сходны с ненормированными коэффициентами корреляции, т.е. по сути скалярными произведениями для непрерывных функций в координатной форме: выражением (37) между разлагаемой в ряд кривой f(x) и функциями Sin и Сos различных частот и амплитуд [2]:
, ( 39 )
где n={1, 2, 3,…} - натуральное число.
Из сравнения выражений (38) и (39) следует вывод о том, что процесс идентификации и прогнозирования (распознавания), реализованный в предложенной математической модели, может рассматриваться как разложение вектора-локатора распознаваемого объекта в ряд по векторам информативностей классов распознавания (которые представляют собой произвольные функции, сформированные при синтезе модели путем многопараметрической типизации на основе эмпирических данных).
Например, результаты идентификации представим на рисунке 3:
Рисунок 3. Пример разложения профиля курсанта усл.№69 в ряд по обобщенным образам классов
Продолжая развивать аналогию с разложением в ряд, данный результат идентификации можно представить в векторной аналитической форме:
или в координатной форме, более удобной для численных расчетов:
, ( 40 )
Предполагается, что . Таким образом массив-локатор, характеризующий распознаваемый объект, рассматривается как сумма произведений профилей классов на интегральный критерий сходства массива-локатора с этими профилями (т.е. взвешенная суперпозиция или разложение в ряд по профилям классов).
В выражении (40):
I(j) - интегральный критерий сходства массива-локатора, описывающего состояние объекта и j-го класса, рассчитываемый, согласно выражений (38) или (40):
( 41 )
I(i,j) - вектор обобщенного образа j-го класса, координаты которого рассчитываются в соответствии с системным обобщением формулы Харкевича (42):
. ( 42 )
Примечание: обозначения I(i,j) и Iij, и т.п. эквивалентны. Смысл всех переменных, входящих в выражения (41) и (42) раскрыт выше.
При дальнейшем развитии данной аналогии естественно возникают вопросы: о полноте, избыточности и ортонормированности системы векторов классов как функций, по которым проводится разложение вектора объекта; о сходимости, т.е. вообще возможности и корректности такого разложения.
В общем случае вектор объекта совершенно не обязательно должен разлагаться в ряд по векторам классов таким образом, что сумма ряда во всех точках точно совпадала со значениями исходной функции. Это означает, что система векторов классов может быть неполна по отношению к профилю распознаваемого объекта, и, тем более, всех возможных объектов.
Предлагается считать не разлагаемые в ряд, т.е. плохо распознаваемые объекты, суперпозицией хорошо распознаваемых объектов ("похожих" на те, которые использовались для формирования обобщенных образов классов), и объектов, которые и не должны распознаваться, так как объекты этого типа не встречались в обучающей выборке и не использовались для формирования обобщенных образов классов, а также не относятся к представляемой обучающей выборкой генеральной совокупности.
Нераспознаваемую компоненту можно рассматривать либо как шум, либо считать ее полезным сигналом, несущим ценную информацию о неисследованных объектах интересующей нас предметной области (в зависимости от целей и тезауруса исследователей). Первый вариант не приводит к осложнениям, так как примененный в математической модели алгоритм сравнения векторов объектов и классов, основанный на вычислении нормированной корреляции Пирсона (сумма произведений), является весьма устойчивым к наличию белого шума в идентифицируемом сигнале. Во втором варианте необходимо дообучить систему распознаванию объектов, несущих такую компоненту (в этой возможности и заключается адаптивность модели). Технически этот вопрос решается просто копированием описаний плохо распознавшихся объектов из распознаваемой выборки в обучающую, их идентификацией экспертами и дообучением системы. Кроме того, может быть целесообразным расширить справочник классов распознавания новыми классами, соответствующими этим объектам, и осуществить пересинтез модели.
Однако на практике гораздо чаще наблюдается противоположная ситуация (можно даже сказать, что она типична), когда система векторов избыточна, т.е. в системе классов распознавания есть очень похожие классы (между которыми имеет место высокая корреляция, наблюдаемая в режиме: "кластерно-конструктивный анализ"). Практически это означает, что в системе сформировано несколько практически одинаковых образов с разными наименованиями. Для исследователя это само по себе является очень ценной информацией. Однако если исходить только из потребности разложения распознаваемого объекта в ряд по векторам классов (чтобы определить суперпозицией каких образов он является, т.е. "разложить его на компоненты"), то наличие сильно коррелирующих друг с другом векторов представляется неоправданным, так как просто увеличивает размерности данных, внося в них мало нового по существу. Поэтому возникает задача исключения избыточности системы классов распознавания, т.е. выбора из всей системы классов распознавания такого минимального их набора, в котором профили классов минимально коррелируют друг с другом, т.е. ортогональны в фазовом пространстве признаков. Это условие в теории рядов называется "ортонормируемостью" системы базовых функций, а в факторном анализе связано с идеей выделения "главных компонент".
В предлагаемой математической модели реализованы два варианта выхода из данной ситуации:
1) исключение неформирующихся, расплывчатых классов;
2) объединение почти идентичных по содержанию (дублирующих друг друга) классов.
Однако выбрать нужный вариант и реализовать его, используя соответствующие режимы, пользователь технологии АСК-анализа должен сам. Вся необходимая и достаточная информация для принятия соответствующих решений предоставляется пользователю инструментария АСК-анализа.
Если считать, что функции образов составляют формально-логическую систему, к которой применима теорема Геделя, то можно сформулировать эту теорему для данного случая следующим образом: "Для любой системы базисных функций в принципе всегда может существовать по крайней мере одна такая функция, что она не может быть разложена в ряд по данной системе базисных функций, т.е. функция, которая является ортонормированной ко всей системе базисных функций в целом". Поэтому для адекватного отражения подобных функций в модели необходимо повышение размерности семантического информационного пространства.
Очевидно, не взаимосвязанными друг с другом могут быть только четко оформленные, детерминистские образы, т.е. образы с высокой степенью редукции ("степень сформированности конструкта"). Поэтому в процессе выявления взаимно-ортогональных базисных образов, в первую очередь, будут выброшены аморфные "расплывчатые" образы, которые связаны практически со всеми остальными образами.
В некоторых случаях результат такого процесса представляет интерес, и это делает оправданным его реализацию. Однако можно предположить, что наличие расплывчатых образов в системе является оправданным, так как в этом случае система образов не будет формальной и подчиняющейся теореме Геделя. Следовательно, система распознавания будет более полна в том смысле, что увеличится вероятность идентификации любого объекта, предъявленного ей на распознавание. Конечно, уровень сходства с аморфным образом не может быть столь высоким, как с четко оформленным. Поэтому в этом случае более уместно применить термин "ассоциация" или нечеткая, расплывчатая идентификация, чем "однозначная идентификация".
Итак, можно сделать следующий вывод: допустимость в математической модели СК-анализа не только четко оформленных (детерминистских) образов, но и образов аморфных, нечетких, расплывчатых является важным достоинством данной модели. Это обусловлено тем, что данная модель обеспечивает корректные результаты анализа, идентификации и прогнозирования даже в тех случаях, когда модели идентификации и информационно-поисковые системы детерминистского типа традиционных АСУ практически неработоспособны. В этих условиях данная модель СК-анализа работает как система ассоциативной (нечеткой) идентификации.
Таким образом, в предложенной семантической информационной модели при идентификации и прогнозировании, по сути, осуществляется разложение векторов идентифицируемых объектов по векторам классов распознавания, т.е. осуществляется "объектный анализ" (по аналогии с спектральным, гармоническим или Фурье-анализом), что позволяет рассматривать идентифицируемые объекты как суперпозицию обобщенных образов классов различного типа с различными амплитудами (25). При этом вектора обобщенных образов классов, с математической точки зрения, представляют собой произвольные функции и не обязательно образуют полную и не избыточную (ортонормированную) систему функций.
Для любого объекта всегда существует такая система базисных функций, что вектор объекта может быть представлен в форме линейной суперпозиции (суммы) этих базисных функций с различными амплитудами. Это утверждение, по-видимому, является одним из следствий фундаментальной теоремы А.Н. Колмогорова, доказанной им в 1957 году (О представлении непрерывных функций нескольких переменных в виде суперпозиций непрерывных функций одного переменного и сложения // Докл. АН СССР, Т. 114, С. 953-956, 1957).
Теорема Колмогорова: Любая непрерывная функция от n переменных F(x1, x2,..., xn) может быть представлена в виде:
,
где gj и hij - непрерывные функции, причем hij не зависят от функции F.
Эта теорема означает, что для реализации функций многих переменных достаточно операций суммирования и композиции функций одной переменной. Удивительно, что в этом представлении лишь функции gj зависят от представляемой функции F, а функции hij универсальны. Необходимо отметить, что теорема Колмогорова является обобщением теоремы В.И. Арнольда (1957), которая дает решение 13-й проблемы Гильберта.
К сожалению, определение вида функций hij и gj для данной функции F представляет собой математическую проблему, для которой пока не найдено общего строгого решения.
В данной работе предлагается рассматривать предлагаемую семантическую информационную модель как один из вариантов решения этой проблемы. В этом контексте функция F интерпретируется как образ идентифицируемого объекта, функция hij - образ j-го класса, а функция gj - мера сходства образа объекта с образом класса.
Инструментальное решение проблемы референтного класса (система "Эйдос")
Цели и основные функции системы "Эйдос"
Универсальная когнитивная аналитическая система "Эйдос" является отечественным лицензионным программным продуктом [14], созданным исключительно с использованием официально приобретенного лицензионного программного обеспечения. По системе "Эйдос" и различным аспектам ее применения имеется 12 научных монографий и учебных пособий с грифами УМО и министерства [2, 3], а также около 200 научных публикаций ряда авторов. Титульная видеограмма системы приведена на рисунке 4:
Рисунок 4. Титульная видеограмма системы "Эйдос"
Система "Эйдос" является одним из элементов предлагаемого решения проблемы и достижения цели данной работы, т.к. она обеспечивает решение следующих задач:
1. Синтез и адаптация семантической информационной модели предметной области, включая объект активный управления и окружающую среду.
2. Идентификация и прогнозирование состояния активного объекта управления, а также разработка управляющих воздействий для его перевода в заданные целевые состояния.
3. Углубленный анализ семантической информационной модели предметной области.
Таким образом, система "Эйдос" является инструментарием, решающим проблему данной работы.
Синтез содержательной информационной модели предметной области
Для разработки информационной модели предметной области необходимо владеть основными принципами ее когнитивной структуризации и формализованного описания. Синтез содержательной информационной модели включает следующие этапы:
1. Формализация (когнитивная структуризация предметной области).
2. Формирование исследуемой выборки и управление ею.
3. Синтез или адаптация модели.
4. Оптимизация модели.
5. Измерение адекватности модели (внутренней и внешней, интегральной и дифференциальной валидности), ее скорости сходимости и семантической устойчивости.
Идентификация и прогнозирование состояния объекта управления, выработка управляющих воздействий
Данный вид работ включает:
1. Ввод распознаваемой выборки.
2. Пакетное распознавание.
3. Вывод результатов распознавания и их оценку.
Углубленный анализ содержательной информационной модели предметной области
Углубленный анализ выполняется в подсистеме "Типология" и включает: конфигуратор когнитивный вероятность эйдос
1. Информационный и семантический анализ классов и признаков.
2. Кластерно-конструктивный анализ классов распознавания и признаков, включая визуализацию результатов анализа в оригинальной графической форме когнитивной графики (семантические сети классов и признаков).
3. Когнитивный анализ классов и признаков (когнитивные диаграммы и диаграммы Вольфа Мерлина).
Обобщенная структура системы "Эйдос"
Данной обобщенной структуре соответствуют и структура управления и дерево диалога системы (таблица 8):
Таблица 8 - ОБОБЩЕННАЯ СТРУКТУРА СИСТЕМЫ "ЭЙДОС"
Подсистема |
Режим |
Функция |
Операция |
|
1. Формализация ПО |
1. Классификационные шкалы и градации |
|||
2. Описательные шкалы (и градации) |
||||
3. Градации описательных шкал (признаки) |
||||
4. Иерархические уровни систем |
1. Уровни классов |
|||
2. Уровни признаков |
||||
5. Программные интерфейсы для импорта данных |
1. Импорт данных из TXT-фалов стандарта DOS-текст |
|||
2. Импорт данных из DBF-файлов стандарта проф. А.Н.Лебедева |
||||
3. Импорт из транспонированных DBF-файлов проф. А.Н.Лебедева |
||||
4. Генерация шкал и обучающей выборки RND-модели |
||||
5. Генерация шкал и обучающей выборки для исследования чисел |
||||
6. Транспонирование DBF-матриц исходных данных |
||||
7. Импорт данных из DBF-файлов стандарта Евгения Лебедева |
||||
6. Почтовая служба по НСИ |
1. Обмен по классам |
|||
2. Обмен по обобщенным признакам |
||||
3. Обмен по первичным признакам |
||||
7. Печать анкеты |
||||
2. Синтез СИМ |
1. Ввод-корректировка обучающей выборки |
|||
2. Управление обучающей выборкой |
1. Параметрическое задание объектов для обработки |
|||
2. Статистическая характеристика, ручной ремонт |
||||
3. Автоматический ремонт обучающей выборки |
||||
3. Синтез семантической информационной модели СИМ |
1. Расчет матрицы абсолютных частот |
|||
2. Исключение артефактов (робастная процедура) |
||||
3. Расчет матрицы информативностей СИМ-1 и сделать ее текущей |
||||
4. Расчет условных процентных распределений СИМ-1 и СИМ-2 |
||||
5. Автоматическое выполнение режимов 1-2-3-4 |
||||
... |
Подобные документы
Понятие как форма мышления, отображающая существенные признаки одноэлементного класса или класса однородных предметов. Логические приемы формирования понятия, их виды, формирование отношений между ними. Виды и сущность определений в логическом анализе.
реферат [96,7 K], добавлен 11.09.2012Проблема, гипотеза, теория, закон как формы научного знания. Методы обоснования научной теории: анализ и синтез, абстрагирование, идеализация. Системно-структурный подход и принцип историзма. Информационные системы и возможности искусственного интеллекта.
реферат [18,2 K], добавлен 21.12.2009Поведенческое сходство человека с животными, стереотипы, уходящие корнями в животный мир. Инстинкт как устойчивая система безусловных (врожденных) рефлексов, наследственная для определенного вида. Приобретение за счет условных рефлексов способностей.
реферат [45,1 K], добавлен 27.12.2009Предмет и цели изучения логики. Понятие и основные концепции истины. Решение задач с помощью "кругов Эйлера". Формализация сложного суждения и построение таблиц истинности. Определение пар суждений, находящихся в отношении противоречия и подчинения.
контрольная работа [116,4 K], добавлен 16.10.2016Функции сознания: познавательная, управляющая, оценочная и целеполагающая. Понятие сознательного и бессознательного. Чувственное и рациональное познание, их единство и основные формы. Современные концепции истины. Проблема истины в философской науке.
презентация [123,8 K], добавлен 26.09.2013Гуманизм в начальный период своего становления. Зарождение и цели реформации. Основные понятия гуманизации образования и принципиальные характеристики содержания гуманитарной подготовки. Гуманизация и гуманитаризация образования как проблема, ее решение.
реферат [30,2 K], добавлен 24.03.2015Понятие мировоззрения, его структура и элементы, роль и значение в формировании личности человека и его взглядов на жизнь. Сущность и признаки картины мира. Модели бытия в рамках философского видения мира, их отличия от естественнонаучной картины мира.
реферат [22,2 K], добавлен 25.01.2011Общее понятие, функции и принципы философии. Необходимость философского познания мира. Человек и мир как центральная проблема философских учений. Философия как теоретическая основу мировоззрения. Сущность диалектического и прагматического методов.
реферат [32,9 K], добавлен 29.05.2010Проблема бытия, структура и свойства сознания. Современная наука о строении материального мира, проблема его познаваемости. Практика как критерий истины, философские концепции общества. Научно-техническая революция, техника как общественный феномен.
шпаргалка [69,4 K], добавлен 08.02.2011История происхождения и дисциплинарный состав философии как научной дисциплины. Понятие, структура и функции религии. Концепции будущего земной жизни. Идея материи в истории философии и естествознания. Смысл жизни человека как философская проблема.
учебное пособие [3,1 M], добавлен 01.04.2013Основные направления формирования методологических идей в области гуманитарного знания. Становление философии истории как науки. Социальные концепции А. Сен-Симона, Дж. Коллингвуда и О. Шпенглера. Философско-методологические проблемы социального познания.
реферат [18,0 K], добавлен 16.04.2009Позитивизм, сциентизм и антисциентизм как социокультурные феномены. Проблема совмещения двух типов культур. Традиции в развитии естественнонаучной и гуманитарной культур. Гносеологический актуализм. Процесс развития науки с позиции исторических корней.
реферат [67,3 K], добавлен 05.06.2008Идеал – образец, норма, идеальный образ, определяющий способ и характер поведения человека или общественного класса. Творчество по идеалу, формирование вещества природы на основе идеала представляет собой специфически человеческую форму жизнедеятельности.
реферат [12,3 K], добавлен 17.02.2005Рассмотрение роли культуры в развитии, реформировании и совершенствовании системы образования. Проблема нравственного и патриотического воспитания подрастающего поколения. Необходимость сочетания личных целей ребенка и социально значимых целей общества.
эссе [15,7 K], добавлен 26.04.2014Нидерландский философ Бенедикт Спиноза и его принцип монизма. Определение природы как единственной основы или субстанции. Уникальность человеческого бытия как философская проблема. Понятие общества, взгляд на него мыслителей и их основные концепции.
контрольная работа [25,1 K], добавлен 19.02.2009Проблема развития общества в истории философии. Исторический процесс в материалистической концепции Маркса. Вопрос смысла жизни человека. Понятие и виды социальной мобильности. Стратификация современной России. Форма правления, типы политических режимов.
контрольная работа [47,2 K], добавлен 03.03.2011Концептуальное представление даосского понимания мироздания. Реальность проявленного Дао и мир как проявленное Дао. Единство пустоты и оформленности мира. Проблема беспорядка в мироздании и человеческое Дао. Путь проявленного мира и роль в нем человека.
автореферат [34,2 K], добавлен 14.07.2009Понятие "наслаждение" в концепции Л. Валы. Гуманистическая переработка христианской этики Э. Роттердамским. Этическое учение Т. Мора. Теория о цели человеческого существования П. Помпанацци. Проблемы человеческой нравственности в философии Монтеня.
реферат [24,3 K], добавлен 16.10.2014Основные принципы учения о "мире идей". Особенности платоновского понимания диалектики. Теория космического миропорядка. Отношение идей к вещам. Отвлечённая диалектика эйдоса. Типы государственного устройства. Черты и принципы идеального государства.
курсовая работа [94,4 K], добавлен 27.03.2015Сущность и основные принципы мифогенной и гносеогенной концепции происхождения философии. Характеристика концепции фрейдизма и неофрейдизма. Особенности формирования и основные черты человеческой личности. Тенденции развития современной цивилизации.
контрольная работа [32,4 K], добавлен 25.08.2012