Системно-когнитивный анализ временных рядов на примере фондового рынка (прогнозирование, принятие решений и исследование предметной области)
Сущность технологии системно-когнитивного анализа и его инструментария. Методика применения СК-анализа для построения семантических моделей временных рядов, решения задач прогнозирования и поддержки принятия решений, исследования предметной области.
Рубрика | Экономико-математическое моделирование |
Вид | статья |
Язык | русский |
Дата добавления | 26.04.2017 |
Размер файла | 1,7 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
УДК 303.732.4
СИСТЕМНО-КОГНИТИВНЫЙ АНАЛИЗ ВРЕМЕННЫХ РЯДОВ НА ПРИМЕРЕ ФОНДОВОГО РЫНКА (прогнозирование, принятие решений и исследование предметной области)
Луценко Евгений Вениаминович
д.э.н., к.т.н., профессор
Лебедев Евгений Александрович
аспирант
Кубанский государственный
аграрный университет, Краснодар, Россия
В статье рассматривается технология и методика применение системно-когнитивного анализа и его инструментария - системы «Эйдос» для использования информационных семантических моделей временных рядов (на примере одного из сегментов фондового рынка) для решения задач прогнозирования и поддержки принятия решений, а также исследования предметной области
In the article the technology and a technique of application of systemic-cognitive analysis and its toolkit - "Eidos" system for information semantic models of time numbers (on an example of one of segments of the share market) and uses of these models for the decision of problems of forecasting and decision-making support, and also subject domain research is examined
Ключевые слова: СИСТЕМНО-КОГНИТИВНЫЙ АНАЛИЗ, ВРЕМЕННЫЕ РЯДЫ, ФОНДОВЫЙ РЫНОК, ТЕХНИЧЕСКИЙ АНАЛИЗ, ФУНДАМЕНТАЛЬНЫЙ АНАЛИЗ, СЕМАНТИЧЕСКАЯ ИНФОРМАЦИОННАЯ МОДЕЛЬ
Keywords: SYSTEMIC-COGNITIVE ANALYSIS, TIME NUMBERS, SHARE MARKET, TECHNICAL ANALYSIS, FUNDAMENTAL ANALYSIS, SEMANTIC INFORMATION MODEL
Данная статья является продолжением [16, 17], в которых на примере одного из сегментов фондового рынка: рынка простых акций Сбербанка России, рассмотрена реализация первых 6 этапов СК-анализа [7]:
1. Когнитивная структуризация предметной области.
2. Формализация предметной области.
3. Подготовка обучающей выборки.
4. Синтез семантической информационной модели (СИМ).
5. Повышение эффективности СИМ.
6. Верификация СИМ.
7. Решение задач прогнозирования.
8. Решение задач поддержки принятия решений.
9. Исследование предметной области путем исследования ее СИМ.
В данной статье на том же примере мы продолжим рассмотрим последующих трех этапов: 7-го, 8-го и 9-го.
7. Решение задач прогнозирования.
Для решения задачи прогнозирования по технологии, описанной в [16], должна быть подготовлена база данных с именем Inp_rasp.dbf, содержащая предысторию динамики фондового рынка за период времени, достаточный для формирования всех градаций описательных шкал. В нашем примере описательные шкалы и градации сформированы таким образом, что это должны быть данные за текущий день и предыдущие 14 дней.
Затем необходимо запустить режим _152 системы «Эйдос» (рисунок 1):
Рисунок 1. Экранная форма меню вызова режима _152 системы «Эйдос»
Если этот режим уже исполнялся для формализации предметной области, то появляется меню выбора, представленное на рисунке 2:
Рисунок 2. Экранная форма меню режима _152 системы «Эйдос», обеспечивающего выбор между формализацией предметной области и подготовкой распознаваемой выборки
1-й режим выбирается, если мы хотим провести формализацию предметной области с другими параметрами, задаваемыми в диалоге [16], а 2-й - в нашем случае: когда мы хотим сформировать распознаваемую выборку. Для примера, рассматриваемого в данной статье, мы просто скопировали файл Inp_data.dbf, содержащий исходные данные для формирования классификационных и описательных шкал и градаций и обучающей выборки в файл с именем Inp_rasp.dbf.
После завершения процесса генерации распознаваемой выборки (рисунок 3) запускается процесс пакетного распознавания (рисунки 4 и 5):
Рисунок 3. Экранная форма процесса генерации распознаваемой выборки в режиме _152 системы «Эйдос»
Рисунок 4. Экранная форма меню выбора режима распознавания: т.е. режима _42 системы «Эйдос»
После выбора данного режима и задания вида интегрального Критерия сходства появляется экранная форма, отображающая процесс пакетного распознавания и содержащая прогноз времени исполнения (рисунок 5):
Рисунок 5. Экранная форма режима _42 системы «Эйдос»
В результате работы данного режима формируется ряд экранных и текстовых выходных форм, отобразить которые можно вызвав режим _432 системы «Эйдос» (рисунок 6):
Рисунок 6. Экранная форма меню выбора режима отображения результатов распознавания _432 системы «Эйдос»
В результате выбора режима _432 получаем экранную форму, представленную на рисунке 7, а также соответствующую текстовую форму (таблица 1). модель прогнозирование временной решение
В верхней части таблицы приведены дни, для которых прогнозируется высокая вероятность наступления данной ситуации, а в нижней - высокая вероятность ее ненаступления. Символом: «v» отмечены дни, когда эта ситуация реально наблюдалась на рынке.
В результате выбора режима _431 получаем экранную форму, представленную на рисунке 8, а также соответствующую текстовую форму (таблица 2).
Рисунок 7. Экранная форма прогнозирования ситуации на фондовом рынке: код 8, наименование: «Тренд недельного курса на неделю вперед: {-45,92, -18,73}»
Таблица 1 - РЕЗУЛЬТАТ ПРОГНОЗИРОВАНИЯ СИТУАЦИИ НА ФОНДОВОМ РЫНКЕ: код 8, наим.: «Тренд недельного курса на неделю вперед: {-45,92, -18,73}»
Рисунок 8. Экранная форма прогноза динамики фондового рынка на 03.09.2007
Таблица 2 - ПРОГНОЗ ДИНАМИКИ ФОНДОВОГО РЫНКА НА 03.09.2007
В верхней части таблицы приведены ситуации на фондовом рынке, для которых на заданную дату прогнозируется высокая вероятность наступления, а в нижней - высокая вероятность ее ненаступления. Символом: «v» отмечены ситуации, которые реально наблюдалась на рынке.
Видно, что все реально наблюдаемые ситуации были успешно спрогнозированы, однако система ошибочно спрогнозировала наступление сценария: код 60, «СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ ВПЕРЕД-S55», а также с очень низким уровнем прогнозируемой достоверности (около 1%) сценария: код 39, «СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ ВПЕРЕД-S36». Второй прогноз можно игнорировать из-за очень низкого уровня прогнозируемой достоверности. А сценарий S55 имеет смысл сравнить с реально наступившим и успешно спрогнозированным сценарием S37. На рисунке 9 видно, что эти два сценария весьма схожи, поэтому этот прогноз не является очень уж большой ошибкой.
Рисунок 9. Реально наступивший и спрогнозированный типовой сценарий изменения суточного тренда суточного средневзвешенного курса S37 и спрогнозированный, но не наступивший сценарий S55
При анализе результатов прогнозирования, представленных на рисунках 7, 8 и таблицах 1, 2 мы видим, что система допускает ошибки ложной идентификации и не идентификации, т.е. иногда прогнозирует возникновение ситуаций, которых фактически (реально) в соответствующие дни не наблюдалось, а иногда для фактически наблюдаемых ситуаций прогнозирует, что они не возникнут. Например, из рисунка 7 видно, что на 16.10.08 была спрогнозирована ситуация: код: 8, наименование: «ТРЕНД НЕДЕЛЬНОГО КУРСА НА НЕДЕЛЮ ВПЕРЕД: {-45.82, -18.73}», а из таблицы 1 видно, что на 10.02.09 было спрогнозировано, что эта ситуация не возникнет, однако фактически она наблюдалась.
Для того, чтобы как-то объяснить такие ошибки, мы обращаем внимание на уровни сходства ситуации с обобщенным образом класса, указанные в этих рисунках и таблицах. Этот уровень сходства по сути является оценкой достоверности прогноза, который дает система, поэтому можно ожидать, что чем выше этот уровень сходства, тем выше будет вероятность совпадения прогнозов с фактом. Иначе говоря, оправданной выглядит гипотеза, что для правильных прогнозов (совпавших с фактом) уровень сходства как правило будет выше, чем для ошибочных прогнозов (не совпавших), хотя могут наблюдаться и достаточно редкие исключения из этого правила. Если окажется, что существует сильная корреляция между уровнем сходства прогноза с классом и вероятностью фактической реализации ситуации на фондовом рынке, соответствующей классу, то будет обоснованным использовать расчетный уровень достоверности в качестве критерия достоверности прогноза. Это было бы очень ценным, т.к. в этом случае можно обоснованно считать, что система не только дает прогноз, но и прогнозирует его достоверность.
Для проверки этой гипотезы применим два метода:
1. Построим зависимость вероятности совпадения прогнозов с фактом от уровня сходства.
2. Построим частотные распределения правильных и ошибочных прогнозов в зависимости от уровня сходства.
В системе «Эйдос» эти распределения формируются в нескольких режимах: и при пакетном распознавании (_42), и при верификации модели (_62), а также в режимах: (_25, _76, _236). Результаты выводится в базе данных DOSTRASP.DBF, которая может быть открыта в Excel (таблица 3).
Эта таблица сконструирована таким образом, чтобы с помощью режима построения точечных диаграмм Excel (т.е. параметрически заданных функций) можно было получить в графическом виде необходимые распределения, которые и приведены на рисунках 10 и 11.
Из рисунка 10 видно, что сглаженная с помощью линейного фильтра (с интервалом сглаживания равным 31) зависимость вероятности совпадения прогноза с фактом от уровня сходства представляет собой монотонно возрастающую функцию до уровня сходства примерно 35%, что находится в полном соответствии с проверяемой гипотезой.
Однако при больших значениях уровня сходства эта функция убывает, что объясняется не нарушением сформулированной в гипотезе закономерности, а просто тем, что прогнозы с более высокими уровнями сходства встречаются редко и по ним при данном объеме обучающей выборки (935 дней) просто нет примеров, т.е. в таблице вместо соответствующих количеств и процентов оказываются нули. Поэтому обоснованным является предположение, что при более равномерном распределении количества прогнозов по уровням сходства, т.е. когда встречаются все уровни сходства, что может наблюдаться при значительно больших объемах выборки и в случайной модели, эта функция должна возрастать вплоть до уровней сходства равных 100%. Это предположение подтверждается исследованием RND-модели (случайной), по всем основным параметрам совпадающей с исследуемой содержательной моделью (рисунок 12), которую можно создать в режиме _154 системы «Эйдос».
Рисунок 10. Зависимость вероятности совпадения прогноза с фактом от уровня сходства
Рисунок 11. Стандартизированные частотные распределения результатов прогнозирования, соответствующих (синий) и несоответствующих (сиреневый) факту в зависимости от уровня сходства
Рисунок 12. Зависимость вероятности совпадения прогноза с фактом от уровня сходства для RND-модели
Из рисунка 11 видно, что действительно, как и ожидалось, для оправдавшихся прогнозов частотное распределение смещено в сторону положительных уровней сходства, а для ошибочных - отрицательных. Однако видно, что встречаются и случаи, когда фактически наблюдаемые ситуаций прогнозировались с отрицательным уровнем сходства, а фактически ненаблюдаемые - с положительным, вместе с тем подобных случаев ошибочных прогнозов гораздо меньше, чем осуществившихся.
Остается еще отметить, что различие приведенных на рисунке 11 распределений тем выше, чем выше качество (адекватность) модели и отражает тот факт, что система позволила выявить в предметной области закономерности, на которых и могут основываться прогнозы. Чем ниже отношение сигнал/шум в исходных данных (т.е. чем выше шум по сравнению с полезным сигналом), тем более плавными являются эти частотные распределения правильных и ошибочных прогнозов в зависимости от уровня их прогнозируемой достоверности, тем меньше отличаются друг от друга эти распределения, тем ближе друг к другу максимумы этих распределений, тем больше область их перекрытия. Для случайной модели с полным отсутствием внутренних закономерностей в данных эти распределения вообще не отличаются друг от друга (при достаточно большой выборке, при которой действует закон больших числе и можно говорить о случайности). По-видимому, прогнозы с прогнозируемыми уровнями достоверности, попадающими в интервал области перекрытия этих распределений, вообще целесообразно игнорировать. Из рисунка 11 видно, что это интервал небольших по модулю уровней прогнозируемой достоверности с центром, несколько смещенным в отрицательную область, т.е. интервал примерно от -15% до +5%. Но конкретные значения границ этого интервала для каждой модели свои, т.к. определяются природой и конкретными характеристиками исходных данных, и могут определяться по приведенной здесь методике исходя из высказанных положений.
Таким образом можно сделать обоснованный вывод о том, что уровень сходства конкретной ситуации с обобщенным образом или классом, формируемый системой «Эйдос» для каждого прогноза, может рассматриваться как обобщенный критерий достоверности этого прогноза, который также, в свою очередь, прогнозируется системой. Причем, проведенные на реальных данных из разных предметных областей численные эксперименты показывают, что у же при уровнях сходства выше 30% как правило наблюдается совпадение с фактом.
Понятно, что модели, обеспечивающие прогнозирование на несколько дней вперед, формируют на один и тот же день несколько прогнозов с нескольких позиций в прошлом, отстоящих от прогнозируемого дня на различные периоды. В связи с этим и возникает вопрос о том, каким образом обобщать эти прогнозы в один итоговый на этот день прогнозирования.
В работе [7] (в разделе: 7.4. Прогнозирование развития различных сегментов рынка (на примере фондового рынка РФ)) подробно описана система «Эйдос-фонд» [18], которая обеспечивала не только прогнозирование курсов на каждый из 30 дней вперед, но и позволяла определять наиболее вероятный сценарий изменения курса в течение каждого из этих дней. Кроме того этой системой прогнозировался не только курс, но и достоверность самого этого прогноза, которая в СК-анализе является аналогом известного в статистике доверительного интервала. Однако в отличие от доверительного интервала достоверность прогноза в СК-анализе может не только уменьшаться для все более отдаленного будущего, но и как это ни парадоксально, возрастать. Иначе говоря система обеспечивает прогнозирование окончания периодов эргодичности и наступление периодов бифуркации, т.е. периодов (обычно кратковременных) изменения закономерностей. Оказалось, что достоверность прогноза на некоторый день в будущем падает не только с среднего уровня сходства этого прогноза, но и с увеличением разброса (уменьшением взаимной согласованности) точечных прогнозов на этот день с различных позиций (дней) в прошлом [7]. Поэтому в работе [7] для обобщения прогнозов на день прогнозирования предлагалось использовать векторное произведение точечных прогнозов.
Однако для автоматического расчета этого векторного произведения необходима программная система, работающая непосредственно с базами данных системы «Эйдос» (типа системы окружения «Эйдос-фонд» [18]), если же мы хотим пользоваться исключительно стандартными средствами базовой системы «Эйдос», то необходим упрощенный вариант обобщения точеных прогнозов, например с использованием возможностей Excel, который и предлагается в данной статье. Рассмотрим таблицу 4:
Из вышеизложенного ясно, что чем выше средняя достоверность точечных прогнозов, тем выше вероятность совпадения прогноза с фактом, и чем ниже взаимная согласованность (смысловое совпадение) точечных прогнозов, тем ниже вероятность совпадения прогноза с фактом. Поэтому предлагается следующий вид интегрального критерия для i-го класса:
Весовые коэффициенты Aj позволяют учесть то обстоятельство, что чем на больший период в прошлое от дня прогнозирования отстоит день, в который был сделал прогноз, тем, по-видимому, меньшее влияние оказывает этот прогноз на интегральный критерий. Коэффициенты Bi и Ci отражают относительный вклад средней достоверности точечных прогнозов и их взаимной согласованности в интегральный критерий. Конкретные численные значения всех этих коэффициентов могут определяться только на основе исследования закономерностей уменьшения уровней сходства точечных прогнозов в зависимости от величины периодов в прошлое, с которых они сделаны, а также сопоставления расчетных величин частных критериев и интегрального критерия с фактом. В этой связи можно сформулировать математическую задачу: «На основе точечных прогнозов и данных об их совпадении с фактом найти такой набор коэффициентов , который бы обеспечил наилучшее совпадение прогнозов с фактом». Однако точная постановка и конкретное решение этой задачи - это уже предмет отдельного исследования, поэтому для начала для простоты эти коэффициенты могут быть приняты равными 1. Тогда интегральный критерий для i-го класса примет вид:
Каким же образом на основе этого интегрального критерия, характеризующего достоверность прогноза для каждого из классов, принимать решение о том, какие из этих прогнозов принимать во внимание, а какие нет? Для этого предлагается следующий алгоритм:
- строки таблицы 4 сортируются (ранжируются) в порядке убывания интегрального критерия;
- считается, что системой прогнозируется наступление тех состояний фондового рынка, которые соответствуют классам в начале отсортированной таблицы;
- состояния фондового рынка, соответствующие классам в конце таблицы, рассматриваются как маловероятные или как состояния, о наступлении или ненаступлении которых на основе имеющейся базы исходных данных и примененных методов невозможно сделать каких-то определенных выводов.
Остановимся подробнее на анализе смысла 1-го и 2-го частных критериев в таблице 4. Низкий уровень сходства сложившейся ситуации с обобщенным образом класса, полученным путем многопараметрической типизации, означает, что сложилась ситуация, не соответствующая данному классу, но это может быть по крайней мере по трем причинам (таблица 5):
Таблица 5 - КЛАССИФИКАЦИЯ СИТУАЦИЙ НА ФОНДОВОМ РЫНКЕ, ИХ ПРИЗНАКОВ, ПРИЧИН НИЗКОГО УРОВНЯ СХОДСТВА СИТУАЦИИ С КЛАССОМ И РЕКОМЕНДУЕМЫХ ДЕЙСТВИЙ ПО УЛУЧШЕНИЮ МОДЕЛИ
№ п/п |
Тип ситуации |
Признаки ситуации |
Причина |
Рекомендуемые действия |
|
1 |
Сложилась ситуация, соответствующая другому классу. |
Средняя достоверность точечных прогнозов по одним классам низка, а по каким-то другим высока и при этом высока согласованность точечных прогнозов |
Модель адекватна |
Работа в штатном режиме |
|
2 |
Сложилась ситуация, прецедентов которой еще не было отражено в исходной базе данных. |
Средняя достоверность точечных прогнозов низка по всем классам но согласованность точечных прогнозов при этом высока |
Модель работает, но в ней нет подходящих классов, т.е. сложившаяся ситуация относится к более широкой генеральной совокупности, чем та, по отношению к которой существующая модель репрезентативна |
Целесообразно добавить описание новой ситуации в базу данных и осуществить пересинтез модели, т.е. выполнить формализацию предметной области, подготовку обучающей выборки, синтез и верификацию модели [16]. |
|
3 |
Нарушилась эргодичность рынка, т.е. изменились основные закономерности, выявленные в рынке при синтезе модели. |
Достоверность точечных прогнозов по одним классам низка, а по другим высока и при этом велик разброс точечных прогнозов |
Модель вообще не работает, т.к. в самой моделируемой предметной области нарушились основные закономерности, выявленные в процессе синтеза модели |
Необходимо заново накапливать обучающую выборку и осуществить синтез новой модели, т.к. старая выборка уже не отражает качественно новых реалий, сложившихся в предметной области после ее революционного изменения, и если использовать старую выборку при синтезе модели, то это приведет не к повышению, а к понижению ее адекватности. |
Прокомментируем дополнительно рекомендуемые действия п.2 и 3.
По п.2: этим самым мы качественно расширяем обучающую выборку таким образом, что она начинает адекватно отражать более широкую генеральную совокупность, чем до этого, при этом ранее накопленные в выборке данные сохраняют ценность
По п.3: в этом случае с использованием старой модели мы уже не можем прогнозировать наступления или ненаступления на фондовом рынке ситуаций, соответствующих тем или иным классам, но мы можем прогнозировать время наступления самой этой ситуации невозможности прогнозирования, т.е. можно прогнозировать само время качественного изменения предметной области, время нарушения ее эргодичности и перехода в точку бифуркации (впервые эта задача была поставлена и решена в работе [7]).
Методика прогнозирования времени нарушения эргодичности предметной области и перехода ее в точку бифуркации основывается на том обстоятельстве, что высокий разброс точечных прогнозов (низкая их согласованность) является специфическим признаком 3-й ситуации. Таким образом остается исследовать зависимость разброса точечных прогнозов от времени, для чего достаточно на основе итоговых строк таблицы 4 построить таблицу 6:
Таблица 6 - ПРОГНОЗИРОВАНИЕ ГРАНИЦ ПЕРИОДОВ ЭРГОДИЧНОСТИ ФОНДОВОГО РЫНКА И ТОЧЕК БИФУРКАЦИИ
Дата |
1-й частный критерий: «Средняя достоверность точечных прогнозов» |
2-й частный критерий: Взаимная согласованность точечных прогнозов» |
Интегральный критерий достоверности i-го прогноза |
|
1 |
8. Решение задач поддержки принятия решений.
На фондовом рынке могут приниматься два типа решений:
1. Это решения, связанные с сознательными попытками целенаправленного управления сегментом фондового рынка, например, с целью повысить или понизить курсы тех или иных ценных бумаг по отношению к другим («игра на повышение или понижение»).
2. Решения не связанные с попытками управления, а основывающиеся на прогнозах и направленные просто на извлечение прибыли путем продажи и приобретении тех или иных ценных бумаг.
Конечно решения 2-го типа также оказывают воздействие на фондовый рынок, но это воздействие в данном случае является своего рода «побочным эффектом», а не целью и само по себе не особо интересует трейдеров. Решения 1-го типа реально могут приниматься только очень крупными игроками и можно сказать заменяют им прогнозы, т.к. они просто знают, как поведет себя рынок под влиянием их воздействий и в этих условиях могут с высокой степенью надежности и с практически гарантированным успехом принимать решения 2-го типа.
Вопросы прогнозирования динамики фондового рынка уже освещены выше в данной статье и работе [7] и технологии принятия решений 2-го типа на фондовом рынке при имеющихся и известных прогнозах вполне понятны.
Поэтому рассмотрим теперь вопросы принятия решений 1-го типа, т.е. решений по управлению фондовым рынком. Для этого необходимо получить информацию о том, какова система детерминации каждой из ситуаций на фондовом рынке, т.е. том, какие значения факторов обусловливают каждую из этих ситуаций. Эта информация необходима для того, чтобы оценить, какие из этих факторов могут быть целенаправленно переведены в нужные значения и какой ценой, т.е. для того, чтобы выбрать наиболее эффективное (например по критерию «эффективность-стоимость») управляющее воздействие.
Отметим, что задача принятия решения о выборе наиболее эффективного управляющего воздействия является обратной задачей по отношению к задаче идентификации и прогнозирования, т.е. вместо того, чтобы по набору факторов прогнозировать будущее состояние объекта, наоборот, по заданному (целевому) состоянию объекта определяется такой набор факторов, который с наибольшей эффективностью перевел бы объект управления в это состояние.
В СК-анализе и его программном инструментарии - системе «Эйдос» есть несколько вариантов решения этой задачи:
1. Формирование и вывод в форме текстовых таблиц и графических круговых диаграмм информационных портретов классов.
2. Формирование и вывод в графической форме нелокальных нейронов классов.
3. Отображение графических профилей классов.
Рассмотрим некоторые из этих методов.
8.1. Формирование и вывод в форме текстовых таблиц и графических круговых диаграмм информационных портретов классов.
Информационный портрет класса - это список значений факторов, ранжированных в порядке убывания силы их влияния на переход объекта управления в состояние, соответствующее данному классу. Информационный портрет класса отражает систему его детерминации. Генерация информационного портрета класса представляет собой решение обратной задачи прогнозирования, т.к. при прогнозировании по системе факторов определяется спектр наиболее вероятных будущих состояний объекта управления, в которые он может перейти под влиянием данной системы факторов, а в информационном портрете мы наоборот, по заданному будущему состоянию объекта управления определяем систему факторов, детерминирующих это состояние, т.е. вызывающих или обусловливающих переход объекта управления в это состояние. В начале информационного портрета класса идут факторы, оказывающие положительное влияние на переход объекта управления в заданное состояние, затем факторы, не оказывающие на это существенного влияния, и далее - факторы, препятствующие переходу объекта управления в это состояние (в порядке возрастания силы препятствования). Информационные портреты классов могут быть от отфильтрованы по диапазону факторов, т.е. мы можем отобразить влияние на переход объекта управления в данное состояние не всех отраженных в модели факторов, а только тех, коды которых попадают в определенный диапазон, например, относящиеся к определенным описательным шкалам.
Для этого запустим режим генерации информационных портретов классов _511 системы «Эйдос» (рисунок 12) и выберем класс с кодом 40 и наименованием: «СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ ВПЕРЕД-S37» _______________________________________:
Рисунок 13. Меню выбора режима _511 генерации информационных портретов классов системы «Эйдос»
В результате получим информационный портрет этого класса: (таблица 7).
Таблица 7 - ИНФОРМАЦИОННЫЙ ПОТРЕТ КЛАССА: КОД 40, НАИМЕНОВАНИЕ: «СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ ВПЕРЕД-S37 (ФРАГМЕНТ)
Код |
Наименование описательной шкалы и градации |
Кол-во информ. (Бит) |
% от теор. макс.возм. кол-ва инф. |
|
16 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД- |
1,38927 |
22,52 |
|
62 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД-S51 |
1,30304 |
21,12 |
|
73 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД-S61 |
1,26445 |
20,49 |
|
32 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД-S24 |
1,22835 |
19,91 |
|
59 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД-S49 |
1,00154 |
16,23 |
|
71 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД-S6 |
1,00154 |
16,23 |
|
17 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД-S1 |
0,91531 |
14,84 |
|
57 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД-S47 |
0,84062 |
13,62 |
|
67 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД-S56 |
0,61381 |
9,95 |
|
142 |
КОЛИЧЕСТВО СДЕЛОК: {111478.20, 148446.60} |
0,59097 |
9,58 |
|
75 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД-S63 |
0,52758 |
8,55 |
|
14 |
ТРЕНД СУТОЧНОГО КУРСА НА ДЕНЬ НАЗАД: {3.03, 12.60} |
0,40811 |
6,61 |
|
147 |
ТРЕНД КОЛИЧЕСТВА СДЕЛОК НА ДЕНЬ НАЗАД: {-127.74, -20.37} |
0,27475 |
4,45 |
|
5 |
КУРС, СУТОЧНЫЙ, СРЕДНЕВЗВЕШЕННЫЙ С УЧЕТОМ ОБЪЕМОВ ПРОДАЖ: {91.92, |
0,27221 |
4,41 |
|
155 |
СТАНД.ОТКЛ.ТРЕНДА КОЛИЧЕСТВА СДЕЛОК НА НЕДЕЛЮ НАЗАД: {36.26, 72.5 |
0,26634 |
4,32 |
|
85 |
СТАНД.ОТКЛ.ТРЕНДА СУТОЧНОГО КУРСА НА НЕДЕЛЮ НАЗАД: {3.08, 6.17} |
0,23488 |
3,81 |
|
153 |
СРЕДНИЙ ТРЕНД КОЛИЧЕСТВА СДЕЛОК НА НЕДЕЛЮ НАЗАД: {4.35, 20.92} |
0,23193 |
3,76 |
|
10 |
КУРС, НЕДЕЛЬНЫЙ, СРЕДНЕВЗВЕШЕННЫЙ С УЧЕТОМ ОБЪЕМОВ ПРОДАЖ: {90.77 |
0,22375 |
3,63 |
|
82 |
СРЕДНИЙ ТРЕНД СУТОЧНОГО КУРСА НА НЕДЕЛЮ НАЗАД: {-0.10, 2.82} |
0,15606 |
2,53 |
|
152 |
СРЕДНИЙ ТРЕНД КОЛИЧЕСТВА СДЕЛОК НА НЕДЕЛЮ НАЗАД: {-12.22, 4.35} |
0,08291 |
1,34 |
|
97 |
СРЕДНИЙ ТРЕНД СРЕДНЕГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД: {-3853.49, 5 |
0,02934 |
0,48 |
|
99 |
СТ.ОТК.ТРЕНДА СРЕДНЕГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД: {0.00, 9699. |
0,01934 |
0,31 |
|
139 |
КОЛИЧЕСТВО СДЕЛОК: {573.00, 37541.40} |
0,01867 |
0,30 |
|
169 |
СТ.ОТК.ТРЕНДА СР.ТРЕНДА КОЛ-ВА СДЕЛОК НА НЕДЕЛЮ НАЗАД: {0.00, 596 |
0,01564 |
0,25 |
|
167 |
СР.ТРЕНДА СР.ТРЕНДА КОЛИЧЕСТВА СДЕЛОК НА НЕДЕЛЮ НАЗАД: {-1236.18, |
0,01502 |
0,24 |
|
119 |
СТАНД.ОТКЛ.ТРЕНДА ОБЪЕМА СДЕЛОК НА НЕДЕЛЮ НАЗАД: {0.00, 2819.06} |
0,01441 |
0,23 |
|
133 |
СР.ТРЕНДА СР.ТРЕНДА ОБЪЕМА СДЕЛОК НА НЕДЕЛЮ НАЗАД: {-211438.64, 5 |
0,00527 |
0,09 |
|
134 |
СТ.ОТК.ТРЕНДА СР.ТРЕНДА ОБЪЕМА СДЕЛОК НА НЕДЕЛЮ НАЗАД: {0.00, 714 |
0,00467 |
0,08 |
|
92 |
ТРЕНД СРЕДНЕГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД: {-28625.35, 7490.45} |
0,00286 |
0,05 |
|
162 |
ТРЕНД СР.ТРЕНДА КОЛИЧЕСТВА СДЕЛОК НА НЕДЕЛЮ НАЗАД: {-9922.12, 147 |
0,00286 |
0,05 |
|
113 |
ТРЕНД ОБЪЕМА СДЕЛОК НА ДЕНЬ НАЗАД: {-7376.26, 99.86} |
0,00166 |
0,03 |
|
104 |
ОБЪЕМ СДЕЛКИ: {256000.00, 1617383819.00} |
0,00046 |
0,01 |
|
128 |
ТРЕНД СРЕДНЕГО ТРЕНДА ОБЪЕМА СДЕЛОК НА НЕДЕЛЮ НАЗАД: {-1880918.72 |
0,00046 |
0,01 |
|
84 |
СТАНД.ОТКЛ.ТРЕНДА СУТОЧНОГО КУРСА НА НЕДЕЛЮ НАЗАД: {0.00, 3.08} |
-0,03016 |
-0,49 |
|
6 |
КУРС, НЕДЕЛЬНЫЙ, СРЕДНЕВЗВЕШЕННЫЙ С УЧЕТОМ ОБЪЕМОВ ПРОДАЖ: {14.36 |
-0,05263 |
-0,85 |
|
9 |
КУРС, НЕДЕЛЬНЫЙ, СРЕДНЕВЗВЕШЕННЫЙ С УЧЕТОМ ОБЪЕМОВ ПРОДАЖ: {71.66 |
-0,05616 |
-0,91 |
|
13 |
ТРЕНД СУТОЧНОГО КУРСА НА ДЕНЬ НАЗАД: {-6.54, 3.03} |
-0,05827 |
-0,94 |
|
1 |
КУРС, СУТОЧНЫЙ, СРЕДНЕВЗВЕШЕННЫЙ С УЧЕТОМ ОБЪЕМОВ ПРОДАЖ: {14.14, |
-0,05967 |
-0,97 |
|
4 |
КУРС, СУТОЧНЫЙ, СРЕДНЕВЗВЕШЕННЫЙ С УЧЕТОМ ОБЪЕМОВ ПРОДАЖ: {72.47, |
-0,10013 |
-1,62 |
|
2 |
КУРС, СУТОЧНЫЙ, СРЕДНЕВЗВЕШЕННЫЙ С УЧЕТОМ ОБЪЕМОВ ПРОДАЖ: {33.58, |
-0,14390 |
-2,33 |
|
7 |
КУРС, НЕДЕЛЬНЫЙ, СРЕДНЕВЗВЕШЕННЫЙ С УЧЕТОМ ОБЪЕМОВ ПРОДАЖ: {33.46 |
-0,14690 |
-2,38 |
|
148 |
ТРЕНД КОЛИЧЕСТВА СДЕЛОК НА ДЕНЬ НАЗАД: {-20.37, 87.00} |
-0,14818 |
-2,40 |
|
140 |
КОЛИЧЕСТВО СДЕЛОК: {37541.40, 74509.80} |
-0,20643 |
-3,35 |
|
8 |
КУРС, НЕДЕЛЬНЫЙ, СРЕДНЕВЗВЕШЕННЫЙ С УЧЕТОМ ОБЪЕМОВ ПРОДАЖ: {52.56 |
-0,24287 |
-3,94 |
|
81 |
СРЕДНИЙ ТРЕНД СУТОЧНОГО КУРСА НА НЕДЕЛЮ НАЗАД: {-3.03, -0.10} |
-0,25121 |
-4,07 |
|
3 |
КУРС, СУТОЧНЫЙ, СРЕДНЕВЗВЕШЕННЫЙ С УЧЕТОМ ОБЪЕМОВ ПРОДАЖ: {53.03, |
-0,26752 |
-4,34 |
|
154 |
СТАНД.ОТКЛ.ТРЕНДА КОЛИЧЕСТВА СДЕЛОК НА НЕДЕЛЮ НАЗАД: {0.00, 36.26 |
-0,28764 |
-4,66 |
|
151 |
СРЕДНИЙ ТРЕНД КОЛИЧЕСТВА СДЕЛОК НА НЕДЕЛЮ НАЗАД: {-28.79, -12.22} |
-0,54353 |
-8,81 |
В информационном портрете можно сделать фильтр по градациям описательной шкалы или диапазону кодов градаций различных шкал. Например в приведенном информационном портрете можно сделать фильтр по сценариям и получить в результате информацию о том, какие сценарии и на сколько способствуют или препятствуют наступлению сценария S37 (таблица 8):
Таблица 8 - ИНФОРМАЦИОННЫЙ ПОТРЕТ КЛАССА: КОД 40, НАИМЕНОВАНИЕ: «СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ ВПЕРЕД-S37 (ФРАГМЕНТ)
Фильтр по сценариям: диапазон кодов: 16-78
Код |
Наименование описательной шкалы и градации |
Кол-во информ. (Бит) |
% от теор. макс. возм. кол-ва инф. |
|
16 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД- |
1,38927 |
22,52 |
|
62 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД-S51 |
1,30304 |
21,12 |
|
73 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД-S61 |
1,26445 |
20,49 |
|
32 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД-S24 |
1,22835 |
19,91 |
|
59 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД-S49 |
1,00154 |
16,23 |
|
71 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД-S6 |
1,00154 |
16,23 |
|
17 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД-S1 |
0,91531 |
14,84 |
|
57 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД-S47 |
0,84062 |
13,62 |
|
67 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД-S56 |
0,61381 |
9,95 |
|
75 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД-S63 |
0,52758 |
8,55 |
Неуказанный сценарий появился в описательной шкале: «СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ НАЗАД» потому, что для первых 6 дней обучающей выборки нет возможности определить предшествующий сценарий из-за отсутствия данных.
8.2. Формирование и вывод в графической форме нелокальных нейронов классов.
Нелокальные нейроны и интерпретируемые нейронные сети позволяют в наглядной форме отобразить систему детерминации будущих состояний. Нелокальный нейрон представляет собой будущее состояние объекта управления с изображением наиболее сильно влияющих на него факторов с указанием силы и направления (способствует-препятствует) их влияния. Нейронная сеть представляет собой совокупность взаимосвязанных нейронов. В классических нейронных сетях связь между нейронами осуществляется по входным и выходным сигналам, а в нелокальных нейронных сетях - на основе общего информационного поля, реализуемого семантической информационной моделью. Система "Эйдос" обеспечивает построение любого подмножества многослойной нейронной сети с заданными или выбираемыми по заданным критериям рецепторами и нейронами, связанными друг с другом связями любого уровня опосредованности.
На рисунке 14 приведена экранная форма системы «Эйдос» с меню выбора режима _65, обеспечивающего графическое отображение нелокальных нейронов, сформированных при синтезе семантической информационной модели:
Рисунок 14. Меню выбора режима _65 системы «Эйдос», обеспечивающего графическое отображение нелокальных нейронов, сформированных при синтезе семантической информационной модели
В результате работы данного режима формируются графические файлы, приведенные на рисунке 15:
Рисунок 15. Примеры графических отображений нелокальных нейронов, сформированных при синтезе СИМ в системе «Эйдос»
8.3. Отображение графических профилей классов и значений факторов.
На рисунке 16 приведена экранная форма системы «Эйдос» с меню выбора режима _64, обеспечивающего графическое отображение профилей классов и значений факторов, сформированных при синтезе семантической информационной модели.
В этом режиме могут загружаться матрицы абсолютных частот, условных и безусловных процентных распределений и базы знаний СИМ-1 и СИМ-2, отличающиеся количественной мерой знаний, а также отображаться различные двумерные и трехмерные диаграммы с выбором диапазонов классов и значений факторов. В качестве примера на рисунке 17 приведем профиль одного из значений фактора, отображаемый в данном режиме.
Рисунок 16. Меню выбора режима _64 системы «Эйдос», обеспечивающего графическое отображение профилей классов, сформированных при синтезе семантической информационной модели
Рисунок 17. Профиль значения фактора: код 1, наименование: «Тренд суточного курса на день вперед»: {-20.44, -10.65} с фильтром по классам 1-5
Таким образом данный профиль в наглядной графической форме показывает силу и направление влияния значений данного фактора на переход фондового рынка в состояния, соответствующие классам.
Хотелось бы отметить, что решение задачи количественного определения силы и направления влияния значений различных по своей природе и единицам измерения количественных и качественных факторов на поведение исследуемого объекта или объекта управления непосредственно на основе зашумленных фрагментированных эмпирических данных представляет собой большую ценность для различных направлений науки и практики и математических методов, оснащенных реализующим их программным инструментарием, позволяющих решить эту задачу в общем виде не так уж и много и одним из них является системно-когнитивный анализ (СК-анализ).
Естественно, метод СК-анализа имеет как свои достоинства, так и недостатки по сравнению с другими методами. Например по сравнению с факторным анализом он имеет следующие достоинства:
- позволяет обрабатывать сильно зашумленные эмпирические данные, в которых полезный сигнал может быть в десятки сотни раз ниже уровня шума (при условии достаточно большой выборки);
- позволяет обрабатывать фрагментированные (т.е. данные с множественными пропусками повторностей) эмпирические данные;
- позволяет обрабатывать эмпирические данные, огромных с точки зрения факторного анализа размерностей: в текущей версии системы «Эйдос» до 4000 классов и до 4000 значений факторов;
- позволяет формализовать предметную область с различным количестве градаций в классификационных и описательных шкалах;
- позволяет обрабатывать как числовые, так и лингвистические переменные;
- обеспечивает детальный анализ модели и моделируемой предметной области за счет наличия в системе «Эйдос» ряда исследовательских подсистем и режимов, которые генерируют 50 различных видов текстовых форм и более 52 различных видов двумерных и трехмерных графических форм, большинство которых не имеет аналогов в Excel, а тем, что имеют, выдаются с намного меньшими затратами труда и времени.
В профиле класса, приведенном на рисунке 18, показано, какое влияние оказывает на поведение курса текущий курс.
Рисунок 18. Профиль класса: код 2, наименование: «Тренд суточного курса на день вперед: {-10.65, -0.87}» с фильтром по значениям фактора: код 1, наименование: «Курс, суточный, средневзвешенный с учетом объемов продаж»
Из этого профиля видно, что чем выше значение суточного курса, тем менее вероятно, что завтра он понизится. Это значит, что матрицу знаний возможно представить в форме продукционных правил вида «Если - то» с различными модулями и знаками весов правил. Однако в системе «Эйдос» матрица знаний формируется не на основе обобщения неформализуемых интуитивных оценок экспертов, как в некоторых экспертных системах, а непосредственно на основе эмпирических данных.
9. Исследование предметной области путем исследования ее семантической информационной модели.
В СК-анализе имеются многочисленные методы исследования СИМ, в частности:
1. Системы детерминации классов и семантические информационные портреты значений факторов.
2. Кластерный и конструктивный анализ классов и значений факторов.
3. Семантические сети классов и значений факторов.
4. Когнитивные диаграммы классов и значений факторов.
5. Исследование независимости классов от значений факторов по критерию хи-квадрат.
6. Парето-подмножества нейронной сети.
7. Классические и интегральные когнитивные карты.
8. Исследование достоверности семантической информационной модели в зависимости от:
- объема обучающей выборки (определение границ периодов эргодичности и поиск точек бифуркации);
- ортонормирования базиса классов;
- ортонормирования базиса значений факторов;
- исключения значений факторов, не оказывающих существенного влияния на поведение объекта исследования (управления) (Парето-оптимизация);
- удаления из исходной базы данных классов и значений факторов, по которым недостаточно данных;
- разделения классов на типичную и нетипичную части;
- генерации сочетанных признаков.
Некоторые из этих методов мы уже кратко рассмотрели выше, а ряд других осветим в данном разделе (нумерация пунктов изменена).
9.1. Системы детерминации классов и семантические информационные портреты значений факторов.
Система детерминации классов - это система значений факторов, которая обусловливает или вызывает переход исследуемого объекта (объекта управления) в состояние, соответствующее данному классу. Знания о системе детерминации классов можно получить в системе «Эйдос» с помощью информационных портретов классов и нелокальных нейронов, что уже было сделано выше. Поэтому остановимся на семантических информационных портретах значений факторов, которые формируются и отображаются на основе базы знаний системы «Эйдос» в режиме _521 (рисунок 19):
Рисунок 19. Экранная форма меню вызова режима _521 системы «Эйдос»
Информационный (семантический) портрет фактора - это список классов, ранжированный в порядке убывания силы влияния данного фактора на переход объекта управления в состояния, соответствующие данным классам. Информационный портрет фактора называется также его семантическим портретом, т.к. в соответствии с концепцией смысла системно-когнитивного анализа, являющейся обобщением концепции смысла Шенка-Абельсона, смысл фактора состоит в том, какие будущие состояния объекта управления он детерминирует. Сначала в этом списке идут состояния объекта управления, на переход в которые данный фактор оказывает наибольшее влияние, затем состояния, на которые данный фактор не оказывает существенного влияния, и далее состояния - переходу в которые данный фактор препятствует. Информационные портреты факторов могут быть от отфильтрованы по диапазону классов, т.е. мы можем отобразить влияние данного фактора на переход объекта управления не во все возможные будущие состояния, а только в состояния, коды которых попадают в определенный диапазон, например, относящиеся к определенным классификационным шкалам.
Допустим нас может заинтересовать, как влияет на будущий курс сценарий суточного курса S37, наблюдавшийся за прошедшую неделю. Ответ на этот вопрос дает семантический информационный портрет данного значения фактора, приведенный в таблице 9:
Таблица 9 - СЕМАНТИЧЕСКИЙ ИНФОРМАЦИОННЫЙ ПОРТРЕТ ЗНАЧЕНИЯ ФАКТОРА: код: 46, наименование: «Сценарий динамики суточного тренда курса на неделю назад-S37»
Код класса |
Наименование класса |
Количество информации в битах |
Количество информации в % от теоретически максимально возможного |
|
24 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ ВПЕРЕД-S22 |
1,34782 |
21,84 |
|
26 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ ВПЕРЕД-S24 |
1,34782 |
21,84 |
|
49 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ ВПЕРЕД-S45 |
0,96008 |
15,56 |
|
67 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ ВПЕРЕД-S61 |
0,96008 |
15,56 |
|
11 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ ВПЕРЕД-S1 |
0,94045 |
15,24 |
|
57 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ ВПЕРЕД-S52 |
0,92149 |
14,94 |
|
37 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ ВПЕРЕД-S34 |
0,78926 |
12,79 |
|
19 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ ВПЕРЕД-S17 |
0,76057 |
12,33 |
|
30 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ ВПЕРЕД-S28 |
0,76057 |
12,33 |
|
36 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ ВПЕРЕД-S33 |
0,70725 |
11,46 |
|
71 |
СЦЕНАРИЙ ДИНАМИКИ СУТОЧНОГО ТРЕНДА КУРСА НА НЕДЕЛЮ ВПЕРЕД-S8 |
0,63676 |
10,32 |
|
3 |
ТРЕНД СУТОЧНОГО КУРСА НА ДЕНЬ ВПЕРЕД: {-0.87, 8.92} |
0,16599 |
2,69 |
|
9 |
ТРЕНД НЕДЕЛЬНОГО КУРСА НА НЕДЕЛЮ ВПЕРЕД: {-18.73, 8.36} |
0,07617 |
1,23 |
|
2 |
ТРЕНД СУТОЧНОГО КУРСА НА ДЕНЬ ВПЕРЕД: {-10.65, -0.87} |
-0,70540 |
-11,43 |
Мы видим, что данным сценарием обусловливается будущий сценарий D22 или S24, в меньшей степени S45 и т.д., и данный сценарий препятствует возникновению на фондовом рынке ситуации: код 2, наименование: «ТРЕНД СУТОЧНОГО КУРСА НА ДЕНЬ ВПЕРЕД: {-10.65, -0.87}». Теоретически максимально возможное количество информации определяется количеством классов в данной модели по формуле Хартли и равно в данном случае примерно 6.17 бита.
В системе «Эйдос» мы можем получить представление данного семантического информационного портрета ив графической форме круговой диаграммы (рисунок 20).
Рисунок 20. Семантический информационный портрет значения фактора: код: 46, наименование: «Сценарий динамики суточного тренда курса на неделю назад-S37»
Естественно, подобную круговую диаграмму можно получить и в Excel непосредственно используя базу данных, в которой сформировался данный портрет, однако это займет значительно большее время, особенно его оформление (заголовок, легенда, надписи по секторам и т.д.) и требует определенной квалификации.
9.2. Кластерный и конструктивный анализ классов и значений факторов.
Кластерно-конструктивный анализ - это математический метод и соответсвующий ему программный инструментарий (режимы _512 и _522 системы «Эйдос»), входящий в состав СК-анализа, обеспечивающий:
- выявление классов, наиболее сходных по системе их детерминации и объединение их в кластеры;
- выявление кластеров классов, наиболее сильно отличающиеся по системе их детерминации и построение из них полюсов конструктов классов, при этом остальные кластеры включаются в конструкты в качестве промежуточных между полюсами;
- выявление факторов, наиболее сходных по детерминируемым ими классам и объединение их в кластеры;
- выявление кластеров факторов, наиболее сильно отличающиеся по детерминируемым ими классам и построение из них полюсов конструктов факторов, при этом остальные кластеры включаются в конструкты в качестве промежуточных между полюсами.
Состояния объекта управления, соответствующие классам, включенным в один кластер, могут быть достигнуты одновременно, т.е. являются совместимыми (коалиционными) по детерминирующим их факторам. Состояния объекта управления, соответствующие классам, образующим полюса конструкта, не могут быть достигнуты одновременно, т.е. являются противоположными по детерминирующим их факторам (антагонистическими).
Факторы, включенные в один кластер, оказывают сходное влияние на поведение объекта управления и могут, при необходимости, быть использованы для замены друг друга. Факторы, образующие полюса конструкта, оказывают противоположное влияние на поведение объекта управления.
Кластерно-конструктивный анализ классов позволяет сравнить их по сходству системы детерминации и отобразить эту информацию в наглядной графической форме семантической сети классов.
Кластерно-конструктивный анализ факторов позволяет сравнить факторы по сходству их влияния на переход объекта в будущие состояния и отобразить эту информацию в наглядной графической форме семантической сети факторов.
На рисунке 21 приведены экранные формы меню вызова режимов _521 и _522 системы «Эйдос», обеспечивающих кластерно-конструктив-ный анализ классов и значений факторов:
Рисунок 21. экранные формы меню вызова режимов _521 и _522 системы «Эйдос»
В режиме кластерно-конструктивного анализа классов сравниваются друг с другом профили классов, приведенные в базе знаний (рисунок 18 и таблица 19 работы [16]). В результате этого сравнения формируется матрица сходства классов (таблица 10). Коды и наименования классов приведены в таблице 13 работы [16].
В режиме кластерно-конструктивного анализа значений факторов сравниваются друг с другом профили значений факторов, приведенные в базе знаний (рисунок 17 и таблица 19 работы [16]). В результате этого сравнения формируется матрица сходства значений факторов (таблица 11). Коды и наименования значений факторов приведены в таблице 14 работы [16].
9.3. Семантические сети классов и значений факторов.
Фрагменты матриц сходства классов и значений факторов, приведенных в таблицах 10 и 11 можно отобразить в наглядной графической форме семантических сетей классов и факторов, что позволяют сделать режимы _5125 и _5225 системы «Эйдос» (экранные формы меню вызова этих режимов приведены на рисунке 21). В результате работы этих режимов получаем выходные формы, представленные на рисунке 22:
Рисунок 22. Семантические сети классов и значений факторов
Отметим, что семантическая сеть классов соответствует четырем нелокальным нейронам, приведенным на рисунке 15, а семантическая сеть значений факторов соответствует рецепторам 1-го нелокального нейрона.
9.4. Когнитивные диаграммы классов и значений факторов.
Когнитивные диаграммы классов (значений факторов) - это графические диаграммы, позволяющие отобразить в чем конкретно состоит сходство и различие любых двух классов (или любых двух факторов), т.е. детально увидеть структуру каждой линии связи в семантической сети. Когнитивные диаграммы представляет собой графическое изображение обобщенного коэффициента корреляции профилей классов (или факторов), при этом каждая линия, вносящая вклад в сходство или различие соответствует одному слагаемому, ее цвет - знаку, а толщина - модулю этого слагаемого.
Когнитивные диаграммы представляют собой конкретный математический и программный механизм, реализованный в системе «Эйдос», обеспечивающий автоматизированное проведение опосредованных правдоподобных рассуждений, о которых впервые писал Дьердь Пойя [20], а также вывод результатов этих рассуждений в наглядной графической форме. Возможность проведения подобных рассуждений и их реализация в общем виде впервые обоснована и описана в работе [7] (раздел: 3.2.4. Математическая модель метода распознавания образов и принятия решений, основанного на системной теории информации).
Поясним приведенный пример на простой интуитивно-ясной аналогии. Если существует два человека: первый брюнет, а второй - с голубыми глазами, то что можно сказать о сходстве-различии этих людей? Подчеркнем, что одной только приведенной в вопросе информации недостаточно для того, чтобы ответить на него и для этого необходима дополнительная информация о предметной области. Например, если известны корреляции между цветом волос и цветом глаз, то это становится возможным, так как позволяет с определенной степенью достоверности восстановить отсутствующую информацию о цвете глаз брюнета и цвете волос голубоглазого и после этого сравнить их. Обратимся к таблице 12.
Таблица 12 - ВОССТАНОВЛЕНИЕ НЕДОСТАЮЩЕЙ ИНФОРМАЦИИ ДЛЯ СРАВНЕНИЯ ПРИЗНАКОВ ПО ИХ СМЫСЛУ