Метод когнитивной кластеризации или кластеризация на основе знаний (кластеризация в системно-когнитивном анализе и интеллектуальной системе "Эйдос")
Алгоритм и результаты агломеративной кластеризации. Кластерный анализ - задача разбиения заданной выборки объектов на подмножества. Кластеризация на основе знаний (кластеризация в системно-когнитивном анализе и интеллектуальной системе "Эйдос").
Рубрика | Экономико-математическое моделирование |
Вид | статья |
Язык | русский |
Дата добавления | 28.04.2017 |
Размер файла | 6,6 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Нормировать частные критерии к нулю при отсутствии связи (когда условная вероятность наблюдения признака у объектов класса равно безусловной вероятности его наблюдения по всей выборке: Pij=Pi) необходимо, чтобы их было удобно использовать в аддитивном интегральном критерии. Это можно сделать разными способами. Например, в ROI (СИМ-4) из отношения условной вероятности к безусловной просто вычитается 1.
Критерий А.Харкевича тесно связан с критерием хи-квадрат. Рассмотрим выражение для частного критерия через абсолютные частоты в первой семантической информационной модели (СИМ-1):
Преобразуем это выражение, учитывая, что логарифм отношения равен разности логарифмов:
Сравнивая полученное выражение с выражением для частного критерия на основе хи-квадрат в СИМ-3 из таблицы 3
видим, что они отличаются только шкалой измерения (логарифмическая шкала или нет) и постоянным множителем, т.е. по сути, единицами измерения. Величина представляет собой фактическое количество наблюдений i-го признака у объектов j-го класса, а
- теоретически ожидаемое в соответствии с критерием хи-квадрат число таких наблюдений.
Также и логарифм отношения условной и безусловной вероятности СИМ-1 и СИМ-2 является разностью их логарифмов:
и отличается от разности этих вероятностей (СИМ-5) только постоянным для каждой модели множителем и применением логарифмической шкалы вместо линейной.
В настоящее время для каждой модели в АСК-анализе используется два аддитивных интегральных критерия: это свертка (сумма частных критериев по тем признакам, которые встречаются у объекта) и нормированная свертка или корреляция:
Отметим, что при расчете интегрального критерия на основе матрицы знаний закладываются основы для решения проблем 4 и 5. Дело в том, что по своей математической форме интегральный критерий является сверткой (скалярным произведением вектора объекта и вектора класса) или нормированной сверткой, т.е. корреляцией. Это означает, что если эти вектора являются суммой двух сигналов: полезного и белого шума, то при расчете неметрического интегрального критерия белый шум будет подавляться, т.к. корреляция белого шума с самим собой (автокорреляция) стремится к нулю по самому определению белого шума. Поэтому интегральный критерий сходства объекта со случным набором признаков с любыми образами классов, или реального объекта с образами классов, сформированными случайным образом, будет близок нулю. Это означает, что выбранный интегральный критерий сходства является высокоэффективным средством подавления белого шума и выделения знаний из шума, который неизбежно присутствует в эмпирических данных.
Важно также отметить неметрическую природу предложенного в АСК-анализе интегрального критерия сходства, благодаря чему его применение является корректным и при неортонормированном семантическом информационном пространстве, каким оно в подавляющем количестве случае и является, т.е. в общем случае. В этом состоит предлагаемое в АСК-анализе решение проблем 1.1 и 1.2.
Метод кластеризации, реализованный в АСК-анализе, в котором сравниваются и объединяются когнитивные модели объектов и классов (кластеров), т.е. их модели, основанные на знаниях и представленные в матрице знаний, будем называть «Метод когнитивной кластеризации» или кластеризацией, основанной на знаниях. Ясно, что кластеризация, основанная на знаниях, может быть реализована уже не в статистических системах, а только методами искусственного интеллекта, т.е. в интеллектуальных системах, работающих с базами знаний. При этом, конечно, может быть разработано много методов кластеризации, основанных на знаниях (не меньше чем уже существующих), отличающихся способами вычисления и представления знаний в различных интеллектуальных системах, а также способами использования знаний для формирования кластеров. В любом случае кластеризация на основе знаний - это новое перспективное направление исследований и разработок, в котором уже есть достижения.
Рассмотрим предлагаемый алгоритм когнитивной кластеризации в графической и текстовой форме (рисунок 3):
Рисунок 2 Алгоритм когнитивной кластеризации тили кластеризации, основанной на знаниях
Дадим необходимые пояснения к приведенному алгоритму.
1. Если не соответствуют размерности баз данных (БД) классов, признаков и информативностей, то выдать сообщение о необходимости пересинтеза модели.
2. Создать БД абсолютных частот: ABS_KLAS, информативностей: INF_KLAS, сходства классов: MSK_KLAS, а также БД учета объединения классов IterObj1.dbf и занести в них начальную информацию по текущей модели.
Данный режим реализован в модуле _5126 системы «Эйдос» и обеспечивает работу с любой из четырех моделей или со всеми этими моделями по очереди, поддерживаемых системой и приведенных в таблице 3. При этом в базах данных этих моделей ничего не изменяется.
3. Цикл по моделям до тех пор, пока есть похожие классы.
4. Рассчитать матрицу сходства классов MSK_KLAS в текущей модели.
Эта матрица рассчитываемся на основе матрицы знаний модели, заданной при запуске режима (СИМ-1 - СИМ-4), путем расчета корреляции обобщенных образов классов (т.е. векторов или профилей классов).
5. Найти пару наиболее похожих классов в матрице сходства.
Здесь определяются два класса, у которых на предыдущем шаге было обнаружено наивысшее сходство. При этом при запуске режима задается параметр: «Исключать ли артефакты (выбросы)». Если задано исключать, то рассматриваются только положительные уровни сходства, если нет - то и отрицательные, т.е. в этом случае могут быть объединены и непохожие классы, но наименее непохожие из всех, если других нет. Считается, что непохожие кассы являются исключениями или «выбросами».
6. Объединить 2 класса с наибольшим уровнем сходства.
Данный пункт алгоритма требует наиболее детальных пояснений. Как же объединяются классы в методе когнитивной кластеризации? Сначала суммируются абсолютные частоты этих классов в таблице 2, причем сумма рассчитывается в столбце класса с меньшим кодом, а затем частоты класса с большим кодом обнуляются. После этого в базе знаний (таблица 4) с использованием частного критерия соответствующей модели (таблица 3) пересчитываются только изменившиеся столбцы и строки, т.е. пересчитывается столбец класса с меньшим кодом, а столбец класса с большим кодом обнуляется.
7. Отразить информацию об объединении классов в БД IterObj1.dbf.
8. Конец цикла итераций. Проверить критерий остановки и перейти на продолжение итераций (п.9) или на окончание работы (п.10).
9. Пересчитать в базе данных сходства классов (MSK_KLAS) только изменившиеся столбцы и строки. Конец цикла по моделям.
10. Нарисовать дерево объединения классов, псевдографическое: /TXT/AgKlastK.txt и графическое: /PCX/AGLKLAST/TrK-#-##.GIF.
Далее рассмотрим работу предлагаемой математической модели и реализующего ее алгоритма когнитивной кластеризации на простом численном примере.
Численный пример основан на варианте той же задачи из работы [7], которая использовалась в статье [8]. В книге Д.Мичи и Р.Джонстона "Компьютер - творец" [7] эта задача приводится (на страницах: 205-208) в качестве примера задачи, решаемой методами искусственного интеллекта. Авторами этой задачи являются Рышард Михальски и Джеймс Ларсон. Суть этой задачи сводится к тому, чтобы выработать правила, обеспечивающие идентификацию и классификацию железнодорожных составов на основе их формализованных описаний (рисунок 2).
Рисунок 3 Исходные данные по численному примеру в графическом виде
Важно отметить, что в данной задаче речь идет о классификации изображений объектов. Признаки этих объектов в данном случае выявляются человеком, однако в принципе могут быть разработаны программы, выявляющие подобные признаки непосредственно из графических файлов с изображениями объектов. Выбор данной задачи не накладывает ограничений на выводы, полученные в результате ее исследования [8].
Этапы АСК-анализа предметной области
В работе [9] предложены следующие этапы АСК-анализа предметной области:
1. Когнитивная структуризация предметной области, при которой определяется, что мы хотим прогнозировать и на основе чего (конструирование классификационных и описательных шкал).
2. Формализация предметной области:
- разработка градаций классификационных и описательных шкал (номинального, порядкового и числового типа);
- использование разработанных на предыдущих этапах классификационных и описательных шкал и градаций для формального описания (кодирования) исходных данных (исследуемой выборки).
3. Синтез и верификация (оценка степени адекватности) модели.
4. Если модель адекватна, то ее использование для решения задач идентификации, прогнозирования и принятия решений, а также для исследования моделируемой предметной области.
Этап формализации предметной области при небольших размерностях модели (т.е. когда мало классов и признаков) и небольших объемах исходных данных может быть выполнен вручную. Однако даже в этом случае какие-либо изменения на первых этапах создания модели могут быть весьма трудоемкими. А такие изменения могут быть необходимыми и могут осуществляться многократно, так как качество модели определяется только на следующем этапе после ее синтеза в процессе верификации. Если же размерность модели и объем исходных данных велики, то вручную выполнить этап формализации предметной области весьма проблематично. Поэтому в системе «Эйдос» реализовано много программных интерфейсов с внешними базами исходных данных различной структуры, которые позволяют автоматизировать этап формализации предметной области, т.е. выполнить его автоматически с учетом параметров формализации, заданных исследователем в диалоге. В численном примере, приведенном в данной статье, авторы воспользовались программным интерфейсом формализации предметной области системы «Эйдос», реализованным в программном модуле (режиме) _152, который мы и рассмотрим.
Программный интерфейс ввода исходных в систему «Эйдос».
Скриншот Help режима _152 приведен на рисунке 4, а скриншот экранной формы с диалогом пользователя по заданию параметров формализации предметной области - на рисунках 5 и 6. Форма представления исходных данных для данного режима, заполненная реальными данными по рассматриваемому численному примеру, приведена в таблице 5. Исходные данные представляются в форме денормализованной таблицы MS Excel, которая затем записывается из самого Excel в виде файла базы данных стандарта DBF 4 (dBASE IV) (*.dbf), непосредственно воспринимаемого системой «Эйдос».
Рисунок 4 Скриншот Help программного интерфейса формализации предметной области системы «Эйдос» (режим _152)
Рисунок 5 Скриншот экранной формы диалога пользователя по заданию параметров формализации предметной области системы «Эйдос» (режим _152)
Рисунок 6 Скриншот экранной формы диалога пользователя по заданию параметров формализации предметной области системы «Эйдос» (режим _152)
Таблица 5 MS EXEL-ФОРМА ДЛЯ ПРЕДСТАВЛЕНИЯ ИСХОДНЫХ ДАННЫХ ПО ЧИСЛЕННОМУ ПРИМЕРУ
Источник информац. |
Классификационные шкалы |
Описательные шкалы |
|||||||||||||||||
Состав следует на |
Назв. состава |
Количество вагонов |
Суммарный вес груза |
Форма вагона |
Длина вагона |
Количество осей вагона |
Грузоподъемность вагона |
Вид стенок вагона |
Вид крыши вагона |
Груз-отсутствует |
Груз-треугольник_прямой |
Груз-треугольник_перевернутый |
Груз-ромб |
Груз-овал |
Груз-квадрат |
Груз-прямоугольник_короткий |
Груз-прямоугольник_длинный |
||
Состав-01 в целом |
ВОСТОК |
Состав-01 |
4 |
61,000 |
|||||||||||||||
Состав-02 в целом |
ВОСТОК |
Состав-02 |
3 |
21,000 |
|||||||||||||||
Состав-03 в целом |
ВОСТОК |
Состав-03 |
3 |
24,000 |
|||||||||||||||
Состав-04 в целом |
ВОСТОК |
Состав-04 |
3 |
45,000 |
|||||||||||||||
Состав-05 в целом |
ВОСТОК |
Состав-05 |
3 |
22,000 |
|||||||||||||||
Состав-06 в целом |
ЗАПАД |
Состав-06 |
2 |
20,000 |
|||||||||||||||
Состав-07 в целом |
ЗАПАД |
Состав-07 |
3 |
14,000 |
|||||||||||||||
Состав-08 в целом |
ЗАПАД |
Состав-08 |
2 |
11,000 |
|||||||||||||||
Состав-09 в целом |
ЗАПАД |
Состав-09 |
3 |
18,000 |
|||||||||||||||
Состав-10 в целом |
ЗАПАД |
Состав-10 |
2 |
12,000 |
|||||||||||||||
Сост-01,ваг-1 |
ВОСТОК |
Состав-01 |
Прямоуг. |
Короткий |
2 |
40,0 |
Одинарные |
Отсутствует |
1 |
||||||||||
Сост-01,ваг-2 |
ВОСТОК |
Состав-01 |
Прямоуг. |
Длинный |
3 |
80,0 |
Одинарные |
Отсутствует |
1 |
||||||||||
Сост-01,ваг-3 |
ВОСТОК |
Состав-01 |
Прямоуг. |
Короткий |
2 |
40,0 |
Одинарные |
Треугольная |
1 |
||||||||||
Сост-01,ваг-4 |
ВОСТОК |
Состав-01 |
Прямоуг. |
Длинный |
2 |
60,0 |
Одинарные |
Отсутствует |
3 |
||||||||||
Сост-02,ваг-1 |
ВОСТОК |
Состав-02 |
Прямоуг. |
Короткий |
2 |
40,0 |
Одинарные |
Прямая |
2 |
||||||||||
Сост-02,ваг-2 |
ВОСТОК |
Состав-02 |
V-образная |
Короткий |
2 |
30,0 |
Одинарные |
Отсутствует |
1 |
||||||||||
Сост-02,ваг-3 |
ВОСТОК |
Состав-02 |
U-образная |
Короткий |
2 |
30,0 |
Одинарные |
Отсутствует |
1 |
||||||||||
Сост-03,ваг-1 |
ВОСТОК |
Состав-03 |
Прямоуг. |
Длинный |
3 |
80,0 |
Одинарные |
Прямая |
1 |
||||||||||
Сост-03,ваг-2 |
ВОСТОК |
Состав-03 |
Ромбов. |
Короткий |
2 |
40,0 |
Одинарные |
Прямая |
1 |
||||||||||
Сост-03,ваг-3 |
ВОСТОК |
Состав-03 |
Прямоуг. |
Короткий |
2 |
40,0 |
Одинарные |
Отсутствует |
1 |
||||||||||
Сост-04,ваг-1 |
ВОСТОК |
Состав-04 |
Прямоуг. |
Короткий |
2 |
40,0 |
Одинарные |
Отсутствует |
1 |
||||||||||
Сост-04,ваг-2 |
ВОСТОК |
Состав-04 |
Овальная |
Короткий |
2 |
40,0 |
Одинарные |
Овальная |
1 |
||||||||||
Сост-04,ваг-3 |
ВОСТОК |
Состав-04 |
Прямоуг. |
Короткий |
2 |
40,0 |
Двойные |
Отсутствует |
1 |
||||||||||
Сост-04,ваг-4 |
ВОСТОК |
Состав-04 |
U-образная |
Короткий |
2 |
30,0 |
Одинарные |
Отсутствует |
1 |
||||||||||
Сост-05,ваг-1 |
ВОСТОК |
Состав-05 |
Прямоуг. |
Короткий |
2 |
40,0 |
Одинарные |
Прямая |
1 |
||||||||||
Сост-05,ваг-2 |
ВОСТОК |
Состав-05 |
Прямоуг. |
Длинный |
3 |
80,0 |
Одинарные |
Прямая |
1 |
||||||||||
Сост-05,ваг-3 |
ВОСТОК |
Состав-05 |
Прямоуг. |
Короткий |
2 |
40,0 |
Двойные |
Отсутствует |
1 |
||||||||||
Сост-06,ваг-1 |
ЗАПАД |
Состав-06 |
Прямоуг. |
Короткий |
2 |
40,0 |
Одинарные |
Отсутствует |
1 |
||||||||||
Сост-06,ваг-2 |
ЗАПАД |
Состав-06 |
Прямоуг. |
Длинный |
2 |
60,0 |
Одинарные |
Прямая |
3 |
||||||||||
Сост-07,ваг-1 |
ЗАПАД |
Состав-07 |
Прямоуг. |
Длинный |
2 |
60,0 |
Одинарные |
Гофрированная |
1 |
||||||||||
Сост-07,ваг-2 |
ЗАПАД |
Состав-07 |
U-образная |
Короткий |
2 |
30,0 |
Одинарные |
Отсутствует |
1 |
||||||||||
Сост-07,ваг-3 |
ЗАПАД |
Состав-07 |
Прямоуг. |
Короткий |
2 |
40,0 |
Двойные |
Отсутствует |
1 |
||||||||||
Сост-08,ваг-1 |
ЗАПАД |
Состав-08 |
U-образная |
Короткий |
2 |
30,0 |
Одинарные |
Отсутствует |
1 |
||||||||||
Сост-08,ваг-2 |
ЗАПАД |
Состав-08 |
Прямоуг. |
Длинный |
3 |
80,0 |
Одинарные |
Прямая |
1 |
||||||||||
Сост-09,ваг-1 |
ЗАПАД |
Состав-09 |
V-образная |
Короткий |
2 |
30,0 |
Одинарные |
Отсутствует |
1 |
||||||||||
Сост-09,ваг-2 |
ЗАПАД |
Состав-09 |
Прямоуг. |
Короткий |
2 |
40,0 |
Одинарные |
Отсутствует |
1 |
||||||||||
Сост-09,ваг-3 |
ЗАПАД |
Состав-09 |
Прямоуг. |
Длинный |
2 |
60,0 |
Одинарные |
Гофрированная |
1 |
||||||||||
Сост-09,ваг-4 |
ЗАПАД |
Состав-09 |
V-образная |
Короткий |
2 |
30,0 |
Одинарные |
Отсутствует |
1 |
||||||||||
Сост-10,ваг-1 |
ЗАПАД |
Состав-10 |
Прямоуг. |
Длинный |
2 |
60,0 |
Одинарные |
Отсутствует |
2 |
||||||||||
Сост-10,ваг-2 |
ЗАПАД |
Состав-10 |
U-образная |
Короткий |
2 |
30,0 |
Одинарные |
Отсутствует |
1 |
Результаты формализации предметной области.
В результате работы программного интерфейса _152 автоматически формируются классификационные и описательные шкалы и градации и с их использованием кодируются исходные данные, в результат чего формируется обучающая выборка (таблицы 6 - 9):
Таблица 6 Справочник классов (классификационных шкал и градаций)
KOD |
NAME |
|
1 |
Состав следует на ВОСТОК |
|
2 |
Состав следует на ЗАПАД |
|
3 |
Состав-01 |
|
4 |
Состав-02 |
|
5 |
Состав-03 |
|
6 |
Состав-04 |
|
7 |
Состав-05 |
|
8 |
Состав-06 |
|
9 |
Состав-07 |
|
10 |
Состав-08 |
|
11 |
Состав-09 |
|
12 |
Состав-10 |
В таблице 1, по сути, приведены исходные кластеры, первые два из которых являются составными или «полиобъектными» (решение о принадлежности объектов к тому или иному составному классу принималось экспертом - учителем), а последующие 10 - «монообъетными». Первый полиобъектный класс состоит из объектов с кодами 3-7, а второй - 8-12, монообъектные классы состоят из объектов с кодами от 3 до 12.
Таблица 7 Справочник признаков (описательных шкал и градаций)
Код |
Наименование |
Ед.изм. |
Тип шкалы |
|
1 |
КОЛИЧЕСТВО ВАГОНОВ-2 |
Шт. |
Порядковая (целочисленная) |
|
2 |
КОЛИЧЕСТВО ВАГОНОВ-3 |
|||
3 |
КОЛИЧЕСТВО ВАГОНОВ-4 |
|||
4 |
СУММАРНЫЙ ВЕС ГРУЗА: 1/5-{11.00, 21.00} |
Тонны |
Числовая (в интервальных значениях) |
|
5 |
СУММАРНЫЙ ВЕС ГРУЗА: 2/5-{21.00, 31.00} |
|||
6 |
СУММАРНЫЙ ВЕС ГРУЗА: 3/5-{31.00, 41.00} |
|||
7 |
СУММАРНЫЙ ВЕС ГРУЗА: 4/5-{41.00, 51.00} |
|||
8 |
СУММАРНЫЙ ВЕС ГРУЗА: 5/5-{51.00, 61.00} |
|||
9 |
ФОРМА ВАГОНА-U-образная |
Текстовая (номинальная) |
||
10 |
ФОРМА ВАГОНА-V-образная |
|||
11 |
ФОРМА ВАГОНА-Овальная |
|||
12 |
ФОРМА ВАГОНА-Прямоугольная |
|||
13 |
ФОРМА ВАГОНА-Ромбовидная |
|||
14 |
ДЛИНА ВАГОНА-Длинный |
Порядковая (целочисленная) |
||
15 |
ДЛИНА ВАГОНА-Короткий |
|||
16 |
КОЛИЧЕСТВО ОСЕЙ ВАГОНА-2 |
Шт. |
Порядковая (целочисленная) |
|
17 |
КОЛИЧЕСТВО ОСЕЙ ВАГОНА-3 |
|||
18 |
ГРУЗОПОДЪЕМНОСТЬ ВАГОНА: 1/5-{30.00, 40.00} |
Тонны |
Числовая (в интервальных значениях) |
|
19 |
ГРУЗОПОДЪЕМНОСТЬ ВАГОНА: 2/5-{40.00, 50.00} |
|||
20 |
ГРУЗОПОДЪЕМНОСТЬ ВАГОНА: 3/5-{50.00, 60.00} |
|||
21 |
ГРУЗОПОДЪЕМНОСТЬ ВАГОНА: 4/5-{60.00, 70.00} |
|||
22 |
ГРУЗОПОДЪЕМНОСТЬ ВАГОНА: 5/5-{70.00, 80.00} |
|||
23 |
ВИД СТЕНОК ВАГОНА-Двойные |
Шт. |
Порядковая (целочисленная) |
|
24 |
ВИД СТЕНОК ВАГОНА-Одинарные |
|||
25 |
ВИД КРЫШИ ВАГОНА-Гофрированная |
Текстовая (номинальная) |
||
26 |
ВИД КРЫШИ ВАГОНА-Овальная |
|||
27 |
ВИД КРЫШИ ВАГОНА-Отсутствует |
|||
28 |
ВИД КРЫШИ ВАГОНА-Прямая |
|||
29 |
ВИД КРЫШИ ВАГОНА-Треугольная |
|||
30 |
ГРУЗ-ОТСУТСТВУЕТ-0001 |
Текстовая (номинальная) |
||
31 |
ГРУЗ-ТРЕУГОЛЬНИК_ПРЯМОЙ-0001 |
|||
32 |
ГРУЗ-ТРЕУГОЛЬНИК_ПЕРЕВЕРНУТЫЙ-0001 |
|||
33 |
ГРУЗ-РОМБ-0001 |
|||
34 |
ГРУЗ-ОВАЛ-0001 |
|||
35 |
ГРУЗ-ОВАЛ-0002 |
|||
36 |
ГРУЗ-ОВАЛ-0003 |
|||
37 |
ГРУЗ-КВАДРАТ-0001 |
|||
38 |
ГРУЗ-КВАДРАТ-0003 |
|||
39 |
ГРУЗ-ПРЯМОУГОЛЬНИК_КОРОТКИЙ-0001 |
|||
40 |
ГРУЗ-ПРЯМОУГОЛЬНИК_КОРОТКИЙ-0002 |
|||
41 |
ГРУЗ-ПРЯМОУГОЛЬНИК_ДЛИННЫЙ-0001 |
Отметим, что эти признаки объектов формализуются в текстовых (номинальных), порядковых (целочисленных) и числовых (со знаками после запятой) шкалах и измеряются в разных единицах измерения, которые можно ввести только для числовых и порядковых шкал.
Соответственно и исходные данные (исследуемая выборка) представлены в форме переменных с количественными и качественными значениями, измеряемыми в различных единицах измерения и формализуемыми в шкалах различного типа. Но в исходных данных есть информация не только о признаках объектов, но и об их принадлежности к тем или иным классам (полиобъектным или монообъектным). Вся эта информация представлена в обучающей выборке, стоящей из двух баз данных, базы заголовков и базы признаков, связанных отношением «один ко многим» по полю «Код объекта» (таблицы 8 и 9):
Таблица 8 Обучающая выборка (база заголовков)
Код объекта |
Наименование объекта |
Коды классов |
||
41 |
ВОСТОК |
1 |
||
42 |
ЗАПАД |
2 |
||
43 |
Состав-01 |
3 |
1 |
|
44 |
Состав-02 |
4 |
1 |
|
45 |
Состав-03 |
5 |
1 |
|
46 |
Состав-04 |
6 |
1 |
|
47 |
Состав-05 |
7 |
1 |
|
48 |
Состав-06 |
8 |
2 |
|
49 |
Состав-07 |
9 |
2 |
|
50 |
Состав-08 |
10 |
2 |
|
51 |
Состав-09 |
11 |
2 |
|
52 |
Состав-10 |
12 |
2 |
Таблица 9 Обучающая выборка (база признаков)
Код объекта |
Коды признаков |
|||||||||||
41 |
3 |
8 |
2 |
4 |
5 |
2 |
5 |
2 |
7 |
2 |
5 |
|
41 |
15 |
16 |
18 |
19 |
24 |
27 |
34 |
12 |
14 |
17 |
22 |
|
41 |
27 |
33 |
12 |
15 |
16 |
18 |
19 |
24 |
29 |
31 |
12 |
|
41 |
16 |
20 |
21 |
24 |
27 |
38 |
12 |
15 |
16 |
18 |
19 |
|
41 |
28 |
35 |
10 |
15 |
16 |
18 |
24 |
27 |
39 |
9 |
15 |
|
41 |
18 |
24 |
27 |
31 |
12 |
14 |
17 |
22 |
24 |
28 |
32 |
|
41 |
15 |
16 |
18 |
19 |
24 |
28 |
31 |
12 |
15 |
16 |
18 |
|
41 |
24 |
27 |
34 |
12 |
15 |
16 |
18 |
19 |
24 |
27 |
37 |
|
41 |
15 |
16 |
18 |
19 |
24 |
26 |
33 |
12 |
15 |
16 |
18 |
|
41 |
23 |
27 |
31 |
9 |
15 |
16 |
18 |
24 |
27 |
31 |
12 |
|
41 |
16 |
18 |
19 |
24 |
28 |
34 |
12 |
14 |
17 |
22 |
24 |
|
41 |
41 |
12 |
15 |
16 |
18 |
19 |
23 |
27 |
31 |
|||
42 |
1 |
4 |
2 |
4 |
1 |
4 |
2 |
4 |
1 |
4 |
12 |
|
42 |
16 |
18 |
19 |
24 |
27 |
31 |
12 |
14 |
16 |
20 |
21 |
|
42 |
28 |
36 |
12 |
14 |
16 |
20 |
21 |
24 |
25 |
30 |
9 |
|
42 |
16 |
18 |
24 |
27 |
31 |
12 |
15 |
16 |
18 |
19 |
23 |
|
42 |
34 |
9 |
15 |
16 |
18 |
24 |
27 |
34 |
12 |
14 |
17 |
|
42 |
24 |
28 |
41 |
10 |
15 |
16 |
18 |
24 |
27 |
34 |
12 |
|
42 |
16 |
18 |
19 |
24 |
27 |
39 |
12 |
14 |
16 |
20 |
21 |
|
42 |
25 |
41 |
10 |
15 |
16 |
18 |
24 |
27 |
34 |
12 |
14 |
|
42 |
20 |
21 |
24 |
27 |
40 |
9 |
15 |
16 |
18 |
24 |
27 |
|
42 |
39 |
|||||||||||
43 |
3 |
8 |
12 |
15 |
16 |
18 |
19 |
24 |
27 |
34 |
12 |
|
43 |
17 |
22 |
24 |
27 |
33 |
12 |
15 |
16 |
18 |
19 |
24 |
|
43 |
31 |
12 |
14 |
16 |
20 |
21 |
24 |
27 |
38 |
|||
44 |
2 |
4 |
5 |
12 |
15 |
16 |
18 |
19 |
24 |
28 |
35 |
|
44 |
15 |
16 |
18 |
24 |
27 |
39 |
9 |
15 |
16 |
18 |
24 |
|
44 |
31 |
|||||||||||
45 |
2 |
5 |
12 |
14 |
17 |
22 |
24 |
28 |
32 |
13 |
15 |
|
45 |
18 |
19 |
24 |
28 |
31 |
12 |
15 |
16 |
18 |
19 |
24 |
|
45 |
34 |
|||||||||||
46 |
2 |
7 |
12 |
15 |
16 |
18 |
19 |
24 |
27 |
37 |
11 |
|
46 |
16 |
18 |
19 |
24 |
26 |
33 |
12 |
15 |
16 |
18 |
19 |
|
46 |
27 |
31 |
9 |
15 |
16 |
18 |
24 |
27 |
31 |
|||
47 |
2 |
5 |
12 |
15 |
16 |
18 |
19 |
24 |
28 |
34 |
12 |
|
47 |
17 |
22 |
24 |
28 |
41 |
12 |
15 |
16 |
18 |
19 |
23 |
|
47 |
31 |
|||||||||||
48 |
1 |
4 |
12 |
15 |
16 |
18 |
19 |
24 |
27 |
31 |
12 |
|
48 |
16 |
20 |
21 |
24 |
28 |
36 |
||||||
49 |
2 |
4 |
12 |
14 |
16 |
20 |
21 |
24 |
25 |
30 |
9 |
|
49 |
16 |
18 |
24 |
27 |
31 |
12 |
15 |
16 |
18 |
19 |
23 |
|
49 |
34 |
|||||||||||
50 |
1 |
4 |
9 |
15 |
16 |
18 |
24 |
27 |
34 |
12 |
14 |
|
50 |
22 |
24 |
28 |
41 |
||||||||
51 |
2 |
4 |
10 |
15 |
16 |
18 |
24 |
27 |
34 |
12 |
15 |
|
51 |
18 |
19 |
24 |
27 |
39 |
12 |
14 |
16 |
20 |
21 |
24 |
|
51 |
41 |
10 |
15 |
16 |
18 |
24 |
27 |
34 |
||||
52 |
1 |
4 |
12 |
14 |
16 |
20 |
21 |
24 |
27 |
40 |
9 |
|
52 |
16 |
18 |
24 |
27 |
39 |
В системе «Эйдос» есть режим _25, экранная форма которого приведена на рисунке 7, обеспечивающий как расчет всех четырех типов моделей (СИМ-1 - СИМ-4), отличающихся видом частных критериев (таблица 3), так и измерение их достоверности с двумя видами интегральных критериев: сверткой и корреляцией.
Рисунок 7Экранная форма режима _25 системы «Эйдос»
В результате работы режима _25 формируется матрица абсолютных частот (таблица 10) и матрицы знаний четырех моделей (таблицы 11 - 14):
Таблица 10 Матрица абсолютных частот
Код |
Наименование |
Классы |
Сумма |
||||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
||||
1 |
КОЛИЧЕСТВО ВАГОНОВ-2 |
6 |
1 |
1 |
1 |
9 |
|||||||||
2 |
КОЛИЧЕСТВО ВАГОНОВ-3 |
8 |
4 |
1 |
1 |
1 |
1 |
1 |
1 |
18 |
|||||
3 |
КОЛИЧЕСТВО ВАГОНОВ-4 |
2 |
1 |
3 |
|||||||||||
4 |
СУММАРНЫЙ ВЕС ГРУЗА: 1/5-{11.00, 21.00} |
2 |
10 |
1 |
1 |
1 |
1 |
1 |
1 |
18 |
|||||
5 |
СУММАРНЫЙ ВЕС ГРУЗА: 2/5-{21.00, 31.00} |
6 |
1 |
1 |
1 |
9 |
|||||||||
6 |
СУММАРНЫЙ ВЕС ГРУЗА: 3/5-{31.00, 41.00} |
||||||||||||||
7 |
СУММАРНЫЙ ВЕС ГРУЗА: 4/5-{41.00, 51.00} |
2 |
1 |
3 |
|||||||||||
8 |
СУММАРНЫЙ ВЕС ГРУЗА: 5/5-{51.00, 61.00} |
2 |
1 |
3 |
|||||||||||
9 |
ФОРМА ВАГОНА-U-образная |
4 |
6 |
1 |
1 |
1 |
1 |
1 |
15 |
||||||
10 |
ФОРМА ВАГОНА-V-образная |
1 |
4 |
2 |
7 |
||||||||||
11 |
ФОРМА ВАГОНА-Овальная |
1 |
1 |
2 |
|||||||||||
12 |
ФОРМА ВАГОНА-Прямоугольная |
23 |
16 |
4 |
1 |
2 |
2 |
3 |
2 |
2 |
1 |
2 |
1 |
59 |
|
13 |
ФОРМА ВАГОНА-Ромбовидная |
1 |
1 |
2 |
|||||||||||
14 |
ДЛИНА ВАГОНА-Длинный |
5 |
9 |
1 |
1 |
1 |
1 |
1 |
1 |
20 |
|||||
15 |
ДЛИНА ВАГОНА-Короткий |
24 |
11 |
2 |
3 |
2 |
3 |
2 |
1 |
1 |
1 |
3 |
53 |
||
16 |
КОЛИЧЕСТВО ОСЕЙ ВАГОНА-2 |
26 |
22 |
3 |
3 |
1 |
4 |
2 |
2 |
3 |
1 |
3 |
2 |
72 |
|
17 |
КОЛИЧЕСТВО ОСЕЙ ВАГОНА-3 |
6 |
1 |
1 |
1 |
1 |
10 |
||||||||
18 |
ГРУЗОПОДЪЕМНОСТЬ ВАГОНА: 1/5-{30.00, 40.00} |
26 |
16 |
2 |
3 |
2 |
4 |
2 |
1 |
2 |
1 |
3 |
1 |
63 |
|
19 |
ГРУЗОПОДЪЕМНОСТЬ ВАГОНА: 2/5-{40.00, 50.00} |
18 |
6 |
2 |
1 |
2 |
3 |
2 |
1 |
1 |
1 |
37 |
|||
20 |
ГРУЗОПОДЪЕМНОСТЬ ВАГОНА: 3/5-{50.00, 60.00} |
2 |
8 |
1 |
1 |
1 |
1 |
1 |
15 |
||||||
21 |
ГРУЗОПОДЪЕМНОСТЬ ВАГОНА: 4/5-{60.00, 70.00} |
2 |
8 |
1 |
1 |
1 |
1 |
1 |
15 |
||||||
22 |
ГРУЗОПОДЪЕМНОСТЬ ВАГОНА... |
Подобные документы
Создание комбинированных моделей и методов как современный способ прогнозирования. Модель на основе ARIMA для описания стационарных и нестационарных временных рядов при решении задач кластеризации. Модели авторегрессии AR и применение коррелограмм.
презентация [460,1 K], добавлен 01.05.2015Цели сегментации рынка в маркетинговой деятельности. Сущность кластерного анализа, основные этапы его выполнения. Выбор способа измерения расстояния или меры сходства. Иерархические, неиерархические методы кластеризации. Оценка надежности и достоверности.
доклад [214,7 K], добавлен 02.11.2009Основные показатели финансового состояния предприятия. Кризис на предприятии, его причины, виды и последствия. Современные методы и инструментальные средства кластерного анализа, особенности их использования для финансово-экономической оценки предприятия.
дипломная работа [1,4 M], добавлен 09.10.2013Математическое моделирование. Сущность экономического анализа. Математические методы в экономическом анализе. Теория массового обслуживания. Задача планирования работы предприятия, надежности изделий, распределения ресурсов, ценообразования.
контрольная работа [24,9 K], добавлен 20.12.2002Изучение математической теории, развивающей формальные методы для исследования взаимосвязей и отношений состояний знаний субъектов в определенной предметной области. Понятие карты навыков. Рассмотрение отношений между состояниями знаний и навыками.
дипломная работа [263,5 K], добавлен 12.10.2015Многомерный статистический анализ. Математические методы построения оптимальных планов сбора, систематизации и обработки данных. Геометрическая структура многомерных наблюдений. Проверка значимости уравнения регрессии. Кластерный и факторный анализ.
курсовая работа [2,6 M], добавлен 10.03.2011Метод имитационного моделирования, его виды, основные этапы и особенности: статическое и динамическое представление моделируемой системы. Исследование практики использования методов имитационного моделирования в анализе экономических процессов и задач.
курсовая работа [54,3 K], добавлен 26.10.2014Построение типологических регрессий по отдельным группам наблюдений. Пространственные данные и временная информация. Сферы применения кластерного анализа. Понятие однородности объектов, свойства матрицы расстояний. Проведение типологической регрессии.
презентация [322,6 K], добавлен 26.10.2013На основе экстраполяции значений прогнозирующей функции осуществить прогноз выпуска продукции на квартал следующего года . Коэффициент простоя системы, среднее число клиентов в системе, среднюю длину очереди, среднее время пребывания клиента в системе.
контрольная работа [93,3 K], добавлен 11.04.2007Синтетический метод в прикладном системном анализе. Предпосылка синтеза системы с оптимальным распределением руководящих (координирующих) функций. Показатели центральности и периферийности. Целочисленное программирование. Учёт факторов неопределённости.
презентация [421,7 K], добавлен 19.12.2013Анализ чувствительности производственной программы предприятия к изменению уровня запасов сырья. Элементы теории графов. Алгоритм для нахождения пути с правильной нумерацией вершин. Транспортная задача, метод минимального элемента и северо-западного угла.
курсовая работа [986,8 K], добавлен 31.05.2013Линейное программирование. Геометрическая интерпретация и графический метод решения ЗЛП. Симплексный метод решения ЗЛП. Метод искусственного базиса. Алгоритм метода минимального элемента. Алгоритм метода потенциалов. Метод Гомори. Алгоритм метода Фогеля.
реферат [109,3 K], добавлен 03.02.2009Задачи операционного исследования. Построение базовой аналитической модели. Описание вычислительной процедуры. Решение задачи оптимизации на основе технологии симплекс-метода. Анализ результатов базовой аналитической модели и предложения по модификации.
курсовая работа [1,5 M], добавлен 12.12.2009Основы математического моделирования детерминированных и стохастических объектов. Идентификация объектов управления по переходной характеристике. Получение модели методом множественной линейной регрессии и проверка ее адекватности по критерию Фишера.
курсовая работа [1,1 M], добавлен 14.10.2014Математическая постановка и алгоритм решения транспортной задачи. Сбалансированность и опорное решение задачи. Методы потенциалов и северо-западного угла. Блок-схема. Формы входной и выходной информации. Инструкция для пользователя и программиста.
курсовая работа [113,8 K], добавлен 10.11.2008Проблема использования индексного анализа динамики средних цен в экономической практике; учет влияния фактора сменяемости изучаемых величин. Методологические принципы исчисления индексов стоимости, средних цен и физического объема внешней торговли.
контрольная работа [1,6 M], добавлен 18.08.2013Связь стохастических процессов и дифференциальных уравнений. Алгоритм Бюффона для определения числа Пи. Геометрический алгоритм Монте-Карло интегрирования. Применение метода Монте-Карло в логистике. Алгоритм Метрополиса, квантовый метод Монте-Карло.
курсовая работа [258,0 K], добавлен 26.12.2013Выполнение кластерного анализа предприятий с помощью программы Statgraphics Plus. Построение линейного уравнения регрессии. Расчет коэффициентов эластичности по регрессионным моделям. Оценка статистической значимости уравнения и коэффициента детерминации.
задача [1,7 M], добавлен 16.03.2014Графический метод решения задачи оптимизации производственных процессов. Применение симплекс-алгоритма для решения экономической оптимизированной задачи управления производством. Метод динамического программирования для выбора оптимального профиля пути.
контрольная работа [158,7 K], добавлен 15.10.2010Определение парных коэффициентов корреляции и на их основе факторов, оказывающих наибольшее влияние на результативный показатель. Анализ множественных коэффициентов корреляции и детерминации. Оценка качества модели на основе t-статистики Стьюдента.
лабораторная работа [890,1 K], добавлен 06.12.2014