К вычислению весовых коэффициентов признаков в интеллектуальных динамических системах
Анализ условий применения упрощенного метода анализа иерархий к получению весовых коэффициентов признаков при большой размерности признакового пространства. Обсуждение способов формирования матрицы парных сравнений, упрощающих процедуры вычислений.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 16.01.2018 |
Размер файла | 50,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Аннотация
УДК 519.7:007.52;519.81;007.01.362
К ВЫЧИСЛЕНИЮ ВЕСОВЫХ КОЭФФИЦИЕНТОВ ПРИЗНАКОВ В ИНТЕЛЛЕКТУАЛЬНЫХ ДИНАМИЧЕСКИХ СИСТЕМАХ Работа выполнена при частичной финансовой поддержке РФФИ (проект № 04-01-00144), РГНФ (проект № 06-06-12603в).
С.И. Колесникова 634029, Томск, ул. Белинского, 21/1, кв. 50, ТГАСУ, skolesnikova@yandex.ru., А.Е. Янковская 634003, Томск, ул. Читинская, 2, кв. 28, ТГАСУ, yank@tsuab.ru.
Анализируются условия применения упрощенного метода анализа иерархий к получению весовых коэффициентов признаков при большой размерности признакового пространства, обсуждаются два метода к формированию матрицы парных сравнений, позволяющих не только существенно сократить количество сравнений, но и упростить процедуру вычисления собственного вектора матрицы применительно к тестовому распознаванию в динамических системах поддержки принятия решений.
Введение
В докладе продолжается обсуждение задачи определения весовых коэффициентов характеристических признаков [Журавлев, 1990], актуальной в тестовом распознавании, логическом выводе, используемых в интеллектуальных системах выявления закономерностей и принятия решений. В работах [Янковская и др., 2004a, Янковская и др., 2004b] излагаются как ранее опубликованные, так и вновь предлагаемые методы определения весовых коэффициентов признаков (ВКП) в тестовых распознающих системах, на основе которых построена коллективная оценка, используемая при принятии решения в интеллектуальных системах. В настоящей работе рассматривается задача использования метода вычисления ВКП в форме зависимостей от времени, учитывающего взаимозависимость признаков и основанного на матричной модели представления данных и знаний, формализме мультимножеств [Петровский, 2003], методе анализа иерархий (МАИ) Саати в пространстве, обладающем большой размерностью. Как известно [Саати, 1989, Ногин, 2004], данная задача до сих пор является нетривиальной не только в случае задания предпочтений экспертами вручную, но и в случае, когда относительная важность ВКП вычисляется по предложенным в [Янковская и др., 2004a, Янковская и др., 2004b] формулам. Например, в случае 50-ти признаков, используемых в задачах диагностики, количество парных сравнений составит 1225, что является не только трудоемким процессом, но и проблематичным для хранения такого объема данных в памяти ЭВМ.
1. Основные определения и понятия
Все рассматриваемые методы основаны на известной матричной модели представления данных и знаний, включающей матрицу описаний (Q) объектов в пространстве характеристических и матрицу различений (R) объектов в пространстве классификационных признаков. Элемент qij матрицы Q задает значение j-го признака для i-го объекта. Если значение qij отмечено символом " - ", то считается, что признак может принимать как нулевые, так и единичные значения, а в случае k-значных признаков - любые целочисленные значения признаков из заданного интервала значений признака. Элемент rij матрицы R задает принадлежность i-го объекта одному из выделенных классов по j-му механизму классификации. Множество всех неповторяющихся строк матрицы R сопоставлено множеству выделенных образов. Элементами образа являются объекты, представленные строками матрицы Q, сопоставленными одинаковым строкам матрицы R. Если имеется единственный механизм классификации, матрица различений вырождается в столбец, что соответствует традиционному представлению знаний в задачах распознавания образов.
Задача распознавания состоит в определении по матрицам Q и R образа, которому принадлежит заданный совокупностью признаков исследуемый объект, как правило, не входящий в обучающую выборку.
При qij{0,1, - } используются следующие определения.
Признаки называются зависимыми, если имеется хотя бы одна пара объектов из разных образов, различаемая этими признаками.
Совокупность признаков, различающих все пары объектов из разных образов (классов), назовем диагностическим тестом (далее слово "диагностический" будем опускать).
Два объекта считаются различимыми, если хотя бы один признак в описании одного из них принимают значение 1 (0), а в описании другого - инверсное (0 (1)).
Авторами предложен подход [Янковская и др., 2004a, Янковская и др., 2004b] и реализующий его метод определения весовых коэффициентов характеристических признаков, используемых в интеллектуальных тестовых распознающих системах. Подход основан на представлении совокупности всех различимых пар объектов из разных образов для каждого признака () в виде мультимножества и применении метода анализа иерархий Саати, использующего парные сравнения критериев (признаков) в матрицах доминирования на основе специальным образом выбранной меры относительной важности признаков, учитывающей их взаимозависимость.
Предложенный метод состоит из трех этапов, на каждом из которых формируется матрица парных сравнений (МПС) признаков (M - количество признаков в тесте) на основе определенной меры относительной важности признака i над признаком j, в качестве которой поэтапно выбираются величины:
, , , (1.1)
где - мощность (общее количество элементов) [Петровский, 2003]i-го мультимножества, соответствующего признаку ; размерность (количество элементов, встречающихся один раз) i-го мультимножества; - разность мультимножеств, соответствующих признакам и ; , если , и , иначе. На s-м () этапе вычисляется М - компонентный вектор значений ВКП -
,
совпадающий со значением нормализованного главного собственного вектора соответствующей матрицы (по Саати - локальные приоритеты). Вектор:
представляет собой обобщенные значения ВКП (глобальные приоритеты), входящих в тест. Вышеуказанные меры позволяют учесть не только общие свойства сравниваемых признаков (степень сходства или различия), но, что особенно важно, и уникальные их свойства (степень приоритетности одного признака над другими).
Известно, что при использовании метода анализа иерархий такой способ определения весового вектора существенно опирается на свойство совместности матрицы парных сравнений и не является обоснованным в случае его нарушения.
Для дальнейшего изложения перечислим требования к матрице относительных весов [Саати, 1989]:
1): aij > 0;
2) ;
3)
4) число M является максимальным собственным значением матрицы A, и для некоторого единственного (нормированного) вектор-столбец:
а
с положительными компонентами выполняется равенство:
A W = M W.
Из свойства 3) [Ногин, 2004] следует, что при формировании матрицы парных сравнений достаточно получить набор элементов первой строки (в том числе от эксперта), после чего остальные элементы матрицы A можно однозначно вычислить (если позволяет специфика задачи) по формуле:
.
Следуя [Ногин, 2004], будем использовать следующие понятия.
Будем говорить, что некоторый набор элементов матрицы:
,
расположенных выше главной диагонали, является определяющим, если на его основе с помощью свойств 2) - 4) можно однозначно определить все остальные элементы матрицы, причем найденная таким способом матрица будет удовлетворять всем свойствам 1)- 4).
Минимальный (по числу) определяющий набор элементов матрицы А назовем базисным.
2. Постановка задачи
Пусть по матрицам Q и R построены все (часть) безызбыточные тесты, представленные матрицей тестов Т, строки которой сопоставлены тестам, а столбцы - характеристическим признакам, и определено число различающих пар "объект- объект" по каждому характеристическому признаку. Требуется определить весовые коэффициенты характеристических признаков, входящих в объединение всех (части) безызбыточных тестов [Янковская и др., 2004a] с учетом возможной взаимозависимости этих признаков. При этом, не исключается возможность того, что размерность признакового пространства достаточно велика, а весовые коэффициенты признаков могут зависеть от времени. иерархия коэффициент признак пространство
3. Методы формирования матрицы парных сравнений при большом количестве признаков
Обсудим подходы, которые могут быть использованы для частичного решения проблемы, связанной с большим количеством признаков в тесте.
Подход, заключающийся в применении операции кластеризации [Айвазян, 1989], которой подвергается множество признаков (или построении некоторой иерархии важности признаков), и в последовательном построении матриц парных сравнений с вычислением локальных приоритетов признаков в каждой таблице, учитывающихся при получении окончательных значений (первичных) признаков, не умаляет количество требуемых сравнений и, соответственно, вычислений.
Второй подход к решению данной проблемы связан с упрощенным вариантом МАИ [Ногин, 2004], технология применения которого к данной задаче может быть следующая.
Сначала выбираются М-1 базисных элементов, на основе которых определяются все остальные элементы МПС. Способ выбора базисных элементов является задачей творческой и зависит от модели задачи (и решения эксперта), в частности, от выбранной меры сравнения относительной важности признаков. Применительно к рассматриваемой задаче рассмотрим два следующих способа.
Первый способ связан с выбором некоторого "идеального" признака-образца, в качестве которого может служить либо признак с наибольшим весом, рассчитанным по формуле, предложенной в [Янковская и др., 2004b], либо объединение всех мультимножеств, порожденных соответствующими признаками (). Далее формируем первую строку на основе соответствующей меры относительной важности (1.1) признака-образца над остальными признаками, элементы которой являются базисными. Остальные элементы МПС находятся из условия, которое обеспечивает выполнение свойства совместности матрицы парных сравнений:
(3.1)
Тогда компоненты весового ненормализованного вектора:
(верхний индекс "У" означает "упрощенный"), следуя теореме 1 [Ногин, 2004], вычисляются по формуле:
(3.2)
Таким образом, компоненты весового вектора составляют последний столбец МПС А, элементы которой получены по формуле (3.2).
Преимущество данного способа с точки зрения трудоемкости вычислений очевидно: вместо вычисления величин потребуется вычислить только величин, т.е. в раза меньше при достаточно большом объеме М. К тому же, в случае экспертного задания оценок, формула (3.2) обеспечивает не только экономию времени, но и согласованность МПС, т.е. избавляет от "модельной" ошибки.
Второй способ предполагает следующий набор базисных элементов: , который реализует схему последовательного сравнения (некоторый "идеальный образец" сравнивается с 1-м, затем 1-й сравнивается со вторым, и т.д.). Сформулируем основные результаты.
Теорема 1. Пусть МПС построена по следующим правилам:
1) элементы являются базисными и определяются по формуле:
, ; (3.3)
2) остальные элементы определяются по формуле:
, . (3.4)
Тогда МПС удовлетворяет всем требованиям относительных весов 1) - 4), и компоненты ненормированного собственного вектора определяются по формуле:
,
Теорема 2. Если матрица парных сравнений:
с элементами, определяющимися по формуле (1.1), удовлетворяет всем требованиям относительных весов 1) - 4), то ее собственный вектор совпадает с собственным вектором МПС, элементы которой вычислены по формулам (3.3), (3.4).
Отметим, что второй способ предполагает вычисление компонентов собственного вектора по базисным элементам, определяемым по точным формулам (3.3), и количество требуемых сравнений определится числом , что в раз меньше традиционно требуемых сравнений.
4. Иллюстративный пример
Рассмотрим пример, где представлены численные значения весовых коэффициентов признаков, полученных по методу, основанному на мультимножествах и МАИ, следуя [4], и методу, использующему упрощенный МАИ, а также их численное сравнение. Ввиду громоздкости МПС при большой ее размерности и ограничения на объем доклада, а также имея в виду, что интерес, главным образом, представляет: а) погрешность в точности получаемых оценок по данным методам, т.е. |WМ - WУ|, где WМ - нормализованный собственный вектор МПС по методу, основанному на мультимножествах и МАИ, WУ - нормализованный собственный вектор МПС по упрощенному МАИ; б) факт совместности МПС или значение индекса согласованности в указанных методах, а значит:
,
рассмотрим получение значений весовых коэффициентов признаков для небольшого теста, например, для при матрицах Q, R, Т, заданных в виде, представленном на рис. 1.
Рис. 1. Матрицы описаний Q, различений R и тестов T
В матрице парных сравнений признаков на основе меры относительной важности расположим признаки по невозрастанию мощностей соответствующих разностей мультимножеств (табл. 1), учитывая, что:
|P5 - P9|=13, |P9 - P5|=15, |P5 - P11|=14, |P11 - P5|=14, |P9 - P11|=10, |P11 - P9|=8.
Соответствующая МПС признаков на основе указанной меры относительной важности имеет вид:
Табл. 1
P9 |
P5 |
P11 |
WМ |
||
P9 |
1 |
15/13 |
5/4 |
0,375 |
|
P5 |
13/15 |
1 |
14/14 |
0,317 |
|
P11 |
4/5 |
14/14 |
1 |
0,308 |
МПС признаков на основе выбранной меры относительной важности и упрощенного МАИ, т.е. формул (3.3), (3.4), имеет вид:
Табл. 2
P9 |
P5 |
P11 |
WУ |
|WМ-WУ| |
||
P9 |
1 |
15/13 |
5/4 |
0,375 |
0,000 |
|
P5 |
13/15 |
1 |
(513)/(415) |
0,325 |
0,008 |
|
P11 |
4/5 |
(415)/(513) |
1 |
0,300 |
0,008 |
Обратим также внимание на погрешность, связанную с индексом совместности МПС по методу, основанному на мультимножествах и МАИ, имея в виду, что уровень отношения согласованности равен 0.001 (для применимости МАИ желательным считается значение, меньшее 0.1):
.
Таким образом, "модельная ошибка" в методе, основанном на мультимножествах и точных формулах (1.1), оказалась больше (максимальное отклонение равно 0.033), чем максимальное отклонение |WМ - WУ|, равное 0.008, позволяющих в 2 раза сократить количество сравнений и упростить процедуру вычисления собственного вектора.
Заключение
Рассмотренные подходы позволяют применить метод определения весовых коэффициентов признаков, основанный на мультимножествах [Янковская и др., 2004a, Янковская и др., 2004b], и учитывающий взаимозависимость признаков, для решения динамических реальных задач большой размерности.
Для случая, когда матрица парных сравнений содержит функции времени в качестве элементов, максимальное собственное число lmax, а также собственный вектор W также будут зависеть от времени, т. е.
A(t) W(t) = lmax(t) W(t).
Известно, что для этого уравнения можно получить аналитическое решение [Саати, 1989], если порядок матрицы A(t) не превышает четырех. Для
Данное уравнение решается (в том числе и численными методами) для различных моментов времени t с последующей аппроксимацией полученных точек с целью получения зависимости компонент вектора приоритетов W(t) от времени. Такой подход позволяет снять ограничение на порядок матрицы A(t) и следить за ее согласованностью во времени.
Теорема 1 содержит обоснование подхода, позволяющего существенно сократить количество вычислений при подсчете весовых коэффициентов признаков с мерами относительной важности признака i над признаком j, равными (1.1), учитывающими возможную взаимозависимость входящих в тест признаков.
Теорема 2 содержит условие, гарантирующее применение предложенного подхода в задачах тестового распознавания без существенной погрешности.
Список литературы
1. [Айвазян, 1989] Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Классификация и снижение размерности. - М.: Финансы и статистика, 1989.
2. [Журавлев, 1990] Журавлев Ю.И., Гуревич И.Б. Распознавание образов и анализ изображений // Искусственный интеллект в 3-х кн. Кн 2. Модели и методы: Справочник / Под ред. Д.А. Поспелова. - М: Радио и связь. - 1990.
3. [Ногин, 2004] Ногин В.Д. Упрощенный вариант метода анализа иерархий на основе нелинейной свертки критериев // Журнал вычислительной математики и математической физики. - 2004. - т. 44. - № 7.
4. [Петровский, 2003] Петровский А.Б. Упорядочивание и классификация объектов с противоречивыми признаками // Новости искусственного интеллекта. - 2003. - № 4.
5. [Саати, 1989] Саати Т.Л. Принятие решений. Метод анализа иерархий. М.: Радио и связь. - 1989.
6. [Янковская и др., 2004a] Янковская А.Е., Колесникова С.И. Поддержка принятия решений, коллективная оценка весовых признаков в интеллектуальных системах // Интеллектуальные системы (AIS'04), Интеллектуальные САПР (CAD-2004). Труды Международных научно-технических конференций. Том 1. - Москва: Физматлит, 2004.
7. [Янковская и др., 2004b] Янковская А.Е., Колесникова С.И. Методы определения весовых коэффициентов признаков в интеллектуальных системах // Вестник Томского государственного университета. - 2004. - Приложение № 9 (II).
Размещено на Allbest.ru
...Подобные документы
Системы стабилизации летательного аппарата по углу тангажа с учетом независимости составляющих углового движения. Передаточные функции воздушного судна. Задание матрицы весовых коэффициентов функционала; расчет рулевого привода; синтез фильтра Калмана.
курсовая работа [309,7 K], добавлен 07.08.2013Анализ матрицы коэффициентов парной корреляции. Выбор факторных признаков для построения двухфакторной регрессионной модели. Оценка параметров регрессии по методу наименьших квадратов. Нахождение определителей матриц. Применение инструмента Регрессия.
контрольная работа [1,0 M], добавлен 13.01.2013Разработка алгоритма и программы на персональном компьютере двухслойной нейросети, аналогичной программы на микроконтроллере STM32F407VG. Этапы реализации обучения нейросети и передачи весовых коэффициентов на микроконтроллер по интерфейсу связи UART.
курсовая работа [1,4 M], добавлен 21.02.2016Выбор типа программного обеспечения, к которому относится оцениваемый программный продукт. Выбор весовых коэффициентов и базовых значений. Восстановление программы после системного сбоя. Схема базы данных "Учет посещаемости студентов" в MS Access.
контрольная работа [52,8 K], добавлен 22.12.2011Анализ систем статистики сайтов и факторы, учитываемые при оценке посещаемости. Наиболее популярные счетчики. Построение модели оценки посещаемости сайта skalyariya.ru. Анализ матрицы коэффициентов парных корреляций и построение уравнения регрессии.
отчет по практике [135,5 K], добавлен 28.04.2014Описание метода анализа иерархий и программно-апаратных средств аутентификации: электронных ключей и идентификаторов. Анализ рынка программно-аппаратных средств аутентификации и выбор наилучшего средства при помощи построения иерархической структуры.
курсовая работа [407,6 K], добавлен 07.05.2011Составление процедуры для матрицы, разложения матрицы на множители, решения системы линейных уравнений, нахождения определителя матрицы и матрицы с транспонированием. Суть метода квадратного корня. Разложение матрицы на множители. Листинг программы.
лабораторная работа [39,4 K], добавлен 18.09.2012Определение количества салатов, при котором прибыль от их продажи будет максимальной. Исследование чувствительности решения к изменению правых частей ограничений и коэффициентов матрицы. Возможности увеличения оптимального значения целевой функции.
курсовая работа [223,0 K], добавлен 23.01.2014Понятия в области метрологии. Представление знаний в интеллектуальных системах. Методы описания нечетких знаний в интеллектуальных системах. Классификация интеллектуальных систем, их структурная организация. Нечеткие системы автоматического управления.
курсовая работа [768,2 K], добавлен 16.02.2015Сущность метода неопределённых коэффициентов, использование интерполяционных многочленов и разностных соотношений для аппроксимации производных. Алгоритм программы и обоснование языка программирования. Экспериментальное исследование и решение задачи.
курсовая работа [227,4 K], добавлен 30.04.2009Параллельная машина как процессоров, памяти и некоторые методы коммуникации между ними, сферы применения. Рассмотрение особенностей организации параллельности вычислений. Анализ типовых схем коммуникации в многопроцессорных вычислительных системах.
курсовая работа [669,3 K], добавлен 07.09.2015Применение методов минимальных невязок, минимальных поправок, скорейшего спуска, сопряженных градиентов. Алгоритмы и блок-схемы решения. Выбор размерности матрицы системы и требуемой точности. Зависимость количества итераций от размерности матрицы.
курсовая работа [582,8 K], добавлен 21.01.2014Метод анализа иерархий. Система для хранения больших объемов информации является база данных. База данных в наибольшей степени удовлетворяет всем выделенным критериям. Она обеспечивает быстрый поиск нужной информации (оперативность).
контрольная работа [326,9 K], добавлен 10.06.2004Создание и уровни реализации облачных вычислений. Достоинства и недостатки использования облачных технологий в организации единого информационного пространства. Оценка важности критериев методом "Попарного сравнения", "Тепловых карт", "Экспертных оценок".
дипломная работа [1,3 M], добавлен 08.04.2014Моделирование линейной системы, соответствующей элементам матричной весовой и переходной функций средствами пакета Matlab, их сравнение с аналитически полученными зависимостями. Расчет весовых и переходных функций. Анализ частотных характеристик.
лабораторная работа [390,0 K], добавлен 06.07.2009Структура, сущность и классификация облачных вычислений. Модель организации информационного пространства научных исследований на примере КубГУ. Использование облачных сервисов Google, Яндекс. Диск в процессе работы над студенческими дипломными проектами.
дипломная работа [2,2 M], добавлен 11.10.2013Сущность и методика исследования вероятностной структуры сигналов, законы распределения случайных величин. Проверка гипотезы по критерию Колмогорова-Смирнова и Пирсона. Разработка программы вычисления признаков и формирования обучающего множества данных.
курсовая работа [509,6 K], добавлен 03.12.2009Сущность и описание симплекс-метода и улучшенного симплекс-метода (метода обратной матрицы), преимущества и недостатки их применения в линейном прогаммировании. Листинг и блок-схема программы на языке Turbo Pascal для решения математической задачи.
курсовая работа [45,0 K], добавлен 30.03.2009Содержание активного и пассивного методов идентификации динамических объектов. Проведение полного факторного эксперимента, в котором реализуются все возможные сочетания уравнений факторов. Применение метода наименьших квадратов и регрессионного анализа.
контрольная работа [140,1 K], добавлен 05.11.2011Характеристика параметрических методов решения задач линейного программирования: методы внутренней и внешней точки, комбинированные методы. Алгоритм метода барьерных поверхностей и штрафных функций, применяемых для решения задач большой размерности.
контрольная работа [59,8 K], добавлен 30.10.2014