Локальный апостериорный вывод в алгебраических байесовских сетях как система матрично-векторных операций
Матрично-векторное описание процессов апостериорного вывода в ФЗ АБС. Разработка программных комплексов, использующих алгебраические байесовские сети как базы знаний с вероятностной неопределенностью. Формализация задачи логико-вероятностного вывода.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 18.01.2018 |
Размер файла | 58,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Локальный апостериорный вывод в алгебраических байесовских сетях как система матрично-векторных операций
ВВЕДЕНИЕ
Объектом рассмотрения настоящей работы являются алгебраические байесовские сети (АБС) и алгоритмы локального апостериорного вывода в них.
Алгебраические байесовские сети представляют собой математическую модель базы фрагментов знаний, преднозначенной для храниения и обработки данных и знаний с неопределенностью. Парадигма алгебраических байесовских сетей была предложена В. И. Городецким и активно развивается в настоящее время. Данная статья посвящена операциям, реализующим локальный апостериорный локико-вероятностный вывод в АБС, и их представлению на матрично-векторном языке.
1. ОСНОВНЫЕ ПОНЯТИЯ АБС
Зафиксируем конечное множество атомарных пропозициональных формул (атомов) - алфавит , все дальнейшие операции будут производится над заданным алфавитом. Определим два набора «базовых» пропозициональных формул.
Идеал цепочек конъюнкций (идеал конъюнктов) - это множество формул , где означает конъюнкцию соответствующих переменных. Знак конъюнкции мы для удобства будем опускать. Каждому из конъюнктов можно сопоставить число - номер (индекс) конъюнкта. Отметим, что индекс над заданным алфавитом, однозначно определяет конъюнкт.
Дадим определение литерала. Литерал (аргументное место) обозначает, что на его месте в формуле может стоять либо , либо его отрицание . Тогда множество квантов над алфавитом . Иными словами, квант - это конъюнкция, которая для любой атомарной переменной содержит либо ее саму, либо ее отрицание. Зададим нумерацию квантов. Выделим «положительную» часть кванта (множество положительно означенных переменных) и рассмотрим ее как конъюнкт. Номер этого конъюнкта и будет номером рассматриваемого кванта.
После введения нумерации квантов и конъюнктов можно определить векторы вероятностей квантов и конъюнктов:
и ,
где - конъюнкт номер , а - -й квант. Появление единицы в первом случае вполне оправдано, так как согласно определению - пустой конъюнкт, соответствующий тождественной истине.
Мы не будем подробно останавливаться на вопросах задания вероятностей над пропозициональными формулами, этот вопрос с достаточной детальностью рассмотрен в [5]. Заметим, что по теореме о совершенной нормальной дизъюнктивной форме любая пропозициональная формула может быть представлена в виде дизъюнкции конечного числа квантов. Так как при любом зафиксированном означивании всех переменных , , …, никакие два разных кванта не могут быть одновременно истинны, а, с другой стороны, один из них заведомо истинен, можно рассмотреть множество как множество элементарных событий. Задав вероятность на квантах, можно, в свою очередь, построить вероятностное пространство, на котором будет определена вероятность любой пропозициональной формулы. За более подробным описанием аксиоматики вероятностной логики можно обратиться, например, к [4, 5].
Согласно [5] cвязь между векторами и может быть выражена формулами:
,(1)
и
,(2)
где - число атомов, а матрицы и задаются следующими соотношениями.
, ;
,.
Здесь означает кронекерово (тензорное) произведение матриц. - это кронекерова степень матрицы , т.е. [1].
При , равном двум, матрицы будут выглядеть следующим образом:
,
.
2. ФРАГМЕНТ ЗНАНИЙ И ЕГО НЕПРОТИВОРЕЧИВОСТЬ
Фрагмент знаний (ФЗ) АБС представляет с собой идеал конъюнктов с оценками их истинности.
Оценки истинности конъюнктов могут быть либо скалярные, то есть представимые в виде , где - конкретные числа, либо интервальные, т.е. представлены в виде .
В случае скалярных оценок оценки вероятностей конъюнктов удобно представить в виде вектора . Вопрос проверки непротиворечивости будет звучать так: существует ли распределение вероятностей, такое,что набор оценок , действительно соответствует вероятностям истинности конъюнктов. Как показано [5], для ответа на данный вопрос достаточно проверить выполняется ли условие
.
Здесь - это вектор, состоящий из нулей, а неравенство векторов следует рассматривать как систему неравенств соответствующих элементов векторов.
Интервальные оценки удобно записать в виде векторов отдельно нижних оценок - и отдельно верхних -.
Мы говорим, что подобные оценки непротиворечивы, если:
Здесь запись вида означает -й элемент вектора . Если выразить словами, то для любой оценки любого конъюнкта (кроме нулевого, оценка для которого всегда единица), лежащей в границах определенных векторами и , существует совокупность оценок вероятностей всех остальных конъюнктов, лежащих в границах, определенных и , и задающих непротиворечивый фрагмент знаний со скалярными оценками.
В случае интервальх оценок вопрос не только в том, что непротиворечивы они или нет, но и если противоречивы, то можно ли их сузить до непротиворечивых. Решения этих двух вопросов взаимосвязаны. Для проверки непротиворечивости необходимо решить серию задач линейного программирования (ЗЛП) [3]. Переменными данных задач будут точечные вероятности , а ограничения будут двух типов: и . Осталось определить только целевые функции. Целевыми функциями будут максимизация и минимизация для каждого . Решение этой серии ЗЛП позволяет определить, непротиворечив ли ФЗ; в этом случае все ЗЛП будут разрешимы и соответствующие максимумы и минимумы совпадают с заданными границами. Если хотя бы одна из ЗЛП дала результат, отличный от заданных границ, то соответствующие максимумы и минимумы дадут наибольший по включению набор интервальных оценок, задающий непротиворечивый ФЗ и лежащий в указанных границах. А если хоть одна из ЗЛП оказалась неразрешима, то, значит, такого сужения не существует, а фрагмент знаний противоречив.
3. ДЕТЕРМИНИРОВАННОЕ СВИДЕТЕЛЬСТВО
Выделяют две задачи апостериорного вывода.
Решением первой задачи апостериорного вывода во фрагменте знаний является оценка вероятности появления свидетельства при заданных оценках.
Решением второй задачи апостериорного вывода во фрагменте знаний является оценка условных вероятностей всех конъюнктов АБС относительно поступившего свидетельства.
Детерминированным свидетельством в теории АБС называют такое свидетельство, которое сообщает нам о том, что некоторый набор атомов положительно означен, а некоторый - отрицательно. Детерминированные свидетельства удобно представить в виде конъюнкта положительно означенных атомов и конъюнкта отрицательно означенных. Ниже приведен пример двух свидетельств:
,
.
Конъюнктам положительно и отрицательно означенных атомов удобно сопоставить индексы, которые однозначно определят свидетельство над заданным набором атомов.
Опишем решение первой задачи апостериорного вывода для детерминированного свидетельства над фрагментом знаний. Свидетельство можно представить как пропозициональную формулу. Обозначим формулу, соответствующую свидетельству через , например: . Вычисление вероятности произвольной пропозициональной формулы -- это задача априорного вывода. С априорным выводом в общем случае можно ознакомиться, например, в [3]. Здесь же мы решим ее для конкретного вида формул . Пусть задан ФЗ с точечными оценками истинности, тогда вероятность может быть легко вычислена как . Здесь играет роль важная особенность квантов, состоящая в том, что конъюнкция кванта с любой пропозициональной формулой - это либо сам квант, если он входит в СДНФ данной формулы, либо ложь. То есть нам остается лишь определить, какие кванты входят в СДНФ , а какие - нет. Пользуясь побитовыми логическими операциями можно записать как:
(3)
В этой формуле и далее по тексту обозначает побитовое «и», а - побитовое отрицание.
Перейдем теперь ко второй задаче апостериорного вывода. Вначале рассмотрим фрагмент знаний с точечными оценками истинности, то есть нам задан вектор . На его основе, по формуле (1) можно построить вектор . Заметим, что полученный вектор содержит в себе информацию о вероятностях всех квантов над нашим алфавитом. Будем строить вектор условных вероятностей относительно нашего свидетельства . Согласно определению условной вероятности
.(4)
Вероятности и мы уже научились вычислять выше. Запишем (4) в виде векторов:
.(5)
Введем обозначение . Запишем,что . Тогда (5) принимает вид
.(6)
Теперь нам необходимо описать структуру матрицы . Основываясь на (3) получаем.
(7)
Матрица имеет очень четкую структуру и может быть записана с использованием тензорного (кронекерова) произведения следующим образом:
.(8)
Если ввести обозначения , ,, то матрица может быть вычислена следующим образом:
(9)
В формуле (6) используются условные (слева) и маргинальные (справа) вероятности квантов. Но мы знаем, что вероятности на квантах выражаются через вероятности на конъюнктах по формуле (1). Обозначим верктор условных вероятностей на конъюнктах через и проведем замену по формуле (1), чтобы получить:
.
Домножив обе части слева на , получаем:
(10)
Вспомним, что все приведенные в вышестоящей формуле матрицы могут быть представлены в виде произведений Кронекера, которое в свою очередь обладает следующим свойством [1]:
.
Воспользовавшись этим свойством, получаем:
.
Рассмотрим матрицы и построенную на их основе . По аналогии с можно выразить :
И соответственно: , , .
Применив новое обозначение к (10), получаем:
(11)
Заметим, что если вычислить , то нет необходимости отдельно вычислять . Это связанно с тем, что по определению - нулевой элемент вектора - равен единице, а, следовательно, нулевой элемент равен в точности . Предполагая, что , получаем:
(11')
Полученная формула дает нам точное выражение для апос-териорной вероятности элементов ФЗ при поступившем свидетельстве, если исходные оценки были скалярные (т.е. оценки вероятности конъюнктов имели вид , где - числа из интервала ), а свидетельства - детерминированные. Если оценки были не скалярные, а интервальные, то нам потребуется решать серию ЗЛП [5].
Пусть задан ФЗ с оценками и , тогда опишем ЗЛП для получения апостериорной вероятности на элементах ФЗ. Если записать все в явном виде, то получаемые задачи не будут задачами линейного программирования, а будут относиться к классу так называемых задач дробно-линейного программирования. В [2] показано как в общем случае задачи дробно-линейного программирования можно свести к задачам линейного программирования. Здесь мы построим конкретный (частный) случай подобного сведения.
Рассмотрим новую переменную . Очевидно, что . Произведем замену переменных - введем вектор , тогда (11') принимает вид
.(12)
Формула (12) - линейная, следовательно можно построить серию задач линейного программирования. Нам потребуется найти максимум и минимум для каждого элемента вектора , кроме нулевого. Нулевой же элемент даст нам дополнительное ограничение вида
.
Кроме того, будут ограничения, следующие из аксиоматики вероятностной логики [5]:
,
и ограничения, следующие из предметной области [5]:
и .
Решив предложенную серию ЗЛП, мы получим решение второй задачи линейного программирования.
4. СТОХАСТИЧЕСКОЕ И НЕОПРЕДЕЛЕННОЕ СВИДЕТЕЛЬСТВА
Стохастическим свидетельством в теории АБС называется свидетельство, задающее единственное распределение на некотором подфрагменте знаний, то есть представимое в виде фрагмента знаний с точечными оценками. Неопределенным свидетельством в теории АБС называется свидетельство, заданное в виде фрагмента знаний с интервальными оценками, где фрагментом знаний является некоторый подфрагмент исходного. Такое свидетельство задает семейство распределений вероятностей.
Поясним подход к обработке этих свидетельств на частном при-мере. В общем виде обработка таких свидетельств рассмотрена в [4, 5].
Пусть задан некоторый фрагмент знаний с точечными оценками . И пусть задан подфрагмент с точечными непротиворечивыми оценками. Для примера возьмем подфрагмент, построенный над , . Для него нам заданы апостериорные оценки , и . На их основе можно вычислить , , и . Будем считать решением второй задачи апостерионого вывода сумму:
(13)
- -й конъюнкт.
Вычислять мы научились в предыдущем разделе. Таким образом, для решения второй задачи апостериорного вывода нам требуется сначала решить ее для серии детерминированных свидетельств, а потом просуммировать результаты с весами, соответствующими апостериорной вероятности этих свидетельств. Если оценки в исходном ФЗ были интервальными, то для вычисления точных апостериорных оценок требуется находить максимум и минимум формулы, аналогичной формуле (13). Данная задача сложна и на данный момент неизвестно, можно ли свести ее к задачам линейного программирования. Наилучшим с точки зрения вычислительной сложности на данный момент считается приближение, когда для каждого детерминированного свидетельства строится апостериорная оценка элементов ФЗ, а потом эти интервальные оценки суммируются с весами свидетельств. Такой способ позволяет получить непротиворечивую оценку, которая содержит настоящую оценку.
В случае если поступило недетерминированное свидетельство, мы решаем задачу в несколько этапов. Первый этап состоит в вычислении результатов для детерминированных свидетельств. А второй - в решенни ЗЛП, где переменными являются апостериорные оценки, такие как , а в качестве коэффицентов в формуле (13) мы рассматриваем минимальные (при поиске минимума) и максимальные (при поиске максимума) значения , вычисленные на первом этапе.
ЗАКЛЮЧЕНИЕ
апостериорный программный байесовский сеть
В работе приведено матрично-векторное описание процессов апостериорного вывода в ФЗ АБС. Изложение на матрично-векторном языке позволяет упростить ряд формализаций, необходимых при переносе теоретического материала на «практику», в частности, при создании программных комплексов, использующих алгебраические байесовские сети как базу знаний с вероятностной неопределенностью. Кроме того, матрично-векторное представление позволяет формализовать постановку задачи логико-вероятностного вывода в степени, достаточной для корректного решения вопросов оценки сложности необходимых вычислений.
ЛИТЕРАТУРА
Беллман Р. Введение в теорию матриц. - М.: Наука, Гл. редакция физико-математической литературы, 1969.
Гавурин М.К., Малоземов В.Н. Экстремальные задачи с линейными ограничениями: учебное пособие. - Л.: Изд-во ЛГУ, 1984.
Сироткин А.В., Тулупьев А.Л. Локальный априорный вывод в алгебраических байесовских сетях: комплекс основных алгоритмов // Труды СПИИРАН. Вып. 5. - СПб.: Наука, 2007. - С.100-111.
Тулупьев А. Л. Алгебраические байесовские сети: локальный логико-вероятностный вывод. - СПб: СПбГУ; Анатолия. 2007.
5.Тулупьев А. Л., Николенко С. И., Сироткин А. В. Байесовские сети: логико-вероятностный подход. - СПб.: Наука, 2006.
Размещено на Allbest.ru
...Подобные документы
Начальное представление систем нечеткого вывода: логический вывод, база знаний. Алгоритм Мамдани в системах нечеткого вывода: принцип работы, формирование базы правил и входных переменных, агрегирование подусловий, активизация подзаключений и заключений.
курсовая работа [757,3 K], добавлен 24.06.2011Анализ процессов диагностики повреждений трубопровода. Разработка модели продукционной базы знаний: обзор методов представления знаний, описание создания базы знаний и разработки механизма логического вывода. Экономическое обоснование концепции проекта.
дипломная работа [3,0 M], добавлен 16.04.2017Реализация алгоритма метода сопряженных градиентов с матрично-векторным произведением по строкам в модели обмена сообщениями на языке программирования С++ с применением MPI для нахождения приближенного решения системы линейных алгебраических уравнений.
курсовая работа [107,7 K], добавлен 01.12.2010Ознакомление с основными понятиями и организацией ввода-вывода, обработкой массивов. Описание одномерных и двумерных массивов. Описание строк и операции с ними. Комбинированный тип данных - записи. Характеристика записей, использующих вариантную часть.
реферат [84,6 K], добавлен 09.02.2011Использование программой функции ввода-вывода данных для реализации дружественного интерфейса с пользователем. Функции консоли и особенности их применения для обеспечения аккуратного ввода информации и упорядоченного вывода. Обзор стандартных функций.
лабораторная работа [40,4 K], добавлен 06.07.2009Основные этапы систем нечеткого вывода. Правила нечетких продукций, используемые в них. Нечеткие лингвистические высказывания. Определение алгоритмов Цукамото, Ларсена, Сугено. Реализации нечеткого вывода Мамдани на примере работы уличного светофора.
курсовая работа [479,6 K], добавлен 14.07.2012Решение задачи аппроксимации поверхности при помощи системы нечёткого вывода. Определение входных и выходных переменных, их термы; алгоритм Сугено. Подбор функций принадлежности, построение базы правил, необходимых для связи входных и выходных переменных.
курсовая работа [1,8 M], добавлен 31.05.2014Понятие базы данных. Разработка таблиц, форм ввода и вывода информации, основных запросов, хранимых процедур и триггеров базы "Доска объявлений". Подготовка для вывода на печать. Анализ необходимости администрирования, средств защиты информации.
курсовая работа [629,5 K], добавлен 20.09.2015Обзор методов и подходов решения поставленной задачи аппроксимации логического вывода экспертной системы. Разработка и описание метода сетевого оператора для решения данной задачи. Разработка алгоритма решения. Проведение вычислительного эксперимента.
дипломная работа [1,5 M], добавлен 23.02.2015Периферийные устройства для вывода визуальной информации: принтер, проектор, монитор и графопостроитель. Вывод звуковой информации с помощью динамиков, акустических систем и наушников. Основные виды акустических систем: однополосные и многополосные.
презентация [62,9 K], добавлен 19.02.2011Поиск как основа функционирования СОЗ. Стратегии; эвристического поиска и управления выводом. Циклическая работа интерпретатора. Вывод на знаниях в продукционных системах. Методы поиска в глубину и ширину. Формализация задач в пространстве состояний.
презентация [741,2 K], добавлен 14.08.2013Отличительные черты компьютерных программ экспертных систем, их разработка. Составные части систем: база знаний, механизм вывода, система пользовательского интерфейса. Структура базы знаний экспертной системы для помощи медикам в постановке диагноза.
курсовая работа [325,0 K], добавлен 04.02.2011Анализ операторов ввода и вывода, а также характеристика форматов, используемых в этих операторах. Оформление законченной программы с применением этих операторов. Структура программы. Алфавит языка и типы данных. Ввод и вывод информации. Форматный вывод.
лабораторная работа [62,0 K], добавлен 15.07.2010Основные понятия теории грамматик простого и операторного предшествования, алгоритмы синтаксического разбора предложения для классов КС-грамматик; разработка дерева вывода для грамматики входного языка в форме Бэкуса-Наура с указанием шагов построения.
лабораторная работа [28,0 K], добавлен 24.07.2012Программные модули основной BIOS (базовой системы ввода-вывода). Программа тестирования при включении питания компьютера. Реализация системы BIOS в виде одной микросхемы, установленной на материнской плате компьютера. Типы, версии и функции системы BIOS.
реферат [190,6 K], добавлен 19.08.2010История возникновения и развития языка Prolog. Рассмотрение императивных и декларативных языков программирования. Элементы экспертной системы: база знаний, механизм вывода и система пользовательского интерфейса. Описание предикатов и предложений.
дипломная работа [44,0 K], добавлен 11.05.2014Изучение архитектуры микроконтроллера AT89C52 фирмы Atmel. Разработка проектной схемы вывода рисунков на графический ЖК-индикатор на основе микроконтроллера. Составление программы по обработке и выводу на жидкокристаллический дисплей данных с LPT порта.
курсовая работа [76,1 K], добавлен 23.12.2012Исследование типовой структуры шины персонального компьютера. Подсистема ввода-вывода в ядре операционной системы. Преобразование запросов на ввод-вывод в аппаратные операции. Блочные, символьные и сетевые устройства. Процесс чтения из дискового файла.
презентация [1,8 M], добавлен 24.01.2014Изучение подсистемы ввода-вывода и файловой системы ОС семейства Windows NT. Анализ особенностей работы приложения TotalCommander и его взаимодействия с файловой системой и подсистемой ввода-вывода. Взаимодействие TotalCommander с сетевыми адаптерами.
лабораторная работа [1,1 M], добавлен 12.06.2012Разработка базы данных с применением выбранной модели представления знаний и системы пользовательского интерфейса. Определение системы логического вывода. Спецификация составных частей программы. Обзор основных используемых приёмов и методов обработки.
курсовая работа [765,6 K], добавлен 12.05.2013