Применение байесовских сетей для интеллектуального анализа данных
Диагностика надежности и отказоустойчивости технических систем. Вычисление матрицы эмпирических значений совместного распределения вероятностей всей сети. Получение более точных значений при уменьшении вычислительной сложности при формировании вывода.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 02.10.2018 |
Размер файла | 32,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ПРИМЕНЕНИЕ БАЙЕСОВСКИХ СЕТЕЙ ДЛЯ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ
П.И. Бидюк, А.Н. Терентьев, Л.А. Коршевнюк.
Інститут прикладного системного аналізу НТУУ «КПІ»
Введение
Применение технологий интеллектуального анализа данных (ИАД) становится всё более актуальным благодаря совершенствованию методов анализа и вычислительных процедур, которые их реализуют. Так, в отчете Ассоциации американских банкиров отмечается, что из 100 крупнейших банков США 45 банков уже внедрили системы интеллектуального анализа данных и еще около 50 банков начали реализацию подобных проектов или планируют это сделать в ближайшее время. При использовании байесовских сетей (БС) в качестве инструмента ИАД необходимо решать две математические задачи: (1) построения структуры БС и (2) формирование вероятностного вывода. Для построения структуры БС удобно использовать эвристические методы построения [1,2].
Постановка задачи. Задача вероятностного вывода в БС является достаточно сложной задачей, относящейся к классу задач принятия решений. В работе [3] предложен метод формирования вероятностного вывода. Однако для его реализации необходимо привести структуру БС к виду объединённого дерева (junction tree), и только после этого можно использовать алгоритм вероятностного вывода в объединённом дереве, который основывается на прохождении сообщений и по дереву. В работе [4] предложен метод поглощающего исключения (bucket elimination). Для его использования необходимо обязательное наличие упорядоченного множества вершин, что является сложной вычислительной задачей. Поэтому задача разработки более простых и точных методов вероятностного вывода является актуальной.
Решение задачи. В процессе выполнения научно-исследовательская работы для гранта НТУУ "КПИ" 3/5-ГР разработан новый метод вероятностного вывода в БС на основе обучающих данных, с использованием двух шагов. На первом шаге выполняется вычисление матрицы эмпирических значений совместного распределения вероятностей всей сети. На втором шаге проводится вычисление значений вероятностей всех возможных состояний неинстанциированных вершин.
Входные данные:
1. Множество обучающих данных , .
2. Структура Байесовской сети представленная множеством из предков.
3. Множество инстанциированных вершин .
Шаг 1. По множеству обучающих данных вычисляется матрица эмпирических значений совместного распределения вероятностей всей сети . По формуле
,
где - количество наблюдений.
Шаг 2. Перебираем последовательно все вершины Байесовской сети. Если вершина не является инстанциированной, то нужно вычислить значения вероятностей всех возможных состояний этой вершины. Для этого делается последовательный перебор всех строк матрицы эмпирических значений совместного распределения вероятностей всей сети. Если значения вершин строки совпадают со значениями инстанциированных вершин и состоянием анализируемой вершины, то соответствующее значение прибавляется к значению вероятности соответствующего состояния анализируемой вершины. После этого выполняется нормирование значений вероятностей состояний анализируемой вершины.
Выходные данные. Выходными данными являются значения вероятностей всех возможных состояний всех неинстанциированных вершин.
Примеры практического использования БС
Анализ и диагностика надежности и отказоустойчивости технических систем. Выполнение профилактического ремонта по мере необходимости обходится дешевле, чем устранение последствий технического сбоя или дублирование компонентов оборудования. Выполняя анализ состояния отдельных компонентов технической системы можно оценивать вероятность выхода системы или её частей из рабочего состояния. Используя результаты такого анализа, технический персонал может выполнять ремонт не всей системы, а наиболее проблемных компонентов. На рис. 1 представлена БС показывающая связь между разными компонентами автомобиля и вероятностью того, что автомобиль заведётся.
Приложение в медицине. ИАД используют для построения экспертных систем для постановки медицинских диагнозов. Такие системы построены главным образом на основе правил, описывающих сочетания различных симптомов различных заболеваний. С помощью вероятностного вывода в БС узнают не только, чем болен пациент, но и как нужно его лечить. Вероятностный вывод помогает выбирать средства медикаментозного воздействия, определять показания - противопоказания, ориентироваться в лечебных процедурах, создавать условия наиболее эффективного лечения, предсказывать исход назначенного курса лечения и прочее. На рис. 2 показана медицинская БС показывающая связь между заболеваниями пациента, хирургическим вмешательством и состоянием здоровья.
Размещено на http://www.allbest.ru/
Рис. 1 Пример БС при анализе технических систем и устройств
Выводы
Экспериментальные результаты, полученные при моделировании различных процессов сетями Байеса, показали, что метод вероятностного вывода позволяет получить более точные значения при значительном уменьшении вычислительной сложности при формировании вероятностного вывода. матрица точный вероятность эмпирический
Размещено на http://www.allbest.ru/
Рис. 2 Пример использования БС в медицине
Литература
1. Терентьев А.Н., Бидюк П.И., Эвристический метод построения Байесовских сетей // Математические машины и системы. - 2006. - 3. - С. 12-23.
2. Терентьев А.Н., Бидюк П.И., Эвристический метод построения Байесовских сетей // Материалы международной научной конференции “Интеллектуальные системы принятия решений и прикладные аспекты информационных технологий” (ISDMIT 2006). - 2006. - т.1 - С. 401-403.
3. Lokeswarappa K.G. Junction trees: motivation / Seminar CSE 714 on advanced topics in machine learning, March 2005. - 57 p.
4. Dechter R. Bucket elimination: a unifying framework for reasoning // ACM Press, Vol. 28, article № 61, December 1996. - P. 1-51.
Размещено на Allbest.ru
...Подобные документы
Сведения о геоинформационной системе РАПИД. Разработка программы для модуля классификации текстур в среде Borland Delphi, позволяющей строить гистограммы распределения значений слоев с геоданными, с учетом разделения исследуемой территории на классы.
дипломная работа [3,8 M], добавлен 24.06.2014Надежность системы управления как совокупность надежности технических средств, вычислительной машины, программного обеспечения и персонала. Расчет надежности технических систем, виды отказов САУ и ТСА, повышение надежности и причины отказов САУ.
курс лекций [228,2 K], добавлен 27.05.2008Временная и ёмкостная сложность программы. Размер входных данных. Связь сложности в худшем случае и в среднем. Понятие оптимальной программы. Классы вычислительной сложности программ. Эквивалентность по сложности. Примеры классов вычислительной сложности.
презентация [77,3 K], добавлен 19.10.2014Пример матрицы смежности для соответствующей сети. Функция распределения степеней узлов. Вариант матрицы смежности для взвешенной сети. Распределение степеней для случайных графов. Требования к интерфейсу. Алгоритм модели Баррат-Бартелэмью-Веспиньяни.
контрольная работа [1,4 M], добавлен 13.06.2012Организация сетей асинхронного способа передачи данных. Технические средства, стек протоколов. Структура ячейки. Пример применения пар значений VPI/VCI. Особенности АТМ-технологии. Управление сквозным функционированием в сети. Коммутационное оборудование.
реферат [111,8 K], добавлен 20.05.2015Понятие локальная вычислительная сеть, виртуальные сети. Разделение данных, ресурсов, программных средств, ресурсов процессора. Многопользовательский режим, показатели надежности и отказоустойчивости. Пропускная способность, стоимость, безопасность.
курсовая работа [29,1 K], добавлен 14.09.2010Классификация вычислительных сетей. Функции локальных вычислительных сетей: распределение данных, информационных и технических ресурсов, программ, обмен сообщениями по электронной почте. Построение сети, адресация и маршрутизаторы, топология сетей.
доклад [23,2 K], добавлен 09.11.2009История развития локальных сетей. Структура и модель взаимодействия открытых систем OSI. Сравнительная характеристика видов топологии сети. Схема организации и функции биллинговых систем. Возможности операционных систем при организации локальной сети.
дипломная работа [4,3 M], добавлен 05.06.2011Проектирование локальной вычислительной сети для предприятия c главным офисом в центре города и двумя филиалами на удалении не более 1,5 км. Выбор топологии сети и основного оборудования. Программное обеспечение для клиент-серверного взаимодействия сети.
курсовая работа [3,4 M], добавлен 27.02.2015Применение методов многомерного анализа для визуализации взаимосвязей web и социальных сетей в социологических исследованиях. Системы интеллектуального поиска данных Nigma.ru, Wolfram Alpha и Quintura. Социологическая информация и эмпирические данные.
презентация [2,6 M], добавлен 09.10.2013Разработка различных программ для вычисления X и Y по формуле, для вычисления интеграла, для вычисления таблицы значений функции и для вычисления элементов вектора. Составление блок-схемы программы. Ввод значений, описание переменных и условия расчета.
контрольная работа [148,1 K], добавлен 08.11.2013Работа в Pascal, теория рядов. Главные признаки сходимости знакоположительных рядов. Общее понятие о ряде Тейлора. Вычисление конечной суммы факториального ряда для заданного массива значений. Исходный текст программы. Результаты выполнения программы.
контрольная работа [1,6 M], добавлен 06.08.2013Микропроцессорные системы обработки данных. Специальные алгоритмы-планировщики для распределения операторов параллельных алгоритмов по процессорам вычислительной сети. Алгоритм построения и уплотнения нитей. Интерфейс программы, результаты работы.
курсовая работа [1,8 M], добавлен 22.02.2011Метод вероятностно-алгебраического моделирования. Примеры определения вероятностных характеристик функционально-сложной системы в символьном виде. Получение и добавление данных с сервера "Всемирной организации здравоохранения". Структура базы данных.
курсовая работа [353,4 K], добавлен 22.06.2014Разработка комплекса интеллектуального анализа данных, получаемых в процессе работы коммерческого предприятия розничной торговли. Исследование стационарности ассоциаций, выявление частоты появления ассоциаций. Скрипты для создания баз данных и таблиц.
курсовая работа [706,3 K], добавлен 07.08.2013Особенности создания и заполнения таблиц в Microsoft Excel. Типы представления данных. Способы ввода числовых значений и текстовой информации в таблицу. Выставление форматов времени. Работа с ячейкой. Использование операторов формул для расчета значений.
презентация [53,8 K], добавлен 06.01.2014Классификация компьютерных сетей. Назначение компьютерной сети. Основные виды вычислительных сетей. Локальная и глобальная вычислительные сети. Способы построения сетей. Одноранговые сети. Проводные и беспроводные каналы. Протоколы передачи данных.
курсовая работа [36,0 K], добавлен 18.10.2008Вычисление значений выражений при вещественных типах данных float и double. Нахождение суммы элементов, используя оператор цикла. Вычисление функций с разложением в степенной ряд. Работа со строками. Обработка массивов с использованием функций.
лабораторная работа [24,3 K], добавлен 09.02.2010Анализ цели проектирования сети. Разработка топологической модели компьютерной сети. Тестирование коммутационного оборудования. Особенности клиентских устройств. Требования к покрытию и скорости передачи данных. Виды угроз безопасности беспроводных сетей.
дипломная работа [3,3 M], добавлен 22.03.2017- Разработка алгоритмов и программ для определения сходства семантических сетей на основе их сложности
Семантические сети как модели представления знаний. Основные методы определения сходства графовых моделей систем. Метод решения задач определения сходства семантических сетей на основе их сложности. Разработка алгоритмов и их программная реализация.
дипломная работа [1,3 M], добавлен 17.12.2011