Применение модели "факт-связь" при анализе причинно-следственных связей

Рассмотрение задачи моделирования, анализа фактов и связей между ними. Понятие причинно-следственной связи. Идея автоматического построения модели, описывающей факты, связи между ними на языке формальной теории "исчисления фактов", построение сети фактов.

Рубрика Производство и технологии
Вид статья
Язык русский
Дата добавления 26.04.2019
Размер файла 129,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Применение модели "факт-связь" при анализе причинно-следственных связей

П.А. Мальцев

Рассматривается задача моделирования и анализа фактов и связей между ними. Дается понятие факта и причинно-следственной связи. Приводится постановка задачи поиска сети фактов. В основе данного подхода лежит идея автоматического построения модели, описывающей факты и связи между ними на языке формальной теории "исчисления фактов". Данная работа может представлять интерес для специалистов, занимающихся решением задач интеллектуального анализа данных (Data Minig).

Ключевые слова: интеллектуальный анализ данных; системы поддержки принятия решений; Business Intelligence.

Введение© П. А. Мальцев, 2011

Понимание взаимосвязей между фактами в некоторой предметной области дает понимание ее законов, знание которых оказывается неоценимым при принятии решений. Понимание этих законов позволяет решать задачи прогнозирования и оптимизации. Другими словами, может помочь предупредить негативные события, вовремя отреагировав на их предпосылки, либо добиться желаемого результата в будущем, создав соответствующие условия в настоящем.

Основная проблема заключается в том, что подобные знания не всегда доступны в явном выражении: в виде правил и законов. Зачастую аналитику доступен лишь набор данных, так или иначе описывающий некоторые свершившиеся факты. Но сами по себе данные не позволяют судить о закономерностях, без применения специализированных методов анализа данных.

Автор предлагает подход к анализу причинно-следственных связей на основе модели "факт-связь". В качестве основы для построения подобных моделей предлагается использовать формальную теорию "исчисление фактов". С основами исчисления фактов можно ознакомиться в работе [1].

Понятие факта и класса фактов

Пусть нами наблюдается некоторая система . Под способностью наблюдать систему нами будет пониматься способность фиксировать некоторые параметры данной системы: . Будем понимать, что система изменяется с течением времени, а вместе с ней меняются и ее параметры. Таким образом, мы должны иметь возможность фиксировать отдельные состояния рассматриваемой системы. Состояние системы в момент времени будем обозначать как . Под возможностью фиксировать состояния системы будем понимать возможность фиксировать значения показателей ее параметров в этих состояниях.

Таким образом, систему будем рассматривать в динамике, т.е. будем рассматривать последовательность состояний системы :

(1)

Что заставляет систему менять свое состояние? Будем различать внутренние и внешние по отношению к самой системе причины смены ее состояний. Будем считать, что система меняет свое состояние вследствие возникновения некоторых событий :

(2)

В каждый момент времени в любой системе может происходить огромное количество событий, но не все события полезны для анализа. Поэтому введем понятие факта. Фактом называется значимое для анализа событие. Другими словами, фактами будем называть события, которые переводят наблюдаемую систему в новое состояние и данное изменение нами может быть обнаружено. Каждый факт характеризуется набором атрибутов, комбинация значений которых однозначно идентифицирует факт среди остальных. Для разных фактов наборы их атрибутов могут отличаться, но каждый факт обязательно обладает атрибутами пространства и времени. Таким образом, факт представляется совокупностью атрибутов с зафиксированными значениями.

Факты будем обозначать строчными буквами греческого алфавита: . Для обозначения структуры факта, т.е. набора его атрибутов, будем использовать следующее обозначение:

где атрибуты факта . ( - атрибут времени, - атрибут пространства).

Будем говорить, что наборы атрибутов и подобны, если выполняются следующие условия:

1);

2)

Введем следующие обозначения:

1. - Множество всех фактов.

2. (будем читать, как " подобен ") - отношение подобия фактов. Будем говорить, что два факта подобны, если их наборы атрибутов подобны. Следует заметить, что отношение подобия обладает свойствами транзитивности и коммутативности.

Множества всех взаимо-подобных фактов будем называть классами фактов.

Понятие причинно-следственной связи

Пусть рассматриваемая нами система находится в состоянии , построим множество всех возможных состояний, в которое может перейти система из данного состояния, обозначим данное множество . Построим множество:

(3)

Множество следует понимать как множество фактов, которые могут иметь место, если система находится в состоянии . Зафиксируем некоторое начальное состояние системы . Рассмотрим все альтернативы динамики развития системы , для этого построим последовательность множеств:

(4)

где - множество возможных состояний системы в момент времени :

. (5)

Рассмотрим два состояния системы и , причем . Положим, что существует момент времени , причем . Пусть также существует состояние , такое, что:

(6)

Из (6) видно, что факты и связаны. Введем на множестве отношение следствия. В основе предлагаемой формальной теории лежит аксиома о том, что все факты объединены причинно-следственными связями. Другими словами: у любого факта есть причина - некоторый факт . Кроме того, существует один и только один факт, не имеющий причин, будем обозначать его , называть его будем "нулевым фактом". Отношение следствия между двумя фактами будем обозначать:

(7)

где - причина, - следствие. Введем следующие аксиомы отношения следствия:

10 :

20

30

40

В основе предлагаемого подхода лежит идея автоматического построения сети фактов. Поэтому следует привести постановку данной задачи.

Задача построения сети фактов

Рассмотрим последовательность множеств (4). На рис. 1 представлена сеть состояний системы , которая определяет возможные варианты развития системы.

Рис. 1. Сеть состояний системы S

Изучив, как тот или иной конкретный факт меняет состояние системы, можно делать точный прогноз о том, в какое состояние перейдет система, если будет иметь место один из известных фактов. Но проблема заключается в том, что не всегда известно, какое событие произойдет в будущем. Поэтому наиболее важной задачей является построение не сети состояний, а сети фактов (см. рис. 2).

Рис. 2. Сеть фактов

Зафиксируем момент времени . Обозначим состояние системы в данный момент времени: . Положим также, что система перешла в данное состояние в результате свершения факта :

Следующим фактом, который может иметь место, будет один из фактов множества . Определим вероятность свершения факта при условии, что система находится в состоянии .

Положим также:

\.

Предметом наших исследований является не отдельные факты, а причинно-следственные связи между ними. Поэтому нам часто важно будет знать, какова вероятность свершения некоторого факта при условии свершения факта . Такую условную вероятность будем обозначать следующим образом:

(8)

Задача построения сети фактов заключается в поиске условной вероятности (8).

Имея сеть фактов, можно легко разрешать неопределенности при принятии решений, но построение подобной сети требует глубоких знаний законов предметной области. В качестве примера подхода решения задачи построения сети фактов можно привести теорию Байесовских сетей (см. [2]). Но применение данного подхода требует знаний об условной зависимости переменных, их априорных и условных вероятностей. На практике же, как правило, исследователю доступен лишь огромный набор данных о свершившихся фактах. И ему требуется сделать прогноз либо выбрать наиболее удачное решение, не имея чёткого представления всех законов предметной области. Поэтому построить Байесовскую сеть, описывающую все факты, не обладая достаточными знаниями о законах предметной области, - крайне сложная задача.

Среди задач интеллектуального анализа данных хорошо изучена задача секвенционального анализа (см. [3]). Методы решения данной задачи можно с успехом применить при выявлении причинно-следственных связей между фактами, но только между теми, записи о которых имеются в базе данных. Таким образом, данный подход также не позволяет достичь желаемого результата. Автор предлагает использовать модель "факт-связь" при решении задачи анализа и поиска причинно-следственных связей между фактами.

Модель "факт-связь"

Пусть мы имеем некоторый конечный набор наблюдений, т.е. множество зафиксированных фактов , например данные из некоторого хранилища данных. Имея подобный ограниченный набор наблюдений на практике не позволит нам решить задачу построения сети фактов в общем виде, т.е. найти условную вероятность (8) на множестве . Связано это с тем, что не все факты, которые могут иметь место, попадают в набор наблюдений .

Решение задачи в общем виде на множестве без сомнения представляет большой теоретический интерес, но на практике может быть достаточно решить задачу на более узком множестве , таком, что:

Методы решения задачи на конечном множестве зафиксированных фактов лежат в области секвенциального анализа и хорошо изучены. Автор предлагает свести задачу на множестве к задаче на множестве . В основе предлагаемого подхода лежит комплекс методов построения модели "факт-связь". Модель "факт-связь" призвана обобщить решение задачи на множестве , что сделает возможным построение сети фактов на множестве . Процесс построения модели факт-связь схематично представлен на рис. 3.

Рис. 3. Процесс построения модели "факт-связь"

Как видно из рис. 3, модель "факт-связь" строится автоматически на основе данных из хранилища данных, но после построения модель может быть модифицирована аналитиком. Это позволяет аналитику уточнить построенную модель, устранить ошибки и неточности автоматически построенной модели, а также решить проблемы противоречивости исходных данных.

Если знания о связях между фактами на множестве можно извлечь из исходных данных, то откуда взять знания о фактах на множестве \. Новые знания могут быть получены при обобщении знаний для множества . В рамках формальной теории исчисления фактов автор выделяет различные типы группировок и обобщения фактов (см. [1]).

Предложенный подход позволяет аналитику обобщить информацию об отдельных фактах из базы данных и связях между ними, что делает возможным судить о наличии связей между фактами из более широкого множества чем .

Список литературы

Мальцев П. Моделирование и анализ фактов и связей между ними // Natural and Artificial Intelligence: International Book Series. Sofia, 2010. P.194-199.

Рассел С., Норвиг П. Искусственный интеллект: современный подход. 2-е изд. / пер. с англ. М.: Вильямс, 2006.

Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP. 2-е изд. СПб.: БХВ-Петербург, 2008.

Размещено на Allbest.ru

...

Подобные документы

  • Рассмотрение видов повреждений элементов подшипников качения. Разработка причинно-следственных связей между видами и причинами повреждения. Типичные отказы подшипников качения и их причина. Влияние нагрузки и её направления на работу подшипников качения.

    контрольная работа [4,0 M], добавлен 31.05.2010

  • Понятие, типы и виды структуры предприятия. Организация наземного испытания космических аппаратов и ракетных двигательных систем; состав и организация работы внутренних подразделений ФКП "НИЦ РКП", система связи, подчиненность и взаимодействие между ними.

    курсовая работа [250,8 K], добавлен 10.11.2013

  • Понятие модели системы. Принцип системности моделирования. Основные этапы моделирования производственных систем. Аксиомы в теории модели. Особенности моделирования частей систем. Требования умения работать в системе. Процесс и структура системы.

    презентация [1,6 M], добавлен 17.05.2017

  • Материаловедение как наука, изучающая строение и свойства металлов и устанавливающая связь между ними. Абсолютная величина трансляции. Понятие наклепа, компонентов, эвтевтики. Компоненты - химически индивидуальные вещества, образовывающие сплав.

    шпаргалка [56,1 K], добавлен 19.03.2011

  • Создание математической конечно-элементной модели осадки кольцевой заготовки, описывающей механизм осаживания заготовки между плоскими шероховатыми плитами. Теоретические исследования метода напряженного и деформационного состояния заготовки при осадке.

    магистерская работа [3,4 M], добавлен 14.10.2009

  • Рассмотрение основных особенностей моделирования адаптивной системы автоматического управления, характеристика программ моделирования. Знакомство со способами построения адаптивной системы управления. Этапы расчета настроек ПИ-регулятора методом Куна.

    дипломная работа [1,3 M], добавлен 24.04.2013

  • Обзор основных видов готовности, взаимосвязей между ними. Построение блок-схем расчета надежности. Минимизация количества и продолжительности внеплановых простоев. Сбор данных об отказах и ремонтах. Определение и устранение узких мест предприятия.

    статья [715,8 K], добавлен 07.11.2014

  • Классификация композитов - искусственно созданных неоднородных сплошных материалов, состоящих из двух или более компонентов с чёткой границей раздела между ними. Схема методов для получения магнитных гидрогелей. Применение магнитополимерных материалов.

    реферат [6,0 M], добавлен 07.10.2015

  • Построение параметрической модели фасонного резца в модуле АРМ GRAPH. Выполнение коррекционного расчета глубины профиля и анализ входных данных, необходимых для построения модели. Использование графических операций - выталкивания, вращения и кручения.

    контрольная работа [1,3 M], добавлен 27.07.2010

  • Понятие объекта управления. Принципы управления и регулирования. Элементы линейной теории автоматического регулирования. Модели статики. Математическое описание. Понятие о линейных элементах. Линеаризация реальных элементов САР, её способы и предпосылки.

    контрольная работа [471,8 K], добавлен 13.01.2009

  • Подготовка модели изделия к последующей материализации интегрированными генеративными технологиями послойного построения. Морфологический, топологический и морфометрический анализ ее триангуляции. Система статистического моделирования рабочих процессов.

    курсовая работа [4,7 M], добавлен 20.11.2014

  • Построение функциональной схемы системы автоматического управления кухонным комбайном. Выбор микропроцессора, электронного усилителя напряжения, электропривода, резервуара, датчиков температуры и концентрации. Расчет характеристик датчика обратной связи.

    курсовая работа [790,4 K], добавлен 20.10.2013

  • Сущность и содержание, а также основные элементы теории марковских случайных процессов. Модели расчета надежности объектов. Порядок присвоения исходной информации. Сравнение результатов расчета, принципы и этапы построения математической модели.

    презентация [963,4 K], добавлен 17.04.2014

  • Зависимость физико-механических и прочностных свойств бумаги от взаимодействия между волокнами. Добавление вторичного волокна, древесной массы, наполнителей с целью увеличения прочности в сухом состоянии. Значение количества гидроксильных связей.

    презентация [1,8 M], добавлен 23.10.2013

  • Геометрические характеристики плоских сечений, зависимость между ними. Внутренние силовые факторы; расчеты на прочность и жесткость при растяжении-сжатии прямого стержня, при кручении прямого вала. Определение прочности перемещений балок при изгибе.

    контрольная работа [1,9 M], добавлен 20.05.2012

  • Описание внешнего вида костюма женского для средней возрастной группы. Предварительный расчет потока в цехе. Детали кроя жакета и юбки. Матрица связей с другими деталями. Схема сборки модели женского жакета. Построение графа процесса изготовления изделия.

    курсовая работа [118,0 K], добавлен 04.04.2015

  • Разработка схемы электрической принципиальной математической модели системы автоматического управления, скорректированной корректирующими устройствами. Оценка устойчивости исходной системы методом Рауса-Гурвица. Синтез желаемой частотной характеристики.

    курсовая работа [172,1 K], добавлен 24.03.2013

  • Выбор трассы и конструкции кабельной линии связи. Определение конструкции кабеля и способы связи. Размещение регенерационных пунктов по трассе кабельной линии. Защита электрических кабелей связи от влияния внешних полей, расчет опасных магнитных влияний.

    курсовая работа [2,8 M], добавлен 06.08.2013

  • Построение технологической схемы объекта автоматического регулирования. Выбор датчика уровня жидкости в емкости, пропорционального регулятора, исполнительного механизма, электронного усилителя. Расчет датчика обратной связи, дискретности микроконтроллера.

    курсовая работа [1,7 M], добавлен 20.10.2013

  • Понятие и функциональные особенности подшипника скольжения, его структура и составные части: часть вала (шейки), антифрикционный вкладыш и слой смазки между ними. Описание и обоснование процессов, протекающих в подшипнике, принципы и этапы диагностики.

    контрольная работа [79,1 K], добавлен 17.12.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.