Программные средства для построения и исследования моделей структурной сложности орграфов

Рассмотрение оригинальных программных средств, реализующих построение и анализ системы моделей структурной сложности орграфов. Индексы структурной сложности орграфов в базисах ориентированных цепных фрагментов. Структурные модели сложности орграфов.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 19.01.2018
Размер файла 315,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Государственный университет - Высшая Школа Экономики, Москва

Московский Энергетический Институт (Технический Университет), Москва

ПРОГРАММНЫЕ СРЕДСТВА ДЛЯ ПОСТРОЕНИЯ И ИССЛЕДОВАНИЯ МОДЕЛЕЙ СТРУКТУРНОЙ СЛОЖНОСТИ ОРГРАФОВ

А.А. Незнано, Ю.В. Старичкова

Аннотация

Рассмотрены оригинальные программные средства, реализующие построение и анализ системы моделей структурной сложности орграфов. Данные средства реализованы в виде подсистемы АСНИ «Graph Model Workshop» и нашли применение при исследовании сложности графовых моделей различных систем.

Введение

Исследуется сложность в классе ориентированных графов (орграфов). Актуальность исследования сложности в классе орграфов обусловлена тем, что данный класс графов имеет большое научное значение и широкое практическое применение (представление знаний, интеллектуальный анализ данных, распознавание образов, структурная лингвистика и другие). Многие проблемы искусственного интеллекта, извлечения знаний и машинного обучения рассматривают структурированные данные переменной размерности, такие как строки и различные последовательности, деревья и ориентированные и неориентированные графы. В качестве примера структурированных данных можно назвать: текст и документы; DNA/RNA-протеиновые последовательности и эволюционные деревья биоинформатики. Один из подходов анализа таких данных основан на графовых моделях, [Frey, 1998]; [Heckerman, 1997], является вероятностным методом, в котором случайные переменные ассоциируются с вершинами графа, а связи прямо соотносятся с Марковским предположением о независимости переменных. Граф обычно состоит из набора входных вершин, отражающих структуру (последовательность, граф и т.д.) входных данных, и выходных вершин, ассоциированных, например, с задачами классификации или регрессии. Графовые модели параметризуются локальными условными распределениями переменных узла относительно соседних узлов - например, узел относительно его родительского узла в случае Байесовских сетей. Чтобы обработать данные переменной размерности и формата, необходимо сделать ряд специфических предположений. Такие предположения на графах регулярной структуры, таких как цепи, деревья и решетки, обычно делаются относительно стационарности либо инвариантности перевода (например, динамические Байесовские сети). Большинство исследований по графовым моделям связано с выбором подходящих графов и случайных переменных, и распространением информации и знаний, которые в сложных моделях требуют серьезных вычислений.

Одной из задач структурной информатики является задача вычисления характеристик, отражающих структурные особенности графа. Одними из таких характеристик являются модели сложности на основе индексов структурной сложности (СС) графов. Индекс СС графа не является полным инвариантом графа. Поэтому задачи анализа сходства нельзя без потери точности свести к вычислению и сравнению индексов СС графов. Это объясняется тем, что числовые значения параметров системы, как правило, не содержат непосредственно информации о наиболее существенных «внутренних» характеристиках системы, важной является структура - инвариантный аспект системы. Поэтому необходимо учитывать классы графов и разрабатывать всё более тонкие методы получения индексов СС.

В докладе рассматривается реализация методов построения и анализа индексов и вектор-индексов структурной спектральной сложности орграфов, а также моделей сложности из класса b-моделей.

1. Индексы структурной сложности орграфов в базисах ориентированных цепных фрагментов

Рассмотрим задачу нахождения индекса, вектор-индекса СС и полного структурного спектра (ПСС) орграфа G в базисе произвольных фрагментов. Вектор-индекс, индекс структурной сложности и ПСС орграфа G в базисе произвольных фрагментов [Кохов, 2002]:

,

,

,

где G - орграф, - элементы базиса, wi - количество канонических изоморфных вложений фрагментов в орграф G, относительно которого характеризуется сложность графа. В качестве параметров построения индексов, вектор-индексов, ПСС необходимо задать сложность хотя бы некоторых базовых фрагментов минимального размера, сложность фрагментов большей длины может вычисляться рекурсивно.

Для разработки алгоритмов и дальнейших исследований в качестве мер сложности выбраны вектор-индексы, индексы СС и ПСС в базисе простых путей (ISSC(G/P)), полупутей (ISSC(G/PP)), контуров (ISSC(G/C)), полуконтуров (ISSC(G/CC)) и ориентированных цепных фрагментов (ОЦФ) (ISSC(G1/OCF)).

ОЦФ - связный орграф, состоящей либо из одной вершины (ОЦФ длины 0, наименьший элемент базиса), либо из большего числа вершин, причем две из них имеют степень 1, а остальные - 2 (длина ОЦФ равна числу дуг в нём). Отметим, что полустепени исхода и захода могут быть любыми. Использования ОЦФ в качестве элементов базиса позволяет увеличить дискриминирующую способность индексов СС при сохранении вычислительной сложности алгоритмов построения индексов.

В таблице 1 приведен пример базовых ОЦФ и их значений сложности.

Табл. 1

Диаграммы минимальных ОЦФ

Стандартные значения сложности ОЦФ

ISSC(F0/OCF) = 1

ISSC(F1/OCF) = 3

ISSC(F2/OCF) = 9

ISSC(F3/OCF) = 10

ISSC(F4/OCF) = 11

Таблица 2 содержит пример вычисления значений индексов СС в базисах путей, полупутей, контуров, полуконтуров и ОЦФ для орграфов G1 и G2.

Табл. 2

Орграф G1

Орграф G2

Значения индексов

ISSC(G1/P) = 86, ISSC(G2/P) = 86

ISSC(G1/PP) = 242, ISSC(G2/PP) = 242

ISSC(G1/C) = 133, ISSC(G2/C) = 16

ISSC(G1/CC) = 234, ISSC(G2/CC) = 234

ISSC(G1/OCF) = 129, ISSC(G2/OCF) = 128

Отметим, что хотя путь являются ОЦФ, его отдельное рассмотрение полезно как для сравнительного анализа, так и для выделения самого простого алгоритма построения индекса СС.

Корректность работы алгоритмов подтверждена результатами вычислительных экспериментов на различных семействах ориентированных орграфов.

Были исследованы все орграфы до 6 вершин включительно (1540421), и несколько более узких классов (например, 20278544 бесконтурных и 4664216 планарных бесконтурных орграфов до 8 вершин) и несколько представительных семейств с числом вершин до 1000 (более 10000 орграфов). В качестве базисов для исследования были выбраны базисы связанных путей, полупутей, контуров, полуконтуров и ОЦФ всех длин.

Рис. 1 График чувствительности различения индексов сложности для орграфов на 6 вершинах

Проведена классификация исследованных классов и семейств орграфов с целью разбиения множеств орграфов с одинаковым числом вершин на классы эквивалентности, на основе значения индексов СС в различных базисах. На Рис. 1. и Рис. 2. приведены примеры графиков чувствительности (отношения числа классов к числу орграфов) для индексов СС орграфов и планарных орграфов в базисах путей, полупутей, контуров, полуконтуров, ОЦФ. Наиболее точную классификацию удалось получить, используя значение индексов СС в базисе ОЦФ, при длине элементов базиса равной числу вершин в орграфе.

Рис. 2 График чувствительности различения индексов сложности для планарных орграфов на 7 вершинах

2. Структурные модели сложности орграфов

программный орграф модель сложность

Кроме моделей СС в виде индексов и вектор-индексов, реализованы и более сложные структурные модели сложности - b-модели в базисе ОЦФ. Данный класс моделей СС впервые предложен Коховым В.А. [Кохов, 2002]. b-модель представляет собой двудольный граф со структурными весами на вершинах и рёбрах [Незнанов, 2005]. Левая доля - элементы базиса (то есть типы фрагментов орграфа); правая доля - помеченные фрагменты; ребро проводится в случае, если помеченный фрагмент, задаваемый весом вершины левой доли вкладывается во фрагмент, тип которого совпадает с типом, задаваемым весом вершины правой доли. Веса рёбер отражают либо число вложений, либо относительные вклады помеченных фрагментов в общую сложность орграфа. В сравнении с индексами и вектор-индексами СС b-модели имеют намного большую дискриминирующую способность, позволяют решать новые классы задач, но требуют больше памяти и имеют большую сложность построения. В таблице 3 приведен пример графов с эквивалентными значениями индекса СС ISSC(G1/OCF) = ISSC(G2/OCF) = 43, но имеющие различные b-модели. Прорисовка диаграмм выполнена идентичным методом для визуального сравнения.

Табл. 3

Диаграмма графа G1

Диаграмма графа G2

Диаграмма b-модели графа G1

Диаграмма b-модели графа G2

3. Программная реализация расширения построения индексов и вектор-индексов сложности

Программный комплекс «Сложность орграфов в ориентированных базисах» (далее - DCDB) предназначен для вычисления ПСС, вектор-индексов, индексов СС в базисе путей, полупутей, контуров, полуконтуров и ОЦФ орграфов с особой обработкой некоторых их подклассов (например, планарных орграфов). Он реализован в виде набора расширений АСНИ «Graph Model Workshop» (GMW).

Комплекс создан в среде Borland Developer Studio 2007 на языке Delphi. Объём авторского исходного кода DCDB - более 100 КБ, число строк исходного кода основных алгоритмов - 1288, всего компилируемых строк - 3170, объём машинного кода - 1391 КБ. Построенные модели структурной сложности хранятся в виде набора таблиц в базе данных результатов экспериментов GMW.

Параметризация построения индексов и вектор-индексов (рис. 3):

· тип базиса для вычисления индекса, вектор-индекса CC;

· длина максимального элемента базиса (для конструктивно перечисляемых базисов) или набор ОЦФ (для выбора базиса, задаваемого пользователем поэлементно);

· значения сложности минимальных элементов базиса (для конструктивно перечисляемых базисов с автоматическим расчётом сложности остальных элементов) или всех элементов.

Рис. 3 Интерфейс расширения АСНИ «Graph Model Workshop»

Технологические ограничения подсистемы (обработка орграфов с числом вершин до 32500, размер фрагмента до 255 вершин) несущественны на фоне высокой временной и емкостной сложности используемых алгоритмов.

Исследована сложность орграфов с использованием индексов, вектор-индексов и b-моделей. Расширена функциональность АСНИ «Graph Model Workshop» программным комплексом «DCDB». Получены оценки чувствительности индексов СС, вектор-индексов, ПСС и b-моделей в базисах ОЦФ для планарных, бесконтурных, планарных бесконтурных и семейств орграфов.

Список литературы

1. Кохов В.А. Концептуальные и математические модели сложности графов. М.: Издательство МЭИ (ТУ), 2002.

2. Незнанов А.А. Методы и программные средства для различения расположения фрагментов графовых моделей систем: дис. кан. тех. наук. М.: МЭИ (ТУ), 2005.

3. Frey B. J., Lawrence N., Bishop C. M. Markovian interence in belief networks. Presented at Learning, Machines that Learn or what some people call Snowbird, Snowbird, Utah, April, 1998.

4. Heckerman D. "Bayesian Networks for Data Mining". Data Mining and Knowledge Discovery. 1997. № 1.

Размещено на Allbest.ru

...

Подобные документы

  • Временная и ёмкостная сложность программы. Размер входных данных. Связь сложности в худшем случае и в среднем. Понятие оптимальной программы. Классы вычислительной сложности программ. Эквивалентность по сложности. Примеры классов вычислительной сложности.

    презентация [77,3 K], добавлен 19.10.2014

  • Общее понятие алгоритма и меры его сложности. Временная и емкостная сложность алгоритмов. Основные методы и приемы анализа сложности. Оптимизация, связанная с выбором метода построения алгоритма и с выбором методов представления данных в программе.

    реферат [90,6 K], добавлен 27.11.2012

  • Понятие алгоритма и анализ теоретических оценок временной сложности алгоритмов умножения матриц. Сравнительный анализ оценки временной сложности некоторых классов алгоритмов обычным программированием и программированием с помощью технологии Open MP.

    дипломная работа [1,6 M], добавлен 12.08.2017

  • Семантические сети как модели представления знаний. Основные методы определения сходства графовых моделей систем. Метод решения задач определения сходства семантических сетей на основе их сложности. Разработка алгоритмов и их программная реализация.

    дипломная работа [1,3 M], добавлен 17.12.2011

  • Временная, пространственная и асимптотическая сложности. Основные классы сложности в теории алгоритмов. Сведение как преобразование одной задачи к другой. Проблема равенства классов P и NP. Характеристика основных иерархических отношений между классами.

    реферат [16,9 K], добавлен 09.04.2012

  • Описание формальной модели алгоритма на основе рекурсивных функций. Разработка аналитической и программной модели алгоритма для распознающей машины Тьюринга. Разработка аналитической модели алгоритма с использованием нормальных алгоритмов Маркова.

    курсовая работа [1,5 M], добавлен 07.07.2013

  • Построение структурной модели в программе RMSRoxar, исследование интерфейса и меню, назначение закладок. Гидродинамическое моделирование и построение соответствующей модели. Особенности построения моделей на разных стадиях изученности месторождения.

    отчет по практике [5,6 M], добавлен 18.12.2014

  • Процессы индивидуализации, интеллектуализации и веб-ориентации традиционных обучающих систем как важные особенности современных компьютерных технологий обучения. Знакомство с программными средствами для построения компетентностно-ориентированных моделей.

    дипломная работа [2,7 M], добавлен 04.10.2014

  • Оценка временной сложности алгоритма. Механизм сортировки пузырьком и вставками. Основные положения технологии параллельного программирования Ореn MР. Оценка временной сложности некоторых классов алгоритма с помощью параллельного программирования.

    дипломная работа [1,7 M], добавлен 27.10.2017

  • Создание программ, позволяющих создавать базы данных. Создание таблицы базы данных. Создание схемы данных. Создание форм, отчетов, запросов. Увеличение объема и структурной сложности хранимых данных. Характеристика системы управления базой данных Access.

    курсовая работа [2,1 M], добавлен 17.06.2013

  • Разработка программного обеспечения для реализации криптографической защиты информации. Обоснование выбора аппаратно-программных средств. Проектирование модели информационных потоков данных, алгоритмического обеспечения, структурной схемы программы.

    дипломная работа [2,0 M], добавлен 10.11.2014

  • Понятие компьютерной и информационной модели. Задачи компьютерного моделирования. Дедуктивный и индуктивный принципы построения моделей, технология их построения. Этапы разработки и исследования моделей на компьютере. Метод имитационного моделирования.

    реферат [29,6 K], добавлен 23.03.2010

  • Природа и сложности коммуникаций. Понятие социальной информационной сети. Описание функционирования линейной, транзакционной, интерактивной, сетевой моделей. Коммуникативная функция блогов. Разновидности программной реализации чатов. Иерархия веб-форума.

    курсовая работа [54,7 K], добавлен 05.12.2013

  • Общий анализ технологического процесса, реализуемого агрегатом, целей и условий его ведения. Разработка структурной схемы объекта управления. Идентификация моделей каналов преобразования координатных воздействий. Реализация моделей и их адекватность.

    курсовая работа [2,0 M], добавлен 29.09.2013

  • Разработка структурной и инфологической моделей информационной системы организации по разработке и продаже программных средств. Выбор и обоснование размера и структуры сети, оборудования, кабельной системы; сетевое взаимодействие между компьютерами.

    курсовая работа [513,0 K], добавлен 12.05.2013

  • Анализ существующих программных средств для автоматического отображения онтологий, их практического применения в зависимости от поставленной задачи и сложности входных онтологий. Отображение сложных онтологий с помощью алгоритма повышенной точности.

    дипломная работа [1,5 M], добавлен 14.06.2012

  • Разработка программы, имитирующей работу системы массового обслуживания. Методы и средства решения задачи. Создание концептуальной и структурной моделей системы. Анализ и оценка результатов моделирования, определение достоинств и недостатков системы.

    курсовая работа [469,5 K], добавлен 03.03.2015

  • Точные и приближенные методы анализа структурной надежности. Критерии оценки структурной надежности методом статистического моделирования. Разработка алгоритма и программы расчета структурной надежности. Методические указания по работе с программой.

    дипломная работа [857,8 K], добавлен 17.11.2010

  • Построение графика изменения вероятности безотказной работы системы согласно структурной схемы. Порядок определения процентной наработки технической системы, обеспечение ее увеличения за счет повышения надежности элементов, структурного резервирования.

    контрольная работа [482,9 K], добавлен 12.05.2009

  • Анализ алгоритмов, оценка параметров алгоритма (эффективности, сложности, правильности). Комплексный анализ эффективности алгоритма на основе комплексной оценки ресурсов формальной системы. Верификация при коллективной разработке программных систем.

    презентация [234,9 K], добавлен 22.10.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.