Марковские модели принятия решений

Применение метода перебора для анализа Марковской модели. Принятие решений при бесконечном количестве этапов. Решение системы линейных уравнений. Концептуальная схема принятия решений в Марковской модели. Нахождение безусловных оптимальных стратегий.

Рубрика Математика
Вид контрольная работа
Язык русский
Дата добавления 20.03.2016
Размер файла 175,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http: //www. allbest. ru/

БЕЛОРУССКИЙ НАЦИОНАЛЬНЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

МЕЖДУНАРОДНЫЙ ИНСТИТУТ ДИСТАНЦИОННОГО ОБРАЗОВАНИЯ

«Информационные системы и технологии»

Контрольная работа

По дисциплине «Методы принятия решения»

выполнил ст. гр. 41704212 Демьянова С.И.

проверила Боярышнова О.А

1. Марковские модели принятия решений

1.1 Концептуальная схема принятия решений в Марковской модели

Концептуальная схема принятия решений при использовании Марковской модели имеет следующие особенности:

· Во-первых, анализируемая система или анализируемый процесс характеризуется дискретным множеством состояний S1,S2, s, m.

· Функционирование системы представляет собой логическую последовательность этапов n-1, n, n+1… N этап. Где n малое - текущий номер этапа. Общее количество этапов N может быть фиксированным или равным бесконечности.

· В момент времени tn-1 система находится в одном из состояний S.

· Системному аналитику или управляющему алгоритму предоставлено право выбора одной из общих стратегий Z. И каждая из этих стратегий соответствует матрицам переходных вероятностей Rij, где элементы матрицы задают вероятность перехода из состояния i, в котором находилась система в момент времени tn-1 в состояние j в следующий момент времени. Из состояния i можно перейти в нужное состояние

· Для каждой общей стратегии определена матрица выигрышей D. Элементы этой матрицы характеризуют локальные критерии оценки принятых решений. Элементы матрицы стоимостей dij фиксируют критерии эффективности, которые формируются при переходе системы из состояния i в состояние j. Необходимо для каждого из моментов принятия решений выбрать такую последовательность общих стратегий Z*, которая будет обеспечивать максимальный суммарный выигрыш от функционирования системы за N этапов. Каждое решение должно иметь свою стоимость.

Размещено на http: //www. allbest. ru/

Для изображенной на рисунке концептуальной модели количество этапов представляет собой фиксированное число N. При этом оптимальную стратегию необходимо определять на каждом этапе и для каждого из состояний. марковский линейный уравнение бесконечный

Одна из модификаций Марковской модели предполагает, что количество этапов может быть бесконечным. Следовательно, при определенных ограничениях на матрицу R(Z) система переходит в установившийся режим.

Тогда выбранная оптимальная стратегия не будет зависеть от номера этапа. Для анализа такой модифицированной модели вводится понятие стационарной стратегии - это вектор, размерность которого равна числу состояний, а значение i-й компоненты соответствует номеру общей стратегии, которую необходимо применить в случае нахождения системы в состоянии i.

Если число общей стратегии равно p, а число состояний m, то количество стационарных стратегий определяется как pm .

Множество стационарных стратегий U=(1,2,…u,…pm) формируется следующим образом:

1.Необходимо определить общую стратегию U1. Таким образом U=(1,1,1,1). То есть из m состояний стационарная стратегия U1 состоит в том, что система переводится в состояние 1.

2.В состоянии 2 если система находилась, можно применить общую стратегию U2, то есть переход во второе состояние.

3.Если система была в состоянии i, применяется общая стратегия Ui.

Анализ Марковской модели установившихся решений предполагает формирование для каждой стационарной стратегии матрицы переходных вероятностей R(U) и матрицы коэффициентов эффективности (выигрышей или доходов) D(U).

Алгоритм конструирования этих матриц для произвольной стационарной стратегии заключается в следующем:

Первая строка матрицы переходов R[U=(u1…ui…um)]. Соответствует первой строке матрицы принятия решений R(z=u1). То есть матрица переходных вероятностей задает вероятности перехода из всех возможных состояний в момент времени tn-1 в первое состояние.

Матрица стоимостных показателей D[U=(u1…ui…um)] соответствует первой строке матрицы принятия решения D(z=u1), то есть матрица определяет все возможные критерии выигрышей при переходе системы из состояния iго в 1ое состояние.

Вторые строки матрицы переходов R[U=(u1…ui…um)] соответствуют вторым строкам матрицы принятия решений R(z=u2) и, соответственно, выигрыши D[U=(u1…ui…um)] - вторым строкам матрицей выигрышей D(z=u2).

Для i-й строки матрица переходов будет выглядеть как R(z=ui) и соответственно матрица стоимостей D(z=ui) для перехода из любого в любое состояние.

1.2 Методы анализа Марковской модели принятия решений

Применение метода прямого перебора для анализа Марковской модели принятия решений при бесконечном количестве этапов.

При бесконечном количестве этапов мы предполагаем, что с течением времени система переходит в стационарный режим.

Для стационарного режима определены вероятности состояний при реализации U-й стратегии рi(u).

При этом на основе матрицы решений D(Z) вычислены матрицы выигрышей для стационарных стратегий D(U). D(Z) >D(U)

Необходимо выбрать такую стационарную стратегию, которая бы обеспечила максимальный суммарный выигрыш за нахождение системы в каждом i-м состоянии.

- эта величина выигрыша при нахождении системы в i-том состоянии при реализации некой u-той стационарной стратегии.

В качестве критерия применяется величина выигрыша за один этап, и этот выигрыш определяется как сумма выигрышей по всем состояниям.

Таким образом, алгоритм решения задачи основан на идее полного перебора всех возможных стационарных состояний и вычислении для них значения суммарного критерия эффективности.

В качестве оптимальной выбирается такая стационарная стратегия, для которой значение функционала будет максимальным.

Таким образом, для задачи полного перебора в исходные данные включены множеств общих стратегий z={1,2,…z…p} соответственно матрица переходных вероятностей R(z) и матрица стоимостей из состояния i в состояние j D(z).

Далее из общей стратегии справедливым условием, что z є Z.

Первый шаг алгоритма - в соответствии с общим числом стратегий p и общего числа состояний m формируется множество стационарных стратегий.

Делаем полный перебор всех ситуаций.

Второй шаг - для каждой из сформированных стационарных стратегий по матрицам конструируются матрицы принятых решений R(Z)>R(U), D(Z)>D(U). Очевидно, что количество переходов R(U) и количество выигрышей D(U)будет равно pm.

Третий шаг - для каждой стационарной стратегии находится вектор стационарного распределения вероятностей (u)=[р1(u),р2(u)…рi(u)…рm(u)]. Для нахождения вектора(u) используется система линейных уравнений, представленная в матричной форме

Решение системы линейных уравнений может быть выполнено либо методом подстановки, либо на основе приведения системы уравнений к канонической форме. Ах=В.

Четвертый шаг - для каждой из стационарных стратегий необходимо найти значение выигрышей за один этап функционирования системы.

Где опять же нi(u) - выигрыш за пребывание системы в i-м состоянии при реализации u-й стратегии.

Основной недостаток метода прямого перебора состоит в том, что при увеличении числа состояний m и количества общих стратегий p, число стационарных стратегий существенно возрастает. Поэтому для задач большой размерности применяется метод динамического программирования для анализа Марковской модели.

Постановка задачи - рассматривается система, которая соответствует следующей базовой концептуальной модели.

Размещено на http: //www. allbest. ru/

Количество этапов N ограничено. Задано множество стратегий Z={1,2…z…p}, задана матрица вероятности переходов R(Z) и матрица выигрышей D(Z). Необходимо для каждого состояния на каждом из этапов найти оптимальные общие стратегии, которые обеспечивают максимальный локальный выигрыш.

Для решения этой задачи введем функцию fn(i), которая означает оптимальный выигрыш для i-того состояния за n-1, n, n+1 этапы функционирования.

Для данной модели уравнение Беллмана представляется следующим образом

нi(z) - выигрыш от пребывания системы в i-м состоянии при реализации общей стратегии Z.

Этот выигрыш при реализации алгоритма обратной прогонки, если известно количество этапов и оно ограничено N, то для решения уравнения Беллмана целесообразно применить алгоритм обратной прогонки.

В этом случае решение производится начиная с последнего этапа принятия решений, то есть n=N и

fN(i)=max{нi(z)}

На следующем шаге рассматривается решение принятое на предпоследнем этапе, то есть n=N-1. В этом случае уравнение Беллмана

Где нi(z)- выигрыш от пребывания системы в i-м состоянии при реализации общей стратегии Z и в этом решении учитывается значение функции fN(j), найденное в предыдущем решении. Функционал fN-1(i) представляет собой локальный выигрыш, получаемый при функционировании системы за n-1 и n этапы. Аналогичные уравнения составляются для остальных шагов до первого шага включительно. После этого производится просмотр полученных таблиц в прямом порядке для нахождения безусловных оптимальных стратегий.

Размещено на Allbest.ru

...

Подобные документы

  • Характеристика уравнений с разделяющимися переменными. Сущность метода Бернулли и метода Лагранжа, задачи Коша. Решение линейных уравнений n-го порядка. Фундаментальная система решений - набор линейно независимых решений однородной системы уравнений.

    контрольная работа [355,9 K], добавлен 28.02.2011

  • Решение систем линейных уравнений методами Крамера и Гауса. Граф состояний марковской системы. Составление уравнений Колмогорова. Предельные вероятности состояний системы. Матричный метод, матрица треугольная, матрица квадратная и решение системы.

    контрольная работа [84,5 K], добавлен 20.07.2010

  • Описание модели Крамера-Лундберга с гамма-распределением величин исков. Дифференциальные, интегро-дифференциальные уравнения для вероятностей неразорения страховой компании в случае гамма-распределения исков. Теорема существования, единственности решений.

    курсовая работа [1,5 M], добавлен 20.01.2015

  • Решение систем уравнений методом Гаусса, с помощью формул Крамера. Построение пространства решений однородной системы трех линейных уравнений с четырьмя неизвестными с указанием базиса. Определение размерности пространства решений неоднородной системы.

    контрольная работа [193,5 K], добавлен 28.03.2014

  • Диофант и история диофантовых уравнений. О числе решений линейных диофантовых уравнений (ЛДУ). Нахождение решений для некоторых частных случаев ЛДУ. ЛДУ c одной неизвестной и с двумя неизвестными. Произвольные ЛДУ.

    курсовая работа [108,7 K], добавлен 13.06.2007

  • Нахождение экстремумов функций методом множителей Лагранжа. Выражение расширенной целевой функции. Схема алгоритма численного решения задачи методом штрафных функций в сочетании с методом безусловной минимизации. Построение линий ограничений.

    курсовая работа [259,9 K], добавлен 04.05.2011

  • Основные положения теории принятия решений, разработанной на основе математических методов и формальной логики, классификация управленческих решений. Некорректно поставленные задачи и регуляризирующие (робастные) алгоритмы: адаптивные, инвариантные.

    курсовая работа [1,1 M], добавлен 23.11.2010

  • Решение системы линейных уравнений методами Крамера, Гаусса (посредством преобразований, не изменяющих множество решений системы), матричным (нахождением обратной матрицы). Вероятность оценки события. Определение предельных вероятностей состояний системы.

    контрольная работа [69,7 K], добавлен 26.02.2012

  • Постановка задач принятия решений в условиях неопределенности, генерация и оценки альтернативных вариантов их решения для хорошо и слабо структурированных проблем. Аналитическая иерархическая процедура Саати, метод порогов несравнимости "Электра".

    курсовая работа [38,3 K], добавлен 10.04.2011

  • Решение дифференциальных уравнений. Численный метод для заданной последовательности аргументов. Метод Эйлера относиться к численным методам, дающим решение в виде таблицы приближенных значений искомой функции. Применение шаговых методов решения Коши.

    дипломная работа [1,2 M], добавлен 16.12.2008

  • Понятие и содержание равносильных уравнений, факторы их оценивания. Теорема о равносильности уравнений и ее доказательство. Причины и пути приобретения посторонних корней при разрешении данных уравнений. Нахождение и сравнение множества решений.

    презентация [16,0 K], добавлен 26.01.2011

  • Понятия и решения простейших дифференциальных уравнений и дифференциальных уравнений произвольного порядка, в том числе с постоянными аналитическими коэффициентами. Системы линейных уравнений. Асимптотическое поведение решений некоторых линейных систем.

    дипломная работа [395,4 K], добавлен 10.06.2010

  • Решение системы линейных уравнений по правилу Крамера и с помощью обратной матрицы. Нахождение ранга матрицы. Вычисление определителя с помощью теоремы Лапласа. Исследование на совместимость системы уравнений, нахождение общего решения методом Гауса.

    контрольная работа [97,3 K], добавлен 24.05.2009

  • Рассмотрение систем линейных алгебраических уравнений общего вида. Сущность теорем и их доказательство. Особенность трапецеидальной матрицы. Решение однородных и неоднородных линейных алгебраических уравнений, их отличия и применение метода Гаусса.

    реферат [66,4 K], добавлен 14.08.2009

  • Обзор применения аппарата разностных уравнений в экономической сфере. Построение моделей динамики выпуска продукции фирмы на основе линейных разностных уравнений второго порядка. Анализ модели рынка с запаздыванием сбыта, динамической модели Леонтьева.

    практическая работа [129,1 K], добавлен 11.01.2012

  • Гиперболические уравнения и уравнения смешанного типа. Неограниченная область свойства решений эллиптических уравнений. Вспомогательные леммы и утверждения. Существование резольвенты дифференциального оператора. Применение преобразования Фурье.

    реферат [93,9 K], добавлен 30.04.2013

  • Основные понятия и теоремы систем линейных уравнений, характеристика методов их решения. Критерий совместности общей системы. Структура общих решений однородной и неоднородной систем. Матричный метод решения и обобщение. Методы Крамера и Гаусса.

    курсовая работа [154,5 K], добавлен 13.11.2012

  • Составление математической модели задачи. Приведение ее к стандартной транспортной задаче с балансом запасов и потребностей. Построение начального опорного плана задачи методом минимального элемента, решение методом потенциалов. Анализ результатов.

    задача [58,6 K], добавлен 16.02.2016

  • Появление понятия функций Ляпунова. Развитие теории устойчивости движения. Применение функций Ляпунова к исследованию продолжимости решений дифференциальных уравнений. Методы построения функций Ляпунова, продолжимость решений уравнений третьего порядка.

    дипломная работа [543,4 K], добавлен 29.01.2010

  • Дифференциальные уравнения Риккати. Общее решение линейного уравнения. Нахождение всех возможных решений дифференциального уравнения Бернулли. Решение уравнений с разделяющимися переменными. Общее и особое решения дифференциального уравнения Клеро.

    курсовая работа [347,1 K], добавлен 26.01.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.