Аппроксимация экспериментальных распределений случайных чисел стандартными статистическими законами

Метод моментов аппроксимации экспериментальных распределений стандартными статистическими законами. Схема эмпирической и гипотетической функции распределения. Метод моментов для экспоненциального закона. Функция плотности экспоненциального закона.

Рубрика Математика
Вид лекция
Язык русский
Дата добавления 23.09.2017
Размер файла 238,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Лекция

Аппроксимация экспериментальных распределений случайных чисел стандартными статистическими законами

На практике для аппроксимации наиболее часто применяются методы моментов максимального правдоподобия.

Метод моментов аппроксимации экспериментальных распределений стандартными статистическими законами

Суть метода моментов заключается в приравнивании оценок моментов, вычисленных по экспериментальным данным, соответствующим им моментам, вычисленным по функции плотности или моментной производящей функции (МПФ). Качество представления рекомендуется оценивать по критериям согласия. Для применения метода момента требуется выполнить следующие действия.

1. На основании физической сущности анализируемого случайного процесса высказывается гипотеза о его подчинении какому-то стандартному статистическому закону. Для выбранного закона, который называется гипотетическим, записывается функция плотности или МПФ и определяется количество параметров гипотетического закона - d.

2. По экспериментальным данным вычисляются оценки начальных моментов. Если все случайные значения равновероятны, то используются следующие формулы для вычисления оценок начальных моментов:

, (3.1)

где s - порядок момента ();

n - количество реализаций случайной величины.

Оценка математического ожидания (первого начального момента) вычисляется по формуле:

. (3.2)

Оценка второго начального момента вычисляется по формуле:

. (3.3)

Оценки центральных моментов вычисляются по формуле:

(3.4)

Оценка второго центрального момента (дисперсии) определяется по формуле:

. (3.5)

Оценка среднего квадратического отклонения (стандартного отклонения) определяется по формуле:

. (3.6)

На практике обычно оценку стандартного отклонения вычисляют по оценкам второго и первого начального моментов.

. (3.7)

При количестве случайных чисел n в выборке (частная выборка), стремящемуся к бесконечности (к генеральной совокупности) n> ?; оценки начальных моментов стремятся к соответствующим им моментам .

3. Записываем формулы для вычисления моментов по ФП и составляем систему уравнений, решение которой определит значения параметров гипотетического закона. Таким образом, система должна состоять из d уравнений, но в любом случае, если даже d=1 рекомендуется определять не менее 2-х первых моментов и их оценок.

4. Оцениваем качество аппроксимации по критериям согласия (КС), среди которых наибольшее применение получили 2 (Пирсона) и критерий Колмогорова-Смирнова.

4.1. Для использования 2 строится гистограмма распределения случайной величины на основе группировки случайных чисел так, как это показано на рис. 3.1.

Рис.3.1. Гистограмма распределения случайной величины х в диапазоне от a до b

КС 2 вычисляется по формуле:

(3.8)

с количеством степеней свободы

R=L - d - 1, (3.9)

где L - количество интервалов гистограммы;

экспериментальная i-я частота, то есть количество попаданий случайной величины в i-й интервал гистограммы;

гипотетическая частота, то есть количество случайных чисел, которое должно было попасть в i-й интервал гистограммы:

;

n - количество реализаций случайной величины;

Pi - вероятность попадания случайной величины в i-й интервал гистограммы;

, (3.10)

где аi-1, ai - левая и правая границы i-го интервала гистограммы;

R - количество степеней свободы (разница между количеством имеющихся интервалов гистограммы и определяемыми параметрами).

По вычисленным значениям 2 и R по статистическим таблицам определяется коэффициент доверия гипотезе - Рр, который должен укладываться в 10% доверительный интервал т.е. должно выполняться неравенства. Если это условие выполняется, то делается заключение, что имеющиеся статистические данные не противоречат гипотезе об их подчинении высказанному гипотетическому закону по КС Пирсона. Если данное неравенство не выполняется, то гипотезу рекомендуется отвергнуть и провести аппроксимацию другим законом, как правило, более сложным.

Для корректного применения КС 2 рекомендуется строить гистограммы с количеством интервалов не менее 7 и чтобы количество попаданий случайной величины в любой интервал гистограммы, было не меньше 7. Таким образом, для использования КС 2 требуется наличие не менее 49 случайных чисел.

4.2. При сравнительно небольшом количестве случайных чисел рекомендуется применять КС Колмогорова, который вычисляется по формуле:

(3.11)

где n - количество реализаций случайной величины;

эмпирическая и гипотетическая функции распределения.

Эмпирическая функция распределения строится по имеющейся последовательности случайных чисел. Каждая имеющаяся случайная величина увеличивает функцию распределения на величину 1/n. Таким образом, функция распределения представляется графиком, изменяющимся от 0 до 1. Значения гипотетической функции распределения вычисляются по формуле:

, (3.12) ,

где а - левая граница диапазона существования закона.

КС Колмогорова-Смирнова не допускает какой-либо группировки случайных событий и требует, чтобы каждое из имеющихся случайных чисел было проверено на поиск максимума индивидуально. По вычисленному значению К по статистическим таблицам находится коэффициент доверия гипотезе РК, который должен удовлетворять условию:

РК 0,20.

Если данное условие выполняется, то делается заключение, что имеющиеся статистические данные не противоречат гипотезе об их подчинении высказанному гипотетическому закону по КС Колмогорова. В противном случае гипотезу рекомендуется отвергнуть.

Метод максимального правдоподобия аппроксимации экспериментальных распределений стандартными статистическими законами

Суть метода максимального правдоподобия заключается в нахождении таких значений параметров статистического закона, при которых функция подобия достигает своего максимального значения. Качество представления рекомендуется оценивать по критериям согласия. Для применения метода максимального правдоподобия требуется выполнить следующие действия.

1. На основании физической сущности анализируемого случайного процесса высказывается гипотеза о его подчинении какому-то стандартному статистическому закону. Для выбранного закона, который называется гипотетическим, записывается функция плотности, которая определяет количество параметров гипотетического закона - d.

2. По экспериментальным данным для каждого параметра статистического закона составляется функция правдоподобия:

L(x1,x2,…xn;p1,p2,···pd)=f(x1, p1,p2,···pdf(x2, p1,p2,···pd)···f(xn, p1,p2,···pd), (3.13)

где f(xi, p1,p2,···pd) - значение функции плотности, определяемой параметрами p1,p2,···pd, в i-ой точке экспериментального распределения случайных чисел;

xi - значение случайной величины в i-ой точке экспериментального распределения случайных чисел;

pj - j - параметр гипотетического закона распределения случайных чисел;

n - количество значений экспериментального распределения случайных чисел;

d - количество параметров гипотетического закона распределения случайных чисел.

3. Рекомендуется, но не обязательно, прологарифмировать функцию правдоподобия:

Ln(L(x1,x2,…xn;p1,p2,···pd))=ln(f(x1, p1,p2,···pd))+ln(f(x2, p1,p2,···pd))+···+

+ln(f(xn, p1,p2,···pd)). (3.14)

4. Составляется система уравнений в частных производных по параметрам статистического закона от функции правдоподобия, которые приравниваются нулю:

? L(x1,x2,…xn;p1,p2,···pd)=0; (3.15)

?pj

Вместо функции правдоподобия можно использовать логарифмическую функцию подобия:

? ln(L(x1,x2,…xn;p1,p2,···pd))=0; (3.16)

?pj

5. Решением системы уравнений (3.15) или (3.16) находятся параметры статистического закона.

6. Качество аппроксимации оценивается по критериям согласия 2 и Колмогорова-Смирнова, по методике, описанной в предыдущем разделе.

Метод моментов для равномерного закона

ФП и ФР равномерного закона:

. (3.17)

Вычислим первый и второй начальные моменты:

(3.18)

(3.19)

Вычислим стандартное отклонение и параметры равномерного закона:

(3.20)

(3.21)

(3.22)

Вычислим вероятность попадания случайной величины в интервалы гистограммы и гипотетическую ФР:

(3.23)

(3.24)

Следует учитывать, что при построении гистограммы принимается:

; .

Пример. Аппроксимация экспериментального распределения случайных чисел равномерным законом с оценкой качества аппроксимации по критерию согласия Колмогорова

Экспериментальное распределение представляет собой выборку, состоящую из 10 трёхразрядных чисел, поэтому проведём аппроксимацию с оценкой качества аппроксимации по КС Колмогорова. Представим распределение случайных чисел по возрастанию их значений: 137, 221, 353, 366, 367, 507,686, 905, 918, 985 и построим по нему эмпирическую ФР, представленную на рис.3.2.

Вычислим основные характеристики эмпирического распределения:

.

сек.

сек.

Рис.3.2. Эмпирическая и гипотетическая функции распределения

Вычислим параметры равномерного закона:

сек.

сек.

По двум найденным точкам построим прямую линию, которая является гипотетической ФР. Она изображена на рис.3.2. По рис.3.2 находим, что максимальная разница между эмпирической и гипотетической ФР при аргументе, равном 367. Уточним значение ФР для этого значения и вычислим КС Колмогорова:

По статистическим таблицам находим коэффициент доверия высказанной гипотезе: .

Вывод: имеющиеся статистические данные не противоречат гипотезе о их подчинении равномерному закону по КС Колмогорова.

Пример. Аппроксимация экспериментального распределения 100 одноразрядных чисел равномерным законом с оценкой качества аппроксимации по КС Пирсона

Выборка из 100 случайных чисел представлена в виде совокупности, состоящей из 5 строк и 20 столбцов.

аппроксимация закон статистический

Подсчитаем количество символов каждого типа и построим гистограмму, представленную на рис.3.3.

Рис.3.3. Гистограмма распределения 100 одноразрядных случайных чисел

Вычислим основные статистические характеристики распределения, параметры закона, значение КС Пирсона и по статистическим таблицам определим коэффициент доверия, выдвинутой гипотезе:

Ввиду того, что найденный коэффициент доверия не укладывается в рекомендуемый 10% - й доверительный интервал то гипотезу ввергаем.

Отметим, что если бы чисел «2» было 9, а не 5; а чисел «4» было бы 13, а не 17, то было бы равно:

2 ={1+4+1+16+9+4+16+4+16+4+25}/10=8,4;

при R=7; тогда по статистическим таблицам находим р=0,31 и гипотеза не отвергается.

Метод моментов для экспоненциального закона

В теории массового обслуживания центральное место занимает экспоненциальный закон, благодаря своим следующим замечательным свойствам.

1. Ординарности, которая заключается в том, что если в ОМ действует несколько экспоненциальных законов, то в любой момент времени в такой системе не может произойти более одного события.

2. Стационарности (независимости от времени). Стационарный режим в простейшей системе наступает тогда, когда выполняется условие, что интенсивность поступления транзактов не превышает интенсивности их обслуживания . В таких системах через некоторое время, которое называют переходным режимом, процесс изменения состояния системы перестает зависеть от времени и зависит только от технических характеристик ОМ и параметров внешней среды, в которой он функционирует. Условие наличия стационарного режима для простейшей СМО .

3. Отсутствия последействия, которое заключается в том, что время, оставшееся до окончания экспоненциального процесса в любой момент его протекания распределено по экспоненциальному закону с той же интенсивностью, с которой распределено все распределение случайных чисел.

Эти три свойства позволяют строить Марковские цепи, являющиеся основой аналитического моделирования СМО.

Функция распределения (ФР) экспоненциального закона приведена на рис.2.4. Это вероятность того, что случайная величина Х не превысит своего текущего значения х.

Рис.3.4. Функция распределения экспоненциального закона

Функция плотности (ФП). Это плотность вероятности случайной величины, или дифференциальная функция распределения. ФП экспоненциального закона приведена на рис.3.5.

Рис. 3.5. Функция плотности экспоненциального закона

Экспоненциальный закон имеет диапазон своего существования от 0 до . Функция плотности экспоненциального закона

. (3.25)

ФР экспоненциального закона можно вычислить по ФП:

(3.26)

ФП экспоненциального закона определяется всего одним параметром . Для потоков событий это количество транзактов (заявок), поступающих за единицу времени. Для процессов обслуживания - это количество транзактов, которое может быть обслужено при их непрерывном поступлении в обслуживающий аппарат (ОА). Вычислим первый начальный момент по функции плотности:

(3.27)

Для вычисления интеграла (3.27) проведём интегрирование по частям:

Пусть , тогда ;

Рассмотрим этот же интеграл с пределами и вычислим основные статистические характеристики экспоненциального закона:

(3.28)

В полученном математическом выражении отдельно рассмотрим первое слагаемое:

Для первого слагаемого получили неопределённость вида бесконечность на бесконечность. Раскроем его по правилу Лопиталя, взяв отдельно производные от числителя и знаменателя.

Таким образом, первое слагаемое в (2.28) можно отбросить и вычислить интеграл по второму слагаемому.

(3.29)

Получили формулу для вычисления интенсивности экспоненциального закона по экспериментальным данным.

(3.30)

Вычислим второй начальный момент:

(3.31)

Пусть , тогда ;

Рассмотрим этот же интеграл с пределами и вычислим основные статистические характеристики экспоненциального закона:

(3.32)

В полученном математическом выражении (3.32) отдельно рассмотрим первое слагаемое:

(3.33)

Для первого слагаемого выражения (3.33) получили неопределённость вида бесконечность на бесконечность. Раскроем его по правилу Лопиталя, взяв отдельно производные от числителя и знаменателя.

(3.34)

Снова получили неопределённость вида бесконечность на бесконечность. Снова раскроем его по правилу Лопиталя, взяв отдельно производные от числителя и знаменателя.

(3.35)

Таким образом, первое слагаемое можно отбросить и вычислить интеграл по второму слагаемому.

(3.36)

Вычислим среднее квадратическое отклонение.

(3.37)

Для вычисления значений КС по формулам (3.8) и (3.11) требуется предварительно вычислить вероятности попадания случайной величины в интервалы гистограммы и гипотетические функции распределения по следующим формулам.

(3.38)

Метод моментов для нормального закона

Нормальный закон является наиболее употребительным. Он применяется для представления самых различных случайных процессов, таких как продолжительность жизни людей, изменения экономических и технических показателей. Функция плотности нормального закона представляется следующей математической зависимостью:

(3.39)

Характерной особенностью нормального закона является то что в качестве его параметров в функцию плотности (3.39) входят математическое ожидание и среднее квадратическое отклонение, поэтому для использования метода моментов достаточно в (3.39) подставить их оценки, вычисленные по экспериментальному распределению. Так как интеграл от функции плотности нормального закона аналитически «не берётся», то он определяется по таблицам, составленным для нормального закона с математическим ожиданием, равным нулю, и средним квадратическим отклонением, равным единице с преобразованием реального распределения по следующим формулам:

(3.40)

Пример. Аппроксимация экспериментального распределения случайных чисел экспоненциальным и нормальным законом с проверкой качества аппроксимации по критерию согласия

Эспериментальное распределение случайных чисел задано в виде гистограммы, представленной на рис.3.6.

Рис.3.6. Гистограмма экспериментального распределения с эмпирическими частотами и гипотетическими частотами, вычисленными для экспоненциального и нормального закона

По гистограмме вычислим основные статистические характеристики экспериментального распределения и интенсивность для его аппроксимации экспоненциальным законом:

Расхождение в и составляет около одной четвертой, поэтому весьма целесообразно выдвинуть гипотезу о подчинении экспериментального (эмпирического) распределения экспоненциальному закону.

По вычисленным гипотетическим частотам вычислим КС Пирсона:

По статистическим таблицам находим коэффициент доверия гипотезе о подчинении данного распределения экспоненциальному закону:

.

Так как вычисленный коэффициент доверия укладывается в рекомендуемый 10% интервал, то гипотеза о подчинении данного экспериментального распределения экспоненциальному закону не отвергается.

Гипотетические частоты для экспоненциального закона приведены на рис.3.6.

Проведём аппроксимацию того же примера нормальным законом. Значения оценок математического ожидания и среднего квадратического отклонения нами уже вычислены, теперь требуется вычислить гипотетические частоты попадания случайной величины в интервалы гистограммы для нормального закона. Результаты вычислений приведены в таблице 3.1.

Таблица 3.1

X

z

0

-1,25

10,56

11

100

-0,86

19,49

9

200

-0,49

31,56

12

300

-0,09

46,41

15

400

0,29

61,41

15

600

1,07

85,77

24

800

1,84

96,71

11

1200

3,38

99,97

3

11 первых значений случайной величины «выходят» за пределы диапазона построения гистограммы, так как в ней нет интервала для отрицательных чисел. В сумме получается 100 значений.

Вычислим значение КС Пирсона:

Так как в статистических таблицах нет коэффициента доверия для такого большого значения КС , то будем считать, что коэффициент доверия гипотезы и таким образом гипотеза о подчинении данного экспериментального распределения нормальному закону отвергается.

Контрольные вопросы

1. Какие задачи решаются на этапе формализации?

2. Какими математическими зависимостями рекомендуется представлять результаты имитационного моделирования?

3. На каком принципе основывается метод моментов?

4. Приведите методику применения метода моментов.

5. Приведите формулу для вычисления начальных моментов.

6. Приведите формулу для вычисления вероятности попадания случайной величины в интервалы гистограммы.

7. Приведите формулу функции плотности равномерного закона.

Размещено на Allbest.ru

...

Подобные документы

  • Особенности метода аппроксимации табулированных функций. Рассмотрение преимуществ работы в среде математической программы Mathcad. Метод наименьших квадратов как наиболее распространенный метод аппроксимации экспериментальных данных, сферы применения.

    курсовая работа [1,2 M], добавлен 30.09.2012

  • Основные понятия математической статистики, интервальные оценки. Метод моментов и метод максимального правдоподобия. Проверка статистических гипотез о виде закона распределения при помощи критерия Пирсона. Свойства оценок, непрерывные распределения.

    курсовая работа [549,1 K], добавлен 07.08.2013

  • Аппроксимация экспериментальных зависимостей методом наименьших квадратов. Правило Крамера. Графическое отображение точек экспериментальных данных. Аномалии и допустимые значения исходных данных. Листинг программы на С++. Результаты выполнения задания.

    курсовая работа [166,7 K], добавлен 03.02.2011

  • Вероятность совместного выполнения двух неравенств в системе двух случайных величин. Свойства функции распределения. Определение плотности вероятности системы через производную от соответствующей функции распределения. Условия закона распределения.

    презентация [57,9 K], добавлен 01.11.2013

  • Решение задач по определению вероятностных и числовых характеристик случайных явлений с обоснованием и анализом полученных результатов. Определение вероятности, среднего значения числа, надежности системы, функции распределения, математического ожидания.

    курсовая работа [227,6 K], добавлен 06.12.2010

  • Пространства элементарных событий. Совместные и несовместные события. Функция распределения системы случайных величин. Функции распределения и плотности распределения отдельных составляющих системы случайных величин. Условные плотности распределения.

    задача [45,4 K], добавлен 15.06.2012

  • Область определения функции, которая содержит множество возможных значений. Нахождение закона распределения и характеристик функции случайной величины, если известен закон распределения ее аргумента. Примеры определения дискретных случайных величин.

    презентация [68,7 K], добавлен 01.11.2013

  • Расчет моментов ряда, построение функции распределения и плотности функции распределения, ее аппроксимация теоретическими зависимостями. Определение стационарности ряда. Вычисление куммулятивной частоты превышения уровня. Прогноз превышения уровня.

    практическая работа [137,2 K], добавлен 11.02.2010

  • Расчет параметров экспериментального распределения. Вычисление среднего арифметического значения и среднего квадратического отклонения. Определение вида закона распределения случайной величины. Оценка различий эмпирического и теоретического распределений.

    курсовая работа [147,0 K], добавлен 10.04.2011

  • Предельные теоремы теории вероятностей. Сходимость последовательностей случайных величин и вероятностных распределений. Метод характеристических функций. Закон больших чисел. Особенности проверки статистических гипотез (критерия согласия w2 Мизеса).

    курсовая работа [1,0 M], добавлен 27.01.2012

  • Сходимость последовательностей случайных величин и вероятностных распределений. Метод характеристических функций. Проверка статистических гипотез и выполнение центральной предельной теоремы для заданных последовательностей независимых случайных величин.

    курсовая работа [364,8 K], добавлен 13.11.2012

  • Преобразование коэффициентов полиномов Чебышева. Функции, применяемые в численном анализе. Интерполяция многочленами, метод аппроксимации - сплайн-аппроксимация, ее отличия от полиномиальной аппроксимации Лагранжем и Ньютоном. Метод наименьших квадратов.

    реферат [21,5 K], добавлен 27.01.2011

  • Таблица значений выборки дискретных случайных величин в упорядоченном виде. Таблица интервального статистического ряда относительных частот. Задание эмпирической функции распределений и построение ее графика. Полигон и распределение случайной величины.

    практическая работа [109,3 K], добавлен 26.07.2012

  • Согласование выборочных распределений. Отбор статистических данных с помощью таблицы случайных чисел. Расчет числовых характеристик распределения выборочных частот. Проверка предположения, что распределение генеральной совокупности является нормальным.

    курсовая работа [276,6 K], добавлен 19.01.2016

  • Графическое изображение теоретической и эмпирической функций плотности распределения; критерии их согласования. Определение доверительных интервалов для математического ожидания. Расчет диапазона рассеивания значений при заданной вероятности риска.

    контрольная работа [519,8 K], добавлен 11.06.2011

  • Двумерная функция распределения вероятностей случайных величин. Понятие условной функции распределения и плотности распределения вероятностей. Корреляция двух случайных величин. Система произвольного числа величин, условная плотность распределения.

    реферат [325,3 K], добавлен 23.01.2011

  • Оценка неизвестных величин по результатам измерений, содержащим случайные ошибки, при помощи метода наименьших квадратов. Аппроксимация многочленами, обзор существующих методов аппроксимации. Математическая постановка задачи аппроксимации функции.

    курсовая работа [1,9 M], добавлен 12.02.2013

  • Изучение сути и выдвижение предположения о законе распределения вероятности экспериментальных данных. Понятие и оценка асимметрии. Принятие решения о виде закона распределения вероятности результата. Переход от случайного значения к неслучайной величине.

    курсовая работа [126,0 K], добавлен 27.04.2013

  • Понятие математического моделирования: выбор чисел случайным образом и их применение. Критерий частот, серий, интервалов, разбиений, перестановок, монотонности, конфликтов. Метод середины квадратов. Линейный конгруэнтный метод. Проверка случайных чисел.

    контрольная работа [55,5 K], добавлен 16.02.2015

  • Изучение аппроксимации таблично заданной функции методом наименьших квадратов при помощи вычислительной системы Mathcad. Исходные данные и функция, вычисляющая матрицу коэффициентов систему уравнений. Выполнение вычислений для разных порядков полинома.

    лабораторная работа [166,4 K], добавлен 13.04.2016

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.