Закон больших чисел. Критерий однородности Смирнова
Сходимость последовательностей случайных величин и вероятностных распределений. Закон больших чисел. Основные задачи математической статистики, их краткая характеристика. Проверка статистических гипотез: основные понятия. Критерий однородности Смирнова.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 10.06.2013 |
Размер файла | 1,2 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
41
Размещено на http://www.allbest.ru/
Курсовая работа
на тему
Закон больших чисел. Критерий однородности Смирнова
ст. гр. ПМ-09-1
Мозговой Н.В.
Введение
Математическая статистика - это прикладная математическая дисциплина, родственная теории вероятностей. Она базируется на понятиях и методах последней, но решает свои специфические задачи своими методами. Любая математическая теория развивается в рамках некоторой модели, описывающей определенный круг реальных явлений, изучением которых и занимается данная теория. За последние годы отделилась в самостоятельные дисциплины теория надежности, теория массового обслуживания и теория информации.
Статистический анализ является необходимым этапом анализа и исследования любой производственно-хозяйственной, финансовой или коммерческой деятельности как отдельной фирмы, организации или предприятия, так и совокупности предприятий и организаций, отрасли или страны, в целом.
Курс «Теория вероятностей и математическая статистика» занимает особое место в системе математических дисциплин, которые изучаются студентами специальностей ПМ, СА, ИНФ, как базовый курс.
Целью данной курсовой работы является углубление теоретических знаний с курса «Теория вероятностей и математическая статистика», а именно, по теме: «Закон больших чисел» и «Критерий однородности Смирнова»; развить навыки самостоятельной работы; приобрести навыки самостоятельной работы с необходимыми литературными источниками; научится применять теоретические знания для решения практических заданий.
1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ
1.1 Предельные теоремы теории вероятностей
1.1.1 Сходимость последовательностей случайных величин и вероятностных распределений
В теории вероятностей приходится иметь дело с разными видами сходимости случайных величин. Рассмотрим следующие основные виды сходимости: по вероятности, с вероятностью единица, среднем порядка р, по распределению.
Пусть , , … - случайные величины, заданные на некотором вероятностном пространстве (, Ф , P).
Определение 1. Последовательность случайных величин , … называется сходящейся по вероятности к случайной величине (обозначение: ), если для любого > 0
P { >} 0, n.
Определение 2. Последовательность случайных величин , , … называется сходящейся с вероятностью единица (почти наверное, почти всюду) к случайной величине , если
P {: } = 0,
т.е. если множество исходов , для которых () не сходятся к (), имеет нулевую вероятность.
Этот вид сходимости обозначают следующим образом: , или , или .
Определение 3. Последовательность случайных величин , , … называется сходящейся в среднем порядка р, 0 < p < , если
M 0, n.
Определение 4. Последовательность случайных величин , ,… называется сходящейся по распределению к случайной величине (обозначение: ), если для любой ограниченной непрерывной функции
M M, n.
Сходимость по распределению случайных величин определяется только в терминах сходимости их функций распределения. Поэтому об этом виде сходимости имеет смысл говорить и тогда, когда случайные величины заданы на разных вероятностных пространствах.
Теорема 1.
а) Для того чтобы (Р-п.н.), необходимо и достаточно, чтобы для любого > 0
P { } 0, n.
b) Последовательность {} фундаментальна с вероятностью единица тогда и только тогда, когда для любого > 0.
P { } 0, n.
Доказательство.
а) Пусть
А = {: |- | }, А= А .
Тогда
{: }= =
Но
P () = P ( ),
поэтому утверждение а) является результатом следующей цепочки импликаций:
Р{: }= 0 P( ) = 0 = 0 Р(А) = 0, m 1
P(A) = 0, > 0 P() 0, n 0, > 0 P{ } 0, n 0, > 0.
b) Обозначим
= {: }, = ,
тогда {: {()} не фундаментальна } = и так же, как в а) показывается, что {: {()} не фундаментальна } = 0
P{ } 0, n.
Теорема доказана.
Теорема 2 (критерий Коши сходимости почти наверно).
Для того чтобы последовательность случайных величин {} была сходящейся с вероятностью единица (к некоторой случайной величине ), необходимо и достаточно, чтобы она была фундаментальна с вероятностью единица.
Доказательство.
Если
, то +
откуда вытекает необходимость условия теоремы.
Пусть теперь последовательность {} фундаментальна с вероятностью единица. Обозначим L = {: {()} не фундаментальная}. Тогда для всех числовая последовательность {} является фундаментальной и, согласно критерию Коши для числовых последовательностей, существует (). Положим
() =
Так определенная функция является случайной величиной и .
Теорема доказана.
1.1.2 Метод характеристических функций
Метод характеристических функций является одним из основных средств аналитического аппарата теории вероятностей. Наряду со случайными величинами (принимающими действительные значения) теория характеристических функций требует привлечения комплекснозначных случайных величин.
Многие из определений и свойств, относящихся к случайным величинам, легко переносятся и на комплексный случай. Так, математическое ожидание Мо комплекснозначной случайной величины ж=о+Яз считается определенным, если определены математические ожидания Мо и Мз. В этом случае по определению полагаем
Мж = Мо + ЯМз.
Из определения независимости случайных элементов следует, что комплекснозначные величины ж1 =о1+Яз1 , ж2=о2+Яз2 независимы тогда и только тогда, когда независимы пары случайных величин (о1 , з1) и (о2 , з2), или, что то же самое, независимы у-алгебры Fо1, з1 и Fо2, з2.
Наряду с пространством L2 действительных случайных величин с конечным вторым моментом можно ввести в рассмотрение гильбертово пространство комплекснозначных случайных величин ж=о+Яз с М |ж|2<?, где |ж|2= о2+з2, и скалярным произведением (о1 , о2)= Мж1ж2Ї, где ж2Ї- комплексно-сопряженная случайная величина.
При алгебраических операциях векторы Rn рассматриваются как алгебраические столбцы,
,
- как вектор-строки, a* - (а1,а2,…,аn). Если Rn , то под их скалярным произведением (a,b) будет пониматься величина . Ясно, что .
Если аRn и R=||rij|| - матрица порядка nхn, то
=. (1)
Определение 1. Пусть F = F(х1,….,хn) - n-мерная функция распределения в (, ( )). Ее характеристической функцией называется функция
. (2)
Определение 2. Если о = (о1,…,оn) - случайный вектор, определенный на вероятностном пространстве со значениями в , то его характеристической функцией называется функция
, (3)
где Fо = Fо(х1,….,хn) - функция распределения вектора о=(о1, … , оn).
Если функция распределения F(х) имеет плотность f = f(х), то тогда
.
В этом случае характеристическая функция есть не что иное, как преобразование Фурье функции f(x).
Из (3) вытекает, что характеристическую функцию цо(t) случайного вектора можно определить также равенством
. (4)
Основные свойства характеристических функций (в случае n=1).
Пусть о = о(щ) - случайная величина, Fо = Fо (х) - её функция распределения и - характеристическая функция.
Следует отметить, что если
,
то .
Поэтому
. (5)
Далее, если о1, о2, … , оn - независимые с. в. и Sn= о1+о2 +… + оn, то
. (6)
В самом деле,
,
где воспользовались тем, что математическое ожидание произведения независимых (ограниченных) случайных величин равно произведению их математических ожиданий.
Свойство (6) является ключевым при доказательстве предельных теорем для сумм независимых случайных величин методом характеристических функций. В этой связи, функция распределения выражается через функции распределения отдельных слагаемых уже значительно более сложным образом, а именно, где знак * означает свертку распределений.
С каждой функцией распределения в можно связать случайную величину, имеющую эту функцию в качестве своей функции распределения. Поэтому при изложении свойств характеристических функций можно ограничиться рассмотрением характеристических функций случайных величин .
Теорема 1. Пусть о - случайная величина с функцией распределения F=F(х) и - ее характеристическая функция.
Имеют место следующие свойства:
1) |
2) равномерно непрерывна по ;
3) ;
4) является действительнозначной функцией тогда и только тогда, когда распределение F симметрично
();
5) если для некоторого n ? 1 , то при всех существуют производные и
,
где и
6) Если существует и является конечной , то
7) Пусть для всех n ? 1 и
тогда при всех |t|<R
Следующая теорема показывает, что характеристическая функция однозначно определяет функцию распределения.
Теорема 2 (единственности). Пусть F и G - две функции распределения, имеющие одну и ту же характеристическую функцию, то есть для всех
Тогда .
Теорема говорит о том, что функция распределения F = F(х) однозначно восстанавливается по своей характеристической функции . Следующая теорема дает явное представление функции F через .
Теорема 3 (формула обобщения). Пусть F = F(х) - функция распределения и - ее характеристическая функция.
а) Для любых двух точек a, b (a < b), где функция F = F(х) непрерывна,
b) eсли то функция распределения F(х) имеет плотность f(x),
.
Теорема 4. Для того чтобы компоненты случайного вектора были независимы, необходимо и достаточно, чтобы его характеристическая функция была произведением характеристических функций компонент:
.
Теорема Бохнера-Хинчина. Пусть - непрерывная функция, Для того, чтобы была характеристической, необходимо и достаточно, чтобы она была неотрицательно-определенной, то есть для любых действительных t1, … , tn и любых комплексных чисел
.
Теорема 5. Пусть - характеристическая функция случайной величины . а) Если для некоторого , то случайная величина является решетчатой с шагом , то есть
где а - некоторая константа.
b) Если для двух различных точек , где - иррациональное число, то случайная величина о является вырожденной:
,
где а - некоторая константа.
с) Если , то случайная величина о вырождена.
1.1.3 Закон больших чисел
Пусть n - последовательность случайных величин, для которых существуют Мn. Законом больших чисел называются теоремы, утверждающие, что разность
сходится к нулю по вероятности.
Теорема Чебышева. Пусть n - последовательность независимых случайных величин, Мn=a, Dn ? c. Тогда
.
Доказательство. Докажем даже больше, что в среднеквадратическом. Так как , то на основании свойств последовательностей сходящихся по вероятности [Для того, чтобы последовательность n сходилась в среднеквадратическом к некоторой постоянной с, необходимо и достаточно, чтобы ], для доказательства теоремы достаточно показать, что . Вследствие независимости величин k
.
Следствие. Пусть - последовательность независимых случайных величин такая, что
, n=1, 2, …
Тогда для каждого > 0
.
Этот частный случай теоремы Чебышева дает обоснование правилу среднего арифметического в теории обработки результатов измерений. Предположим, что нужно измерить некоторую физическую величину а. Повторив измерения n раз в одинаковых условиях, наблюдатель получает результаты измерений В качестве приближенного значения а принимается среднее арифметическое результатов измерений
.
Если наблюдения лишены систематической ошибки, т. е. Мn = а, то согласно сформулированному выше следствию,
.
Теорема Хинчина. Если {n} -- последовательность независимых одинаково распределенных случайных величин, то закон больших чисел к такой последовательности применим и без предположения о существовании дисперсий. Имеет место следующее утверждение.
Теорема Хинчина. Пусть {n} -- последовательность независимых одинаково распределенных величин, имеющих конечное математическое ожидание Мn = а. Тогда для каждого е > 0
.
Теорема Бернулли. Рассмотрим еще один частный случай теоремы Чебышева. Пусть имеем последовательность испытаний, в каждом из которых может быть два исхода -- успех У (с вероятностью р) или неудача Н (с вероятностью q=1--р) независимо от исходов других испытаний. Образуем последовательность случайных величин следующим образом. Пусть k = 1, если в k-м испытании произошел успех, и k = 0, если в k-м испытании произошла неудача. Тогда {k} есть последовательность независимых одинаково распределенных случайных величин, Мn = р, . Случайная величина
представляет собой частоту появления успеха в первых п испытаниях. Так как для последовательности {k} выполнены условия теоремы Чебышева, то мы из теоремы Чебышева получаем следующее утверждение.
Теорема Бернулли. Для любого е > 0 при .
Смысл этого утверждения состоит в том, что введенное нами определение вероятности соответствует интуитивному пониманию вероятности как предела частоты.
Многочлены Бернштейна. Закон больших чисел можно использовать для доказательства известной из курса математического анализа теоремы Вейерштрасса о равномерном приближении непрерывной функции многочленами.
Предположим, что производятся независимые испытания, в каждом из которых может произойти либо событие А (успех) с вероятностью х, либо противоположное событие (неудача) с вероятностью 1 -- х (0 < х < 1). Пусть -- число появлений А при п испытаниях, a f (х) -- непрерывная функция на [0, 1]. Как известно,
.
Поэтому
. (1)
Многочлен Вп(х) называется многочленом Бернштейна для функции f(x).
Выше мы отметили, что . Естественно ожидать, что при . Докажем следующее утверждение.
Теорема Бернштейна. Последовательность многочленов Вn(х), определенных равенством (1), сходится к функции f(х) равномерно относительно х [0, 1].
Так как f (х) равномерно непрерывна на [0,1], то для каждого е > 0 найдется такое, что , как только . Функция f(x) ограничена на [0,1]. Поэтому существует такая постоянная С, что |f(x)|? C для всех х [0,1]. Заметим также, что
.
Поэтому
и имеем далее
,
.
Вследствие неравенства Чебышева,
.
Пусть такое, что . Тогда при
при всех х [0,1]. Теорема доказана.
1.2 Проверка статистических гипотез
1.2.1 Основные задачи математической статистики их краткая характеристика
Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении статистических данных - результатах наблюдений. Первая задача математической статистики - указать способы сбора и группировки статистических сведений. Вторая задача математической статистики - разработать методы анализа статистических данных, в зависимости от целей исследования.
При решении любой задачи математической статистики располагают двумя источниками информации. Первый и наиболее определенный(явный) - это результат наблюдений (эксперимента) в виде выборки из некоторой генеральной совокупности скалярной или векторной случайной величины. При этом объем выборки n может быть фиксирован, а может и увеличиваться в ходе эксперимента (т. е. могут использоваться так называемые последовательные процедуры статистического анализа).
Второй источник - это вся априорная информация об интересующих свойствах изучаемого объекта, которая накоплена к текущему моменту. Формально объем априорной информации отражается в той исходной статистической модели, которую выбирают при решении задачи. Однако и о приближенном в обычном смысле определении вероятности события по результатам опытов говорить не приходится. Под приближенным определением какой-либо величины обычно подразумевают, что можно указать пределы погрешностей, из которых ошибка не выйдет. Частота же события случайна при любом числе опытов из-за случайности результатов отдельных опытов. Из-за случайности результатов отдельных опытов частота может значительно отклоняться от вероятности события. Поэтому, определяя неизвестную вероятность события как частоту этого события при большом числе опытов, не можем указать пределы погрешности и гарантировать, что ошибка не выйдет из этих пределов. Поэтому в математической статистике обычно говорят не о приближенных значениях неизвестных величин, а об их подходящих значениях, оценках.
Задача оценивания неизвестных параметров возникает в тех случаях, когда функция распределения генеральной совокупности известна с точностью до параметра . В этом случае необходимо найти такую статистику , выборочное значение которой для рассматриваемой реализации xn случайной выборки можно было бы считать приближенным значением параметра . Статистику , выборочное значение которой для любой реализации xn принимают за приближенное значение неизвестного параметра , называют его точечной оценкой или просто оценкой, а - значением точечной оценки. Точечная оценка должна удовлетворять вполне определенным требованиям для того, чтобы её выборочное значение соответствовало истинному значению параметра .
Возможным является и иной подход к решению рассматриваемой задачи: найти такие статистики и ,чтобы с вероятностью г выполнялось неравенство:
P { } = г.
В этом случае говорят об интервальной оценке для . Интервал () называют доверительным интервалом для с коэффициентом доверия г. Оценив по результатам опытов ту или иную статистическую характеристику, возникает вопрос: насколько согласуется с опытными данными предположение (гипотеза) о том, что неизвестная характеристика имеет именно то значение, которое получено в результате её оценивания? Так возникает второй важный класс задач математической статистики - задачи проверки гипотез.
В некотором смысле задача проверки статистической гипотезы является обратной к задаче оценивания параметра. При оценивании параметра мы ничего не знаем о его истинном значении. При проверке статистической гипотезы из каких-то соображений предполагается известным его значение и необходимо по результатам эксперимента проверить данное предположение.
Во многих задачах математической статистики рассматриваются последовательности случайных величин , сходящиеся в том или ином смысле к некоторому пределу (случайной величине или константе), когда .
Таким образом, основными задачами математической статистики являются разработка методов нахождения оценок и исследования точности их приближения к оцениваемым характеристикам и разработка методов проверки гипотез.
1.2.2 Проверка статистических гипотез: основные понятия
Задача разработки рациональных методов проверки статистических гипотез - одна из основных задач математической статистики. Статистической гипотезой (или просто гипотезой) называют любое утверждение о виде или свойствах распределения наблюдаемых в эксперименте случайных величин.
Пусть имеется выборка , являющаяся реализацией случайной выборки из генеральной совокупности , плотность распределения которой зависит от неизвестного параметра .
Статистические гипотезы относительно неизвестного истинного значения параметра называют параметрическими гипотезами. При этом если - скаляр, то речь идет об однопараметрических гипотезах, а если вектор - то о многопараметрических гипотезах.
Статистическую гипотезу называют простой, если она имеет вид
где - некоторое заданное значение параметра.
Статистическую гипотезу называют сложной, если она имеет вид
где - некоторое множество значений параметра , состоящее более чем из одного элемента.
В случае проверки двух простых статистических гипотез вида
где - два заданных (различных) значения параметра, первую гипотезу обычно называют основной, а вторую - альтернативной, или конкурирующей гипотезой.
Критерием, или статистическим критерием, проверки гипотез называют правило, по которому по данным выборки принимается решение о справедливости либо первой, либо второй гипотезы. Критерий задают с помощью критического множества , являющегося подмножеством выборочного пространства случайной выборки . Решение принимают следующим образом:
1) если выборка принадлежит критическому множеству , то отвергают основную гипотезу и принимают альтернативную гипотезу ;
2) если выборка не принадлежит критическому множеству (т. е. принадлежит дополнению множества до выборочного пространства ), то отвергают альтернативную гипотезу и принимают основную гипотезу .
При использовании любого критерия возможны ошибки следующих видов:
1) принять гипотезу , когда верна - ошибка первого рода;
2) принять гипотезу , когда верна - ошибка второго рода.
Вероятности совершения ошибок первого и второго рода обозначают и :
где - вероятность события при условии, что справедлива гипотеза Указанные вероятности вычисляют с использованием функции плотности распределения случайной выборки :
Вероятность совершения ошибки первого рода также называют уровнем значимости критерия.
Величину , равную вероятности отвергнуть основную гипотезу , когда она верна, называют мощностью критерия.
1.2.3 Критерий однородности Смирнова
Предполагается, что функции распределения и являются непрерывными. Статистика критерия Смирнова измеряет различие между эмпирическими функциями распределения, построенными по выборкам
.
При практическом использовании критерия значение статистики рекомендуется вычислять в соответствии с соотношениями [3]
,
,
.
Если гипотеза справедлива, то при неограниченном увеличении объемов выборок , т.е. статистика
(1)
в пределе подчиняется распределению Колмогорова . Однако при ограниченных значениях m и n случайные величины и являются дискретными, и множество их возможных значений представляет собой решетку с шагом , где k наименьшее общее кратное m и n. Для значений таблицы процентных точек для статистики приводятся в [3]. Условное распределение статистики при справедливости гипотезы медленно сходится к и существенно отличается от него при не очень больших m и n.
На рис. 1 показаны условные распределения статистики (1) при справедливости в зависимости от m и n (при m=n). Как следует из полученной картины, даже при и ступенчатость сохраняется. Другим недостатком применения критерия со статистикой (1) является то (см. рис. 1), что распределения с ростом m и n приближаются к предельному распределению слева.
Рис. 1. Распределения статистики (1) при справедливости в зависимости от m и n
Гладкость распределения статистики сильно зависит от величины k. Поэтому предпочтительнее применять критерий, когда объемы выборок m и n не равны и представляют собой взаимно простые числа. В таких случаях наименьшее общее кратное m и n максимально и равно , а распределение статистики существенно больше напоминает непрерывную функцию распределения. И вот тогда при небольших и умеренных значениях m и n проявляется существенное отличие распределения от предельного , так как заметно сдвинуто влево от .
В этой связи можно предложить следующую простую модификацию статистики (1),
, (2)
у которой практически отсутствует последний недостаток. Условные распределения статистики (2) при справедливости в зависимости от m и n (при m=n) иллюстрирует рис. 2.
Рис. 2. Распределения статистики (2) при справедливости в зависимости от m и n
Как было сказано выше, гладкость распределения статистики зависит от величины k. В качестве иллюстрации этого факта и различий в распределениях статистик (1) и (2) на рис. 3 приведено предельное распределение Колмогорова и полученные в результате моделирования эмпирические распределения статистики (1) и статистики (2) при m=61 и n=53 . Как видим, распределение статистики (1) существенно отличается от распределения Колмогорова , а распределение статистики (2) визуально практически совпадает с ним. Объем выборок смоделированных значений статистик в данном случае, как и во всех остальных в данной работе, составил 10000 наблюдений. При проверке согласия полученного эмпирического распределения статистики (2) с распределением Колмогорова достигнутые уровни значимости по соответствующим критериям составили: 0.72 по критерию Пирсона (при 10 равновероятных интервалах), 0.83 по критерию Колмогорова, 0.97 по критерию Крамера-Мизеса-Смирнова, 0.94 по критерию Андерсона-Дарлинга.
Рис. 3. Распределения статистики (1) и (2) при справедливости , m=61 и n=53
Использование в критерии Смирнова со статистикой (2) взаимно простых m и n делает более обоснованным вычисление достигаемого уровня значимости
,
где - значение статистики (2), найденное при проверке гипотезы по конкретным выборкам, в соответствии с распределением Колмогорова: .
Соответственно, более правомерно применение в критерии процентных точек (квантилей) распределения Колмогорова. Этого нельзя сказать относительно критерия Смирнова со статистикой (1), так как в этом случае критические значения, определяемые по распределению Колмогорова, оказываются завышенными по сравнению с истинными. Следовательно, проверяемая гипотеза может необоснованно приниматься (не отклоняться).
Коэффициент 4.6 в статистике (2) подобран эмпирически. Он удовлетворительно действует от малых до очень приличных объемов выборок (m= =n =1000). Однако при больших значениях наименьшего общего кратного m и n, когда они представляют собой взаимно простые числа, величина этого коэффициента должна быть несколько уменьшена. Например, при простых m=641 и n=643 коэффициент 4.6 следует заменить на 3.4.
Ниже при исследовании мощности критерия Смирнова рассматривались распределения статистики (1). Но все выводы относительно мощности справедливы и для критерия со статистикой (2), так как все распределения при одинаковых объемах выборок оказываются сдвинутыми на одну и ту же величину.
Предвосхищая вопросы о точности, отметим, что для проверки соответствия результатов моделирования нами специально моделировались распределения статистики . Результаты показали полное совпадение критических значений, получаемых в процессе моделирования, с точными критическими значениями статистики.
В данной работе мощность критериев проверки однородности исследовалась при ряде альтернатив. Для определенности гипотезе соответствовала принадлежность выборок одному и тому же стандартному нормальному закону распределения с плотностью
с параметрами сдвига и масштаба . При всех альтернативах первая выборка всегда соответствовала стандартному нормальному закону, а вторая - некоторому другому. В частности, в случае гипотезы вторая выборка соответствовала нормальному закону с параметром сдвига и параметром масштаба . В случае гипотезы - нормальному закону с параметрами и . В случае гипотезы - нормальному закону с параметрами и . В случае гипотезы - нормальному закону с параметрами и . В случае гипотезы - вторая выборка соответствовала логистическому закону с плотностью
\
и параметрами и . Нормальный и логистический законы очень близки и трудно различимы с помощью критериев согласия. На рис. 4 представлены полученные в результате моделирования условные распределения статистики при справедливости , на основании которых можно оценить значения мощности при различных значениях объемов выборок m и n.
Рис. 4. Распределения статистики (1) при справедливости
Аналогичным образом при различных объемах выборок были построены условные распределения статистики (1) при справедливости других рассматриваемых альтернатив: , , . На основании этих распределений и предельного распределения статистики = были вычислены значения мощности критерия относительно различных альтернатив. Найденные значения мощности критерия Смирнова, где - вероятность ошибки второго рода, относительно рассматриваемых конкурирующих гипотез ч при различных объемах выборок для уровней значимости (вероятностей ошибок первого рода) =0.1, 0.05, 0.025 представлены в таблице 1.
Таблица 1. Мощность критерия однородности Смирнова относительно ч в зависимости от объемов выборок (m=n )
Уровень значимости |
Значения мощности относительно альтернативы |
|||||||
n=20 |
n=50 |
n=100 |
n=300 |
n=500 |
n=1000 |
n=2000 |
||
0,1 |
0,0937 |
0,1480 |
0,1766 |
0,2775 |
0,3806 |
0,6171 |
0,8688 |
|
0,05 |
0,0410 |
0,0569 |
0,0944 |
0,1883 |
0,2682 |
0,4899 |
0,7762 |
|
0,025 |
0,0410 |
0,0344 |
0,0505 |
0,1163 |
0,1829 |
0,3859 |
0,6737 |
|
Значения мощности относительно альтернативы |
||||||||
0,1 |
0,3457 |
0,7200 |
0,9332 |
1 |
1 |
1 |
1 |
|
0,05 |
0,2202 |
0,5341 |
0,8722 |
0,9996 |
1 |
1 |
1 |
|
0,025 |
0,2202 |
0,4328 |
0,7842 |
0,9992 |
1 |
1 |
1 |
|
Значения мощности относительно альтернативы |
||||||||
0,1 |
0,0884 |
0,1229 |
0,1257 |
0,1466 |
0,1856 |
0,2967 |
0,5508 |
|
0,05 |
0,0352 |
0,0458 |
0,0630 |
0,0789 |
0,1024 |
0,1677 |
0,3520 |
|
0,025 |
0,0352 |
0,0257 |
0,0280 |
0,0410 |
0,0518 |
0,0967 |
0,2098 |
|
Значения мощности относительно альтернативы |
||||||||
0,1 |
0,1396 |
0,2986 |
0,5213 |
0,9609 |
0,9989 |
1 |
1 |
|
0,05 |
0,0570 |
0,1268 |
0,3161 |
0,8977 |
0,9952 |
1 |
1 |
|
0,025 |
0,0570 |
0,0763 |
0,1689 |
0,7738 |
0,9786 |
1 |
1 |
|
Значения мощности относительно альтернативы |
||||||||
0,1 |
0,0836 |
0,1209 |
0,1308 |
0,1568 |
0,1976 |
0,3191 |
0,5639 |
|
0,05 |
0,0341 |
0,0455 |
0,0673 |
0,0891 |
0,1158 |
0,1879 |
0,3754 |
|
0,025 |
0,0341 |
0,0258 |
0,0316 |
0,0471 |
0,0618 |
0,1119 |
0,2390 |
Подчеркнем, что значения мощностей, приведенные в таблице 1, получены относительно ()-квантилей предельного распределения Колмогорова . Вследствие того, что распределения статистики (1) существенно отличаются от , действительные уровни значимости отличаются от заданных =0.1, 0.05, 0.025.
В таблице 2 приведены действительные уровни значимости для критерия Смирнова, соответствующие значениям мощности, представленным в таблице 1. Вследствие ступенчатости действительные значения особенно сильно отличаются от задаваемых при малых объемах выборок. Например, для m=n=20 при задаваемом уровне значимости 0.1 мы имеем действительный уровень значимости 0.0835.
Таблица 2. Действительные уровни значимости критерия однородности Смирнова, соответствующие (1-)-квантилям распределения Колмогорова, в зависимости от объемов выборок (m=n)
Заданный уровень значимости |
Действительные уровни значимости |
|||||||
n=20 |
n=50 |
n=100 |
n=300 |
n=500 |
n=1000 |
n=2000 |
||
0,1 |
0,0835 |
0,1120 |
0,1085 |
0,0927 |
0,0970 |
0,0980 |
0,1041 |
|
0,05 |
0,0334 |
0,0410 |
0,0543 |
0,0496 |
0,0514 |
0,0471 |
0,0480 |
|
0,025 |
0,0334 |
0,0240 |
0,0252 |
0,0254 |
0,0238 |
0,0259 |
0,0245 |
2. ПРАКТИЧЕСКАЯ ЧАСТЬ
2.1 Решения задач о типах сходимости
2.1.1 Доказать, что из сходимости почти наверное следует сходимость по вероятности
Приведите контрпример, показывающий, что обратное утверждение неверно.
Решение. Пусть последовательность случайных величин сходится к случайной величине почти наверное. Значит, для любого
и из сходимости к почти наверное вытекает, что сходится к по вероятности, так как в этом случае
Но обратное утверждение неверно. Пусть последовательность независимых случайных величин, имеющих одну и ту же функцию распределения , равную нулю при и равную при . Рассмотрим последовательность
Эта последовательность сходится к нулю по вероятности, так как
стремится к нулю при любом фиксированном и . Однако сходимость к нулю почти наверное иметь место не будет.
Действительно,
стремится к единице, то есть с вероятностью 1 в последовательности при любых и найдутся реализации, превосходящие
2.1.2 Пусть монотонная последовательность. Доказать, что в этом случае сходимость к по вероятности влечет за собой сходимость к с вероятностью 1
Решение. Пусть монотонно убывающая последовательность, то есть . Для упрощения наших рассуждений будем считать, что , при всех . Пусть сходится к по вероятности, однако сходимость почти наверное не имеет место. Тогда существует , такое, что при всех
что противоречит сходимости к по вероятности. Таким образом, для монотонной последовательности , сходящейся к по вероятности, имеет место и сходимость с вероятность 1 (почти наверное).
2.1.3 Пусть последовательность сходится к по вероятности. Доказать, что из этой последовательности можно выделить подпоследовательность , сходящуюся к с вероятностью 1 при .
Решение Пусть некоторая последовательность
положительные числа, что ряд . Построим последовательность
индексов , выбирая так, чтобы
Тогда ряд
то есть, как следует из предыдущей задачи, .
2.1.4 Доказать, что из сходимости в среднем какого-либо положительного порядка следует сходимость по вероятности. Приведите контрпример, показывающий, что обратное утверждение неверно
Решение. Пусть последовательность сходится к величине в среднем порядка
Воспользуемся обобщенным неравенством Чебышева: для произвольного и
Устремив и учитывая, что , получим, что то есть сходится к по вероятности.
Однако сходимость по вероятности не влечет за собой сходимость в среднем порядка . Это показывает следующий пример. Рассмотрим вероятностное пространство , где , борелевская алгебра, мера Лебега.
Определим последовательность случайных величин следующим образом:
Последовательность сходится к 0 по вероятности, так как
но при любом
то есть сходимость в среднем иметь место не будет.
2.1.5 Пусть , причем для всех . Доказать, что в этом случае сходится к в среднеквадратическом
Решение
Заметим, что так как , то . Получим оценку для . Рассмотрим случайную величину . Пусть произвольное положительное число.
Тогда
и
при .
Значит
среднеквадратическом.
2.1.6 Доказать, что если сходится к по вероятности, то имеет место слабая сходимость . Приведите контрпример, показывающий, что обратное утверждение неверно
Решение
Докажем, что если , то в каждой точке , являющейся точкой непрерывности (это необходимое и достаточное условие слабой сходимости ), функция распределения величины , а величины .
Пусть точка непрерывности функции . Если , то справедливо по крайней мере одно из неравенств или . Тогда
Аналогично, при справедливо хотя бы одно из неравенств или и
или
Откуда
Если , то для сколь угодно малого существует такое , что при всех
Тогда
С другой стороны, если точка непрерывности , то можно найти такое , что для сколь угодно малого
и
Значит для сколь угодно малых и существует такое , что при
или
или, что-то же самое,
Это означает, что во всех точках непрерывности имеет место сходимость и . Следовательно, из сходимости по вероятности вытекает слабая сходимость.
Обратное утверждение, вообще говоря, не имеет места. Чтобы убедиться в этом, возьмем последовательность случайных величин , не равных с вероятностью 1 постоянным и имеющих одну и ту же функцию распределения . Считаем, что при всех величины и независимы. Очевидно, слабая сходимость имеет место, так как у всех членов последовательности одна и та же функция распределения. Рассмотрим :
Из независимости и одинаковой распределенности величин следует, что
математический статистика однородность критерий
то есть
Выберем среди всех функций распределений невырожденных случайных величин такую , будет отлично от нуля при всех достаточно малых . Тогда не стремится к нулю при ограниченном росте и сходимость иметь место не будет.
2.1.7 Пусть имеет место слабая сходимость , где с вероятностью 1 есть постоянная, доказать, что в этом случае будет сходится к по вероятности
Решение. Пусть с вероятностью 1 равно . Тогда слабая сходимость означает сходимость при любых . Так как , то при и при . То есть
любого вероятности
стремятся к нулю при .
Размещено на Allbest.ru
...Подобные документы
- Закон больших чисел. Проверка статистических гипотез (критерий согласия w2 Мизеса: простая гипотеза)
Предельные теоремы теории вероятностей. Сходимость последовательностей случайных величин и вероятностных распределений. Метод характеристических функций. Закон больших чисел. Особенности проверки статистических гипотез (критерия согласия w2 Мизеса).
курсовая работа [1,0 M], добавлен 27.01.2012 Сходимость последовательностей случайных величин. Центральная предельная теорема для независимых одинаково распределенных случайных величин. Основные задачи математической статистики, их характеристика. Проверка гипотез по критерию однородности Смирнова.
курсовая работа [1,6 M], добавлен 13.11.2012Сходимость последовательностей случайных величин и вероятностных распределений. Метод характеристических функций. Проверка статистических гипотез и выполнение центральной предельной теоремы для заданных последовательностей независимых случайных величин.
курсовая работа [364,8 K], добавлен 13.11.2012Основные понятия, которые касаются центральной предельной теоремы для независимых одинаково распределенных случайных величин и проверки статистических гипотез. Анализ сходимости последовательностей случайных величин и вероятностных распределений.
курсовая работа [582,0 K], добавлен 13.11.2012Критерий согласия – критерий проверки гипотезы о предполагаемом законе распределения генеральной совокупности. Критерий Колмогорова-Смирнова и его практическое применение. Критические значения статистик Стефенса. Критерии Пирсона и Смирнова-Крамера.
курсовая работа [629,9 K], добавлен 26.08.2012Теорема Бернулли как простейшая форма закона больших чисел. Предельные теоремы теории вероятностей и объяснение природы устойчивости частоты появлений события. Качественные и количественные утверждения закона больших чисел, его практическое применение.
курсовая работа [75,2 K], добавлен 17.12.2009Основные понятия математической статистики, интервальные оценки. Метод моментов и метод максимального правдоподобия. Проверка статистических гипотез о виде закона распределения при помощи критерия Пирсона. Свойства оценок, непрерывные распределения.
курсовая работа [549,1 K], добавлен 07.08.2013Описание случайных ошибок методами теории вероятностей. Непрерывные случайные величины. Числовые характеристики случайных величин. Нормальный закон распределения. Понятие функции случайной величины. Центральная предельная теорема. Закон больших чисел.
реферат [146,5 K], добавлен 19.08.2015Понятие математического моделирования: выбор чисел случайным образом и их применение. Критерий частот, серий, интервалов, разбиений, перестановок, монотонности, конфликтов. Метод середины квадратов. Линейный конгруэнтный метод. Проверка случайных чисел.
контрольная работа [55,5 K], добавлен 16.02.2015Представление доказательства неравенства Чебышева. Формулирование закона больших чисел. Приведение примера нахождения математического ожидания и дисперсии для равномерно распределенной случайной величины. Рассмотрение содержания теоремы Бернулли.
презентация [65,7 K], добавлен 01.11.2013Изучение основных подгрупп алгоритмов проверки простоты больших чисел: детерминированные и вероятностные проверки. Исследование методов генерации и проверки на простоту больших чисел с помощью метода Ферма (малая теорема Ферма), составление программы.
лабораторная работа [11,7 K], добавлен 27.12.2010Понятие математической статистики как науки о математических методах систематизации и использования статистических данных для научных и практических выводов. Точечные оценки параметров статистических распределений. Анализ вычисления средних величин.
курсовая работа [215,1 K], добавлен 13.12.2014Понятие вероятности, математического ожидания, закона больших чисел, динамика их развития. Введение аксиоматического определения понятия вероятности математического ожидания. Теоремы Бернулли и Пуассона как простейшие формы закона больших чисел.
дипломная работа [388,7 K], добавлен 23.08.2009Классификация случайных событий. Функция распределения. Числовые характеристики дискретных случайных величин. Закон равномерного распределения вероятностей. Распределение Стьюдента. Задачи математической статистики. Оценки параметров совокупности.
лекция [387,7 K], добавлен 12.12.2011Методы регистрации, описания и анализа статистических экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений. Обзор задач математической статистики. Закон распределения случайной величины. Проверка правдоподобия гипотез.
презентация [113,3 K], добавлен 01.11.2013Общая характеристика сходимости последовательностей случайных величин и вероятностных распределений. Значение метода характеристических функций в теории вероятностей. Методика решения задач о типах сходимости. Анализ теоремы Ляпунова и Линдеберга.
курсовая работа [2,6 M], добавлен 22.07.2011Закон сохранения количества чисел Джойнт ряда в натуральном ряду чисел как принцип обратной связи чисел в математике. Структура натурального ряда чисел. Изоморфные свойства рядов четных и нечетных чисел. Фрактальная природа распределения простых чисел.
монография [575,3 K], добавлен 28.03.2012Вивчення властивостей натуральних чисел. Нескінченість множини простих чисел. Решето Ератосфена. Дослідження основної теореми арифметики. Асимптотичний закон розподілу простих чисел. Характеристика алгоритму пошуку кількості простих чисел на проміжку.
курсовая работа [79,8 K], добавлен 27.07.2015Понятие, происхождение и предмет статистики с точки зрения современной науки и практики; стадии и методы статистического исследования, математическая составляющая. Метод главных компонент, его применение. Закон больших чисел, парадокс сэра Гиффена.
курсовая работа [955,2 K], добавлен 17.05.2012Числа натурального ряда, их закономерное периодическое изменение: сведение бесконечного к конечному путем выявления периодичности. Обоснование метода поиска простых чисел с помощью "решета" Баяндина. Закон динамического сохранения относительных величин.
книга [359,0 K], добавлен 28.03.2012