Теория вероятностей и математическая статистика

Поиск выборочных ковариации и коэффициента корреляции. Доверительный интервал для математического ожидания величины. Оценка параметров модели методом наименьших квадратов. Тестирование близости эмпирического распределения остатков моделей к нормальному.

Рубрика Математика
Вид контрольная работа
Язык русский
Дата добавления 10.11.2017
Размер файла 948,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

43

Размещено на http://www.allbest.ru/

Министерство Российской Федерации по связи и информатизации

Сибирский Государственный Университет Телекоммуникаций и Информатики

Межрегиональный центр переподготовки специалистов

ОТЧЕТ

по курсовой работе

"Теория вероятностей и математическая статистика"

2011

Часть I. Теория вероятностей и математическая статистика

Задача 1

В партии из N деталей ровно M бракованных. Дайте ответы на следующие вопросы (запишите формулы и сделайте вычисления с подробными объяснениями):

а) какова вероятность того, что наудачу выбранная деталь из партии окажется бракованной?

б) какова вероятность того, что наудачу выбранная деталь из партии окажется НЕ бракованной?

в) какова вероятность того, что из K1 случайно выбранных из партии деталей ровно L1 окажется бракованными?

г) какова вероятность того, что из K2 случайно выбранных из партии деталей не более L2 окажется бракованными?

д) какова вероятность того, что из K3 случайно выбранных из партии деталей не менее L3 окажется НЕ бракованными?

е) из партии выбрано случайно K4 деталей, из них L4 оказалось бракованными; какова вероятность, что больше в выборке нет бракованных деталей?

ж) из партии выбрано K5 деталей, и которых не менее L5 оказалось бракованными; какова вероятность того, что в последующей выборке из K6 деталей бракованных окажется не более L6 (предыдущая выборка в партию не возвращается)?

Числовые данные

N=140000, M=10920, K1=1097, L1=39, K2=1000, L2=10, K3=1107, L3=5, K4=517, L4=67, K5=917, L5=13, K6=423, L6=11

Решение:

a) Из N деталей можно выбрать один N способами, а один бракованный M способами, следовательно P=M/N=0.078.

б) Тут имеем событие, противоположенное событию из пункта а), => p=1-M/N= (N-M) /N=0.922.

в) Ясно, что если L1 > M, то невозможно, чтобы из K1 случайно выбранных деталей ровно L1 вышло бракованными. Пусть Из N деталей можно выбрать способами.

L1 бракованные детали надо выбрать из M, а остальные K1-L1 небракованные из N-M не бракованных. Количество выборов в 1-ом случае равно , во втором случае =>

По принцыпу умножения получим число выборов, в которых ровно L1 бракованные:

г) Если то ясно что в любой выборке не более M => не более L2 элементов не бракованные. Пусть L2 < M. Из N элементов можно выбрать K2, способами. Пусть

любое целое число. Пусть X - число бракованных элементов среди выбранных K2. Найдем Из M бракованных элементов можно выбрать способами, из N-M не бракованных можно выбрать остальные способами => по принцыпу умножения получим:

д) Если

Аналогично получим:

е) Тут речь идет о условной вероятности Аналогично пункта д) и используя формулу Байеса, получим:

.

ж) В данной задаче проведено два эксперимента:

I. Выбрали деталей из N;

II. Выбрали деталей из .

У первого эксперимента может быть исхода. Результаты второго эксперимента зависят от результатов первого.

Вероятность в первом эксперименте выбрать одну бракованную деталь равна . Пусть в первом эксперименте выбрали s бракованных деталей, . Вероятность выбрать s бракованных деталей в первом эксперименте (обозначим это событие ) можно вычислить по формуле Бернулли: , где . События составляют полную группу событий.

После проведения первого эксперимента в партии осталось деталей, из них бракованных. Вероятность выбрать одну бракованную деталь во втором эксперименте равна . Вероятность выбрать во втором эксперименте r бракованных деталей при условии, что в первом эксперименте их было s штук, равна , . Вероятность выбрать во втором эксперименте от 0 до () бракованных деталей при условии можно вычислить как сумму вероятностей событий {выбрали r бракованных деталей}, , то есть по формуле . Далее по формуле полной вероятности вычисляем вероятность события {выбрали от 0 до бракованных деталей}:

. Результат получен с помощью программы в математическом пакете Maple:

> P: =0: PHss: =0: for s from 13 to 917 do

PHs: =binomial (K5, s) *p^s*q^ (K5-s); #P (H_s)

p_s: = (M-s) / (N-K5);

q_s: =1-p_s;

P: =P+PHs*sum (binomial (K6, r) *p_s^r*q_s^ (K6-r), r=0. L6); # прибавляем P (H_s) *P (L_6|s) od:

Задача 2

"Неправильную" монетку (вероятность выпадения "орла" составляет A) подбрасывают N раз. Рассматриваются следующие величины: x - количество выпавших "орлов", y - количество выпавших "решек", , , . Ответьте на следующие вопросы об этих случайных величинах:

а) опишите распределения с. в. x, y, z1, z2, z3; найдите математические ожидания, вторые моменты, дисперсии;

б) опишите условное распределение с. в. x|y;

в) в процессе подбрасывания на M-том броске оказалось, что уже выпало ровно L "орлов", какова вероятность того, что всего выпадет не более K решек?

г) найдите ковариацию и коэффициент корреляции величин x и y;

д) найдите ковариацию и коэффициент корреляции величин x2 и y;

Числовые данные

A=0,69; N=252; M=142; L=80; K=55

Решение а) опишите распределения с. в. x, y, z1, z2, z3; найдите математические ожидания, вторые моменты, дисперсии;

Решение. В данной задаче идет речь о независимых испытаниях () в каждом из которых событие А - выпал "орел" может появиться с вероятностью 0,69, а событие В - выпала "решка" с вероятностью 0, 31.

Случайные величины: x - количество выпавших "орлов", y - количество выпавших "решек" распределены по биномиальному закону:

вероятность того, что случайная величина примет значение, равное может быть вычислена по формуле

,

вероятность того, что случайная величина примет значение, равное может быть вычислена по формуле

.

Для того, чтобы найти математические ожидания, вторые моменты и дисперсии данных случайных величин, составим их производящие функции. Так как формула Бернулли получается из разложения бинома Ньютона, то очевидно, что

- производящая функция случайной величины ,

- производящая функция случайной величины .

Тогда для случайной величины имеем:

,

,

.

Тогда для случайной величины имеем:

,

,

.

.

Случайная величина - постоянная величина, принимающая значение, равное 252 с вероятностью 1.

Поэтому , . Случайная величина

, поэтому ,

.

б) опишите условное распределение с. в. x|y;

Решение. Вероятность может принимать только два значения.

, если и , если .

в) в процессе подбрасывания на 142-том броске оказалось, что уже выпало ровно 80 "орлов", какова вероятность того, что всего выпадет не более 55 решек?

Решение. Найдем вероятность того, что событие А - выпал "орел" в 142 испытаниях произошло ровно 80 раз. Для этого воспользуемся локальной формулой Лапласа:

, .

В нашем случае , , , .

Поэтому ,

.

.

Найдем вероятность того, что в 252 подбрасываниях выпадет не более 55 "решек", т.е. не менее 197 "орлов", используя интегральную формулу Лапласа

, , .

В нашем случае , , , .

Поэтому

,

.

.

Найдем вероятность того, что всего выпадет не менее 197 "орлов" при условии, что на 142-том броске уже выпало ровно 80 "орлов".

.

г) найдите ковариацию и коэффициент корреляции величин x и y;

Решение. Ковариация двух случайных величин может быть найдена по формуле

.

Так как , то .

.

Поэтому

.

Следовательно,

.

Вычислим коэффициент корреляции

д) найдите ковариацию и коэффициент корреляции величин x2 и y;

Решение. Ковариация двух случайных величин x2 и y может быть найдена по формуле

.

Так как , то .

.

,

Поэтому

.

Следовательно,

.

Найдем дисперсию случайной величины по формуле

.

.

Вычислим коэффициент корреляции

Задача 3

Срок службы электрической лампы имеет показательное распределение с математическим ожиданием L часов. Ответьте на следующие вопросы:

а) какова вероятность того, что лампа прослужит от m1 до M1 часов?

б) какова вероятность того, что прослужившая уже m2 часов лампа прослужит еще не менее M2 часов?

в) какова вероятность того, что средний срок службы для N3 ламп составит не менее M3 часов?

г) какова вероятность того, что для N4 ламп срок службы составит от m4 до M4 часов?

Числовые данные

L=76; m1=75; M1=109; m2=77; M2=99; N3=820; M3=81; N4=890; m4=93; M4=139.

Решение

Плотность распределения величины X (срок службы электрической лампы) имеет вид:

,

где .

Функция распределения имеет вид:

,

a) ;

б) .

в) сроки службы ламп друг от друга независимы. Введём в рассмотрение событие - средний срок службы i-ой лампы составил не менее M3 часов. Интересующее нас событие , то есть одновременное наступление событий , то есть их произведение. Тогда по теореме о произведении вероятностей

г) так как события независимы,

Задача 4

Рассмотрите случайную выборку Xi из некоторого известного распределения и ответьте на следующие вопросы:

а) найдите оценку параметра A методом моментов, если известно, что выборка сделана из равномерного распределения U (-1; A)

б) найдите оценку методом моментов параметра B, если известно, что выборка сделана из равномерного распределения U (-B; B)

в) найдите оценки методом максимального правдоподобия параметров c и C, если известно, что выборка сделана из равномерного распределения U (c; C);

г) найдите (и сравните) оценки параметра L методом моментов и методом максимального правдоподобия, если известно, что выборка сделана из экспоненциального EL распределения;

д) найдите оценку параметра m методом моментов, если известно, что выборка сделана из нормального распределения N (m, 1)

е) найдите оценки параметров M и S любым известным методом, если известно, что выборка сделана из нормального распределения N (M, S);

ж) постройте гистограмму и полигон по выборке, количество интервалов - K;

з) в каждом из пунктов (а) - (е) оцените близость данного теоретического распределения к эмпирическому на основе критерия Пирсона; какое из распределений (а) - (е) лучше описывает выборку?

Числовые данные

i1=-0,036;

i2=-0,809;

i3=0,315;

i4=-0,265;

i5=0,471;

i6=-0,386;

i7=0,576;

i8=-0,556;

i9=0,508;

i10=0,477;

K=3

Решение

а) найдите оценку параметра A методом моментов, если известно, что выборка сделана из равномерного распределения U (-1; A)

Решение. Известно, что для равномерно распределенной на отрезке случайной величины математическое ожидание может быть вычислено по формуле . Точеной оценкой математического ожидания является среднее арифметическое .

В нашем случае имеем .

б) найдите оценку методом моментов параметра B, если известно, что выборка сделана из равномерного распределения U (-B; B).

Решение. Известно, что для равномерно распределенной на отрезке случайной величины дисперсия может быть вычислено по формуле . Точеной оценкой дисперсии является выборочная дисперсия .

В нашем случае имеем

в) найдите оценки методом максимального правдоподобия параметров c и C, если известно, что выборка сделана из равномерного распределения U (c; C);

Решение.

Запишем функцию плотности вероятностей

.

Пусть , тогда

Составим функцию правдоподобия:

если , , …, , т. е , то

.

Если , то , поскольку в этом случае хотя бы один из сомножителей указанного произведения обращается в нуль.

График функции правдоподобия при оценке параметра равномерного распределения имеет вид

Наибольшее значение функции правдоподобия находиться в точке , т.е. .

г) найдите (и сравните) оценки параметра L методом моментов и методом максимального правдоподобия, если известно, что выборка сделана из экспоненциального EL распределения;

Решение. Пусть наблюдаемая в эксперименте случайная величина имеет экспоненциальное распределение с плотностью

Применяя метод максимального правдоподобия, найдем точечную оценку для параметра .

Составим функцию правдоподобия

.

Применяя операцию логарифмирования, получаем

.

Следовательно, уравнение правдоподобия имеет вид

.

Применяя метод моментов, найдем точечную оценку для параметра .

Найдем математическое ожидание случайной величины, имеющей экспоненциальное распределение:

Так как точеной оценкой математического ожидания является среднее арифметическое , то получаем .

Применяя два различных метода, мы получили один и тот же результат

д) найдите оценку параметра m методом моментов, если известно, что выборка сделана из нормального распределения N (m, 1).

Решение. Пусть непрерывная случайная величина распределена по нормальному закону с параметрами и .

Тогда плотность вероятности имеет вид

.

Найдем математическое ожидание случайной величины :

.

Первый интеграл равен нулю как интеграл от нечетной функции по симметричному относительно начала координат промежутку, второй интеграл - интеграл Эйлера-Пуассона.

Так как точеной оценкой математического ожидания является среднее арифметическое , то получаем

е) найдите оценки параметров M и S любым известным методом, если известно, что выборка сделана из нормального распределения N (M, S);

Решение. Пусть непрерывная случайная величина распределена по нормальному закону с параметрами и .

Тогда плотность вероятности имеет вид

.

Найдем математическое ожидание случайной величины :

.

Первый интеграл равен нулю как интеграл от нечетной функции по симметричному относительно начала координат промежутку, второй интеграл - интеграл Эйлера-Пуассона.

Так как точеной оценкой математического ожидания является среднее арифметическое , то получаем

Найдем дисперсию случайной величины :

.

Точеной оценкой дисперсии является выборочная дисперсия

.

Поэтому

ж) постройте гистограмму и полигон по выборке, количество интервалов - 3;

Найдем максимальное и минимальное значения по выборке:

, .

Размах варьирования .

Рассмотрим три равных частичных интервала, в которые попадают все элементы выборки

[-0,81; - 0,34]

[-0,34; 0,13]

[0,13; 0,6]

3

2

5

з) в каждом из пунктов (а) - (е) оцените близость данного теоретического распределения к эмпирическому на основе критерия Пирсона; какое из распределений (а) - (е) лучше описывает выборку?

Решение.

[-0,81; - 0,41]

[-0,41; - 0,01]

[-0,01; 0,39]

[0,39; 0,79]

2

3

1

4

В пункте а) была найдена оценка параметра .

Найдем плотность предполагаемого равномерного распределения на отрезке

,

Найдем теоретические частоты:

,

,

,

Сравним эмпирические и теоретические частоты, используя критерий Пирсона

[-0,81; - 0,41]

2

1,94

0,06

0,0036

0,0019

[-0,41; - 0,01]

3

1,94

1,06

1,1236

0,5792

[-0,01; 0,39]

1

1,94

-0,94

0,8836

0,4555

[0,39; 0,79]

4

1,94

2,06

4,2436

2,1874

сумма

10

Найдем по таблице критических точек распределения по уровню значимости и числу степеней свободы критическую точку правосторонней критической области .

Так как наблюдаемое значение критерия меньше критического значения критерия (3,224<3,8), то делаем вывод о том, что наблюдения согласуются с равномерным распределением на рассматриваемом отрезке на уровне значимости .

В пункте б) была найдена оценка параметра .

Найдем плотность предполагаемого равномерного распределения на отрезке

,

Найдем теоретические частоты:

,

,

,

Сравним эмпирические и теоретические частоты, используя критерий Пирсона

[-0,81; - 0,41]

2

2,4

-0,4

0,16

0,0667

[-0,41; - 0,01]

3

2,4

0,6

0,36

0,15

[-0,01; 0,39]

1

2,4

-1,4

1,96

0,8167

[0,39; 0,79]

4

2,4

1,6

2,56

1,0667

сумма

10

Найдем по таблице критических точек распределения по уровню значимости и числу степеней свободы критическую точку правосторонней критической области .

Так как наблюдаемое значение критерия меньше критического значения критерия (2,1001<3,8), то делаем вывод о том, что наблюдения согласуются с равномерным распределением на рассматриваемом отрезке на уровне значимости .

В пункте u) была найдена оценка параметра .

Найдем плотность предполагаемого экспоненциального распределения

,

Найдем теоретические частоты:

,

,

,

Сравним эмпирические и теоретические частоты, используя критерий Пирсона

[-0,81; - 0,41]

2

8419603071104

-8419603071102

8419603071100

[-0,41; - 0,01]

3

10870723

-10870720

10870715

[-0,01; 0,39]

1

474,6

-473,6

472,6

[0,39; 0,79]

4

0,0007

3б9993

22849,14

сумма

10

Найдем по таблице критических точек распределения по уровню значимости и числу степеней свободы критическую точку правосторонней критической области .

Так как наблюдаемое значение критерия значительно больше критического значения критерия, то делаем вывод о том, что наблюдения не согласуются с экспоненциальным распределением на уровне значимости .

В пункте д) была найдена оценка параметра .

Найдем плотность предполагаемого нормального распределения с парметрами 0,0295 и 1

,

Найдем теоретические частоты:

,

,

,

Сравним эмпирические и теоретические частоты, используя критерий Пирсона

[-0,81; - 0,41]

1

1,295

-0,295

0,16

0,067

[-0,41; - 0,01]

3

1,54

1,46

2,1316

1,38

[-0,01; 0,39]

1

1,57

-0,57

0,3249

0,21

[0,39; 0,79]

4

1,36

2,64

6,9696

5,12

сумма

10

Найдем по таблице критических точек распределения по уровню значимости и числу степеней свободы критическую точку правосторонней критической области .

Так как наблюдаемое значение критерия больше критического значения критерия, то делаем вывод о том, что наблюдения не согласуются с нормальным распределением с параметрами 0, 0295 и 1 на уровне значимости .

В пункте е) была найдена оценка параметра ,

Найдем плотность предполагаемого нормального распределения с парметрами 0,0295 и 0,48

,

Найдем теоретические частоты:

,

,

,

Сравним эмпирические и теоретические частоты, используя критерий Пирсона

[-0,81; - 0,41]

1

1,39

-0,39

0,1521

0,109

[-0,41; - 0,01]

3

2,89

0,11

0,0121

0,004

[-0,01; 0,39]

1

3,05

-2,05

4, 2025

1,378

[0,39; 0,79]

4

1,7

2,3

5,29

3,112

сумма

10

Найдем по таблице критических точек распределения по уровню значимости и числу степеней свободы критическую точку правосторонней критической области .

Так как наблюдаемое значение критерия больше критического значения критерия, то делаем вывод о том, что наблюдения не согласуются с нормальным распределением с параметрами 0, 0295 и 0,48 на уровне значимости .

Из представленных распределений указанная выборка лучше всего согласуется с равномерным распределением на отрезке , т.к. в этом случае получено наименьшее наблюдаемое значение критерия.

Часть II. Математическая статистика (практикум)

Задание 1

По данной выборке Xi выполните следующие вычисления:

а) постройте гистограмму, полигон, выборочную функцию распределения;

б) вычислите выборочные моменты и связанные величины (первый, второй, третий, дисперсию, СКО, эксцесс и коэффициент асимметрии);

в) оцените методом моментов или/и методом максимального правдоподобия по выборке параметры основных непрерывных распределений (равномерное, экспоненциальное, нормальное и пр.), оцените близость оценок теоретических распределений к выборочному; подберите качественное описание выборочного распределения теоретическим;

г) предположив, что выборка получена из нормального распределения, протестируйте гипотезы равенства среднего нулю при неизвестной дисперсии; равенства среднего нулю при дисперсии, равной выборочной;

Числовые данные

вариант:

6

i

Xi

1

0,15

2

-3,28

3

5,13

4

0, 19

5

-40,44

6

11,06

7

-2,17

8

0

9

0,26

10

-7,68

11

0,33

12

-8,03

13

0,37

14

23,67

15

44,56

16

-1,62

17

42,31

18

2,62

19

21,84

20

-1,7

21

-0,49

22

-0,2

23

0,35

24

-32,11

25

13,72

26

-0,02

27

-1,95

28

-12,02

29

-7,96

30

-2,97

Решение:

а) Построим гистограмму, полигон, выборочную функцию распределения.

По данной выборке построим интервальный вариационный ряд, выделив пять частичных интервалов: - 40 - 23, - 23 - 6, - 6 - 11, 11 - 28, 28 - 45. Длина частичных интервалов . Полученный интервальный статистический ряд запишем в виде таблицы:

-40 - 23

-23 - 6

-6 - 11

11 - 28

28 - 45

2

4

18

4

2

Найдем плотность частоты и запишем в таблицу:

-40 - 23

-23 - 6

-6 - 11

11 - 28

28 - 45

2

4

18

4

2

Построим полигон и гистограмму:

Из интервального ряда составим вариационный ряд, выбрав в качестве вариант середины интервалов. Запишем полученный ряд в виде таблицы:

-31,5

-14,5

2,5

19,5

36,5

2

4

18

4

2

Построим выборочную функцию распределения , учитывая, что объем выборки .

Значения наблюдались 0 раз; следовательно, при .

Значения наблюдались 2 раза; следовательно, при . Значения наблюдались 6 раз; следовательно, при .

Значения наблюдались 24 раза; следовательно, при . Значения наблюдались 28 раз; следовательно, при .

Значения наблюдались 30 раз; следовательно, при .

Выборочная функция распределения имеет вид:

.

б) Вычислим выборочные моменты и связанные величины (первый, второй, третий, дисперсию, СКО, эксцесс и коэффициент асимметрии). Воспользуемся методом произведений, для чего составим расчетную таблицу: варианты записываем в первый столбец; частоты - во второй, сумму частот поместим в нижнюю клетку столбца

1

2

3

4

5

6

7

-31,5

2

-2

-4

8

-16

32

-14,5

4

-1

-4

4

-4

4

2,5

18

0

0

0

0

0

19,5

4

1

4

4

4

4

36,5

2

2

4

8

16

32

В качестве ложного нуля С выберем варианту 2,5. В клетке третьего столбца, которая принадлежит строке, содержащей выбранный ложный нуль, пишем 0; над нулем последовательно записываем - 1; - 2, а под нулем - 1; 2.

Выборочные условные моменты -го порядка определим по формуле

; ; ;

.

;

;

;

Найдем центральные эмпирические моменты 3-го и 4-го порядка:

;

Найдем значения коэффициента асимметрии и эксцесс по соответствующим формулам:

;

в) оцените методом моментов или/и методом максимального правдоподобия по выборке параметры основных непрерывных распределений (равномерное, экспоненциальное, нормальное и пр.), оцените близость оценок теоретических распределений к выборочному; подберите качественное описание выборочного распределения теоретическим.

i

1

2

3

4

5

6

7

8

9

Xi

0,15

-3,28

5,13

0, 19

-40,44

11,06

-2,17

0

0,26

10

11

12

13

14

15

16

17

18

19

-7,68

0,33

-8,03

0,37

23,67

44,56

-1,62

42,31

2,62

21,84

20

21

22

23

24

25

26

27

28

29

30

-1,7

-0,49

-0,2

0,35

-32,11

13,72

-0,02

-1,95

-12,02

-7,96

-2,97

1) экспоненциальное распределение: X~Exp (), .

.

2) нормальное распределение: X~. Параметр состоит из двух компонент: .

, .

3) равномерное распределение: X~R (a, b); q= (a, b).

, .

4) гамма - распределение: X~, (л>0, ). . Оценки получаются из решения системы:

Визуально можно определить, что лучше всего подходит нормальное распределение.

г) Предположив, что выборка получена из нормального распределения, протестируем гипотезы равенства среднего нулю при неизвестной дисперсии; равенства среднего нулю при дисперсии, равной выборочной. При проверке гипотез будем использовать уровень значимости .

Протестируем гипотезы равенства среднего нулю при известной дисперсии. Предположим, что дисперсия известна и равна выборочной дисперсии. Выборочное среднее и выборочная дисперсия были вычислены в пункте б) данной задачи: , . Среднее квадратическое отклонение .

Проверим нулевую гипотезу при конкурирующей гипотезе .

Найдем наблюдаемое значение критерия .

По условию, конкурирующая гипотеза имеет вид , поэтому критическая область - двусторонняя. Найдем критическую точку из равенства

. По таблице значений функции Лапласа находим .

Так как - нет оснований отвергнуть нулевую гипотезу. Другими словами, выборочная и гипотетическая средние различаются незначительно.

Проверим нулевую гипотезу при конкурирующей гипотезе . Найдем критическую точку из равенства

. По таблице значений функции Лапласа находим .

Так как - нет оснований отвергнуть нулевую гипотезу. Другими словами, выборочная и гипотетическая средние различаются незначительно.

Проверим нулевую гипотезу при конкурирующей гипотезе . Найдем критическую точку из равенства .

Так как - нет оснований отвергнуть нулевую гипотезу. Другими словами, выборочная и гипотетическая средние различаются незначительно.

Протестируем гипотезы равенства среднего нулю при неизвестной дисперсии. Выборочное среднее и исправленное среднее квадратическое были вычислены в пункте б) данной задачи: , .

Проверим нулевую гипотезу при конкурирующей гипотезе .

Найдем наблюдаемое значение критерия .

По условию, конкурирующая гипотеза имеет вид , поэтому критическая область - двусторонняя. По таблице распределения Стьюдента по уровню значимости и числу степеней свободы находим .

Так как - нет оснований отвергнуть нулевую гипотезу. Другими словами, выборочная и гипотетическая средние различаются незначительно.

Проверим нулевую гипотезу при конкурирующей гипотезе . Найдем .

Так как - нет оснований отвергнуть нулевую гипотезу. Другими словами, выборочная и гипотетическая средние различаются незначительно.

Проверим нулевую гипотезу при конкурирующей гипотезе . Найдем критическую точку из равенства .

Так как - нет оснований отвергнуть нулевую гипотезу. Другими словами, выборочная и гипотетическая средние различаются незначительно.

Задание 2

По выборкам Xi, Yi выполните следующие вычисления:

а) найдите выборочную ковариацию и выборочный коэффициент корреляции;

б) методом наименьших квадратов оцените параметры модели X=aY+b, протестируйте гипотезу {a=0};

в) методом наименьших квадратов оцените параметры модели Y=kX+d, протестируйте гипотезу {k=0};

г) в пунктах (б), (в) найдите и сравните коэффициенты R2;

д) в пунктах (б), (в) протестируйте близость эмпирического распределения остатков моделей к нормальному;

е) каково ожидаемое значение с. в. Y, если известно значение с. в. X? Каков доверительный интервал для Y в этом случае? Постройте график этих зависимостей для выборочных значений Xi и сравните с выборочными значениями Yi.

Числовые данные

вариант:

6

i

Уi

1

0,77

2

-16,69

3

26,11

4

0,96

5

-205,9

6

56,3

7

-11,05

8

0

9

1,33

10

-39,1

11

1,68

12

-40,88

13

1,88

14

120,5

15

226,85

16

-8,25

17

215,39

18

13,34

19

111,18

20

-8,65

21

-2,49

22

-1,02

23

1,78

24

-163,5

25

69,84

26

-0,1

27

-9,93

28

-61, 19

29

-40,52

30

-15,12

Решение:

а) Найдем выборочную ковариацию и выборочный коэффициент корреляции.

По данной выборке построим интервальный ряд, выделив пять частичных интервалов: - 207 - 120, - 120 - 33, - 33 - 54, 54 - 141, 141 - 228. Полученный интервальный статистический ряд запишем в виде таблицы:

-207 - 120

-120 - 33

-33 - 54

54 - 141

141 - 228

2

4

18

4

2

Составим корреляционную таблицу для двумерной случайной величины .

-163,5

-76,5

10,5

97,5

184,5

-207 - 120

-120 - 33

-33 - 54

54 - 141

141 - 228

-31,5

-40 - 23

2

-

-

-

-

2

-14,5

-23 - 6

-

4

-

-

-

4

2,5

-6 - 11

-

-

18

-

-

18

19,5

11 - 28

-

-

-

4

-

4

36,5

28 - 45

-

-

-

-

2

2

2

4

18

4

2

Выборочную ковариацию найдем по формуле:

.

(вычислено в задаче №12)

Выборочный коэффициент корреляции найдем по формуле:

б) методом наименьших квадратов оцените параметры модели X=aY+b, протестируйте гипотезу {a=0};

в) методом наименьших квадратов оцените параметры модели Y=kX+d, протестируйте гипотезу {k=0};

г) в пунктах (б), (в) найдите и сравните коэффициенты R2;

д) в пунктах (б), (в) протестируйте близость эмпирического распределения остатков моделей к нормальному;

е) каково ожидаемое значение с. в. Y, если известно значение с. в. X? Каков доверительный интервал для Y в этом случае? Постройте график этих зависимостей для выборочных значений Xi и сравните с выборочными значениями Yi.

б) Методом наименьших квадратов оценим параметры модели X=aY+b. а=0.2, b=-0.03.

в) Методом наименьших квадратов оценим параметры модели Y=kX+d. k=5.09, d=0.02.

г) R - коэффициент детерминации; это доля объяснённой дисперсии отклонений зависимой переменной от её среднего значения. .

При оценке модели регрессии X на Y получаем ; значит, почти 100% доля признака Y объясняется признаком Х. Аналогично получаем .

Остатки модели:

i

Уi

Xi

1

0,77

0,15

0,7821

0,124

-0,0121

0,026

2

-16,69

-3,28

-16,6766

-3,368

-0,0134

0,088

3

26,11

5,13

26,1303

5, 192

-0,0203

-0,062

4

0,96

0, 19

0,9857

0,162

-0,0257

0,028

5

-205,9

-40,44

-205,821

-41,21

-0,079

0,77

6

56,3

11,06

56,314

11,23

-0,014

-0,17

7

-11,05

-2,17

-11,0267

-2,24

-0,0233

0,07

8

0

0

0,0186

-0,03

-0,0186

0,03

9

1,33

0,26

1,342

0,236

-0,012

0,024

10

-39,1

-7,68

-39,0726

-7,85

-0,0274

0,17

11

1,68

0,33

1,6983

0,306

-0,0183

0,024

12

-40,88

-8,03

-40,8541

-8, 206

-0,0259

0,176

13

1,88

0,37

1,9019

0,346

-0,0219

0,024

14

120,5

23,67

120,4989

24,07

0,0011

-0,4

15

226,85

44,56

226,829

45,34

0,021

-0,78

16

-8,25

-1,62

-8,2272

-1,68

-0,0228

0,06

17

215,39

42,31

215,3765

43,048

0,0135

-0,738

18

13,34

2,62

13,3544

2,638

-0,0144

-0,018

19

111,18

21,84

111,1842

22, 206

-0,0042

-0,366

20

-8,65

-1,7

-8,6344

-1,76

-0,0156

0,06

21

-2,49

-0,49

-2,4755

-0,528

-0,0145

0,038

22

-1,02

-0,2

-0,9994

-0,234

-0,0206

0,034

23

1,78

0,35

1,8001

0,326

-0,0201

0,024

24

-163,5

-32,11

-163,421

-32,73

-0,0787

0,62

25

69,84

13,72

69,8534

13,938

-0,0134

-0,218

26

-0,1

-0,02

-0,0832

-0,05

-0,0168

0,03

27

-9,93

-1,95

-9,9069

-2,016

-0,0231

0,066

28

-61, 19

-12,02

-61,1632

-12,268

-0,0268

0,248

29

-40,52

-7,96

-40,4978

-8,134

-0,0222

0,174

30

-15,12

-2,97

-15,0987

-3,054

-0,0213

0,084

Протестируем принадлежность остатка модели регрессии Y=kX+d, k=5.09, d=0.02 к нормальному распределению. Будем использовать критерий Пирсона. Для этого разобьём область (-0.08, 0.022) на 5 интервалов с границами - 0.08, - 0.025, - 0.021, - 0.017, - 0.013, 0.022 и подсчитаем число элементов выборки, попавших в каждый интервал. Вычислим гипотетическую вероятность попадания в эти же интервалы случайной величины Z~N (0,0.02) (распределение остатков модели должно иметь математическое ожидание 0; дисперсия вычислена по выборке).

номер

середина

частота

теор. частота

1

-0.0525

6

11.74

2

-0.023

6

2.42

3

-0.019

5

1.52

4

-0.015

7

2.38

5

0.0045

6

10.48

По таблице можно заключить, даже не вычисляя реализацию статистики , что эмпирическая (выборочная) частоты слишком отличаются, чтобы принадлежать одному распределению. Всё же вычислим её: . Это значение соответствует очень малому уровню значимости (меньше 0.01), поэтому гипотезу следует отвергнуть.

Протестируем принадлежность остатка модели регрессии X=aY+b. а=0.2, b=-0.03 к нормальному распределению.

Будем использовать критерий Пирсона. Для этого разобьём область (-0.8, 0.8) на 5 интервалов с границами - 0.8, - 0.2, 0.025, 0.05, 0.1, 0.8 и подсчитаем число элементов выборки, попавших в каждый интервал.

Вычислим гипотетическую вероятность попадания в эти же интервалы случайной величины Z~N (0,0.305) (распределение остатков модели должно иметь математическое ожидание 0; дисперсия вычислена по выборке).

номер

середина

частота

теор. частота

1

-0.5

5

7.54

2

-0.0875

7

8.30

3

0.0375

6

0.97

4

0.075

6

1.90

5

0.45

6

11.01

, поэтому гипотезу о принадлежности остатков модели к нормальному распределению следует отвергнуть.

Построим доверительный интервал для математического ожидания величины Y следующим образом:

ковариация корреляция доверительный интервал

,

где - стандартная ошибка групповой средней , , - выборочная остаточная дисперсия (дисперсия остатка модели); статистика при примет значение 2.05. Таким образом,

или .

Построим график зависимости ожидаемых значений Y при известных значениях Х.

Как и следовало ожидать (судя по величине остатков моделей), графики на рисунке выше неразличимы.

Размещено на Allbest.ru

...

Подобные документы

  • Нахождение плотности, среднеквадратического отклонения, дисперсии, ковариации и коэффициента корреляции системы случайных величин. Определение доверительного интервала для оценки математического ожидания нормального распределения с заданной надежностью.

    контрольная работа [200,3 K], добавлен 16.08.2010

  • Вычисление математического ожидания, дисперсии и коэффициента корреляции. Определение функции распределения и его плотности. Нахождение вероятности попадания в определенный интервал. Особенности построения гистограммы частот. Применение критерия Пирсона.

    задача [140,0 K], добавлен 17.11.2011

  • Длина интервала группирования. Гистограмма относительных частот. Кусочно-постоянная функция. Среднеквадратичное отклонение оценки математического ожидания случайной величины. Коэффициент корреляции. Границы доверительного интервала для ожидания.

    курсовая работа [622,9 K], добавлен 18.02.2009

  • Вычисление математического ожидания, дисперсии, функции распределения и среднеквадратического отклонения случайной величины. Закон распределения случайной величины. Классическое определение вероятности события. Нахождение плотности распределения.

    контрольная работа [38,5 K], добавлен 25.03.2015

  • Сущность закона распределения и его практическое применение для решения статистических задач. Определение дисперсии случайной величины, математического ожидания и среднеквадратического отклонения. Особенности однофакторного дисперсионного анализа.

    контрольная работа [328,2 K], добавлен 07.12.2013

  • Теория вероятностей. Коэффициенты использования рабочего времени. Закон распределения случайной величины. Функция плотности. Математическое ожидание. Закон распределения с математическим ожиданием. Статистика. Доверительный интервал. Выборочная средняя.

    контрольная работа [178,3 K], добавлен 24.11.2008

  • Длина интервала группирования. Графическое описание выборки. Гистограмма относительных частот. Кусочно-постоянная функция. Границы доверительного интервала математического ожидания. Вычисление коэффициента корреляции. Эмпирическая функция распределения.

    практическая работа [737,5 K], добавлен 14.02.2009

  • Определение вероятности случайного события; вероятности выиграшных лотерейных билетов; пересечения двух независимых событий; непоражения цели при одном выстреле. Расчет математического ожидания, дисперсии, функции распределения случайной величины.

    контрольная работа [480,0 K], добавлен 29.06.2010

  • Вероятность попадания случайной величины Х в заданный интервал. Построение графика функции распределения случайной величины. Определение вероятности того, что наудачу взятое изделие отвечает стандарту. Закон распределения дискретной случайной величины.

    контрольная работа [104,7 K], добавлен 24.01.2013

  • Цель и задачи статистического анализа. Методы получения оценок: максимального правдоподобия, моментов. Доверительный интервал. Точечная оценка параметров распределения. Генеральная и выборочная дисперсии. Интервальное оценивание математического ожидания.

    презентация [395,9 K], добавлен 19.07.2015

  • Классическое определение вероятности. Формулы сложения и умножения вероятностей. Дисперсия случайной величины. Число равновозможных событий . Матрица распределения вероятностей системы. Среднее квадратическое отклонение, доверительный интервал.

    контрольная работа [89,7 K], добавлен 07.09.2010

  • Определение закона распределения вероятностей результатов измерения в математической статистике. Проверка соответствия эмпирического распределения теоретическому. Определение доверительного интервала, в котором лежит значение измеряемой величины.

    курсовая работа [2,0 M], добавлен 11.02.2012

  • Определение вероятности того, что из урны взят белый шар. Нахождение математического ожидания, среднего квадратического отклонения и дисперсии случайной величины Х, построение гистограммы распределения. Определение параметров распределения Релея.

    контрольная работа [91,7 K], добавлен 15.11.2011

  • Исследование точности прогнозирования случайного процесса с использованием метода наименьших квадратов. Анализ расхождения между трендом и прогнозом, последующая оценка близости распределения расхождений наблюдений и распределения сгенерированного шума.

    курсовая работа [1,0 M], добавлен 29.01.2010

  • Определение вероятности появления события в каждом из независимых испытаний. Случайные величины, заданные функцией распределения (интегральной функцией), нахождение дифференциальной функции (плотности вероятности), математического ожидания и дисперсии.

    контрольная работа [59,7 K], добавлен 26.07.2010

  • Дискретные случайные величины и их распределения. Формула полной вероятности и формула Байеса. Общие свойства математического ожидания. Дисперсия случайной величины. Функция распределения случайной величины. Классическое определение вероятностей.

    контрольная работа [33,8 K], добавлен 13.12.2010

  • Предмет и метод математической статистики. Распределение непрерывной случайной величины с точки зрения теории вероятности на примере логарифмически-нормального распределения. Расчет корреляции величин и нахождение линейной зависимости случайных величин.

    курсовая работа [988,5 K], добавлен 19.01.2011

  • Статистическое, аксиоматическое и классическое определение вероятности. Дискретные случайные величины. Предельные теоремы Лапласа и Пуассона. Функция распределения вероятностей для многомерных случайных величин. Формула Байеса. Точечная оценка дисперсии.

    шпаргалка [328,7 K], добавлен 04.05.2015

  • Примеры пространства элементарных событий. Вероятность появления одного из двух несовместных событий. Функция распределения F(x,y) системы случайных величин. Расчет математического ожидания и дисперсии. Закон генеральной совокупности и его параметры.

    контрольная работа [178,1 K], добавлен 15.06.2012

  • Особенности выполнения теоремы Бернулли на примере электрической схемы. Моделирование случайной величины по закону распределения Пуассона, заполнение массива. Теория вероятности, понятие ожидания, дисперсии случайной величины и закон распределения.

    курсовая работа [29,7 K], добавлен 31.05.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.