Математическая статистика
Составление группированных статистических рядов. Вычисление средних значений и дисперсии группированных выборок, значения состоятельных и несмещенных оценок генеральных дисперсий. Особенности поиска доверительного интервала для генеральной средней.
Рубрика | Математика |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 23.06.2015 |
Размер файла | 363,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ АРХТЕКТУРНО-СТРОИТЕЛЬНЫЙ УНИВЕРСИТЕТ (Сибстрин)
Контрольная работа по математической статистике
Проверил: Федоров А.В.
Новосибирск 2013г.
Исходные данные
X |
Y |
|
4,469141 |
4,726199 |
|
3,956641 |
7,312685 |
|
3,844141 |
6,670743 |
|
3,331641 |
7,843014 |
|
1,219141 |
5,786859 |
|
2,706641 |
5,544918 |
|
3,594141 |
4,902976 |
|
3,081641 |
6,075247 |
|
2,969141 |
5,433306 |
|
3,456641 |
8,019791 |
|
3,344141 |
7,377849 |
|
1,831641 |
7,135908 |
|
2,719141 |
5,079752 |
|
2,206641 |
7,666238 |
|
3,094141 |
9,852724 |
|
3,581641 |
6,782354 |
|
3,469141 |
8,968840 |
|
3,956641 |
8,284957 |
|
2,844141 |
4,814587 |
|
2,331641 |
8,815286 |
|
1,219141 |
6,759131 |
|
2,706641 |
9,345616 |
|
3,594141 |
7,289461 |
|
2,081641 |
8,461732 |
|
2,969141 |
3,577151 |
|
2,456841 |
4,749423 |
|
4,344141 |
5,521694 |
|
2,831641 |
6,693966 |
|
2,719141 |
7,466238 |
|
2,206641 |
8,638509 |
|
4,781641 |
6,582354 |
|
2,269141 |
6,340413 |
|
3,156641 |
7,112685 |
|
0,644141 |
6,870743 |
|
3,531641 |
7,643014 |
|
5,019141 |
7,401073 |
|
2,906641 |
8,173345 |
|
4,394141 |
7,931403 |
|
1,969141 |
6,405578 |
|
4,144141 |
8,550121 |
|
2,031641 |
7,908180 |
|
3,894141 |
4,395869 |
|
2,781641 |
5,698471 |
|
2,644141 |
6,428801 |
|
4,219141 |
6,317189 |
|
3,706641 |
9,434004 |
|
4,719141 |
9,764335 |
|
1,581641 |
6,252024 |
|
1,781641 |
8,968840 |
|
1,581641 |
6,693966 |
статистический дисперсия интервал генеральный
Задание 1. Составить группированные статистические ряды, разбив выборки на 5 интервалов
Для составления интервального вариационного ряда необходимо разбить весь интервал варьирования на равные частичные интервалы.
Для этого сначала определяем минимальное и максимальное значения во всем интервале:
5,019141
0,644141
9,852724
3,577151
Далее находим размах R
4,375000
6,275573
Нам необходимо разбить весь интервал на частичные интервалы равной длины h
0,875000
1,255115
Далее определяем нижнюю границу первого частичного интервала
0,644141
3,577151
находим границы всех интервалов по формуле:
Составим группированный статистический ряд для признака X:
№ интервала |
Левая граница интервала |
Правая граница интервала |
n |
|
1 |
0,644141 |
1,519141 |
3 |
|
2 |
1,519141 |
2,394141 |
11 |
|
3 |
2,394141 |
3,269141 |
15 |
|
4 |
3,269141 |
4,144141 |
14 |
|
5 |
4,144141 |
5,019141 |
7 |
|
Сумма |
|
|
50 |
Составим группированный статистический ряд для признака Y:
№ интервала |
Левая граница интервала |
Правая граница интервала |
n |
|
1 |
3,577151 |
4,832266 |
5 |
|
2 |
4,832266 |
6,087380 |
8 |
|
3 |
6,087380 |
7,342495 |
16 |
|
4 |
7,342495 |
8,597609 |
13 |
|
5 |
8,597609 |
9,852724 |
8 |
|
Сумма |
|
|
50 |
где n - частота (количество чисел выборки попадающих в соответствующей интервал)
Задание 2. Вычислить среднее значение и дисперсии группированных выборок
Так как у нас интервальный вариационный ряд, то будут использоваться следующие формулы:
Среднее арифметическое:
где xi - середина i-го интервала, ni - частота i-го интервала
Выборочная дисперсия:
для удобства, вычисления сведем в таблицу
Вычислим среднее значение и дисперсию для признака X:
№ интервала |
Левая граница интервала |
Правая граница интервала |
Частота n |
середина интервала xi |
|||
1 |
0,644141 |
1,519141 |
3 |
1,081641 |
3,244923 |
11,319919 |
|
2 |
1,519141 |
2,394141 |
11 |
1,956641 |
21,523051 |
12,535119 |
|
3 |
2,394141 |
3,269141 |
15 |
2,831641 |
42,474615 |
0,5558438 |
|
4 |
3,269141 |
4,144141 |
14 |
3,706641 |
51,892974 |
6,5212874 |
|
5 |
4,144141 |
5,0191411 |
7 |
4,5816411 |
32,071487 |
16,980645 |
|
Сумма |
|
|
50 |
|
151,20705 |
47,912814 |
Вычислим среднее значение и дисперсию для признака Y:
№ интервала |
Левая граница интервала |
Правая граница интервала |
Частота n |
середина интервала xi |
|||
1 |
3,577151 |
4,8322656 |
5 |
4,2047083 |
21,023542 |
38,818855 |
|
2 |
4,8322656 |
6,0873802 |
8 |
5,4598229 |
43,678583 |
18,757563 |
|
3 |
6,0873802 |
7,3424948 |
16 |
6,7149375 |
107,439 |
1,2199221 |
|
4 |
7,3424948 |
8,5976094 |
13 |
7,9700521 |
103,61068 |
12,459463 |
|
5 |
8,5976094 |
9,852724 |
8 |
9,2251667 |
73,801334 |
39,929765 |
|
Сумма |
|
|
50 |
|
349,55314 |
111,18557 |
Задание 3. Составить программу и провести расчет средних значений и дисперсий выборок
Вводим исходные данные в ячейки первого и второго столбца. Для расчета среднего значения воспользуемся стандартной функцией СРЗНАЧ, а для расчета дисперсии - функцией ДИСП.
Получим следующие значения:
Для признака X:
3,017895
1,0096399
Для признака Y:
7,009391
2,217137
Задание 4. Вычислить значения состоятельных и несмещенных оценок генеральных дисперсий D(X) и D(Y)
Значения состоятельных и несмещенных оценок генеральных дисперсий D(X) и D(Y) находим по формулам:
0,9778125
2,2690932
где n - число элементов выборки
Задание 5. Построить гистограммы, разбив выборки, на пять интервалов
ось x - количество элементов в интервале, ось y - середина интервала.
Задание 6. Проверить гипотезу о том, что генеральные совокупности X и У распределены по нормальному закону. Использовать критерий Пирсона
Для признака X:
Определим границы интервалов по формуле:
для удобства вычислений составим таблицу:
i |
Границы интервалов |
Границы интервалов |
|||
xi |
xi+1 |
zi |
zi+1 |
||
1 |
0,644141 |
1,519141 |
-2,406851 |
-1,5219792 |
|
2 |
1,519141 |
2,394141 |
-1,521979 |
-0,6371076 |
|
3 |
2,394141 |
3,269141 |
-0,637108 |
0,247764 |
|
4 |
3,269141 |
4,144141 |
0,247764 |
1,1326356 |
|
5 |
4,144141 |
5,0191411 |
1,132636 |
2,0175073 |
Найдем фактические вероятности pi и теоретические частоты n`i, по формулам:
где Ф(zi) - значение функции Лапласа в точке zi
где n = 50 - количество элементов выборки
Результаты расчетов запишем в таблицу:
i |
Границы интервалов |
Ф(zi) |
Ф(zi+1) |
pi |
ni`=pi*50 |
||
zi |
zi+1 |
||||||
1 |
-2,4068508 |
-1,5219792 |
-0,491955 |
-0,4359928 |
0,0559618 |
2,798089 |
|
2 |
-1,5219792 |
-0,6371076 |
-0,435993 |
-0,2379726 |
0,1980202 |
9,9010121 |
|
3 |
-0,6371076 |
0,247764 |
-0,237973 |
0,0978415 |
0,3358141 |
16,790706 |
|
4 |
0,247764 |
1,1326356 |
0,097842 |
0,3713164 |
0,2734748 |
13,673742 |
|
5 |
1,1326356 |
2,0175073 |
0,371316 |
0,4781787 |
0,1068623 |
5,3431175 |
|
Сумма |
|
|
|
|
0,9701333 |
48,506666 |
Вычислим наблюдаемое значение критерия Пирсона по формуле:
для удобства, вычисления сведем в таблицу
i |
ni |
ni` |
ni-ni` |
(ni-ni`)^2 |
X^2набл |
|
1 |
3 |
2,798089 |
0,201911 |
0,0407681 |
0,01457 |
|
2 |
11 |
9,9010121 |
1,098988 |
1,2077745 |
0,121985 |
|
3 |
15 |
16,790706 |
-1,790706 |
3,2066275 |
0,1909763 |
|
4 |
14 |
13,673742 |
0,326258 |
0,1064442 |
0,0077846 |
|
5 |
7 |
5,3431175 |
1,656883 |
2,7452596 |
0,5137936 |
|
Сумма |
50 |
48,506666 |
|
|
0,8491094 |
0,8491094
По уровню значимости =0,05 и количеству степеней свободы k=n-3=5-3=2 находим по таблице критических точек распределения «хи-квадрат»:
Так как , то нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности признака X.
Для признака Y:
Определим границы интервалов по формуле:
для удобства вычислений составим таблицу:
i |
Границы интервалов |
Границы интервалов |
|||
xi |
xi+1 |
zi |
zi+1 |
||
1 |
3,577151 |
4,8322656 |
-2,266345 |
-1,4331302 |
|
2 |
4,8322656 |
6,0873802 |
-1,43313 |
-0,599915 |
|
3 |
6,0873802 |
7,3424948 |
-0,599915 |
0,2333003 |
|
4 |
7,3424948 |
8,5976094 |
0,2333 |
1,0665155 |
|
5 |
8,5976094 |
9,852724 |
1,066516 |
1,8997308 |
Найдем фактические вероятности pi и теоретические частоты n`i, по формулам:
где Ф(zi) - значение функции Лапласа в точке zi
где n = 50 - количество элементов выборки
Результаты расчетов запишем в таблицу:
i |
Границы интервалов |
Ф(zi) |
Ф(zi+1) |
pi |
ni`=pi*50 |
||
zi |
zi+1 |
||||||
1 |
-2,2663455 |
-1,4331302 |
-0,488285 |
-0,4240897 |
0,0641952 |
3,2097596 |
|
2 |
-1,4331302 |
-0,599915 |
-0,42409 |
-0,2257186 |
0,1983711 |
9,9185569 |
|
3 |
-0,599915 |
0,2333003 |
-0,225719 |
0,0922359 |
0,3179544 |
15,897721 |
|
4 |
0,2333003 |
1,0665155 |
0,092236 |
0,3569047 |
0,2646688 |
13,23344 |
|
5 |
1,0665155 |
1,8997308 |
0,356905 |
0,4712658 |
0,1143611 |
5,7180551 |
|
Сумма |
|
|
|
|
0,9595507 |
47,977533 |
Вычислим наблюдаемое значение критерия Пирсона по формуле:
для удобства, вычисления сведем в таблицу
i |
ni |
ni` |
ni-ni` |
(ni-ni`)^2 |
X^2набл |
|
1 |
5 |
3,2097596 |
1,79024 |
3,2049608 |
0,9985049 |
|
2 |
8 |
9,9185569 |
-1,918557 |
3,6808605 |
0,3711085 |
|
3 |
16 |
15,897721 |
0,102279 |
0,0104609 |
0,000658 |
|
4 |
13 |
13,23344 |
-0,23344 |
0,0544941 |
0,0041179 |
|
5 |
8 |
5,7180551 |
2,281945 |
5,2072724 |
0,910672 |
|
Сумма |
50 |
47,977533 |
2,022467 |
4,0903744 |
2,2850613 |
2,2850613
По уровню значимости =0,05 и количеству степеней свободы k=n-3=5-3=2 находим по таблице критических точек распределения «хи-квадрат»:
Так как , то нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности признака X.
Задание 7. Из выборки, для которой гипотеза о нормальном распределении подтвердилась, взять первые 10 элементов. Найти доверительный интервал для генеральной средней. В качестве дисперсии генеральной совокупности взять значение дисперсии, полученное на ЭВМ
Для признака X:
Рассчитаем среднее значение и дисперсию для n = 10.
xi |
|
4,469141 |
|
3,956641 |
|
3,844141 |
|
3,331641 |
|
1,219141 |
|
2,706641 |
|
3,594141 |
|
3,081641 |
|
2,969141 |
|
3,456641 |
0,7812934
Находим среднее квадратическое отклонение:
0,883908
Доверительный интервал - интервал, который с заданной вероятностью «накрывает» неизвестное истинное значение генеральной характеристики. Границы, в которые попадает генеральная средняя, задаются неравенствами:
где - предельная ошибка выборки, t - коэффициент доверия, который определим из соотношения:
где Ф(х) - интегральная функция Лапласа,
по условию
p = 0,95
из таблицы значений интегральной функции Лапласа определим t
Тогда
Границы, в которые попадает генеральная средняя, будут:
2,71503913? a ?3,8107429
Для признака Y:
Рассчитаем среднее значение и дисперсию для n = 10.
yi |
|
4,726199 |
|
7,312685 |
|
6,670743 |
|
7,843014 |
|
5,786859 |
|
5,544918 |
|
4,902976 |
|
6,075247 |
|
5,433306 |
|
8,019791 |
1,3909326
Находим среднее квадратическое отклонение:
1,1793781
Доверительный интервал - интервал, который с заданной вероятностью «накрывает» неизвестное истинное значение генеральной характеристики. Границы, в которые попадает генеральная средняя, задаются неравенствами:
где - предельная ошибка выборки, t - коэффициент доверия, который определим из соотношения:
где Ф(х) - интегральная функция Лапласа,
по условию
p = 0,95
из таблицы значений интегральной функции Лапласа определим t
Тогда
Границы, в которые попадает генеральная средняя, будут:
5,5005877? a ?6,9625599
Задание 8. Составить корреляционную таблицу
Числовой характеристикой, измеряющей степень тесноты линейной связи между случайными перехменными X и У. является коэффициент корреляции между X и У, который обозначим P(Х,У).
Составим корреляционную таблицу:
p (X,Y) |
3,577151 |
4,832266 |
6,087380 |
7,342495 |
8,597609 |
ni |
||
4,832266 |
6,087380 |
7,342495 |
8,597609 |
9,852724 |
||||
0,644141 |
1,519141 |
|
1 |
2 |
|
|
3 |
|
1,519141 |
2,394141 |
|
1 |
4 |
4 |
2 |
11 |
|
2,394141 |
3,269141 |
2 |
4 |
4 |
3 |
2 |
15 |
|
3,269141 |
4,144141 |
2 |
2 |
5 |
4 |
1 |
14 |
|
4,144141 |
5,019141 |
1 |
|
1 |
2 |
3 |
7 |
|
nj |
5 |
5 |
8 |
16 |
13 |
8 |
где ni nj частоты интервалов для выборки X и Y соответственно
Задание 9. Используя корреляционную таблицу, вычислить значения выборочного коэффициента корреляций
Точечной оценкой теоретического коэффициента корреляции р(Х,У) является выборочный коэффициент корреляции который находится по формуле:
где xi yi - середины интервалов, - среднее по выборке X и Y соответственно, nxy - частота на пересечении x и y в корреляционной таблице
3,017895
7,0093912
для удобства, вычисления сведем в таблицу
середины интервалов |
|
(xi-X) |
(yi-Y) |
(xi-X)^2 |
(yi-Y)^2 |
p (X,Y) |
(xi-X)*(yi-Y)*p(X,Y) |
||
1 |
xi |
yi |
|||||||
2 |
1,081641 |
4,2047083 |
-1,936254 |
-2,8046829 |
3,7490796 |
7,8662464 |
0 |
0 |
|
3 |
1,956641 |
5,4598229 |
-1,061254 |
-1,5495683 |
1,1262601 |
2,401162 |
1 |
1,644486 |
|
4 |
2,831641 |
6,7149375 |
-0,186254 |
-0,2944537 |
0,0346906 |
0,086703 |
4 |
0,219373 |
|
5 |
3,706641 |
7,9700521 |
0,688746 |
0,9606609 |
0,4743711 |
0,9228693 |
4 |
2,646605 |
|
6 |
4,5816411 |
9,2251667 |
1,563746 |
2,2157755 |
2,4453019 |
4,9096609 |
3 |
10,39473 |
|
? |
|
|
|
|
7,8297031 |
16,186642 |
12 |
14,90519 |
0,110333
Задание 10. Составить программу и вычислить значение выборочного коэффициента корреляций
Рассчитаем в Ехсеlе значение выборочного коэффициента корреляции, воспользовавшись стандартной функцией КОРРЕЛ:
0,0473414
Задание 11. Проверить гипотезу о независимости генеральных совокупностей X и У. Для проверки использовать критерий, значение которого вычисляется с помощью корреляционной таблицы
Рассчитаем по формуле:
где n = ?ni + ?nj
для удобства, вычисления сведем в таблицу
nij^2/(ni*nj) |
4,8322656 |
6,08738 |
7,3424948 |
8,5976094 |
9,852724 |
ni |
|
1,519141 |
0 |
0,041667 |
0,0833333 |
0 |
0 |
3 |
|
2,394141 |
0 |
0,011364 |
0,0909091 |
0,1118881 |
0,0454545 |
11 |
|
3,269141 |
0,0533333 |
0,133333 |
0,0666667 |
0,0461538 |
0,0333333 |
15 |
|
4,144141 |
0,0571429 |
0,035714 |
0,1116071 |
0,0879121 |
0,0089286 |
14 |
|
5,0191411 |
0,0285714 |
0 |
0,0089286 |
0,043956 |
0,1607143 |
7 |
|
nj |
5 |
8 |
16 |
13 |
8 |
0 |
26,091117
Задаем уровень значимости 0,05
Находим число степеней свободы
.
По таблицам находим
26,296
Т.к. , то можно принять гипотезу о независимости генеральных совокупностей X и Y.
Размещено на Allbest.ru
...Подобные документы
Математическая статистика как наука о математических методах систематизации статистических данных, ее показатели. Составление интегральных статистических распределений выборочной совокупности, построение гистограмм. Вычисление точечных оценок параметров.
курсовая работа [241,3 K], добавлен 10.04.2011Длина интервала группирования. Графическое описание выборки. Гистограмма относительных частот. Кусочно-постоянная функция. Границы доверительного интервала математического ожидания. Вычисление коэффициента корреляции. Эмпирическая функция распределения.
практическая работа [737,5 K], добавлен 14.02.2009Длина интервала группирования. Гистограмма относительных частот. Кусочно-постоянная функция. Среднеквадратичное отклонение оценки математического ожидания случайной величины. Коэффициент корреляции. Границы доверительного интервала для ожидания.
курсовая работа [622,9 K], добавлен 18.02.2009Обоснование оценок прямых и косвенных измерений и их погрешностей. Введение доверительного интервала в асимптотическом приближении бесконечно большого числа экспериментов. Вычисление коэффициента корреляции для оценки зависимости случайных величин.
реферат [151,5 K], добавлен 19.08.2015Сущность закона распределения и его практическое применение для решения статистических задач. Определение дисперсии случайной величины, математического ожидания и среднеквадратического отклонения. Особенности однофакторного дисперсионного анализа.
контрольная работа [328,2 K], добавлен 07.12.2013Понятие доверительной вероятности и доверительного интервала и его границ. Закон распределения оценки. Построение доверительного интервала, соответствующего доверительной вероятности для математического ожидания. Доверительный интервал для дисперсии.
презентация [124,9 K], добавлен 01.11.2013Определение закона распределения вероятностей результатов измерения в математической статистике. Проверка соответствия эмпирического распределения теоретическому. Определение доверительного интервала, в котором лежит значение измеряемой величины.
курсовая работа [2,0 M], добавлен 11.02.2012Получение интервальной оценки. Построение доверительного интервала. Возникновение бутстрапа или практического компьютерного метода определения статистик вероятностных распределений, основанного на многократной генерации выборок методом Монте-Карло.
курсовая работа [755,6 K], добавлен 22.05.2015Построение линейной множественной регрессии для моделирования потребления продукта в разных географических районах. Расчет оценки дисперсии случайной составляющей. Вычисление и корректировка коэффициентов детерминации. Расчет доверительного интервала.
контрольная работа [814,0 K], добавлен 19.12.2013Понятие генеральной совокупности, математического ожидания и дисперсии. Обеспечение случайности и репрезентативности выборки в статистическом планировании. Дискретный и интервальный вариационный ряд, точечные оценки параметров распределения признака.
реферат [259,1 K], добавлен 13.06.2011Оценки неизвестных параметров закона распределения случайной величины Х по данным выборки. Интервальное оценивание. Случайный интервал. Граничные точки доверительного интервала. Нижний и верхний доверительные пределы.
реферат [30,0 K], добавлен 31.03.2003Понятие математической статистики как науки о математических методах систематизации и использования статистических данных для научных и практических выводов. Точечные оценки параметров статистических распределений. Анализ вычисления средних величин.
курсовая работа [215,1 K], добавлен 13.12.2014Изучение раздела математической статистики, посвященного методам выявления влияния отдельных факторов на результат эксперимента. Эффекты взаимодействия. Использование однофакторного дисперсионного анализа для сравнения средних значений нескольких выборок.
презентация [110,0 K], добавлен 09.11.2014Вычисление среднего одномерных случайных величин. Определение доверительного интервала для математического ожидания и для дисперсии. Построение эмпирической и приближенной линий регрессии Y по X. Дисперсионный анализ греко-латынского куба второго порядка.
курсовая работа [698,0 K], добавлен 08.05.2012Примеры пространства элементарных событий. Вероятность появления одного из двух несовместных событий. Функция распределения F(x,y) системы случайных величин. Расчет математического ожидания и дисперсии. Закон генеральной совокупности и его параметры.
контрольная работа [178,1 K], добавлен 15.06.2012Вычисление математического ожидания, дисперсии и коэффициента корреляции. Определение функции распределения и его плотности. Нахождение вероятности попадания в определенный интервал. Особенности построения гистограммы частот. Применение критерия Пирсона.
задача [140,0 K], добавлен 17.11.2011Ознакомление с математическим аппаратом анализа временных рядов и моделями авторегрессии. Составление простейших моделей авторегрессии стационарных временных рядов. Оценка дисперсии и автоковариации, построение графика автокорреляционной функции.
лабораторная работа [58,7 K], добавлен 14.03.2014Применение в статистике конкретных методов в зависимости от заданий. Методы массовых наблюдений, группировок, обобщающих показателей, динамических рядов, индексный метод. Корреляционный и дисперсный анализ. Расчет средних статистических величин.
контрольная работа [29,5 K], добавлен 21.09.2009Изучение изменений анализируемых показателей во времени как важнейшая задача статистики. Понятие рядов динамики (временных рядов). Числовые значения того или иного статистического показателя, составляющего ряд динамики. Классификация рядов динамики.
презентация [255,0 K], добавлен 28.11.2013Нахождение плотности, среднеквадратического отклонения, дисперсии, ковариации и коэффициента корреляции системы случайных величин. Определение доверительного интервала для оценки математического ожидания нормального распределения с заданной надежностью.
контрольная работа [200,3 K], добавлен 16.08.2010