Основы математической статистики
Ознакомление с особенностями составления интервального вариационного ряда. Исследование процесса создания группированных статистических рядов. Определение среднего значения и дисперсии группированных выборок. Расчет оценок генеральных дисперсий.
Рубрика | Математика |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 27.06.2015 |
Размер файла | 265,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ АРХТЕКТУРНО-СТРОИТЕЛЬНЫЙ УНИВЕРСИТЕТ (Сибстрин)
Контрольная работа по математической статистике
Проверил: Федоров А.В.
Новосибирск 2013
Исходные данные
X |
Y |
|
1,955887 |
11,650307 |
|
-0,51744 |
9,576991 |
|
0,873345 |
10,567775 |
|
0,132079 |
5,030357 |
|
3,254915 |
6,021142 |
|
0,781598 |
7,411927 |
|
0,440332 |
8,402712 |
|
-0,300934 |
9,793497 |
|
-2,37425 |
10,784282 |
|
3,812687 |
8,710965 |
|
0,00732 |
7,969699 |
|
0,998104 |
9,360484 |
|
-2,807263 |
8,619218 |
|
1,647623 |
10,010004 |
|
4,770459 |
9,268737 |
|
0,565592 |
10,659523 |
|
3,687927 |
9,918256 |
|
-1,058706 |
9,576991 |
|
3,254915 |
8,835724 |
|
-0,950453 |
8,494459 |
|
2,172383 |
9,485244 |
|
-0,300934 |
10,876029 |
|
2,821902 |
10,134763 |
|
0,348585 |
9,793497 |
|
-1,724731 |
5,588129 |
|
-0,733946 |
8,710965 |
|
0,656839 |
9,70175 |
|
-0,084427 |
7,628433 |
|
3,038408 |
8,619218 |
|
2,297142 |
8,277953 |
|
0,223826 |
9,268737 |
|
1,214611 |
7,195421 |
|
2,605396 |
8,186205 |
|
3,596181 |
9,035724 |
|
2,713649 |
11,758561 |
|
3,704434 |
12,60808 |
|
1,631117 |
10,134763 |
|
0,889851 |
8,061446 |
|
-1,183465 |
6,237648 |
|
2,730155 |
7,736687 |
|
1,847623 |
6,995421 |
|
0,565092 |
6,654155 |
|
1,955877 |
7,64494 |
|
1,214611 |
6,870661 |
|
0,873345 |
12,516333 |
|
1,86413 |
11,633801 |
|
1,522864 |
6,345902 |
|
0,240332 |
11,200788 |
|
-1,183465 |
11,650307 |
|
-1,383465 |
8,602712 |
Задание 1
Составить группированные статистические ряды, разбив выборки на 5 интервалов.
Для составления интервального вариационного ряда необходимо разбить весь интервал варьирования на равные частичные интервалы.
Для этого сначала определяем минимальное и максимальное значения во всем интервале:
4,770459
-2,807263
12,608080
5,030357
Далее находим размах R
7,577722
7,577723
Нам необходимо разбить весь интервал на частичные интервалы равной длины h
1,515544
1,515545
Далее определяем нижнюю границу первого частичного интервала
-2,807263
5,030357
находим границы всех интервалов по формуле:
Составим группированный статистический ряд для признака X:
№ интервала |
Левая граница интервала |
Правая граница интервала |
n |
|
1 |
-2,807263 |
-1,291719 |
4 |
|
2 |
-1,291719 |
0,223826 |
11 |
|
3 |
0,223826 |
1,739370 |
17 |
|
4 |
1,739370 |
3,254915 |
11 |
|
5 |
3,254915 |
4,770459 |
7 |
|
Сумма |
50 |
Составим группированный статистический ряд для признака Y
№ интервала |
Левая граница интервала |
Правая граница интервала |
n |
|
1 |
5,030357 |
6,545902 |
5 |
|
2 |
6,545902 |
8,061446 |
10 |
|
3 |
8,061446 |
9,576991 |
15 |
|
4 |
9,576991 |
11,092535 |
13 |
|
5 |
11,092535 |
12,608080 |
7 |
|
Сумма |
50 |
где n - частота (количество чисел выборки попадающих в соответствующей интервал)
Задание 2
Вычислить среднее значение и дисперсии группированных выборок.
Так как у нас интервальный вариационный ряд, то будут использоваться следующие формулы:
Среднее арифметическое:
где xi - середина i-го интервала, ni - частота i-го интервала
Выборочная дисперсия:
для удобства, вычисления сведем в таблицу
Вычислим среднее значение и дисперсию для признака X:
№ интервала |
Левая граница интервала |
Правая граница интервала |
Частота n |
середина интервала xi |
|||
1 |
-2,807263 |
-1,2917186 |
4 |
-2,0494908 |
-8,1979632 |
41,292297 |
|
2 |
-1,2917186 |
0,2238258 |
11 |
-0,5339464 |
-5,8734104 |
31,693198 |
|
3 |
0,2238258 |
1,7393702 |
17 |
0,981598 |
16,687166 |
0,562275 |
|
4 |
1,7393702 |
3,2549146 |
11 |
2,4971424 |
27,468566 |
19,565698 |
|
5 |
3,2549146 |
4,7704591 |
7 |
4,0126869 |
28,088808 |
56,826522 |
|
Сумма |
50 |
58,173167 |
149,93999 |
Вычислим среднее значение и дисперсию для признака Y:
№ интервала |
Левая граница интервала |
Правая граница интервала |
Частота n |
середина интервала xi |
|||
1 |
5,030357 |
6,5459016 |
5 |
5,7881293 |
28,940647 |
52,593854 |
|
2 |
6,5459016 |
8,0614462 |
10 |
7,3036739 |
73,036739 |
29,850193 |
|
3 |
8,0614462 |
9,5769908 |
15 |
8,8192185 |
132,28828 |
0,6752814 |
|
4 |
9,5769908 |
11,092535 |
13 |
10,334763 |
134,35192 |
22,083998 |
|
5 |
11,092535 |
12,60808 |
7 |
11,850308 |
82,952154 |
55,623892 |
|
Сумма |
50 |
451,56974 |
160,82722 |
Задание 3
Составить программу и провести расчет средних значений и дисперсий выборок.
Вводим исходные данные в ячейки первого и второго столбца. Для расчета среднего значения воспользуемся стандартной функцией СРЗНАЧ, а для расчета дисперсии - функцией ДИСП.
Получим следующие значения:
Для признака X:
1,046153
3,0134878
Для признака Y:
8,996346
3,2362803
Задание 4
Вычислить значения состоятельных и несмещенных оценок генеральных дисперсий D(X) и D(Y).
Значения состоятельных и несмещенных оценок генеральных дисперсий D(X) и D(Y) находим по формулам:
3,0599998
3,2821881
где n - число элементов выборки
Задание 5
Построить гистограммы, разбив выборки, на пять интервалов
Ось x - количество элементов в интервале, ось y - середина интервала.
Задание 6
Проверить гипотезу о том, что генеральные совокупности X и У распределены по нормальному закону. Использовать критерий Пирсона.
Для признака X:
Определим границы интервалов по формуле:
Для удобства вычислений составим таблицу:
i |
Границы интервалов |
Границы интервалов |
|||
xi |
xi+1 |
zi |
zi+1 |
||
1 |
-2,807263 |
-1,2917186 |
-2,269913 |
-1,4035341 |
|
2 |
-1,2917186 |
0,2238258 |
-1,403534 |
-0,537155 |
|
3 |
0,2238258 |
1,7393702 |
-0,537155 |
0,3292241 |
|
4 |
1,7393702 |
3,2549146 |
0,329224 |
1,1956031 |
|
5 |
3,2549146 |
4,7704591 |
1,195603 |
2,0619823 |
Найдем фактические вероятности pi и теоретические частоты n`i, по формулам: вариационный дисперсия статистический
где Ф(zi) - значение функции Лапласа в точке zi
где n = 50 - количество элементов выборки
Результаты расчетов запишем в таблицу:
i |
Границы интервалов |
Ф(zi) |
Ф(zi+1) |
pi |
ni`=pi*50 |
||
zi |
zi+1 |
||||||
1 |
-2,2699132 |
-1,4035341 |
-0,488394 |
-0,4197712 |
0,0686224 |
3,4311193 |
|
2 |
-1,4035341 |
-0,537155 |
-0,419771 |
-0,2044197 |
0,2153515 |
10,767573 |
|
3 |
-0,537155 |
0,3292241 |
-0,20442 |
0,1290068 |
0,3334266 |
16,671328 |
|
4 |
0,3292241 |
1,1956031 |
0,129007 |
0,3840743 |
0,2550674 |
12,753372 |
|
5 |
1,1956031 |
2,0619823 |
0,384074 |
0,4803953 |
0,096321 |
4,816051 |
|
Сумма |
0,9687889 |
48,439443 |
Вычислим наблюдаемое значение критерия Пирсона по формуле:
Для удобства, вычисления сведем в таблицу
i |
ni |
ni` |
ni-ni` |
(ni-ni`)^2 |
X^2набл |
|
1 |
4 |
3,4311193 |
0,568881 |
0,3236253 |
0,0943206 |
|
2 |
11 |
10,767573 |
0,232427 |
0,0540225 |
0,0050171 |
|
3 |
17 |
16,671328 |
0,328672 |
0,1080251 |
0,0064797 |
|
4 |
11 |
12,753372 |
-1,753372 |
3,0743135 |
0,2410589 |
|
5 |
7 |
4,816051 |
2,183949 |
4,769633 |
0,9903618 |
|
Сумма |
50 |
48,439443 |
1,3372381 |
1,3372381
По уровню значимости =0,05 и количеству степеней свободы k=n-3=5-3=2 находим по таблице критических точек распределения «хи-квадрат»:
Так как , то нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности признака X.
Для признака Y:
Определим границы интервалов по формуле:
Для удобства вычислений составим таблицу:
i |
Границы интервалов |
Границы интервалов |
|||
xi |
xi+1 |
zi |
zi+1 |
||
1 |
5,030357 |
6,5459016 |
-2,208467 |
-1,3719265 |
|
2 |
6,5459016 |
8,0614462 |
-1,371926 |
-0,5353859 |
|
3 |
8,0614462 |
9,5769908 |
-0,535386 |
0,3011546 |
|
4 |
9,5769908 |
11,092535 |
0,301155 |
1,1376951 |
|
5 |
11,092535 |
12,60808 |
1,137695 |
1,9742356 |
Найдем фактические вероятности pi и теоретические частоты n`i, по формулам:
где Ф(zi) - значение функции Лапласа в точке zi
где n = 50 - количество элементов выборки
Результаты расчетов запишем в таблицу:
i |
Границы интервалов |
Ф(zi) |
Ф(zi+1) |
pi |
ni`=pi*50 |
||
zi |
zi+1 |
||||||
1 |
-2,208467 |
-1,3719265 |
-0,486394 |
-0,4149568 |
0,0714373 |
3,5718648 |
|
2 |
-1,3719265 |
-0,5353859 |
-0,414957 |
-0,2038085 |
0,2111483 |
10,557417 |
|
3 |
-0,5353859 |
0,3011546 |
-0,203808 |
0,1183517 |
0,3221602 |
16,108009 |
|
4 |
0,3011546 |
1,1376951 |
0,118352 |
0,3723761 |
0,2540244 |
12,70122 |
|
5 |
1,1376951 |
1,9742356 |
0,372376 |
0,4758225 |
0,1034464 |
5,1723214 |
|
Сумма |
0,9622167 |
48,110833 |
Вычислим наблюдаемое значение критерия Пирсона по формуле:
Для удобства, вычисления сведем в таблицу
i |
ni |
ni` |
ni-ni` |
(ni-ni`)^2 |
X^2набл |
|
1 |
5 |
3,5718648 |
1,428135 |
2,03957 |
0,5710099 |
|
2 |
10 |
10,557417 |
-0,557417 |
0,3107138 |
0,0294308 |
|
3 |
15 |
16,108009 |
-1,108009 |
1,2276847 |
0,0762158 |
|
4 |
13 |
12,70122 |
0,29878 |
0,0892694 |
0,0070284 |
|
5 |
7 |
5,1723214 |
1,827679 |
3,3404089 |
0,6458239 |
|
Сумма |
50 |
48,110833 |
1,889167 |
3,5689529 |
1,3295088 |
1,3295088
По уровню значимости =0,05 и количеству степеней свободы k=n-3=5-3=2 находим по таблице критических точек распределения «хи-квадрат»:
Так как , то нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности признака X.
Задание 7
Из выборки, для которой гипотеза о нормальном распределении подтвердилась, взять первые 10 элементов. Найти доверительный интервал для генеральной средней. В качестве дисперсии генеральной совокупности взять значение дисперсии, полученное на ЭВМ.
Для признака X:
Рассчитаем среднее значение и дисперсию для n = 10.
xi |
|
1,955887 |
|
-0,517440 |
|
0,873345 |
|
0,132079 |
|
3,254915 |
|
0,781598 |
|
0,440332 |
|
-0,300934 |
|
-2,374250 |
|
3,812687 |
0,8058219
3,3381546
Находим среднее квадратическое отклонение:
1,8270617
Доверительный интервал - интервал, который с заданной вероятностью «накрывает» неизвестное истинное значение генеральной характеристики. Границы, в которые попадает генеральная средняя, задаются неравенствами:
где - предельная ошибка выборки, t - коэффициент доверия, который определим из соотношения:
где Ф(х) - интегральная функция Лапласа, по условию p = 0,95 из таблицы значений интегральной функции Лапласа определим t:
Тогда
1,1324246
Для признака Y:
Рассчитаем среднее значение и дисперсию для n = 10.
yi |
|
11,650307 |
|
9,576991 |
|
10,567775 |
|
5,030357 |
|
6,021142 |
|
7,411927 |
|
8,402712 |
|
9,793497 |
|
10,784282 |
|
8,710965 |
8,7949955
4,5335473
Находим среднее квадратическое отклонение:
2,1292128
Доверительный интервал - интервал, который с заданной вероятностью «накрывает» неизвестное истинное значение генеральной характеристики. Границы, в которые попадает генеральная средняя, задаются неравенствами:
где - предельная ошибка выборки, t - коэффициент доверия, который определим из соотношения:
где Ф(х) - интегральная функция Лапласа, по условию p = 0,95
Из таблицы значений интегральной функции Лапласа определим t
Тогда
1,3196998
Задание 8
Составить корреляционную таблицу.
Числовой характеристикой, измеряющей степень тесноты линейной связи между случайными переменными X и У. является коэффициент корреляции между X и У, который обозначим P(Х,У).
Составим корреляционную таблицу:
p (X,Y) |
5,030357 |
6,545902 |
8,061446 |
9,576991 |
11,092535 |
ni |
||
6,545902 |
8,061446 |
9,576991 |
11,092535 |
12,608080 |
||||
-2,807263 |
-1,291719 |
1 |
2 |
1 |
4 |
|||
-1,291719 |
0,223826 |
2 |
3 |
5 |
1 |
11 |
||
0,223826 |
1,739370 |
3 |
4 |
5 |
2 |
3 |
17 |
|
1,739370 |
3,254915 |
1 |
3 |
3 |
3 |
1 |
11 |
|
3,254915 |
4,770459 |
1 |
2 |
2 |
2 |
7 |
||
nj |
5 |
5 |
10 |
15 |
13 |
7 |
ni nj частоты интервалов для выборки X и Y соответственно
Задание 9
Используя корреляционную таблицу, вычислить значения выборочного коэффициента корреляций.
Точечной оценкой теоретического коэффициента корреляции р(Х,У) является выборочный коэффициент корреляции который находится по формуле:
где xi yi - середины интервалов, - среднее по выборке X и Y соответственно, nxy - частота на пересечении x и y в корреляционной таблице
1,0461531
8,9963465
Для удобства, вычисления сведем в таблицу
середины интервалов |
(xi-X) |
(yi-Y) |
(xi-X)^2 |
(yi-Y)^2 |
p (X,Y) |
(xi-X)*(yi-Y)*p(X,Y) |
|||
1 |
xi |
yi |
|||||||
2 |
-2,0494908 |
5,7881293 |
-3,095644 |
-3,2082172 |
9,5830114 |
10,292657 |
0 |
0 |
|
3 |
-0,5339464 |
7,3036739 |
-1,5801 |
-1,6926726 |
2,4967146 |
2,8651404 |
2 |
5,349182 |
|
4 |
0,981598 |
8,8192185 |
-0,064555 |
-0,177128 |
0,0041674 |
0,0313743 |
5 |
0,057173 |
|
5 |
2,4971424 |
10,334763 |
1,450989 |
1,3384166 |
2,1053698 |
1,7913591 |
3 |
5,826085 |
|
6 |
4,0126869 |
11,850308 |
2,966534 |
2,8539612 |
8,8003223 |
8,1450948 |
2 |
16,93274 |
|
? |
22,989585 |
23,125626 |
12 |
28,16518 |
0,1017933
Задание 10
Составить программу и вычислить значение выборочного коэффициента корреляций
Рассчитаем в Ехсеlе значение выборочного коэффициента корреляции, воспользовавшись стандартной функцией КОРРЕЛ:
0,0926423
Задание 11
Проверить гипотезу о независимости генеральных совокупностей X и У. Для проверки использовать критерий, значение которого вычисляется с помощью корреляционной таблицы.
Рассчитаем по формуле:
где n = ?ni + ?nj
для удобства, вычисления сведем в таблицу
nij^2/(ni*nj) |
6,5459016 |
8,061446 |
9,5769908 |
11,092535 |
12,60808 |
ni |
|
-1,2917186 |
0 |
0,025 |
0,0666667 |
0,0192308 |
0 |
4 |
|
0,2238258 |
0 |
0,036364 |
0,0545455 |
0,1748252 |
0,012987 |
11 |
|
1,7393702 |
0,1058824 |
0,094118 |
0,0980392 |
0,0180995 |
0,0756303 |
17 |
|
3,2549146 |
0,0181818 |
0,081818 |
0,0545455 |
0,0629371 |
0,012987 |
11 |
|
4,7704591 |
0,0285714 |
0 |
0,0380952 |
0,043956 |
0,0816327 |
7 |
|
nj |
5 |
10 |
15 |
13 |
7 |
0 |
20,411262
Задаем уровень значимости 0,05. Находим число степеней свободы
.
По таблицам находим
Т.к. , то можно принять гипотезу о независимости генеральных совокупностей X и Y.
Размещено на Allbest.ru
...Подобные документы
Числовые характеристики для статистических распределений. Построение интервального вариационного ряда, многоугольника частостей, графика выборочной функции распределения и определения среднего значения выборки и выборочной дисперсии двумя способами.
презентация [140,3 K], добавлен 01.11.2013Нахождение вероятности того, что наудачу взятое натуральное число не делится. Построение гистограммы для изображения интервальных рядов, расчет средней арифметической дискретного вариационного ряда, среднего квадратического отклонения и дисперсии.
контрольная работа [140,8 K], добавлен 18.05.2009Составление характеристики непрерывного признака. Методы составления приближенного распределения признака, имеющего непрерывное распределения. Относительные частоты и их плотности. Статистическое распределение частот интервального вариационного ряда.
творческая работа [17,8 K], добавлен 10.11.2008Определение вероятность срабатывания устройств при аварии. Расчет математического ожидания, дисперсии и функции распределения по заданному ряду распределения. Построение интервального статистического ряда распределения значений статистических данных.
контрольная работа [148,8 K], добавлен 12.02.2012Ознакомление с механизмом проверки гипотезы для случая единственной выборки, двух и нескольких независимых выборок. Проверка совпадений карт, выбор фильмов разных жанров. Обоснование результатов, полученных после проверки статистических гипотез.
курсовая работа [726,2 K], добавлен 26.02.2015Исторические аспекты развития статистики, ее предмет. Понятие статистической методологии. Организация государственной и международной статистики. Программа и формы статистического наблюдения. Формы вариационного ряда. Средняя арифметическая и ее свойства.
шпаргалка [37,9 K], добавлен 12.12.2010Понятие математической статистики как науки о математических методах систематизации и использования статистических данных для научных и практических выводов. Точечные оценки параметров статистических распределений. Анализ вычисления средних величин.
курсовая работа [215,1 K], добавлен 13.12.2014Построение полигона относительных частот, эмпирической функции распределения, кумулянты и гистограммы. Расчет точечных оценок неизвестных числовых характеристик. Проверка гипотезы о виде распределения для простого и сгруппированного ряда распределения.
курсовая работа [216,2 K], добавлен 28.09.2011Основные этапы обработки данных натуральных наблюдений методом математической статистики. Оценка полученных результатов, их использование при принятии управленческих решений в области охраны природы и природопользования. Проверка статистических гипотез.
практическая работа [132,1 K], добавлен 24.05.2013Теоретические основы юридической статистики, числовые характеристики. Построение гистограммы выборки. Оценка среднего значения, дисперсии и эксцесса. Выборочное уравнение регрессии по данным корреляционных таблиц. Интервальная оценка распределения.
курсовая работа [1,1 M], добавлен 16.11.2013Определение вероятности наступления определенного события по законам теории вероятности. Вычисление математического ожидания, дисперсии и среднего квадратичного отклонения. Нахождение выборочного уравнения регрессии по данным корреляционной таблицы.
контрольная работа [212,0 K], добавлен 01.05.2010Исследование сходимости числового ряда. Использование признака Даламбера. Исследование на сходимость знакочередующегося ряда. Сходимость рядов по признаку Лейбница. Определение области сходимости степенного ряда. Сходимость ряда на концах интервала.
контрольная работа [131,9 K], добавлен 14.12.2012Ознакомление с математическим аппаратом анализа временных рядов и моделями авторегрессии. Составление простейших моделей авторегрессии стационарных временных рядов. Оценка дисперсии и автоковариации, построение графика автокорреляционной функции.
лабораторная работа [58,7 K], добавлен 14.03.2014Изучение изменений анализируемых показателей во времени как важнейшая задача статистики. Понятие рядов динамики (временных рядов). Числовые значения того или иного статистического показателя, составляющего ряд динамики. Классификация рядов динамики.
презентация [255,0 K], добавлен 28.11.2013Определение среднего квадратичного отклонения. Расчет значения критерия Стьюдента, значения доверительных границ с его учетом. Обоснование выбора математической модели прогнозирования. Параметры по методу наименьших квадратов, наработка до отказа.
контрольная работа [394,1 K], добавлен 18.06.2014Определение условий сходимости положительного ряда и описание свойств гармонических рядов Дирихле. Изучение теорем сравнения рядов и описание схемы Куммера для вывода из нее признаков сравнения ряда. Вывод признаков сравнения Даламбера, Раабе и Бертрана.
курсовая работа [263,6 K], добавлен 14.06.2015Основные понятия математической статистики, интервальные оценки. Метод моментов и метод максимального правдоподобия. Проверка статистических гипотез о виде закона распределения при помощи критерия Пирсона. Свойства оценок, непрерывные распределения.
курсовая работа [549,1 K], добавлен 07.08.2013Решение неравенств и определение области сходимости рядов по признаку Даламбера и теореме Лейбница для знакопеременных рядов. Условия и пределы сходимости ряда. Исследование границ интервала. Проверка условия Лейбница при знакочередующемся ряде.
контрольная работа [127,2 K], добавлен 07.09.2010Определение математической вероятности правильного набора, если на нечетных местах комбинации стоят одинаковые цифры. Использование классического определения вероятности. Расчет математического ожидания и дисперсии для очков, выпавших на игральных костях.
контрольная работа [90,2 K], добавлен 04.01.2011Алгоритм определения вероятности события и выполнения статистических ожиданий. Оценка возможных значений случайной величины и их вероятности. Расчет математического ожидания, дисперсии и среднего квадратического отклонения. Анализ характеристик признака.
контрольная работа [263,8 K], добавлен 13.01.2014