Проверка статистических гипотез
Определение интервальных статистических рядов распределения частот, составление эмпирических функций распределения, анализ числовых характеристик выборки. Изучение методики проверки статистических гипотез. Анализ метода наименьших квадратов в статистике.
Рубрика | Математика |
Вид | методичка |
Язык | русский |
Дата добавления | 06.05.2015 |
Размер файла | 351,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ВВЕДЕНИЕ
Самостоятельное выполнение студентами заданий является одним из важнейших условий усвоения математической статистики.
Предлагаемые методические указания составлены таким образом, чтобы студент, пользуясь ими, решил самостоятельно поставленные перед ним задачи.
Методические указания включают четыре задания по математической статистике: «Статистическое распределение», «Проверка статистических гипотез», «Корреляция», «Метод наименьших квадратов».
Построение каждого задания следующее. Вначале сформулировано само задание. Затем дается решение типового примера на конкретных данных выборки объема 100. Приведены формулы, расчеты, чертежи. Сделаны соответствующие выводы.
Выполнение задания «Метод наименьших квадратов» предполагается на ЭВМ. Дана программа и образец распечатки результатов для отчетности студента.
В приложениях кроме таблиц функции Лапласа и критерия согласия Пирсона (приложения 1,2) даны таблицы данных эффективности сельскохозяйственного производства для выполнения заданий, по которым можно выдать необходимое количество вариантов.
Приложение 3 содержит практический материал для заданий 1-3, приложение 4 - для задания 4.
Методические указания составлены для студентов экономических специальностей, однако могут быть использованы студентами всех факультетов.
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА
1. Сборник индивидуальных заданий по теории вероятностей и математической статистике: учеб. пособие/ А.П. Рябушко, В.В. Бархатов, В.В. Державец, И.Е. Юруть; под общ. ред. А.П. Рябушко. Минск: Выш.шк., 1992.
2. М а ц к е в и ч И.П. Высшая математика. Теория вероятностей и математическая статистика: учебник / И.П. Мацкевич, Г.П. Свирид. Минск: Выш.шк., 1993.
3. К р а с с М.С. Основы математики и ее приложения в экономическом образовании: учебник / М.С.Красс, Б.П.Чупрынов. 2-е изд., испр. М.: Дело, 2001.
4. Г у с а к А.А. Высшая математика. Т. 2 / А.А. Гусак. Минск: Тетра Системс, 2000.
5. Б е л ь к о И.В. Теория вероятностей и математическая статистика. Примеры и задачи: учеб. пособие/ И.В. Белько, Г.П. Свирид; под ред. К.К.Кузьмича. 2-е изд., стер. Минск: Новое знание, 2004.
6. П и с ь м е н н ы й Д.Т. Конспект лекций по теории вероятностей и математической статистике / Д.Т.Письменный. М.: Айрис - пресс, 2004.
7. Г р и н б е р г А.С. Теория вероятностей и математическая статистика: курс лекций/ А.С. Гринберг, О.Б. Плющ, Б.В. Новыш . 3-е изд. доп. Минск: Академия управления при Президенте Республики Беларусь, 2005.
ЗАДАНИЕ 1. СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ
По статистическим данным случайных величин (СВ) Х и У требуется:
1) составить интервальные статистические ряды распределения частот и частостей;
2) построить гистограмму и полигон частостей;
3) составить эмпирические функции распределения F*(x) и F*(y), поcтроить их графики;
4) вычислить числовые характеристики выборки: среднюю выборочную , дисперсию выборочную (, среднее квадратическое выборочное отклонение (, асимметрию и эксцесс Аs(Х) (Аs(У)), выборочный коэффициент вариации V(Х) (V(У)).
Решение типового варианта
Методику выполнения этого задания покажем на примере статистических данных (табл. 1) , где СВ Х - стоимость основных производственных фондов ( y.е/га) , СВ У - стоимость валовой продукции (y.е/га).
1. Изучение непрерывной случайной величины ( НСВ) начинается с группировки статистического материала, т.е. с разбиения интервала наблюденных значений СВ Х на k частичных интервалов равной длины и подсчета частот попадания наблюденных значений СВ Х в частичные интервалы. Количество интервалов можно выбирать произвольно, их число обычно бывает не менее 5 и не более 15. Можно для определения числа интервалов использовать формулу
где n - объем выборочной совокупности. При объеме выборки n = 100 имеем Далее определяют размах вариации R, длину интервала наблюденных СВ Х, , где - наименьшее значение СВ Х, - наибольшее ее значение.
Определив размах вариации, определяют ширину частичного интервала. Ширина частичного интервала должна способствовать выявлению основных черт распределения и сглаживанию случайных колебаний признака в выборочной совокупности.
Т а б л и ц а 1. Статистические данные
№ п.п. |
X |
У |
№ п.п. |
X |
У |
№ п.п. |
X |
У |
|
1 |
0,73 |
0,60 |
36 |
1,48 |
1,50 |
71 |
0,68 |
0,53 |
|
2 |
0,82 |
0,61 |
37 |
1,39 |
1,48 |
72 |
0,89 |
0,82 |
|
3 |
0,89 |
0,95 |
38 |
0,96 |
0,89 |
73 |
1,27 |
1,40 |
|
4 |
1,79 |
1,22 |
39 |
1,29 |
1,25 |
74 |
1,33 |
1,29 |
|
5 |
1,41 |
0,88 |
40 |
0,96 |
0,81 |
75 |
0,92 |
0,65 |
|
6 |
0,80 |
0,58 |
41 |
1,28 |
1,17 |
76 |
0,93 |
0,58 |
|
7 |
0,83 |
0,50 |
42 |
1,53 |
1,42 |
77 |
1,16 |
0,80 |
|
8 |
0,57 |
0,70 |
43 |
1,68 |
1,81 |
78 |
1,04 |
0,93 |
|
9 |
1,15 |
0,77 |
44 |
1,43 |
1,51 |
79 |
0,98 |
0,62 |
|
10 |
1,41 |
1,41 |
45 |
0,99 |
1,17 |
80 |
0,88 |
1,09 |
|
11 |
1,35 |
0,92 |
46 |
1,19 |
0,95 |
81 |
1,39 |
1,44 |
|
12 |
0,97 |
0,56 |
47 |
1,05 |
0,98 |
82 |
1,21 |
1,12 |
|
13 |
0,92 |
0,67 |
48 |
0,94 |
0,79 |
83 |
1,06 |
1,33 |
|
14 |
0,78 |
0,58 |
49 |
0,87 |
0,91 |
84 |
0,80 |
0,90 |
|
15 |
0,97 |
0,87 |
50 |
1,22 |
1,10 |
85 |
0,92 |
0,61 |
|
16 |
1,13 |
1,25 |
51 |
1,29 |
1,23 |
86 |
1,08 |
0,63 |
|
17 |
1,16 |
1,05 |
52 |
1,10 |
0,99 |
87 |
0,98 |
0,89 |
|
18 |
1,27 |
1,01 |
53 |
1,07 |
0,87 |
88 |
1,10 |
1,02 |
|
19 |
0,93 |
0,94 |
54 |
1,20 |
1,11 |
89 |
0,74 |
0,68 |
|
20 |
1,12 |
0,88 |
55 |
0,97 |
1,10 |
90 |
1,12 |
0,75 |
|
21 |
1,24 |
1,15 |
56 |
1,34 |
1,08 |
91 |
0,95 |
0,89 |
|
22 |
1,04 |
0,93 |
57 |
1,54 |
1,40 |
92 |
1,06 |
0,92 |
|
23 |
0,95 |
0,60 |
58 |
1,28 |
1,51 |
93 |
0,72 |
0,58 |
|
24 |
0,96 |
0,69 |
59 |
1,20 |
0,86 |
94 |
1,21 |
1,13 |
|
25 |
1,08 |
0,69 |
60 |
0,99 |
0,62 |
95 |
0,83 |
0,67 |
|
26 |
1,27 |
0,84 |
61 |
0,85 |
0,56 |
96 |
0,91 |
0,78 |
|
27 |
1,81 |
1,04 |
62 |
0,80 |
0,83 |
97 |
0,98 |
0,66 |
|
28 |
1,79 |
1,13 |
63 |
1,07 |
0,75 |
98 |
1,20 |
0,94 |
|
29 |
1,33 |
1,20 |
64 |
0,94 |
0,88 |
99 |
0,94 |
0,59 |
|
30 |
1,05 |
1,10 |
65 |
0,88 |
0,93 |
100 |
1,02 |
0,86 |
|
31 |
0,85 |
0,70 |
66 |
1,36 |
1,16 |
||||
32 |
0,99 |
0,75 |
67 |
1,24 |
1,39 |
||||
33 |
1,12 |
0,99 |
68 |
0,89 |
0,77 |
||||
34 |
0,89 |
0,58 |
69 |
0,77 |
0,83 |
||||
35 |
0,85 |
0,67 |
70 |
1,10 |
0,74 |
При построении частичных интервалов рекомендуется за начало первого интервала х0 взять , где h - ширина частичного интервала, определяемая по формуле , тогда границы частичных интервалов находятся следующим образом:
хо= хmin- , х1=хо + h, х2=х1 + h, …,
В нашем случае, как определили ранее, k = 7, xmin=0,57, xmax=1,81, тогда R = xmax - xmin= 1,81- 0,57 = 1,24 и ширина частичного интервала есть . Если при нахождении h деление не выполняется нацело, то результат округляют в большую сторону.
Далее имеем и получаем
Если бы выражалось десятичной дробью с двумя знаками после запятой, то границы частичных интервалов имели бы такой же вид, и тогда при подсчете частот в каждый интервал включаются те значения СВ Х, которые больше нижней границы и меньше или равны верхней границе соответствующего частичного интервала. Сумма всех частот должна быть равна объему выборки, т.е. .
Шкала интервалов и группировка исходных статистических данных сведены в табл. 2. В результате получили статистический ряд распределения частот.
Т а б л и ц а 2. Подсчет частот СВ Х
Интервалы наблюден- ных значе- ний СВ Х |
0,465- 0,675 |
0,675- 0,885 |
0,885- 1,095 |
1,095- 1,305 |
1,305- 1,515 |
1,515- 1,725 |
1,725- 1,935 |
|
Подсчет частот |
I |
IIIIIIIII IIIIIIIII |
IIIIIIIIII IIIIIIIIII IIIIIIIIII IIIIIIII |
IIIIIIIII IIIIIIIII IIIIIIII |
IIIIIIIII II |
III |
III |
|
Частоты mi |
1 |
18 |
38 |
26 |
11 |
3 |
3 |
Контроль:
Для получения статистического ряда частостей разделим частоты на объем выборки. В результате получаем интервальный статистический ряд распределения частостей. В табл. 3 представлен интервальный статистический ряд распределения частот и частостей СВ Х.
Т а б л и ц а 3. Интервальный статистический ряд распределения СВ Х
Интервалы наблюден- ных значе- ний СВ Х |
0,465- 0,675 |
0,675- 0,885 |
0,885- 1,095 |
1,095- 1,305 |
1,305- 1,515 |
1,515- 1,725 |
1,725- 1,935 |
|
Частоты |
1 |
18 |
38 |
26 |
11 |
3 |
3 |
|
Частости |
0,01 |
0,18 |
0,38 |
0,26 |
0,11 |
0,03 |
0,03 |
|
-накопленные частости |
0,01 |
0,19 |
0,57 |
0,83 |
0,94 |
0,97 |
1,00 |
|
0,05 |
0,86 |
1,80 |
1,24 |
0,52 |
0,14 |
0,14 |
Контроль:
2. Для построения гистограммы частостей на оси ОХ откладывают частичные интервалы, на каждом из которых строят прямоугольник, площадь которого равна частости соответствующего частичного интервала. Полученная при этом ступенчатая фигура называется гистограммой частостей. Если частости отнести к серединам частичных интервалов, то полученная ломаная линия образует полигон частостей.
На рис.1 изображены гистограмма и полигон частостей.
Размещено на http://www.allbest.ru/
Рис. 1.
3. Значения эмпирической функции распределения F*(x) записаны в соответствующей строке табл. 3. Составим аналитическое выражение для эмпирической функции распределения F*(x).
Замечание. При построении графика эмпирической функции распределения ее значения относят к верхней границе частичного интервала. График эмпирической функции изображен на рис.2.
Размещено на http://www.allbest.ru/
Рис. 2.
4. Числовые характеристики выборки найдем по формулам:
- средняя выборочная,
- дисперсия выборочная,
- выборочное среднее квадратическое отклонение,
-асимметрия,
- эксцесс,
- выборочный коэффициент вариации,
где хi и mi - соответственно середина и частота i-го интервала.
Составим табл. 4 для вычисления числовых характеристик СВ Х.
Т а б л и ц а 4. Вычисление числовых характеристик СВ Х
Интервалы наблюденных значений СВ Х |
Середины интервалов хi |
Частоты |
|||||||
0,465-0,675 |
0,57 |
1 |
0,57 |
- 0,5229 |
- 0,5229 |
0,2734 |
- 0,1429 |
0,0748 |
|
0,675-0,885 |
0,78 |
18 |
14,04 |
- 0,3129 |
- 5,6322 |
1,7622 |
- 0,6534 |
0,1728 |
|
0,885-1,095 |
0,99 |
38 |
37,62 |
- 0,1029 |
- 3,9102 |
0,4028 |
- 0,0418 |
0,0038 |
|
1,095-1,305 |
1,20 |
26 |
31,20 |
0,1071 |
2,7846 |
0,2990 |
0,0312 |
0,0026 |
|
1,305-1,515 |
1,41 |
11 |
15,51 |
0,3171 |
3,4881 |
1,1066 |
0,3509 |
0,1111 |
|
1,515-1,725 |
1,62 |
3 |
4,86 |
0,5271 |
1,5813 |
0,8334 |
0,4392 |
0,2316 |
|
1,725-1,935 |
1,83 |
3 |
5,49 |
0,7331 |
2,2113 |
1,6299 |
1,2015 |
0,8856 |
|
Cумма |
100 |
109,29 |
0 |
6,3073 |
1,1847 |
1,4823 |
Аналогичным образом выполним это задание для СВ У - стоимость валовой продукции (у. е/га).
1. Составим интервальный статистический ряд частот и частостей СВ У (табл. 5, 6).
.
.
Т а б л и ц а 5. Подсчет частот СВ У
Интервалы наблюден- ных значе- ний СВ У |
0,39-0,61 |
0,61-0,83 |
0,83-1,05 |
1,05-1,27 |
1,27-1,49 |
1,49-1,71 |
1,71-1,93 |
|
Подсчет частот |
IIIIIII IIIIIII |
IIIIIIIII IIIIIIIII IIIIIIII |
IIIIIIIII IIIIIIIII IIIIIIIII II |
IIIIIIIII IIIIIIIII |
IIIIIIIII |
III |
I |
|
Частоты mi |
14 |
26 |
29 |
18 |
9 |
3 |
1 |
Контроль: .
Т а б л и ц а 6. Интервальный статистический ряд распределения СВ У
Интервалы наблюден- ных значе- ний СВ У |
0,39-0,61 |
0,61-0,83 |
0,83-1,05 |
1,05-1,27 |
1,27-1,49 |
1,49-1,71 |
1,71-1,93 |
|
Частоты |
14 |
26 |
29 |
18 |
9 |
3 |
1 |
|
Частости |
0,14 |
0,26 |
0,29 |
0,18 |
0,09 |
0,03 |
0,01 |
|
-накопленные частости |
0,14 |
0,40 |
0,69 |
0,87 |
0,96 |
0,99 |
1,00 |
|
0,64 |
1,2 |
1,3 |
0,82 |
0,4 |
0,14 |
0,05 |
Контроль:
2. Построим гистограмму и полигон частостей СВ У (рис.3).
Рис. 3.
3. Составим эмпирическую функцию распределения и построим ее график (рис. 4).
Рис. 4.
4. Вычислим числовые характеристики выборки (табл.7) (
ЗАДАНИЕ 2. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
1. По результатам задания 1 по виду гистограммы и полигона частостей, а также по значению выборочных коэффициентов асимметрии и эксцесса сделать предварительный выбор закона распределения
СВ Х и У.
2. Найти точечные оценки параметров нормального распределения, записать для него функцию плотности вероятности f(x) (f(y)) и функцию распределения F(x) (F(y)).
3. Найти теоретические частоты нормального распределения. Проверить согласие эмпирической функции распределения с теоретической, используя критерий согласия Пирсона для СВ Х и У. Построить эмпирические и теоретические кривые распределения.
Т а б л и ц а 7. Вычисление числовых характеристик СВ У
Интервалы наблюденных значений СВ У |
Середины интервалов yi |
Частоты mi |
|||||||
0,39-0,61 |
0,50 |
14 |
7 |
- 0,429 |
- 6,006 |
2,5760 |
- 1,1051 |
0,4732 |
|
0,61-0,83 |
0,72 |
26 |
18,72 |
- 0,209 |
- 5,434 |
1,1362 |
- 0,2374 |
0,0494 |
|
0,83-1,05 |
0,94 |
29 |
27,26 |
0,011 |
0,319 |
0,0029 |
0,0000 |
0,0000 |
|
1,05-1,27 |
1,16 |
18 |
20,88 |
0,231 |
4,158 |
0,9612 |
0,2214 |
0,0504 |
|
1,27-1,49 |
1,38 |
9 |
12,42 |
0,451 |
4,059 |
1,8306 |
0,8253 |
0,3726 |
|
1,49-1,71 |
1,60 |
3 |
4,8 |
0,671 |
2,013 |
1,3506 |
0,9060 |
0,6078 |
|
1,71-1,93 |
1,82 |
1 |
1,82 |
0,891 |
0,891 |
0,7939 |
0,7074 |
0,6303 |
|
Сумма |
100 |
92,9 |
0 |
8,6514 |
1,3176 |
2,1837 |
4. Найти доверительный интервал для оценки математического ожидания нормального распределения (доверительную вероятность принять 1-=0,95).
Решение типового варианта
Методику выполнения этого задания покажем на результатах задания 1.
1. По виду гистограммы и полигона частостей (напоминают нормальную кривую), а также по значению выборочных коэффициентов асимметрии и эксцесса (Аs(X)=0,749, , они близки к нулю), предполагая, что СВ Х - стоимость основных производственных фондов изменяется под влиянием большого числа факторов, примерно равнозначных по силе влияния, можно выдвинуть гипотезу о том, что закон распределения СВ Х является нормальным.
2. Плотность вероятности нормального закона распределения имеет вид , или
Точечными оценками параметров а и нормального закона распределения служат средняя выборочная и среднее выборочное квадратическое отклонение , вычисленные ранее, т.е. , =0,251. Следовательно, плотность вероятности предполагаемого нормального закона распределения имеет вид
, или
.
Функция распределения предполагаемого нормального закона
.
Используя нормированную функцию Лапласа , функцию распределения нормального закона записывают в виде , в нашем случае эта функция есть , ее называют теоретической функцией распределения.
3. Проведем проверку гипотезы о нормальном законе распределения СВ Х, используя критерий согласия Пирсона . Для удобства вычислений интервалы наблюденных значений нормируют, т.е. выражают их в единицах среднего квадратического отклонения : , причем наименьшее значение ui полагают равным , а наибольшее - , эта замена производится для того, чтобы сумма теоретических частот была равной объему выборки. Далее вычисляют вероятность попадания СВ Х, распределенной по нормальному закону с параметрами и , в частичные интервалы по формуле
После того как будут найдены находим теоретические частоты для каждого частичного интервала по формуле , где - теоретическая частота i-го интервала. Между теоретическими и эмпирическими частотами могут быть расхождения. Замену эмпирических частот теоретическими называют выравниванием частот статистического ряда.
Составим табл. 8 для вычисления теоретических частот СВ Х.
Для примера вычислений найдем вероятность того , что СВ Х попадет в первый частичный интервал , эта вероятность равна
. Аналогично находим
и т.д. Для вычисления значений функции Ф использовано приложение 1. После этого вычисляют теоретические частоты , например, и т.д. Сумма теоретических частот должно быть равна объему выборки, т.е. . Далее находим значение выборочной статистики или это есть наблюдаемое значение критерия . Затем по таблицам квантилей распределения , по уровню значимости =0,05 и числу степеней свободы (где k - число частичных интервалов, r - число параметров предполагаемого закона распределения СВ X) находят критическое значение , удовлетворяющее условию . При использовании критерия необходимо, чтобы в каждом частичном интервале было не менее 5 элементов. Если же число элементов менее 5, рекомендуется соседние интервалы объединять в один (как это сделано в табл.9). Уменьшенное число частичных интервалов учитывается при нахождении числа степеней свободы .
Составим табл. 9 для вычисления .
Т а б л и ц а 9. Вычисление выборочной статистики CВ Х
Интервалы наблюдаемых значе- ний СВ Х |
Эмпирические частоты |
Теоретические частоты |
||||
0,465-0,675 0,675-0,885 0,885-1,095 1,095-1,305 1,305-1,515 1,515-1,725 1,725-1,935 |
1 19 18 38 26 11 3 17 3 |
4,75 20,33 15,58 30,07 29,55 15,40 4,06 20,05 0,59 |
- 1,33 7,93 - 3,55 - 3,05 |
1,7689 62,8849 12,6025 9,3025 |
0,0870 2,0913 0,4264 0,4640 |
|
Сумма |
100 |
100 |
Т а б л и ц а 8. Вычисление теоретических частот СВ Х
Интервалы наблюденных значений СВ Х |
Частоты mi |
Начало интервала |
Конец интервала |
Теоретические частоты |
||||||
0,465-0,675 |
1 |
0,465 |
0,675 |
- |
- 1,67 |
- 0,5 |
-0,4525 |
0,0475 |
4,75 |
|
0,675-0,885 |
18 |
0,675 |
0,885 |
- 1,67 |
- 0,83 |
- 0,4525 |
-0,2967 |
0,1558 |
15,58 |
|
0,885-1,095 |
38 |
0,885 |
1,095 |
- 0,83 |
0,01 |
- 0,2967 |
-0,0040 |
0,3007 |
30,07 |
|
1,095-1,305 |
26 |
1,095 |
1,305 |
0,01 |
0,84 |
0,0040 |
0,2995 |
0,2955 |
29,55 |
|
1,305-1,515 |
11 |
1,305 |
1,515 |
0,84 |
1,68 |
0,2995 |
0,4535 |
0,1540 |
15,40 |
|
1,515-1,725 |
3 |
1,515 |
1,725 |
1,68 |
2,52 |
0,4535 |
0,4941 |
0,0406 |
4,06 |
|
1,725-1,935 |
3 |
1,725 |
1,935 |
2,52 |
+ |
0,4941 |
0,5 |
0,0059 |
0,59 |
|
Сумма |
100 |
1 |
100 |
Число степеней свободы По таблице квантилей (приложение 2) по уровню значимости и числу степеней свободы находим критическое значение Так как то нет оснований для отклонения гипотезы о нормальном законе распределения СВХ. Другими словами расхождения между эмпирическими и теоретическими частотами являются незначительными, т.е. случайными и предположение о распределении СВ Х по нормальному закону вполне согласуется с эмпирическим распределением выборки.
На рис.5 построены нормальная кривая по найденным теоретическим частотам и полигон эмпирических (наблюдаемых) частот.
4. Доверительный интервал для оценки математического ожидания случайной величины Х, распределенной по нормальному закону, (при n30) находят по формуле
где квантили нормального распределения находят по таблицам функции Лапласа (приложение 1) из условия - доверительная вероятность, в нашем случае или и Точность оценки математического ожидания (предельная погрешность) есть . Вычислим предельную погрешность Искомый доверительный интервал, накрывающий математическое ожидания СВ Х, равен
Рис. 5.
Смысл полученного результата таков: если будет произведено достаточно большое число выборок по 100 значений СВ Х - стоимости основных производственных фондов, то в 95% из них доверительный интервал накроет математическое ожидание СВ Х и только в 5% случаев математическое ожидание может выйти за границы доверительного интервала.
Аналогичным образом выполним это задание для СВ У - стоимость валовой продукции (у. е /га).
1. По виду гистограммы и полигона частостей, а также по значению выборочных коэффициентов асимметрии и эксцесса ( выдвигаем гипотезу о том, что закон распределения СВ У является нормальным.
2. Плотность вероятности предполагаемого нормального закона распределения имеет вид
Функция распределения нормального закона для СВ У есть
3. Вычислим теоретические частоты нормального распределения СВ У для проверки согласия эмпирической функции распределения с теоретической (табл.10).
Далее составим табл. 11 для нахождения выборочной статистики СВ У.
Число степеней свободы . По таблице (приложение 2 ) по уровню значимости находим критическое значение . Так, как , то нет оснований для отклонения гипотезы о нормальном законе распределения СВ У.
На рис. 6 построены эмпирическая и теоретическая кривые распределения.
4. Для нахождения доверительного интервала для оценки математического ожидания СВ У вычислим предельную погрешность , тогда доверительный интервал равен или .
Рис. 6.
Т а б л и ц а 11. Вычисление выборочной статистики СВ У
Интервалы наблюдаемых значе- ний СВ У |
Эмпирические частоты |
Теоретические частоты |
||||
0,39-0,61 0,61-0,83 0,83-1,05 1,05-1,27 1,27-1,49 1,49-1,71 1,71-1,93 |
14 26 29 18 9 3 13 1 |
14,01 22,68 29,22 21,79 9,49 2,42 12,3 0,39 |
- 0,1 3,32 - 0,22 - 3,79 0,7 |
0,01 11,0224 0,0484 14,3641 0,49 |
0,0007 0,4860 0,0017 0,6592 0,0398 |
|
Cумма |
100 |
100 |
ЗАДАНИЕ 3. КОРРЕЛЯЦИЯ
1. По результатам задания 1 составить корреляционную таблицу.
2. Найти условные средние , построить точки , и по характеру их расположения подобрать вид функций регрессии.
3. Найти выборочный коэффициент корреляции и сделать вывод о силе корреляционной связи.
4. Найти доверительный интервал, накрывающий коэффициент корреляции генеральной совокупности с заданной доверительной вероятностью .
5. Найти уравнения линий регрессии х на у и у на х и построить их.
Решение типового варианта
Методику выполнения этого задания покажем на примере статистических данных табл.1, где СВ Х - стоимость основных производственных фондов (у. е /га), СВ У - стоимость валовой продукции (у.е/га).
1. Для составления корреляционной таблицы воспользуемся разбиением СВ Х и У на частичные интервалы (табл. 2 и 5). Сделаем подсчет частот системы СВ Х и У, рассматривая каждую пару значений табл.1. Например, первая пара (0,73; 0,60) попадает во вторую строку и первый столбец табл.8 и отмечается черточкой. Вторая пара значений (0,82; 0,61) попадает также во вторую строку и первый столбец, причем, значение 0,61 совпадает с концами интервалов 0,39-0,61 и 0,61-0,83; будем относить это число к тому интервалу, где наблюдается совпадение с правым концом, т.е. к интервалу 0,39-0,61. Третья пара (0,89; 0,95) - третья строка и третий столбец. Таким образом просматриваем все 100 пар значений системы СВ Х и У. В результате получим табл. 12.
Т а б л и ц а 12 .Подсчет частот системы СВ Х и У
У Х |
0,39-0,61 |
0,61-0,83 |
0,83-1,05 |
1,05-1,27 |
1,27-1,49 |
1,49-1,71 |
1,71-1,93 |
||
0,465-0,675 |
I 1 |
1 |
|||||||
0,675-0,885 |
IIIIIIII 8 |
IIIIII 6 |
III 3 |
I 1 |
18 |
||||
0,885-1,095 |
IIIIII 6 |
IIIIIIIII IIIIII 15 |
IIIIIIIII IIII 13 |
III 3 |
I 1 |
38 |
|||
1,095-1,305 |
IIII 4 |
IIIIIIIIII 10 |
IIIIIIIII 9 |
II 2 |
I 1 |
26 |
|||
1,305-1,515 |
II 2 |
III 3 |
IIII 4 |
II 2 |
11 |
||||
1,515-1,725 |
II 2 |
I 1 |
3 |
||||||
1,725-1,935 |
I 1 |
II 2 |
3 |
||||||
14 |
26 |
29 |
18 |
9 |
3 |
1 |
100 |
Для дальнейших расчетов нужны будут середины интервалов, которые запишем под частичными интервалами.
Т а б л и ц а 10. Вычисление теоретических частот СВ У
Интервалы наблюденных значений СВ У |
Частоты mi |
Начало ин- тервала |
Конец интер-вала |
Теоретичес кие час- тоты |
||||||
0,39-0,61 |
14 |
0,39 |
0,61 |
- |
- 1,8 |
-0,5 |
-0,3599 |
0,1401 |
14,01 |
|
0,61-0,83 |
26 |
0,61 |
0,83 |
- 1,08 |
- 0,34 |
-0,3599 |
-0,1331 |
0,2268 |
22,68 |
|
0,83-1,05 |
29 |
0,83 |
1,05 |
- 0,34 |
0,41 |
-0,1331 |
0,1591 |
0,2922 |
29,22 |
|
1,05-1,27 |
18 |
1,05 |
1,27 |
0,41 |
1,16 |
0,1591 |
0,3770 |
0,2179 |
21,79 |
|
1,27-1,49 |
9 |
1,27 |
1,49 |
1,16 |
1,91 |
0,3770 |
0,4719 |
0,0949 |
9,49 |
|
1,49-1,71 |
3 |
1,49 |
1,71 |
1,91 |
2,66 |
0,4719 |
0,4961 |
0,0242 |
2,42 |
|
1,71-1,93 |
1 |
1,71 |
1,93 |
2,66 |
+ |
0,4961 |
0,5 |
0,0039 |
0,39 |
|
Сумма |
100 |
1 |
100 |
В столбце табл.13 записаны суммы частот по строкам, а в строке - суммы частот по столбцам. , где n - объем выборки.
2. Находим условные средние по формуле
;
;
;
Т а б л и ц а 13. Корреляционная таблица системы СВ Х и У
У Х |
0,39- 0,61 0,50 |
0,61- 0,83 0,72 |
0,83- 1,05 0,94 |
1,05- 1,27 1,16 |
1,27- 1,49 1,38 |
1,49- 1,71 1,60 |
1,71-1,93 1,82 |
||
0,465-0,675 0,57 |
1 |
1 |
|||||||
0,675-0,885 0,78 |
8 |
6 |
3 |
1 |
18 |
||||
0,885-1,095 0,99 |
6 |
15 |
13 |
3 |
1 |
38 |
|||
1,095-1,305 1,20 |
4 |
10 |
9 |
2 |
1 |
26 |
|||
1,305-1,515 1,41 |
2 |
3 |
4 |
2 |
11 |
||||
1,515-1,725 1,62 |
2 |
1 |
3 |
||||||
1,725-1,935 1,83 |
1 |
2 |
3 |
||||||
14 |
26 |
29 |
18 |
9 |
3 |
1 |
100 |
;
;
;
;
.
Результаты вычислений заносим в табл. 14.
Т а б л и ц а 14 . Условные средние
0,50 |
0,72 |
0,94 |
1,16 |
1,38 |
1,60 |
1,82 |
||
0,87 |
0,96 |
1,10 |
1,25 |
1,36 |
1,34 |
1,62 |
Каждая пара значений представляет координаты точки. Построив эти точки в системе координат xoy, по их расположению делаем вывод о виде функции регрессии. Из чертежа видно, что расположение точек близко к прямой линии, поэтому можно считать, что зависимость х на у является линейной.
Аналогично находим условные средние по формуле
; ;
;
;
;
;
;
.
Результаты вычислений поместим в табл.15.
Т а б л и ц а 15. Условные средние
0,57 |
0,78 |
0,99 |
1,20 |
1,41 |
1,62 |
1,83 |
||
0,72 |
0,68 |
0,81 |
1,04 |
1,28 |
1,58 |
1,09 |
Точки построим на предыдущем чертеже и по их расположению делаем вывод о линейной зависимости у на х. Значит линии регрессии представляют собой прямые (рис.7).
3. Выборочный коэффициент корреляции находим по формуле
,
где из расчетов задания 1 известно, что , , , .
Остается найти . Воспользуемся корреляционной табл.13 и формулой
Рис. 7.
Выборочный коэффициент корреляции
По знаку и величине коэффициента корреляции делаем вывод о связи между СВ X и У: прямая линейная корреляционная зависимость, средняя связь.
Квадрат коэффициента корреляции называется коэффициентом детерминации, который показывает процент влияния СВ X на СВ У.
В нашем случае коэффициент детерминации равен
.
Вывод: примерно 42% составляет влияние стоимости основных производственных фондов на стоимость валовой продукции. Остальные 58% обусловлены влиянием других факторов.
4. Доверительный интервал для коэффициента корреляции генеральной совокупности с заданной доверительной вероятностью находится по формуле
где находится, используя функцию Лапласа: , т.е. 0,95=Ф(t0,95). По значению функции Лапласа 0,95, по приложению 1 находим значение t0,95 = 1,96.
Подставим имеющиеся данные в формулу доверительного интервала: имеем .
В результате вычислений получим доверительный интервал .
Вывод: если рассматривать большое число выборок системы СВ Х и У и для каждой из них найти коэффициент корреляции , то примерно в 95% из них доверительный интервал накроет коэффициент корреляции генеральной совокупности и только в 5% случаев может выйти за границы этого интервала.
5. Найдем линейные уравнения функций регрессии. Уравнение регрессии у на х имеет вид: Подставляем имеющиеся данные: имеем
преобразуя, получим
Аналогично составим уравнение регрессии x на y.
Построим эти прямые на чертеже (рис.7), учитывая, что они проходят через точку
ЗАДАНИЕ 4. МЕТОД НАИМЕНЬШИХ КВАДРАТОВ
На основании опытных данных х и у требуется:
1) построить точки и по точечной диаграмме определить вид эмпирической функции;
2) найти параметры эмпирической функции методом наименьших квадратов;
3) построить график эмпирической функции на точечной диаграмме;
4) выполнить эту работу на ЭВМ.
Решение типового варианта
Методику выполнения этого задания покажем на примере опытных данных, приведенных в табл. 16, где х- количество внесенных удобрений определенного вида на 1 га; у - урожайность ячменя, ц/га.
Т а б л и ц а 16. Опытные данные урожайности ячменя и количества внесенных удобрений
№ п. п. |
Хі |
Уі |
|
1 |
0 |
21,5 |
|
2 |
0 |
22,3 |
|
3 |
0,3 |
24,5 |
|
4 |
0,3 |
25,7 |
|
5 |
0,6 |
28,7 |
|
6 |
0,6 |
27,5 |
|
7 |
0,9 |
28,3 |
|
8 |
0,9 |
29,5 |
|
9 |
1,2 |
30,8 |
|
10 |
1,2 |
31,6 |
|
11 |
1,5 |
32,3 |
|
12 |
1,5 |
33,7 |
1. Опытные данные представляют собой пары чисел , которые являются координатами точек на плоскости . Построив их, получим точечную диаграмму (рис.8).
По расположению точек на плоскости делаем вывод, что зависимость между количеством внесенных удобрений и урожайностью ячменя линейная и эмпирическую функцию будем искать в виде , где а и b - неизвестные параметры.
2. Находим параметры а и b методом наименьших квадратов. Для этого заполняем расчетную табл. 17.
Т а б л и ц а 17. Расчетные данные для определения параметров а и b
№ п.п. |
хі |
уі |
хі2 |
хі уі |
ур |
Контроль |
||
1 |
0 |
21,5 |
0 |
0 |
22,7 |
1,20 |
1,44 |
|
2 |
0 |
22,3 |
0 |
0 |
22,7 |
0,40 |
0,16 |
|
3 |
0,3 |
24,5 |
0,09 |
7,35 |
24,83 |
0,33 |
0.1089 |
|
4 |
0,3 |
25,7 |
0,09 |
7,71 |
24,83 |
-0,87 |
0,7569 |
|
5 |
0,6 |
28,7 |
0,36 |
17,22 |
26,96 |
-1,74 |
3,0276 |
|
6 |
0,6 |
27,5 |
0,36 |
16,50 |
26,96 |
-0,54 |
0,2916 |
|
7 |
0,9 |
28,3 |
0,81 |
25,47 |
29,09 |
0,79 |
0,6241 |
|
8 |
0,9 |
29,5 |
0,81 |
26,55 |
29,09 |
-0,41 |
0,1681 |
|
9 |
1,2 |
30,8 |
1,44 |
36,96 |
31,22 |
0,42 |
0,1764 |
|
10 |
1,2 |
31,6 |
1,44 |
37,92 |
31,22 |
-0,38 |
0,1444 |
|
11 |
1,5 |
32,3 |
2,25 |
48,45 |
33,35 |
1,05 |
1,1025 |
|
12 |
1,5 |
33,7 |
2,25 |
50,55 |
33,35 |
-0,35 |
0,1225 |
|
9,0 |
336,4 |
9,9 |
274,68 |
-0,1 |
8,123 |
Результаты вычислений табл. 17 подставим в нормальную систему
и получим систему .
Решив ее, найдем параметры a и b, а=7,1, b=22,7. Подставим эти значения в уравнение и получим уравнение эмпирической функции
3. Строим график полученной прямой на точечной диаграмме (рис. 8).
Рис. 8.
Для выполнения этой работы на ЭВМ параметры а и b линейной эмпирической функции можно находить по следующим формулам:
Расчет по методу наименьших квадратов в Excel может быть выполнен в следующей последовательности:
1) в ячейки А5:А16 ввести значения х, а в ячейки В5:В16 - значения
у;
2) в ячейку С5 ввести формулу =А5Л2 и копировать ее в ячейки C6.CI6;
3) в ячейку D5 ввести формулу =А5*В5 и копировать ее в ячейки D6:D16;
4) в ячейку AI8 ввести формулу =СРЗНАЧ(А5:А16) и копировать ее в ячейки D18:D18;
5) в ячейку В19 ввести формулу =(DI8-A18*B18)/(C18-AI8A2), а в ячейку В20 формулу =В 18-В 19*А18;
6) в ячейку Е5 ввести формулу ~"В$19*А5+В$20 и копировать ее в ячейки E6:EI6;
7) в ячейку F5 ввести формулу =Е5-В5 и копировать ее в ячейки F6:F16, а в ячейку G5 формулу =F5A2 и копировать ее в ячейки G6:G16.
Для построения графика с помощью Мастера диаграмм выбрать точечную диаграмму и указать данные в ячейках А5:В16, Е5:Е16. На построенном графике можно указать заголовок и другие надписи.
ПРИЛОЖЕНИЯ
П р и л о ж е н и е 1
Значения функции
х |
Ф(х) |
х |
Ф(х) |
х |
Ф(х) |
х |
Ф(х) |
|
0,00 |
0,0000 |
0,39 |
0,1517 |
0,78 |
0,2823 |
1,17 |
0,3790 |
|
0,01 |
0,0040 |
0,40 |
0,1554 |
0,79 |
0,2852 |
1,18 |
0,3810 |
|
0,02 |
0,0080 |
0,41 |
0,1591 |
0,80 |
0,2881 |
1,19 |
0,3830 |
|
0,03 |
0,0120 |
0,42 |
0,1628 |
0,81 |
0,2910 |
1,20 |
0,3849 |
|
0,04 |
0,0160 |
0,43 |
0,1664 |
0,82 |
0,2939 |
1,21 |
0,3869 |
|
0,05 |
0,0199 |
0,44 |
0,1700 |
0,83 |
0,2967 |
1,22 |
0,3883 |
|
0,06 |
0,0239 |
0,45 |
0,1736 |
0,84 |
0,2995 |
1,23 |
0,3907 |
|
0,07 |
0,0279 |
0,46 |
0,1772 |
0,85 |
0,3023 |
1,24 |
0,3925 |
|
Подобные документы
Ознакомление с механизмом проверки гипотезы для случая единственной выборки, двух и нескольких независимых выборок. Проверка совпадений карт, выбор фильмов разных жанров. Обоснование результатов, полученных после проверки статистических гипотез.
курсовая работа [726,2 K], добавлен 26.02.2015Первичный анализ и основные характеристики статистических данных. Точечные оценки параметров распределения. Доверительные интервалы для неизвестного математического ожидания и для среднего квадратического отклонения. Проверка статистических гипотез.
дипломная работа [850,9 K], добавлен 18.01.2016- Закон больших чисел. Проверка статистических гипотез (критерий согласия w2 Мизеса: простая гипотеза)
Предельные теоремы теории вероятностей. Сходимость последовательностей случайных величин и вероятностных распределений. Метод характеристических функций. Закон больших чисел. Особенности проверки статистических гипотез (критерия согласия w2 Мизеса).
курсовая работа [1,0 M], добавлен 27.01.2012 Согласование выборочных распределений. Отбор статистических данных с помощью таблицы случайных чисел. Расчет числовых характеристик распределения выборочных частот. Проверка предположения, что распределение генеральной совокупности является нормальным.
курсовая работа [276,6 K], добавлен 19.01.2016Основные понятия математической статистики, интервальные оценки. Метод моментов и метод максимального правдоподобия. Проверка статистических гипотез о виде закона распределения при помощи критерия Пирсона. Свойства оценок, непрерывные распределения.
курсовая работа [549,1 K], добавлен 07.08.2013Понятие и виды статистических рядов распределения, основные формы их представления. Расчет и анализ показателей, характеризующих центральную тенденцию, вариацию, структуру и форму ряда распределения. Проведение сглаживания эмпирического распределения.
курсовая работа [698,3 K], добавлен 07.06.2011Исследование точности прогнозирования случайного процесса с использованием метода наименьших квадратов. Анализ расхождения между трендом и прогнозом, последующая оценка близости распределения расхождений наблюдений и распределения сгенерированного шума.
курсовая работа [1,0 M], добавлен 29.01.2010Доверительное оценивание параметров законов распределения (дисперсия, математическое ожидание), классический регрессионный анализ. Проверка гипотез, методики расчета доверительных интервалов и критериев согласия для различных числовых характеристик.
курсовая работа [302,9 K], добавлен 25.07.2013Вероятностная модель и аксиоматика А.Н. Колмогорова. Случайные величины и векторы, классическая предельная проблема теории вероятностей. Первичная обработка статистических данных. Точечные оценки числовых характеристик. Статистическая проверка гипотез.
методичка [433,3 K], добавлен 02.03.2010Методы регистрации, описания и анализа статистических экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений. Обзор задач математической статистики. Закон распределения случайной величины. Проверка правдоподобия гипотез.
презентация [113,3 K], добавлен 01.11.2013Составление характеристики непрерывного признака. Методы составления приближенного распределения признака, имеющего непрерывное распределения. Относительные частоты и их плотности. Статистическое распределение частот интервального вариационного ряда.
творческая работа [17,8 K], добавлен 10.11.2008Закон и свойства нормального распределения случайной величины. На основе критерия согласия Пирсона построение гистограммы, статистической функции и теоретической кривой и определение согласованности теоретического и статистического распределения.
курсовая работа [894,5 K], добавлен 30.10.2013Построение полигона относительных частот, эмпирической функции распределения, кумулянты и гистограммы. Расчет точечных оценок неизвестных числовых характеристик. Проверка гипотезы о виде распределения для простого и сгруппированного ряда распределения.
курсовая работа [216,2 K], добавлен 28.09.2011Оценка необходимости настройки технологического процесса или ремонта и замены оборудования для обеспечения заданной точности по толщине металла. Определение количества замеров толщины стенки листа стали. Статистические особенности анализа доли брака.
курсовая работа [126,4 K], добавлен 29.10.2012Числовые характеристики выборки. Статистический ряд и функция распределения. Понятие и графическое представление статистической совокупности. Метод наибольшего правдоподобия для нахождения плотности распределения. Применение метода наименьших квадратов.
контрольная работа [62,6 K], добавлен 20.02.2011Закон распределения случайной величины Х, функция распределения и формулы основных числовых характеристик: математическое ожидание, дисперсия и среднеквадратичное отклонение. Построение полигона частот и составление эмпирической функции распределения.
контрольная работа [36,5 K], добавлен 14.11.2010Определение вероятности, что машина с неисправной ходовой частью имеет также неисправный мотор. Методика вычисления дисперсии. Проверка статистических гипотез и дисперсионный анализ. Формирование контрольных карт, их содержание и принципы построения.
курсовая работа [686,4 K], добавлен 31.01.2015Числовые характеристики непрерывных величин. Точечные оценки параметров распределения. Статистическая проверка гипотез. Сравнение средних известной и неизвестной точности измерений. Критерий Хи-квадрат для проверки гипотезы о виде распределения.
курсовая работа [79,0 K], добавлен 23.01.2012Сходимость последовательностей случайных величин и вероятностных распределений. Метод характеристических функций. Проверка статистических гипотез и выполнение центральной предельной теоремы для заданных последовательностей независимых случайных величин.
курсовая работа [364,8 K], добавлен 13.11.2012Математическая статистика как наука о математических методах систематизации статистических данных, ее показатели. Составление интегральных статистических распределений выборочной совокупности, построение гистограмм. Вычисление точечных оценок параметров.
курсовая работа [241,3 K], добавлен 10.04.2011