Анализ данных в линейной регрессионной модели
Изучение математических законов теории вероятностей. 3адача определения закона распределения случайной величины по статистическим данным. Статистическое описание и выборочные характеристики двумерного случайного вектора. Выборочная линейная регрессия.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 18.10.2017 |
Размер файла | 56,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Московский Государственный Институт
Электронной Техники (ТУ)
Курсовая работа по
«Теории вероятностей и математической статистике»
« Анализ данных в линейной регрессионной модели»
Выполнил студент ЭКТ-22:
Орехов М.В.
Преподаватель: Гавриков А.И.
МОСКВА 2004 г
Вводимые данные |
ДXІ |
ДYІ |
Произведение величин |
Остатки |
Остаточная сумма квадратов |
|||||
X |
Y |
(X-ср(y))І |
(Y-ср(y))І |
XІ |
YІ |
XY |
(X+Y)І |
ei |
Qe |
|
6,15 |
18,94 |
0,1647 |
1,0380 |
37,8225 |
358,7236 |
116,4810 |
629,5081 |
0,8489 |
0,7207 |
|
7,07 |
18,51 |
1,7577 |
0,3467 |
49,9849 |
342,6201 |
130,8657 |
654,3364 |
0,0338 |
0,0011 |
|
7,35 |
18,46 |
2,5786 |
0,2903 |
54,0225 |
340,7716 |
135,6810 |
666,1561 |
-0,1334 |
0,0178 |
|
8,16 |
18,58 |
5,8361 |
0,4340 |
66,5856 |
345,2164 |
151,6128 |
715,0276 |
-0,3524 |
0,1242 |
|
3,73 |
16,18 |
4,0570 |
3,0318 |
13,9129 |
261,7924 |
60,3514 |
396,4081 |
-0,8981 |
0,8065 |
|
5,67 |
17,84 |
0,0055 |
0,0066 |
32,1489 |
318,2656 |
101,1528 |
552,7201 |
-0,0501 |
0,0025 |
|
4,95 |
17,42 |
0,6308 |
0,2512 |
24,5025 |
303,4564 |
86,2290 |
500,4169 |
-0,1688 |
0,0285 |
|
4,11 |
17,19 |
2,6706 |
0,5347 |
16,8921 |
295,4961 |
70,6509 |
453,6900 |
-0,0471 |
0,0022 |
|
7,81 |
19,05 |
4,2675 |
1,2742 |
60,9961 |
362,9025 |
148,7805 |
721,4596 |
0,2641 |
0,0697 |
|
4,29 |
17,48 |
2,1147 |
0,1947 |
18,4041 |
305,5504 |
74,9892 |
473,9329 |
0,1675 |
0,0281 |
|
6,68 |
17,91 |
0,8757 |
0,0001 |
44,6224 |
320,7681 |
119,6388 |
604,6681 |
-0,4029 |
0,1623 |
|
3,25 |
16,82 |
6,2210 |
1,2126 |
10,5625 |
282,9124 |
54,6650 |
402,8049 |
-0,0571 |
0,0033 |
|
6,49 |
18,44 |
0,5562 |
0,2692 |
42,1201 |
340,0336 |
119,6756 |
621,5049 |
0,2066 |
0,0427 |
|
4,71 |
17,53 |
1,0696 |
0,1530 |
22,1841 |
307,3009 |
82,5663 |
494,6176 |
0,0417 |
0,0017 |
|
3,25 |
17,29 |
6,2210 |
0,3984 |
10,5625 |
298,9441 |
56,1925 |
421,8916 |
0,4129 |
0,1704 |
|
7,34 |
18,6 |
2,5466 |
0,4608 |
53,8756 |
345,9600 |
136,5240 |
672,8836 |
0,0108 |
0,0001 |
|
7,4 |
18,96 |
2,7417 |
1,0791 |
54,7600 |
359,4816 |
140,3040 |
694,8496 |
0,3457 |
0,1195 |
|
4,78 |
17,84 |
0,9297 |
0,0066 |
22,8484 |
318,2656 |
85,2752 |
511,6644 |
0,3224 |
0,1039 |
|
6,18 |
18,82 |
0,1899 |
0,8078 |
38,1924 |
354,1924 |
116,3076 |
625,0000 |
0,7164 |
0,5132 |
|
6,44 |
18,8 |
0,4841 |
0,7723 |
41,4736 |
353,4400 |
121,0720 |
637,0576 |
0,5875 |
0,3452 |
|
6,45 |
17,73 |
0,4982 |
0,0366 |
41,6025 |
314,3529 |
114,3585 |
584,6724 |
-0,4866 |
0,2368 |
|
7,58 |
18,57 |
3,3702 |
0,4209 |
57,4564 |
344,8449 |
140,7606 |
683,8225 |
-0,1197 |
0,0143 |
|
6,18 |
17,74 |
0,1899 |
0,0328 |
38,1924 |
314,7076 |
109,6332 |
572,1664 |
-0,3636 |
0,1322 |
|
7,53 |
19,89 |
3,1891 |
3,8762 |
56,7009 |
395,6121 |
149,7717 |
751,8564 |
1,2213 |
1,4915 |
|
4,76 |
17,44 |
0,9686 |
0,2316 |
22,6576 |
304,1536 |
83,0144 |
492,8400 |
-0,0692 |
0,0048 |
|
5,78 |
18,24 |
0,0013 |
0,1016 |
33,4084 |
332,6976 |
105,4272 |
576,9604 |
0,3038 |
0,0923 |
|
6,97 |
19,01 |
1,5026 |
1,1855 |
48,5809 |
361,3801 |
132,4997 |
674,9604 |
0,5757 |
0,3314 |
|
4,58 |
16,25 |
1,3554 |
2,7929 |
20,9764 |
264,0625 |
74,4250 |
433,8889 |
-1,1839 |
1,4016 |
|
3,45 |
16,56 |
5,2634 |
1,8529 |
11,9025 |
274,2336 |
57,1320 |
400,4001 |
-0,4009 |
0,1607 |
|
5,04 |
17,15 |
0,4959 |
0,5947 |
25,4016 |
294,1225 |
86,4360 |
492,3961 |
-0,4764 |
0,2270 |
|
7,08 |
17,75 |
1,7844 |
0,0293 |
50,1264 |
315,0625 |
125,6700 |
616,5289 |
-0,7304 |
0,5334 |
|
5,04 |
18,35 |
0,4959 |
0,1839 |
25,4016 |
336,7225 |
92,4840 |
547,0921 |
0,7236 |
0,5236 |
|
4,92 |
16,77 |
0,6793 |
1,3253 |
24,2064 |
281,2329 |
82,5084 |
470,4561 |
-0,8062 |
0,6500 |
|
5,82 |
17,41 |
0,0057 |
0,2613 |
33,8724 |
303,1081 |
101,3262 |
539,6329 |
-0,5429 |
0,2948 |
|
6,31 |
18,71 |
0,3201 |
0,6222 |
39,8161 |
350,0641 |
118,0601 |
626,0004 |
0,5520 |
0,3047 |
|
6,59 |
19,05 |
0,7154 |
1,2742 |
43,4281 |
362,9025 |
125,5395 |
657,4096 |
0,7748 |
0,6002 |
|
9,11 |
17,32 |
11,3286 |
0,3614 |
82,9921 |
299,9824 |
157,7852 |
698,5449 |
-2,0101 |
4,0405 |
|
9,91 |
19,65 |
17,3539 |
2,9887 |
98,2081 |
386,1225 |
194,7315 |
873,7936 |
-0,0150 |
0,0002 |
|
5,78 |
18,22 |
0,0013 |
0,0893 |
33,4084 |
331,9684 |
105,3116 |
576,0000 |
0,2838 |
0,0806 |
|
3,4 |
16,55 |
5,4953 |
1,8802 |
11,5600 |
273,9025 |
56,2700 |
398,0025 |
-0,3899 |
0,1521 |
|
3,83 |
17,65 |
3,6642 |
0,0735 |
14,6689 |
311,5225 |
67,5995 |
461,3904 |
0,5301 |
0,2810 |
|
4,75 |
17,86 |
0,9884 |
0,0037 |
22,5625 |
318,9796 |
84,8350 |
511,2121 |
0,3550 |
0,1260 |
|
3,32 |
17,33 |
5,8767 |
0,3495 |
11,0224 |
300,3289 |
57,5356 |
426,4225 |
0,4235 |
0,1794 |
|
5,82 |
17,16 |
0,0057 |
0,5794 |
33,8724 |
294,4656 |
99,8712 |
528,0804 |
-0,7929 |
0,6287 |
|
4,79 |
17,42 |
0,9105 |
0,2512 |
22,9441 |
303,4564 |
83,4418 |
493,2841 |
-0,1018 |
0,0104 |
|
5,13 |
16,54 |
0,3772 |
1,9077 |
26,3169 |
273,5716 |
84,8502 |
469,5889 |
-1,1241 |
1,2636 |
|
8,63 |
19,92 |
8,3278 |
3,9952 |
74,4769 |
396,8064 |
171,9096 |
815,1025 |
0,7908 |
0,6254 |
|
3,94 |
17,2 |
3,2551 |
0,5201 |
15,5236 |
295,8400 |
67,7680 |
446,8996 |
0,0340 |
0,0012 |
|
5,21 |
18,57 |
0,2854 |
0,4209 |
27,1441 |
344,8449 |
96,7497 |
565,4884 |
0,8724 |
0,7611 |
|
3,7 |
17,39 |
4,1788 |
0,2822 |
13,6900 |
302,4121 |
64,3430 |
444,7881 |
0,3245 |
0,1053 |
|
?X |
?Y |
?ДX |
?ДY |
?XІ |
?YІ |
?XY |
?(X+Y)І |
?ei |
?eiІ |
|
287,21 |
896,06 |
128,80 |
41,09 |
1778,59 |
16099,56 |
5201,06 |
28280,28 |
0,0000 |
18,5184 |
Теоретическая часть
Основные задачи математической статистики
Математические законы теории вероятностей не являются беспредметными абстракциями, лишенными физического содержания; они представляют собой математическое выражение реальных закономерностей, фактически существующих в массовых случайных явлениях природы.
До сих пор, говоря о законах распределения случайных величин, мы не затрагивали вопроса о том, откуда берутся, на каком основании устанавливаются эти законы распределения. Ответ на вопрос вполне определенен - в основе всех этих характеристик лежит опыт; каждое исследование случайных явлений, выполняемое методами теории вероятностей, прямо или косвенно опирается на экспериментальные данные. Оперируя такими понятиями, как события и их вероятности, случайные величины, их законы распределения и числовые характеристики, теория вероятностей дает возможность теоретическим путем определять вероятности одних событий через вероятности других, законы распределения и числовые характеристики одних случайных величин через законы распределения и числовые характеристики других. Такие косвенные методы позволяют значительно экономить время и средства, затрачиваемые на эксперимент, но отнюдь не исключают самого эксперимента. Каждое исследование в области случайных явлений, как бы отвлеченно оно ни было, корнями своими всегда уходит в эксперимент, в опытные данные, в систему наблюдений.
Разработка методов регистрации, описания и анализа статистических экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений, составляет предмет специальной науки- математической статистики.
Все задачи математической статистики касаются вопросов обработки наблюдений над массовыми случайными явлениями, но в зависимости от характера решаемого практического вопроса и от объема имеющегося экспериментального материала эти задачи могут принимать ту или иную форму.
Охарактеризуем вкратце некоторые типичные задачи математической статистики, часто встречаемые на практике.
3адача определения закона распределения случайной величины (или системы случайных величин) по статистическим данным
Что закономерности, наблюдаемые в массовых случайных явлениях, проявляются тем точнее и отчетливее, чем больше объем статистического материала. При обработке обширных по своему объему статистических данных часто возникает вопрос об определении законов распределения тех или иных случайных величин. Теоретически при достаточном количестве опытов свойственные этим случайным величинам закономерности будут осуществляться сколь угодно точно. На практике нам всегда приходится иметь дело с ограниченным количеством экспериментальных данных; в связи с этим результаты наших наблюдений и их обработки всегда содержат больший или меньший элемент случайности. Возникает вопрос о том, какие черты наблюдаемого явления относятся к постоянным, устойчивым и действительно присущи ему, а какие являются случайными и проявляются в данной серии наблюдений только за счет ограниченного объема экспериментальных данных. Естественно, к методике обработки экспериментальных данных следует предъявить такие требования, чтобы она, по возможности, сохраняла типичные, характерные черты наблюдаемого явления и отбрасывала все несущественное, второстепенное, связанное с недостаточным объемом опытного материала. В связи с этим возникает характерная для математической статистики задача сглаживания или выравнивания статистических данных, представления их в наиболее компактном виде с помощью простых аналитических зависимостей.
Задача проверки правдоподобия гипотез
Эта задача тесно связана с предыдущей; при решении такого рода задач мы обычно не располагаем настолько обширным статистическим материалом, чтобы выявляющиеся в нем статистические закономерности были в достаточной мере свободны от элементов случайности. Статистический материал может с большим или меньшим правдоподобием подтверждать или не подтверждать справедливость той или иной гипотезы. Например, может возникнуть такой вопрос: согласуются ли результаты эксперимента с гипотезой о том, что данная случайная величина подчинена закону распределения? Другой подобный вопрос: указывает ли наблюденная в опыте тенденция к зависимости между двумя случайными величинами на наличие действительной объективной зависимости между ними или же она объясняется случайными причинами, связанными с недостаточным объемом наблюдений? Для решения подобных вопросов математическая статистика выработала ряд специальных приемов.
Задача нахождения неизвестных параметров распределения
Часто при обработке статистического материала вовсе не возникает вопрос об определении законов распределения исследуемых случайных величин. Обыкновенно это бывает связано с крайне недостаточным объемом экспериментального материала. Иногда же характер закона распределения качественно известен до опыта, из теоретических соображений; например, часто можно утверждать заранее, что случайная величина подчинена нормальному закону. Тогда возникает более узкая задача обработки наблюдений -- определить только некоторые параметры (числовые характеристики) случайной величины или системы случайных величин. При небольшом числе опытов задача более или менее точного определения этих параметров не может быть решена; в этих случаях экспериментальный материал содержит в себе неизбежно значительный элемент случайности; поэтому случайными оказываются и все параметры, вычисленные на основе этих данных. В таких условиях может быть поставлена только задача об определении так называемых «оценок» или «подходящих значений» для искомых параметров, т. е. таких приближенных значений, которые при массовом применении приводили бы в среднем к меньшим ошибкам, чем всякие другие. С задачей отыскания «подходящих значений» числовых характеристик тесно связана задача оценки их точности и надежности.
Статистическое описание и выборочные характеристики двумерного случайного вектора
Пусть (xi,yi), i = 1,2,......,n,- выборка объема n из наблюдений случайного двумерного вектора (X,Y). Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой прямоугольной системой координат. Это представление выборки называется диаграммой рассеивания.
Построить диаграмму рассеяния нанести на нее уравнения регресси Y на X
y=*0 +*1x и X на Y x=*0 +*1y.
Сначала вычислим суммы
xi, yi,x2i,y2i, xiyi, (xi+yi)2
Для контроля правильности вычислений используется тождество
(xi+yi)2= x2i + 2 xiyi + y2i
Выборочные средние находятся по формулам
x*=*1,0=(1/n) xi, y*=*0,1=(1/n) yi. (1)
Затем вычисляются суммы квадратов отклонений от среднего и произведений отклонений от средних:
Qx=(xi - x*)2=x2i - (x)2i/n, (2)
Qy=(yi - y*)2=y2i - (y)2i/n, (3)
Qxy=(xi - x*)(yi - y*)=xiyi - (x i)(yi )/n, (4)
Отсюда
D*x= (1/n) Qx, D*y= (1/n) Qy,
R=(*1,1)/ (D*x D*y)1/2= (Qxy)/( Qx Qy)1/2 (5)
Выборочная линейная регрессия Y на X по выборке (xi, yi ), i= 1,......, n определяется уравнением
y=*0 +*1x= y* + r (D*y / D*x ) (x - x*)
Коэффициенты *0 и *1 называются выборочными коэффициентами регрессии. Они вычисляются по формулам
1*=[n xiyi - (x i)(yi )]/(n x2i - (xi)2 ) = Qxy / Qx (6)
0* = y*- 1*x* (7)
Аналогично определяется выборочная линейная регрессия X на Y:
математический вероятность регрессия статистический
x=*0 +*1y = x* + r (D*x / D*y ) (y - y*)
1*=[n xiyi - (x i)(yi )]/(n y2i - (yi)2 ) = Qxy / Qy (8)
0*= x*- *1y* (9)
Для контроля правильности расчетов используют соотношение
(1*1*)1/2= r (10)
Прямые
y=*0 +*1x, x=*0 +*1y
Пересекаются в точке с координатами (x*, y* )
Функция y=*0 +*1x
Определяет выборочную (эмпирическую ) регрессию Y на x. Последняя является оценкой предполагаемой (теоретической) регрессии по результатам наблюдений. Разности между наблюдаемыми значениями переменной Y при x=xi, i=1,2,....,n, и расчетными значениями yi=*0 +*1x называются остатками и обозначаются ei:
ei = yi - y i, i = 1,2,......,n. Все остатки приведены в таблице 1. (11)
Качество аппроксимации результатов наблюдений (xi,yi), i = 1,2,......,n, выборочной регрессии определяется величиной остаточной дисперсии, вычисляемой по формуле
S2= e2i /(n-2)=1/(n-2) [ yi - (*0 +*1xi)]2=Qe/(n-2) (12)
Величина Qe определяемая выражением
Qe = e2i= (yi - y i)2 (13)
Называется остаточной суммой квадратов.
В практических вычислениях остаточную сумму квадратов получают из тождества
(yi - y*i)2 = (yi - y*i )2 + (yi - yi) 2 (14)
Которое записывается в виде
Qy = Qr + Qe, где
Qy= (yi - y*i)2= y2i - n*(y*i )2,
Qr = (yi - y*i )2=*1 Qxy=2*1 Qx= Q2xy/ Qx (15)
Величина Qr называется суммой квадратов, обусловленной регрессией регрессией.
Полезной характеристокой линейной регрессии является коэффициент детерминации R2, вычисляемый по формуле
R2= Qr / Qy =1 - (Qe / Qy) (16)
Коэффициент детерминации R2 равен той доле разброса результатов наблюдений (xi,yi), i = 1,2,......,n, относительно горизонтальной прямой y=y*, которая объсняется выборочной регрессией. Величина R= + (R2)1/2 является оценкой коэффициента корреляции между результатами наблюдений yi и вычисленными значениями yi, предсказываемыми регрессией, т.е.
R= p*yy= ryy
В случае линейной регрессии Y на x (одной независимой переменной x) между коэффициентом R и выборочным коэффициентом корреляции rxy имеется следующее соотношение:
rxy = ( знак *1 ) R.
Однофакторный дисперсионный анализ
Пусть результаты наблюдений составляют l независимых выборок ( групп ), полученных из l нормально распределенных генеральных совокупностей, которые имеют, вообще говоря, различные средние m1, m2,....., ml и равные дисперсии 2. Проверяется гипотеза о равенстве средних H0 m1= m2 =..... =ml. На практике такая задача возникает при исследованиии влияния, которое оказывает изменение некоторого фактора на измеряемую величину. Например, если измерения проводятся на l различных приборах, то можно исследовать влияние фактора «прибор» на результаты измерений. В данном случае на синтересует вопрос, имеют ли различные приборы одну и ту же систематическую ошибку ( гипотеза H0 ). При l=2 для проверки гипотезы H0 используется известные критерии значимости. Если l>2, то для проверки гипотезы о равенстве l средних применяют однофакторный дисперсионный анализ, суть которого состоит в следующем.
Пусть xik обозначает i-й элемент k-й выборки, i = 1,2,......,n, k = 1,2,......,n, x*k-выборочное среднее k-й выборки, т.е.
x*k=(1/nk) xik = (1/n) x..k,
k*- общее выборочное среднее, т.е.
x*=(1/n) xik = (1/n) x..,
где n - общее число наблюдений, n= nk
Общая сумма квадратов отклонений наблюдений от общего среднего x* может быть предтавлена так:
( xik - x*)2= nk ( x*k - x*)2+ ( xik - x*k)2 (17)
Это основное тождество дисперсионного анализа. Запишем его в виде
Q=Q1+Q2 (18)
Где Q- общая сумма квадратов отклонений наблюдений от общего среднего, Q1 - сумма квадратов отклонений выборочных средних x*k от общего среднего x* (между группами), Q2-сумма квадратов отклонений наблюдений от выборочных средних групп (внутри групп).
Тождество (1) легко проверяется, если воспользоваться очевидным равенством
( xik - x*)= [( x*k - x*)+ ( xik - x*k)]
и учесть, что
( xik - x*k) ( x*k - x*)=0
в силу определения средних x*k и x*
Если верна гипотеза H0: m1= m2 =.....= ml, то статистики Q1/2 и Q2/2 независимы и имеют распределение 2 с l-1 и n-l степенями свободы. Следовательно, статистики S21= Q1/(l-1) и S22= Q2/(n-l) являются несмещенными оценками неизвесной дисперсии 2. Оценка S21 характеризует рассеяние групповых средних, а оценка S22-рассеяние внутри групп, которое обусловленно случайными вариациями результатов наблюдений. Значительное превышение величины S21 над значением величины S22 можно объяснить различием средних в группах. Отношение этих оценок имеет распределение Фишера с l-1 и n-l степенями свободы, т.е.
S21/S22= Q1/(l-1)Q2/(n-l)=F(l-1,n-l)
Статистика используется для проверки гипотезы H0: m1= m2 =.....= ml. Гипотеза H0 не противоречит результатам наблюдений, если выборочное значение Fв статистики меньше квантили F1-(l-1,n-l), т.е. если Fв< F1-(l-1,n-l). В этом случае x* и Q2/(n-l) являются несмещенными оценками параметров m и 2.Если Fв< F1-(l-1,n-l), то гипотеза H0 отклоняется и следует считать, что среди средних m1, m2,....., ml имеется хотя бы два не равных друг другу.
Практическая часть
1)Уравнения регрессии Y на X y=*0 +*1x и X на Y x=*0 +*1y
Объем выборки n=50. Предварительно вычислим
xi = 287,21, yi = 896,06, x2i = 1778,5947, y2i = 16099,5576, xiyi = 5201,0637
Тогда по формуле (1)
x*== 5,7442 , y*==17,9212
Для контроля правильности вычислений используется тождество
(xi+yi)2= 28280,2797
x2i + 2 xiyi + y2i = 1778,5947+2*5201,0637+16099,5576=28280,2797
Следовательно, вычисления проведены верно. Предварительно найдем
Qx=1778,5947 - = 128,803
Qy=16099,5576 - = 41,0871
Qxy=5201,0637 - = 53,9158
Окончательно из соотношений (5) получаем
D*x=2,5761, D*y = 0,8217
R=0,7411
По формулам (6) и (7) найдем оценки коэффициентов регрессии
1*= = 0,4185
0* = = 15,5172
1*= =1,3122
0*==-17,7720
Таким образом, выборочная линейная регрессия Y на Х имеет вид:
y=15,5172+0,4185*x
выборочная линейная регрессия X на Y:
x=-17,7720+1,3122 *y
Точка пересечения (5,7442 ; 17,9212)
2)Вычисление ei, Qe, Qr, S2, R2, rxy
Вычисляем остатки:
ei = yi - y i, i = 1,2,......,n. Все остатки приведены в таблице 1.
Находим остаточную сумму квадратов Qe
Qe = e2i=18,5184
По формуле (15) находим сумму квадратов, обусловленную регреггией Qr
Qr= Qy -Qe = 41,0871-18,5184=22,5687
Оценка дисперсии ошибок наблюдений по формуле (12) равна
S2=18,5184/(50-2)=0,3858
Коэффициент детерминации R2 по формуле (16)
R2= = 0,5493
Выборочный коэффициент корреляции
rxy= + (0,5493)1/2=0,7414
3)Доверительные интервалы
Значение квантили (=0,1) t1-/2(n-2)= t0,950(48) = 1,678 (таблица П6)
Границы доверительных интервалов равны: для коэффициента 0*:
0* = 15,5172 0,5477
для коэффициента 1*
1* t1-/2(n-2) * s * []1/2 = 0,4185 0,0918
Границы доверительного интервала для значения Y0 соответствующего заданному значению переменной x=x0:
y0* t1-/2(n-2) * s *[ + ()]1/2 = y0* 1,0422*
Границы доверительного интервала для дисперсии ошибок наблюдений 2
< 2 < (20,950(48)= 64,6665; 20,05(48)= 33,2000)
0,2864 < 2 < 0,5578
Этот результат означает, что полученное уравнение регрессии на 54,93% объясняет общий разброс результатов наблюдений относительно горизонтальной прямой y=17,9212. Выборочный коэффициент корреляции rxy= + (0,5493)1/2=0,7414
4)Однофакторный дисперсионный анализ
Задача заключается в проверке гипотезы H0: m1=m2 где mk- математическое ожидание чисел k-й группы.В нашем случае l=2,n=100.
Вычисления удобно проводить в такой последовательности
x..= xik=287,21+896,06=1183,27
x2ik=1778,5947 + 16099,5576 =17878,1523
Далее из (17) и (18) получаем
Q=17878,1523 - = 3876,8733
Q1= =3706,9832
Q2 = Q - Q1=169,88
Найдем статистики S21 и S22
S21= = 3706,9832
S21= = 1,7335
Найдем выборочное значение статистики H0
Fв= = 2138,4385
Так как квантиль распределения Фишера F1-(1,n-2)= F0,9 (1,48)=2,84, что меньше выборочного значения статистики Fв, то гипотеза H0 отклоняется на уровне значимости = 0,1. Таким образом, линейная регрессия Y на x статистически значима.
Размещено на Allbest.ru
...Подобные документы
Статистическое описание и выборочные характеристики двумерного случайного вектора. Оценка параметров линейной регрессии, полученных по методу наименьших квадратов. Проверка гипотезы о равенстве средних нормальных совокупностей при неизвестных дисперсиях.
контрольная работа [242,1 K], добавлен 05.11.2011Функция распределения вероятностей двух случайных величин. Функция и плотность распределения вероятностей случайного вектора. Многомерное нормальное распределение. Коэффициент корреляции. Распределение вероятностей функции одной случайной величины.
реферат [241,8 K], добавлен 03.12.2007Описание случайных ошибок методами теории вероятностей. Непрерывные случайные величины. Числовые характеристики случайных величин. Нормальный закон распределения. Понятие функции случайной величины. Центральная предельная теорема. Закон больших чисел.
реферат [146,5 K], добавлен 19.08.2015Понятия теории вероятностей и математической статистики, применение их на практике. Определение случайной величины. Виды и примеры случайных величин. Закон распределения дискретной случайной величины. Законы распределения непрерывной случайной величины.
реферат [174,7 K], добавлен 25.10.2015Определение вероятностей различных событий по формуле Бернулли. Составление закона распределения дискретной случайной величины, вычисление математического ожидания, дисперсии и среднеквадратического отклонения случайной величины, плотностей вероятности.
контрольная работа [344,8 K], добавлен 31.10.2013Предмет и метод математической статистики. Распределение непрерывной случайной величины с точки зрения теории вероятности на примере логарифмически-нормального распределения. Расчет корреляции величин и нахождение линейной зависимости случайных величин.
курсовая работа [988,5 K], добавлен 19.01.2011Рассмотрение в теории вероятностей связи между средним арифметическим и математическим ожиданием. Основные формулы математического ожидания дискретного распределения, целочисленной величины, абсолютно непрерывного распределения и случайного вектора.
презентация [55,9 K], добавлен 01.11.2013Генеральная совокупность подлежащих изучению объектов или возможных результатов наблюдений, производимых в одинаковых условиях над одним объектом. Описание наблюдаемых значений случайной величины Х. Характеристика статистической функции распределения.
курсовая работа [216,5 K], добавлен 03.05.2011Вероятность попадания случайной величины Х в заданный интервал. Построение графика функции распределения случайной величины. Определение вероятности того, что наудачу взятое изделие отвечает стандарту. Закон распределения дискретной случайной величины.
контрольная работа [104,7 K], добавлен 24.01.2013Классическое, статистическое и геометрическое определения вероятности. Дискретные случайные величины и законы их распределения. Числовые характеристики системы случайных величин. Законы равномерного и нормального распределения систем случайных величин.
дипломная работа [797,0 K], добавлен 25.02.2011Особенности функции распределения как самой универсальной характеристики случайной величины. Описание ее свойств, их представление с помощью геометрической интерпретации. Закономерности вычисления вероятности распределения дискретной случайной величины.
презентация [69,1 K], добавлен 01.11.2013Вычисление математического ожидания, дисперсии, функции распределения и среднеквадратического отклонения случайной величины. Закон распределения случайной величины. Классическое определение вероятности события. Нахождение плотности распределения.
контрольная работа [38,5 K], добавлен 25.03.2015Теория вероятностей и закономерности массовых случайных явлений. Неравенство и теорема Чебышева. Числовые характеристики случайной величины. Плотность распределения и преобразование Фурье. Характеристическая функция гауссовской случайной величины.
реферат [56,1 K], добавлен 24.01.2011Дискретные случайные величины и их распределения. Формула полной вероятности и формула Байеса. Общие свойства математического ожидания. Дисперсия случайной величины. Функция распределения случайной величины. Классическое определение вероятностей.
контрольная работа [33,8 K], добавлен 13.12.2010Нахождение вероятности события, используя формулу Бернулли. Составление закона распределения случайной величины и уравнения регрессии. Расчет математического ожидания и дисперсии, сравнение эмпирических и теоретических частот, используя критерий Пирсона.
контрольная работа [167,7 K], добавлен 29.04.2012Теория вероятностей. Коэффициенты использования рабочего времени. Закон распределения случайной величины. Функция плотности. Математическое ожидание. Закон распределения с математическим ожиданием. Статистика. Доверительный интервал. Выборочная средняя.
контрольная работа [178,3 K], добавлен 24.11.2008Определение вероятности случайного события, с использованием формулы классической вероятности, схемы Бернулли. Составление закона распределения случайной величины. Гипотеза о виде закона распределения и ее проверка с помощью критерия хи-квадрата Пирсона.
контрольная работа [114,3 K], добавлен 11.02.2014Функция распределения непрерывной случайной величины. Математическое ожидание непрерывной случайной величины, плотность распределения вероятностей системы. Ковариация. Коэффициент корреляции.
лабораторная работа [52,3 K], добавлен 19.08.2002Случайные величины. Функция и плотность распределения вероятностей дискретной случайной величины. Сингулярные случайные величины. Математическое ожидание случайной величины. Неравенство Чебышева. Моменты, кумулянты и характеристическая функция.
реферат [244,6 K], добавлен 03.12.2007Предпосылки корреляционного анализа - математико-статистического метода выявления взаимозависимости компонентов многомерной случайной величины и оценки их связи. Точечные оценки параметров двумерного распределения. Аппроксимация уравнений регрессии.
контрольная работа [648,3 K], добавлен 03.04.2011