Статистическая обработка результатов испытаний одномерных и двумерных случайных величин
Проведение статистической обработки результатов контрольных обмеров 100 валиков методом интервальной оценки. Доверительный интервал для оценки среднего квадратического отклонения. Разработка корреляционной модели капиталовложений по группе предприятий.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 23.04.2014 |
Размер файла | 690,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
3
Государственное бюджетное образовательное учреждение высшего профессионального образования Московской области
«Международный университет природы, общества и человека «Дубна»
Факультет Естественных и Инженерных наук
Кафедра прикладной математики и информатики
Курсовая работа по «Теории вероятности и математической статистики»
Статистическая обработка результатов испытаний одномерных и двумерных случайных величин
Студентки II курса группы 2241
Селиверстовой Дарьи Валерьевны
Руководитель:
Доц. к. т.н.: Богомолова Е. В.
Дубна, 2012 г.
Оглавление
Введение
Статистическая обработка
Интервальные оценки
Доверительный интервал для оценки среднего квадратического отклонения
Двумерные случайные величины
Выборочное корреляционное отношение
Доверительные интервалы для коэффициентов регрессии
Заключение
Список использованной литературы
Введение
В данной курсовой работе проводим статистическую обработку результатов испытаний для двух разных задач. В первой задаче представлены контрольные обмеры 100 валиков. Для статистической обработки строим полигон и гистограмму частот, это позволяет нам определить вид распределения. Проверяем гипотезу о нормальном распределении генеральной совокупности по критерию Пирсона. Вычисляем числовые характеристики выборки: выборочную среднюю, моду, медиану, выборочную дисперсию, коэффициент вариации, коэффициенты асимметрии и эксцесса. Оцениваем математическое ожидание и среднее квадратическое отклонение нормально распределенного признака генеральной совокупности с помощью доверительных интервалов с заданной надежностью.
Во второй задаче представлена корреляционная таблица распределения 100 предприятий по капиталовложениям Х (млн. руб.) и выписка продукции Y (млн. руб.). По данным этой таблицы находим выборочные уравнения прямых линий регрессии Y на X и X на Y, строим их графики. Вычисляем коэффициент корреляции, который позволяет нам судить о прямой или обратной зависимости прямых линий регрессии и их силе. Также находим выборочное корреляционное отношение, которое оценивает тесноту связи между Y и X, X и Y. Вычисляем интервальные оценки для генеральных коэффициентов регрессии.
Для статистической обработки результатов используем различные методы: метод моментов, наибольшего правдоподобия, метод произведений вычисления выборочных средней дисперсии, метод сумм вычисления выборочных средней дисперсии, используем разделы теории корреляции и статистической проверки статистических гипотез.
интервальная оценка корреляционная модель капиталовложение
Статистическая обработка
Одномерные случайные величины
Задача №1. Контрольные обмеры 100 валиков дали следующие результаты:
Табл.№1
7,39 |
7,43 |
7,54 |
7,64 |
7,4 |
7,55 |
7,4 |
7,26 |
7,42 |
7,5 |
|
7,32 |
7,31 |
7,28 |
7,52 |
7,46 |
7,63 |
7,38 |
7,44 |
7,52 |
7,53 |
|
7,37 |
7,33 |
7,24 |
7,13 |
7,53 |
7,53 |
7,39 |
7,57 |
7,51 |
7,34 |
|
7,39 |
7,47 |
7,51 |
7,48 |
7,62 |
7,58 |
7,57 |
7,33 |
7,51 |
7,4 |
|
7,3 |
7,48 |
7,4 |
7,57 |
7,51 |
7,4 |
7,52 |
7,56 |
7,4 |
7,34 |
|
7,23 |
7,37 |
7,48 |
7,48 |
7,62 |
7,35 |
7,36 |
7,4 |
7,45 |
7,29 |
|
7,48 |
7,58 |
7,44 |
7,56 |
7,28 |
7,59 |
7,47 |
7,62 |
7,54 |
7,2 |
|
7,38 |
7,43 |
7,35 |
7,56 |
7,51 |
7,47 |
7,4 |
7,29 |
7,2 |
7,46 |
|
7,42 |
7,44 |
7,41 |
7,29 |
7,48 |
7,39 |
7,5 |
7,38 |
7,45 |
7,5 |
|
7,45 |
7,42 |
7,29 |
7,53 |
7,34 |
7,55 |
7,33 |
7,32 |
7,69 |
7,46 |
Составим интервальный ряд для контрольных обмеров 100 валиков. Для этого находим максимальные и минимальные варианты и, используя заданный шаг h=0,07 - расстояние между двумя соседними вариантами, прибавляем h к х=7,13 до тех пор пока не перекроем максимальное значение х=7,69; От интервального вариационного ряда переходим к дискретному вариационному ряду, приняв за новые варианты у - середины интервалов; Перейдем к условным вариантам: u=(y-C)/h, где u - условная варианта середины интервала, С - ложный нуль (С=7,38)
Табл.№2
интервалы: |
У |
n |
U |
n*u |
n*( |
n* |
n* |
n* |
|||
7,13-7,20 |
7,17 |
1 |
0,01 |
-3 |
-3 |
-3,95 |
15,6025 |
9 |
-27 |
81 |
|
7,20-7,27 |
7,24 |
5 |
0,05 |
-2 |
-10 |
-2,95 |
43,5125 |
20 |
-40 |
80 |
|
7,27-7,34 |
7,31 |
13 |
0,13 |
-1 |
-13 |
-1,95 |
49,4325 |
13 |
-13 |
13 |
|
7,34-7,41 |
7,38 |
23 |
0,23 |
0 |
0 |
-0,95 |
20,7575 |
0 |
0 |
0 |
|
7,41-7,48 |
7,45 |
18 |
0,18 |
1 |
18 |
0,05 |
0,045 |
18 |
18 |
18 |
|
7,48-7,55 |
7,52 |
23 |
0,23 |
2 |
46 |
1,05 |
25,3575 |
92 |
184 |
368 |
|
7,55-7,62 |
7,59 |
11 |
0,11 |
3 |
33 |
2,05 |
46,2275 |
99 |
297 |
891 |
|
7,62-7,69 |
7,66 |
6 |
0,06 |
4 |
24 |
3,05 |
55,815 |
96 |
384 |
1536 |
|
сумма |
- |
100 |
- |
- |
95 |
-3,6 |
256,75 |
347 |
803 |
2987 |
Для наглядности строят различные графики статистического распределения, в частности, полигон и гистограмму.
Полигоном частот называют ломаную, отрезки которой соединяют точки (х1; n1), (х2; n2), … (xk;nk).
Для построения полигона частот на оси абсцисс откладывают варианты хi, а на оси ординат - соответствующие им частоты ni. Точки (xi;ni). Соединяют отрезками прямых и получают полигоны частот.
Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (x1;W1) … (xk;Wk).Для построения полигона относительных частот на оси абсцисс откладывают варианты хi, а на оси ординат - соответствующие им относительные частоты Wi. Точки …(xi;Wi).соединяют отрезками прямых и получают полигон относительных частот.
Для построения полигона используем частоты и варианты у - середины интервалов дискретного вариационного ряда.
Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению ni/h (плотность частоты).
Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии ni/h.
Площадь i-го частичного прямоугольника равна hni/h=ni - сумме частот вариант i-го интервала; следовательно, площадь гистограммы частот равна сумме всех частот, т.е. объему выборки.
Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению Wi/h (плотность относительной частоты).
Для построения гистограммы относительны частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии Wi/h. Площадь i-го частичного прямоугольника равна hWi/h=Wi - относительной частоте вариант, попавших в i-й интервал. Площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице.
Для построения гистограммы используем частоты и интервалы интервального ряда
Выборочная средняя:
Пусть для изучения генеральной совокупности относительно количественного признака Х извлечена выборка объема n. Выборочной средней хв называют среднее арифметическое значение признака выборочной совокупности. Если все значения х1, x2,…,xn признака выборки объема n различны , то
=(х1, x2,…,xn)/h.
Если значения признака х1, x2,…,xk имеют соответственно частоты n1,n2…,nk, причем n1+n2+…+nk=n, то
=(n1х1+n2х2+…+nkхk)/n, или =, [1]
т.е. выборочная средняя есть средняя взвешенная значений признака с весами, равным соответствующим частотам. По данным интервального ряда 7,4465 Выборочная дисперсия:
Для того чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения , вводят свободную характеристику - выборочную дисперсию.
Выборочной дисперсией Dв называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения . Если все значения х1, x2,…,xn признака выборки объема n различны, то
Dв=(?(хi-)2)/n.
Если же значения признака х1, x2,…,xk имеют соответственно частоты n1,n2,…,nk, причем n1+n2+…+nk=n, то
Dв=(, [2]
т.е. выборочная дисперсия есть средняя взвешенная квадратов отклонений с весами, равными соответствующим частотам.
Кроме дисперсии для характеристики рассеяния значений признака выборочной совокупности вокруг своего среднего значения пользуются сводной характеристикой - средним квадратическим отклонением.
Выборочным средним квадратическим отклонением (стандартом) называют квадратический корень из выборочной дисперсии:
??в = [3]
Вычисление дисперсии можно упростить, используя теорему:
Теорема: Дисперсия равна среднему квадратов значений признака минус квадрат общей средней:
D= [4]
Доказательство: Справедливость теоремы вытекает из преобразований:
Dв=(=
Выборочная дисперсия является смешенной оценкой генеральной дисперсии, т.е. математическое ожидание выборочной дисперсии не равно оцениваемой генеральной дисперсии, а равно М(Dв)= Dг. [5]
Чтобы найти исправленную дисперсию, которую обозначают S2 нужно умножить Dв на дробь .
Для контрольных обмеров валика:
Выборочная дисперсия - Dв=0,012581,
Выборочное среднее квадратическое отклонение - ??в =0,11216394,
Исправленная дисперсия - S=0,113297.
Модой М0 называют варианту, которая имеет наибольшую частоту.
Медианой me называют варианту, которая делит вариационный ряд на 2 части, равные по числу вариант. Если число вариант нечетно, т.е. n=2k+1, то me=xk+1; при четном n=2k медиана me=(xk+ xk+1)/2.
Коэффициентом вариации V называют выраженное в процентах отношение выборочного среднего квадратического отклонения к выборочной средней:
V= [6]
Коэффициент вариации служит для сравнения величин рассеяния по отношению к выборочной средней двух вариационных рядов. Тот из рядов имеет большее рассеяние по отношению к выборочной средней, у которого коэффициент вариации больше. Коэффициент вариации - безразмерная величина, поэтому он пригоден для сравнения рассеяний вариационных рядов, варианты которых имеют различную размерность.
По результатам контрольного обмера валиков:
Медиана - me=7,44
Мода - Мо=7,44
Коэффициент вариации - V=21,51806%
Для оценки отклонения эмпирического распределения от нормального используют различные характеристики, к числу которых относятся асимметрия и эксцесс.
Асимметрия эмпирического распределения определяется равенством
Аs=m3/ув3, где m3 - центральный эмпирический момент третьего порядка [7]
Эксцесс эмпирического распределения определяется равенством
Ек=m4/у4в - 3, где m4 - центральный эмпирический момент четвертого порядка [8]
m3=[M3-3M2M1+2(M1)3]*h3 [9]
m4=[M4 - 4M3M1+6M2(M1)2 - 3(M1)4]*h4 [10]
m2=[M2 - (M1)2]*h2 [11]
Mk=(?nixik)/n [12]
Для данного интервального ряда условные и эмпирические моменты:
M1 |
0,95 |
|
M2 |
3,47 |
|
M3 |
8,03 |
|
M4 |
29,87 |
|
m3 |
-5E-05 |
|
m4 |
0,000377 |
Тогда можно вычислить: As= 0,03518 и = 0,61796
Проверка гипотезы о нормальном распределении генеральной совокупности по критерию Пирсона
Пусть эмпирическое распределение задано в виде последовательности интервалов и соответствующих им частот. Для того чтобы при заданном уровне значимости б проверить гипотезу о нормальном распределении генеральной совокупности, надо:
1) Перейти к дискретному вариационному ряду, взяв середины интервалов за новые варианты.
2) Вычислить непосредственно выборочную среднюю и выборочное среднее квадратическое отклонение ??.
3) Вычислить теоретические частоты
, [13]
где n - объем выборки, вероятность попадания нормированной случайной величины в интервал [14]
, где Ф=. [15]
4) Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого:
А) составляют расчетную таблицу, по которой находят наблюдаемое значение критерия
. [16]
Б) по таблице критических точек распределения , по заданному уровню значимости б и числу степеней свободы k=s-3 (s - число групп выборки) находят критическую точку =(б; k) правосторонней критической области. Если < - нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности. Другими словами, эмпирические и теоретические частоты различаются не значимо. Если > - гипотезу отвергают, т.е. эмпирические и теоретические частоты различаются значимо.
Составим расчетную таблицу, где и концы интервалов контрольных обмеров валиков, их частота, выборочную среднюю и выборочное среднее квадратическое отклонение ?? мы уже вычислили ранее, находим значение случайной величины Z, значение Ф(Z) нашли по таблице приложения №2, разность значений Ф() и Ф(). Уровень значимости б=0,05 и число групп выборки s=7, тогда число степеней свободы k=4. Критическая точка =(б; k)=(0,05; 4)=9,5.
Табл.№3
i |
Ф() |
Ф() |
n'=n |
(-n')2/n' |
|||||||
1 |
7,13 |
7,2 |
1 |
-? |
-2,1977 |
-0,5 |
-0,4861 |
0,0139 |
1,39 |
||
2 |
7,2 |
7,27 |
5 |
-2,1977 |
-1,5736 |
-0,4861 |
-0,4418 |
0,0443 |
4,43 |
0,0056 |
|
3 |
7,27 |
7,34 |
13 |
-1,5736 |
-0,9495 |
-0,4418 |
-0,3289 |
0,1129 |
11,29 |
0,259 |
|
4 |
7,34 |
7,41 |
23 |
-0,9495 |
-0,3254 |
-0,3289 |
-0,1274 |
0,2015 |
20,15 |
0,4031 |
|
5 |
7,41 |
7,48 |
18 |
-0,3254 |
0,29867 |
-0,1274 |
0,1179 |
0,2453 |
24,53 |
1,7383 |
|
6 |
7,48 |
7,55 |
23 |
0,2987 |
0,92276 |
0,1179 |
0,3212 |
0,2033 |
20,33 |
0,3507 |
|
7 |
7,55 |
7,62 |
11 |
0,9228 |
1,54684 |
0,3212 |
0,4394 |
0,1182 |
11,82 |
0,0569 |
|
8 |
7,62 |
7,69 |
6 |
1,5468 |
? |
0,4394 |
0,5 |
0,0606 |
6,06 |
0,0006 |
|
100 |
1 |
2,8141 |
Из таблицы №3 находим 2,8141.
Так как =9,5, то следует, что (2,8141<9,5). Критерий Пирсона выполняется, значит, результаты контрольного обмера валиков имеют нормальное распределение.
Кривая Гаусса
Непрерывная случайная величина Х имеет нормальное распределение с параметрами а и ??2, где а - выборочное среднее значение и ??2 - среднее квадратическое отклонение, если плотность распределения вероятностей имеет вид f(x)= График плотности f(x) нормального распределения называется кривой Гаусса. Для построения графика используем 5 точек:
1) точка максимума (а; )=(7,4465; 2,4904)
2) точка перегиба (а+??; )=(7,6067; 1,5105)
3) точка перегиба (а-??; )=(7,2863; 1,5105)
4) вспомогательная точка (а-2??; )=(7,1260; 0,9162)
5) вспомогательная точка (а+2??; )=( 7,7670; 0,9162)
Интервальные оценки
Интервальной называют оценку, которая определяется двумя числами - концами интервала. Интервальные оценки позволяют установить точность и надежность оценок.
Пусть найденная по данным выборки статистическая характеристика ??*служит оценкой неизвестного параметра ??. Будем считать ?? постоянным числом (?? может быть и случайной величиной). ??* тем точнее определяет параметр ??, чем меньше абсолютная величина разности | ?? - ??*|.
Однако статистические методы не позволяют категорически утверждать, что оценка ??* удовлетворяет неравенству | ?? - ??*|<??; можно лишь говорить о вероятности ??, с которой это неравенство осуществляется.
Надежностью (доверительной вероятностью) оценки ?? по ??* называют вероятность ??, с которой осуществляется неравенство | ?? - ??*|<??. Обычно надежность оценки задается наперед , причем в качестве ?? берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99; 0,999.
Пусть вероятность того, что | ?? - ??*|<??, равна ??:
Р[| ?? - ??*|<??]=??.
Заменив неравенство | ?? - ??* | < ?? равносильным ему двойным неравенством -??<?? - ??*<??, или ??*-??< ?? < ??*+??, имеем
Р[??*-??< ?? < ??*+??]=??.
Это соотношение следует понимать так: вероятность того что интервал (??*-??,??*+??) заключает в себе (покрывает) неизвестный параметр ??, равна ??.
Доверительным называют интервал (??*-??; ??*+??) который покрывает неизвестный параметр с заданной надежностью ??.
Пусть количественный признак Х генеральной совокупности имеет нормальное распределение с неизвестным средним квадратическим отклонением ??. По выборке х1, x2,…,xn требуется оценить математическое ожидание а.
Рассмотрим случайную величину Т=, где Z имеет нормальное распределение N(0,1); V имеет распределение ??2 с «к» степенями свободы; Т имеет распределение Стьюдента «к» степенями свободы.
В качестве Z=, V=(k-1)(S2/??2), где S - исправленное выборочное среднее квадратическое отклонение
Возьмем Т== имеет распределение Стьюдента с (к-1) степенями свободы. Пусть S(t,n) плотность распределения Стьюдента.
Р(||<t??)=2(t,n) dt=??
Заменив неравенство в круглых скобках равносильным ему двойным неравенством, получим:
P( - t??S/<a< + t??S/)=??
Пользуясь распределением Стьюдента, нашли доверительный интервал покрывающий неизвестный параметр а с надежностью ??: ( - t??S/ + t??S/ [17]
и S находятся по выборке. По таблице приложения 3 по заданным n и ?? можно найти t??.
В первой задаче надежность ?? =0,95; n=100, по таблице приложения №3 - t??=1,984, тогда находим доверительный интервал для оценки математического ожидания при неизвестном ??: 7,4240<a<7,4690. Вывод: в генеральной совокупности средние размеры валиков заключены в пределах от 7,4240 до 7,4690.
Доверительный интервал для оценки среднего квадратического отклонения ??
Пусть количественный признак Х генеральной совокупности распределен нормально. Требуется оценить неизвестное генеральное среднее квадратическое отклонение ?? по х1, x2,…,xn и «исправленному» выборочному среднему квадратическому отклонению S. Нужно найти доверительный интервал, покрывающий неизвестный параметр ?? с заданной надежностью ??=Р(|у-S|<д)
-д<у-S<д
S-д<у<д+S
S(1-д/S)<у<(1+д/S)S
Обозначим q=д/S => S(1-q)<у<S(1+q) [18]
< ; ч=
< <
< <
Обозначим ч= имеющее распределение ч2 с (n-1) степенями свободы
Пусть ее плотность R(t,n) распределения ч2,то Р(ч1 <ч< ч2)= =>P( < ч < )=г=. Из этого выражения находим q.
На практике q находят из таблицы приложения №4 по заданным n и г.
По данным таблицы интервального ряда:
По заданным надежности ?? =0,95 и объема n=100, по таблице приложения №4 q=0,143. Тогда доверительный интервал для оценки среднего квадратического отклонения ?? контрольного обмера валиков имеет вид 0,0971<??<0,1295. Вывод: в генеральной совокупности средние квадратические отклонения размеров валиков заключены в пределах (0,0971; 0,1295).
Примечание: все таблицы приложения находятся в книге «В.Е. Гмурман “Теория вероятностей и математическая статистика”» 1998 г.»
Двумерные случайные величины
Задача №2: Распределение 100 предприятий по капиталовложениям Х (млн. руб.) и выпуску продукции Y (млн. руб.) приведено в таблице:
Табл.№4
У |
Х |
|||||||
12 |
17 |
22 |
27 |
32 |
37 |
|||
25 |
2 |
4 |
- |
- |
- |
- |
6 |
|
35 |
- |
6 |
3 |
- |
- |
- |
9 |
|
45 |
- |
- |
6 |
45 |
4 |
- |
55 |
|
55 |
- |
- |
2 |
8 |
6 |
- |
16 |
|
65 |
- |
- |
- |
4 |
7 |
3 |
14 |
|
2 |
10 |
11 |
57 |
17 |
3 |
100 |
Перейдем к условным вариантам:
где =22, =5;
=45, =10;
Табл. №5
U |
||||||||
V |
-2 |
-1 |
0 |
1 |
2 |
3 |
||
-2 |
2 |
4 |
- |
- |
- |
- |
6 |
|
-1 |
- |
6 |
3 |
- |
- |
- |
9 |
|
0 |
- |
- |
6 |
45 |
4 |
- |
55 |
|
1 |
- |
- |
2 |
8 |
6 |
- |
16 |
|
2 |
- |
- |
- |
4 |
7 |
3 |
14 |
|
2 |
10 |
11 |
57 |
17 |
3 |
100 |
Корреляционная зависимость:
Одному значению случайной величины Х отвечает условное математическое ожидание другой случайной величины У.
В качестве оценок условных математических ожиданий применяют условные средние, которые находят по выборке.
Условным средним называют среднее арифметическое значений Y, соответствующих при Х=х.
Условным средним называют среднее арифметическое значений Х, соответствующее при Y=y.
Условное математическое ожидание М(Y|x) является функцией от х, его оценка, т.е. условное среднее , также функция от х; обозначив эту функцию через f*(x), получим уравнение = f*(x).Это уравнение называют выборочным уравнением регрессии Y на Х; функцию f*(x) называют выборочной регрессией Y на Х, а ее график - выборочной линией регрессии Y на Х.
Аналогичное уравнение =??*(у) называют выборочным уравнением регрессии Х на Y; функцию ??*(у) называют выборочной регрессией Х на Y, ее график - выборочной линией регрессии Х на Y.
Пусть известны результаты n независимых опытов известны пары чисел (х1, у1), (х2, у2), …, (хn, уn).
Найдем по данным наблюдений выборочное уравнение прямой линии среднеквадратичной регрессии. Для определенности будем искать в виде
=kх+b регрессии Y на Х. Угловой коэффициент прямой линии регрессии У на Х называют выборочным коэффициентом регрессии Y на Х и обозначают ??ух.
Выборочное уравнение прямой линии регрессии Y на Х вида Y= ??ух х+b.
Подберем параметры ??ух и b так, чтобы точки (х1, у1), (х2, у2), …, (хn, уn), построенные по данным наблюдений, на плоскости хОу лежали как можно ближе к прямой линии регрессии.
Воспользуемся методом наименьших квадратов. Так как каждое отклонение зависит от отыскиваемых параметров, то и сумма квадратов отклонений есть функция F этих параметров.
F(??, b)=?(Yi-yi)2, или F(??, b)=?(??xi+b-yi)2
Для отыскания минимума приравниваем к нулю соответствующие частные производные:
dF/d??=2;
dF/db=2.
Выполнив элементарные преобразования, получим систему двух линейных уравнений относительно ?? и b:
(?х2)??+(?x)b=?xy; (?х)??+nb=?y.
Решив эту систему, найдем искомые параметры:
??ху=(n?xy-?x?y)/(n?x2-(?x)2);
b=(?x2?y-?x?xy)/(n?x2-(?x)2).
Аналогично можно найти выборочное уравнение прямой линии регрессии Х ни Y:
=х+С, где - выборочный коэффициент регрессии Х на У.
Допустим, что получено большое число данных, среди них есть повторяющиеся, и они сгруппированы в виде корреляционной таблицы. Воспользуемся тождествами:
?x=n; ?y=n; ?x2=n; ?xy=?xy, пара чисел (x, y)встретилась раз.
Подставив в систему
и сократив обе части второго уравнения на n, получим
Решив эту систему, найдем параметры и b и искомое уравнение
=х+b.
Однако более целесообразно, введя новую величину - выборочный коэффициент корреляции, написать уравнение регрессии в ином виде. Найдем b из второго уравнения второй системы: b=.
Подставив правую часть этого равенства в уравнение =х+b, получим
=(х - ).
Найдем из первой системы коэффициент регрессии, учитывая, что 2- ()2=??2х:
??ху==. [19]
Умножив обе части равенства на дробь ??х/??у
??ух=. [20]
Обозначив правую часть через rв - выборочный коэффициент корреляции
rв=. [21]
Подставив rв в =(х - ): = rв. [22]
Отсюда = rв [23]
то уравнение регрессии Y по Х имеет вид = rв(х - ) [24]
Аналогично уравнение регрессии Х по Y: = rв(y- [25]
Выборочный коэффициент корреляции определяется равенством:
rв=, где и - варианты признаков Х и Y; частота пары вариант (х, у); n - объем выборки; , - выборочные средние квадратические отклонения; - выборочные средние.
Если величины Y и Х независимы, то r=0; если r=1 и r= -1, то У и Х связаны линейной функциональной зависимостью. Коэффициент корреляции измеряет силу (тесноту) линейной связи между Y и Х. Выборочный коэффициент корреляции является оценкой коэффициента корреляции генеральной совокупности и поэтому также служит для измерения линейной связи между величинами - количественными признаками Y и Х.
Если выборка имеет достаточно большой объем и хорошо представляет генеральную совокупность, то заключение о тесноте линейной зависимости между признаками, полученные по данным выборки, может быть распространено и на генеральную совокупность. Рассмотрим 2 вспомогательные таблицы:
Табл.№6 Умножение частоты nij на условную варианту U:
U |
|||||||||
V |
-2 |
-1 |
0 |
1 |
2 |
3 |
U |
v*U |
|
-2 |
-4 |
-4 |
0 |
0 |
0 |
0 |
-8 |
16 |
|
-1 |
0 |
-6 |
0 |
0 |
0 |
0 |
-6 |
6 |
|
0 |
0 |
0 |
0 |
45 |
8 |
0 |
53 |
0 |
|
1 |
0 |
0 |
0 |
8 |
12 |
0 |
20 |
20 |
|
2 |
0 |
0 |
0 |
4 |
14 |
9 |
27 |
54 |
|
сумма |
96 |
Табл.№7 Умножение частоты на условную варианту V:
U |
||||||||
V |
-2 |
-1 |
0 |
1 |
2 |
3 |
||
-2 |
-4 |
-8 |
0 |
0 |
0 |
0 |
||
-1 |
0 |
-6 |
-3 |
0 |
0 |
0 |
||
0 |
0 |
0 |
0 |
0 |
0 |
0 |
||
1 |
0 |
0 |
2 |
8 |
6 |
0 |
||
2 |
0 |
0 |
0 |
8 |
14 |
6 |
||
V |
-4 |
-14 |
-1 |
16 |
20 |
6 |
сумма |
|
u*V |
8 |
14 |
0 |
16 |
40 |
18 |
96 |
Вычислим выборочные характеристики случайных величин Х, переходя к условным вариантам
Табл.№8
Ui |
Ni |
Ui*ni |
Ui^2*ni |
|
-2 |
2 |
-4 |
8 |
|
-1 |
10 |
-10 |
10 |
|
0 |
11 |
0 |
0 |
|
1 |
57 |
57 |
57 |
|
2 |
17 |
34 |
68 |
|
3 |
3 |
9 |
27 |
|
сумма |
100 |
86 |
170 |
По таблице находим =0,86, =1,7, тогда 0,98
Табл.№9
Vi |
Ni |
Vi*ni |
Vi^2*ni |
|
-2 |
6 |
-12 |
24 |
|
-1 |
9 |
-9 |
9 |
|
0 |
55 |
0 |
0 |
|
1 |
16 |
16 |
16 |
|
2 |
14 |
28 |
56 |
|
Сумма |
100 |
23 |
105 |
По таблице находим = 0,23, = 1,05, тогда 0,998549
Тогда выборочный коэффициент корреляции по формуле [21] rв=0,778885
Выборочное корреляционное отношение
Выборочным корреляционным отношением Y к Х называют отношение межгруппового среднего квадратического отклонения к общему среднему квадрати-ческому отклонению признака Y:
= или ??ух= [26]
Здесь
,
где n - объем выборки; частота значения х признака Х; частота значения у признака Y; общая средняя признака Y; условная средняя признака У.
Аналогично определяется выборочное корреляционное отношение Х к Y:
= [27]
Составим две расчетных таблиц...
Подобные документы
Определение среднего арифметического исправленных результатов многократных наблюдений, оценка среднего квадратического отклонения. Расчет доверительных границ случайной составляющей погрешности результата измерения. Методика выполнения прямых измерений.
лабораторная работа [806,9 K], добавлен 26.05.2014Понятие доверительного интервала и доверительной вероятности. Доверительный интервал для математического ожидания (пример задачи). Распределение Стьюдента. Принятие решения о параметрах генеральной совокупности, проверка статистической гипотезы.
реферат [64,9 K], добавлен 15.02.2011Понятие корреляционно-регрессионного анализа как метода изучения по выборочным данным статистической зависимости ряда величин. Оценка математического ожидания, дисперсии, среднего квадратического отклонения и коэффициента корреляции случайных величин.
курсовая работа [413,0 K], добавлен 11.08.2012Построение корреляционного поля результатов измерения непрерывной работы станков в зависимости от количества обработанных деталей. Определение интервала для математического ожидания и среднего квадратического отклонения при доверительной вероятности.
контрольная работа [200,4 K], добавлен 03.10.2014Значения показателей и коэффициент вариации. Пределы возможных ошибок, исключение ошибочных результатов. Величина доверительных интервалов для заданных значений доверительных вероятностей. Средние квадратичные отклонения. Значения коэффициента доверия.
лабораторная работа [38,4 K], добавлен 01.03.2011Понятия доверительного интервала и доверительной вероятности и их применение в эконометрических задачах. Доверительный интервал для математического ожидания нормальной случайной величины при известной и при неизвестной дисперсии, генеральная совокупность.
реферат [2,0 M], добавлен 12.12.2009Элементарные понятия о случайных событиях, величинах и функциях. Числовые характеристики случайных величин. Виды асимметрии распределений. Статистическая оценка распределения случайных величин. Решение задач структурно-параметрической идентификации.
курсовая работа [756,0 K], добавлен 06.03.2012Расчёт скользящего среднего методом математического усреднения цифровых величин согласно условию задач. Составление таблицы и построение графика полученных результатов расчета. Сравнительный анализ решений трех заданий, построение их общего графика.
лабораторная работа [26,9 K], добавлен 15.11.2010Метод наименьших квадратов; регрессионный анализ для оценки неизвестных величин по результатам измерений. Приближённое представление заданной функции другими; обработка количественных результатов естественнонаучных опытов, технических данных, наблюдений.
контрольная работа [382,4 K], добавлен 16.03.2011Формулы вычисления критерия Пирсона, среднего квадратического отклонения и значений функций Лапласа. Определение свойств распределения хи-квадрата. Критерий согласия Колмогорова-Смирнова. Построение графика распределения частот в заданном массиве.
контрольная работа [172,2 K], добавлен 27.02.2011Структурная, аналитическая и комбинационная группировка по признаку-фактору. Расчет среднего количества балансовой прибыли, среднего арифметического значения признака, медианы, моды, дисперсии, среднего квадратического отклонения и коэффициента вариаций.
контрольная работа [194,5 K], добавлен 06.04.2014Публикация данных: источники информации и влияние факторов на деятельность. Статистическая автокоррелированность ряда и проверка ее порядков, статистика Дарбина–Уотсона. Регрессионные зависимости и леммы эконометрической модели, доверительный интервал.
практическая работа [327,4 K], добавлен 15.03.2009Сущность и особенности понятия "вариация", ее виды и формы исчисления. Метод электронно-вычислительного способа расчета. Принцип вычисления среднего квадратического отклонения. Характеристика общих, межгрупповых, средних и внутригрупповых дисперсий.
методичка [168,9 K], добавлен 15.12.2008Расчет выборочной средней, дисперсии, среднего квадратического отклонения и коэффициента вариации. Точечная оценка параметра распределения методом моментов. Решение системы уравнений по формулам Крамера. Определение уравнения тренда для временного ряда.
контрольная работа [130,4 K], добавлен 16.01.2015Определение площади фигуры аналитическим методом (с помощью вычисления определенного интеграла) и методом статистических испытаний Монте-Карло. Построение графиков для наглядной демонстрации результатов эксперимента. Вычисление доверительного интервала.
лабораторная работа [211,9 K], добавлен 15.10.2013Ковариация и коэффициент корреляции, пары случайных переменных. Вычисление их выборочных значений и оценка статистической значимости в Excel. Математическая мера корреляции двух случайных величин. Построение моделей парной и множественной регрессии.
контрольная работа [2,2 M], добавлен 24.12.2014Проведение статистического наблюдения за деятельностью предприятий корпорации. Выборочные данные по предприятиям, выпускающим однородную продукцию. Статистический анализ выборочной и генеральной совокупности. Экономическая интерпретация результатов.
лабораторная работа [1,1 M], добавлен 29.12.2008Изучение показателей качества конструкционного газобетона как случайных величин. Проведение модульного эксперимента и дисперсионного анализа с целью определения достоверности влияния факторов на поведение выбранных показателей качества данной продукции.
курсовая работа [342,3 K], добавлен 08.05.2012Проверка однородности дисперсии и эффективности математической модели. Перевод уравнения регрессии из кодированных обозначений факторов в натуральные. Построение графиков зависимости выходной величины от управляемых факторов. Упрессовка сырого шпона.
курсовая работа [85,8 K], добавлен 13.01.2015Построение гистограммы и эмпирической функции распределения. Нахождение доверительного интервала для оценки математического распределения. Проверка статистической гипотезы о равенстве средних значений, дисперсий, их величине, о виде закона распределения.
курсовая работа [1,7 M], добавлен 29.11.2014