Вычисление корреляционного отношения
Особенности методики построения корреляционной таблицы, вычисление с ее помощью параметров уравнения. Определение параболической регрессии по формуле Крамера. Оценка надежности корреляционного отношения, вариация факторного и результативного признака.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 14.04.2015 |
Размер файла | 144,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://allbest.ru
Введение
В природе многие явления и процессы взаимосвязаны между собой. В физической культуре и спорте, в спортивной команде и в организме спортсмена тоже существует много взаимосвязей между различными признаками. Например, с повышением количества занимающихся в каком-либо виде спорта повышаются результаты в этом виде; осложнения во взаимоотношениях между игроками одной команды ухудшает её результативность; с повышением интенсивности нагрузки у спортсмена повышается пульс; увеличивается скорость кровообращения ; регулярность тренировок, оптимально подобранные нагрузки по их виду, объему и интенсивности улучшают результаты спортсмена и т.д.
Влияние одних признаков на другие может быть положительным и отрицательным. Грамотный специалист должен хорошо разбираться в таких взаимосвязях в своей области, устранять или уменьшать негативное влияние и уметь своевременно и в достаточной мере использовать полезные взаимосвязи.
Некоторые методы математической статистики могут помочь любому специалисту выявить взаимосвязи, раскрыть их особенности. Одним из таких методов и является метод корреляционного анализа. Она направлен на то, чтобы на основе статистического материала выявить факт влияния одного признака на другой, установить полезность или вред этого влияния и оценить уверенность в полученных выводах. При этом различают два вида зависимости - функциональную и статистическую (корреляционную).
Корреляция - статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом, изменения значений одного или нескольких из этих величин приводят в систематическому изменению значений другой или других величин.
Корреляция считается простой, когда речь идет об отношениях между двумя величинами или переменными ( например, между потреблением и доходами), и множеством, если в ней участвуют три и более переменных (например, потребление, доходы, цены). Частичная К. определяет отношения между двумя переменными когда для третьей переменной берется определенная постоянная величина (например, корреляция между потреблением и доходами для данного возрастного класса участников). Математической мерой корреляции двух случайных величин служит коэффициент корреляции в теории вероятности и статистике - это показатель характера изменения двух случайных величин.
1. Построение корреляционной таблицы
Таблица 1. Исходные данные
X |
Y |
X |
Y |
X |
Y |
X |
Y |
X |
Y |
|
0 |
185 |
24 |
85 |
53 |
2 |
85 |
40 |
121 |
180 |
|
2 |
180 |
24 |
90 |
55 |
4 |
87 |
45 |
123 |
174 |
|
3 |
175 |
27 |
75 |
57 |
0 |
89 |
35 |
125 |
185 |
|
5 |
170 |
28 |
82 |
59 |
2 |
90 |
64 |
127 |
196 |
|
7 |
160 |
29 |
64 |
63 |
5 |
92 |
60 |
129 |
200 |
|
8 |
155 |
30 |
70 |
64 |
2 |
95 |
83 |
130 |
196 |
|
10 |
140 |
33 |
58 |
67 |
8 |
98 |
94 |
132 |
210 |
|
12 |
140 |
34 |
50 |
69 |
10 |
100 |
100 |
134 |
220 |
|
12 |
145 |
36 |
40 |
70 |
4 |
103 |
112 |
|||
14 |
125 |
38 |
30 |
72 |
6 |
105 |
120 |
|||
14 |
118 |
38 |
25 |
75 |
10 |
108 |
125 |
|||
15 |
124 |
40 |
23 |
77 |
15 |
110 |
140 |
|||
17 |
120 |
42 |
25 |
77 |
20 |
112 |
146 |
|||
19 |
100 |
45 |
14 |
79 |
25 |
114 |
135 |
|||
20 |
95 |
46 |
12 |
81 |
30 |
115 |
154 |
Параболическая зависимость имеет вид:
у=а+bx+cx2.
Для получения такого вида строят корреляционную таблицу.
Для того чтобы построить корреляционную таблицу , необходимо представить вариационный ряд (табл.1) в виде интервального ряда (табл.2). Для этого воспользуемся формулой величины интервала.
h = (Xmax-Xmin)/ (1+3,2lg(n))
h = (Ymax- Ymin)/(1+3,2lg(n))
где Xmax, Ymax - максимальное значение изучаемого признака
Xmin, Ymin - минимальное значение изучаемого признака
n = 72 - количество проб
В нашем случае:
Xmax=134, Xmin=0
Ymax=220, Ymin=0
Таблица 2.
Границы интервалов для x: |
Границы интервалов для y: |
|
0-20 |
0-32 |
|
20-40 |
32-64 |
|
40-60 |
64-96 |
|
60-80 |
96-128 |
|
80-100 |
128-160 |
|
100-120 |
160-192 |
|
120-140 |
192-224 |
В корреляционной таблице факторный признак X, располагают в строках, а результативный признак Y - в столбцах таблицы. Числа, расположенные на пересечении строк и столбцов таблицы, означают частоту повторения данного значения X и Y.
Корреляционная таблица, а также расчет дополнительных величин представлен в таблице 2.
Таблица 3.
? |
-4 |
-3 |
-2 |
-1 |
0 |
1 |
2 |
my |
my з |
myз 2 |
||
З |
0-20 |
20-40 |
40-60 |
60-80 |
80-100 |
100-120 |
120-140 |
|||||
-4 |
0-32 |
3 |
8 |
10 |
1 |
22 |
-88 |
352 |
||||
-3 |
32-64 |
4 |
6 |
10 |
-30 |
90 |
||||||
-2 |
64-96 |
1 |
5 |
2 |
8 |
-16 |
32 |
|||||
-1 |
96-128 |
5 |
1 |
1 |
3 |
10 |
-10 |
10 |
||||
0 |
128-160 |
5 |
4 |
9 |
0 |
0 |
||||||
1 |
160-192 |
4 |
1 |
3 |
8 |
8 |
8 |
|||||
2 |
192-224 |
5 |
5 |
10 |
20 |
|||||||
У |
15 |
13 |
8 |
10 |
10 |
8 |
8 |
72 -126 512 |
||||
?mx |
-60 |
-39 |
-16 |
-10 |
0 |
8 |
16 |
-101 |
||||
?2mx |
240 |
117 |
32 |
10 |
0 |
8 |
32 |
439 |
||||
?3mx |
-960 |
-351 |
-64 |
-10 |
0 |
8 |
64 |
-1313 |
||||
?4mx |
3840 |
1053 |
128 |
10 |
0 |
8 |
128 |
5167 |
||||
Уmз |
-3 |
-35 |
-32 |
-40 |
-27 |
-2 |
13 |
-126 |
||||
Уз2 m |
13 |
105 |
128 |
160 |
79 |
4 |
23 |
512 |
||||
?Уmз |
12 |
105 |
64 |
40 |
0 |
-2 |
26 |
245 |
||||
?2Уmз |
-48 |
-315 |
-128 |
-40 |
0 |
-2 |
52 |
-481 |
||||
УУmy= Уmy/Уm |
2064 |
751,998 |
128 |
160 |
576 |
1088 |
1568 |
6335,998 |
||||
137,6 |
57,846 |
16 |
16 |
57,6 |
136 |
196 |
617,046 |
2. Вычисления параметров уравнения
2.1 С помощью корреляционной решетки
Уравнение регрессии в форме параболы второго порядка имеет вид (в координатах з и ?) :
з= а'+ b' ?+c' ?2 (1)
2)Параметры этого уравнения определяют по способу наименьших квадратов, решая систему уравнений(2):
Уmз = a'n + b'У ? m+c'У ? 2m
? Уmз = a' У ? m + b'У ? 2m +c'У ? 3m (2)
? 2Уmз = a'У ? 2m + b'У ? 3m +c'У(? 2 )2m
Из таблицы 2 находим необходимые данные
N=72 ,У ? m = -101, У ? 2m= 439, У ? 3m= -1313, У(? 2 )2m= 5167
Подставляем данные в систему уравнений(2), и получаем систему уравнений (А):
-126= a'72-b'101+c'439
245= -a' 101 +b'439 -c'1313
-481= a' 439 - b' 1313 +c' 5167
Решая эту систему уравнений найдем a',b',c':
a'= -2,896 ,
b'=1,456 ,
c'= 0,523
Уравнение параболы имеет вид:
з= -2,896+ 1,456?+0,523?2
Произведя в уравнении параболы замену переменных и найдем уравнение параболической регрессии :
Y=(y-144)/32;
X=(x-90)/20;
Подставив в уравнение вместо з, ?, получим уравнение параболической регрессии:
(y-144)/32= -2,896+ 1,456(x-90)/20+0,523((x-90)/20)2
Упростив, мы получим:
У=0,042x2-5,202x-497,24
2.2 С помощью матриц по формуле Крамера
Определим параметры параболической регрессии по формуле Крамера
Уmз = a'n + b'У ? m+c'У ? 2m
? Уmз = a' У ? m + b'У ? 2m +c'У ? 3m (2)
? 2Уmз = a'У ? 2m + b'У ? 3m +c'У(? 2 )2m
Для нашей системы уравнений определитель будет иметь вид:
А=
D=18313896
Дополнительные определители a,b,c:
D1:= -53037696
D2:= 26656518
D3:= 9575106
Корни уравнения равны:
a' = D1 / D = -53037696/18313896=-2,896
b' = D2 / D = 26656518/18313896=1,456
c' = D3 / D = 9575106/18313896=0,523
Подставив, получим уравнение:
Y=0,042x2-5,202x-497,24
3. Вычисление корреляционного отношения
Такая задача как измерение тесноты зависимости, для всех форм связи, в том числе и параболы, может быть решена при помощи вычисления эмпирического корреляционного отношения :
дисперсия в ряду выровненных значений результативного показателя;
средняя внутригрупповая дисперсия у.
Проведем дополнительные расчеты.
Определим средние значения у для каждой группы по х (по данным таблицы 2):
У(10)=137,6
У(30)=57,846
У(50)=16
У(70)=16
У(90)=57.6
У(110)=136
Для значения у вычисляют дисперсия по группам по формуле:
у = У(yi-yi)2*mi/У*mi
у10=(80-137,6)2*1+(112-137,6)2*5+(144-137,6)2*5+(176-137,6)2*4/15=846,507
у30=(16-57,846)2*3+(48-57,846)2*4+(80-56,846)2*5+(112-57,846)2*1/13=848,284
у50=(16-16)2*8/8=0
у70=(16-16)2*10/10=0
у90=(16-57,6)2*1+(48-57,6)2*6+(80-57,6)2*2+(112-57,6)2*1/10=624,64
у110=(112-136)2*3+(144-136)2*4+(176-136)2*1/8=448
у130=(176-196)2*3+(208-196)2*5/8=240
Средневзвешенное значение дисперсии показывает рассеяние содержания уза счет прочих факторов, кроме х. Оно вычисляется по формуле:
у2 = У(у i)2*mi/У*mi
у2 = (846,507+848,284+624,64+448+240)/72 =41,77
Влияние содержания х на содержание у отражает межгрупповая дисперсия:
у2=У(yi-yi)2*mi/У*n,
где у среднее вычисляется по формуле:
у=Уyi*mi/n
у2=(846,507*15)+(848,284*13)+(0*8)+(0*10)+(624,64*10)+(448*8)+(240*8)/72=492,77
Среднее значение у в целом по совокупности данных:
Тогда:
=3653,062
Общую дисперсию находим по правилу сложения дисперсий
Тогда корреляционное отношение равно:
Корреляционное отношение измеряет близость эмпирической линии связи к теоретической. Значение корреляционного отношения, которое мы получили равно 0.88 ближе к 1, свидетельствует о том, что связь является тесной.
4. Оценка надежности корреляционного отношения
Значимость корреляционного отношения определим с использованием критерия Стьюдента. Расчет t-критерия проводится по формуле:
Расчет:
Табличное значение t-критерия при уровне значимости 0,88 и степенях свободы 72-2=70 равно 1,989. Расчетное значение выше критического, следовательно, корреляционное отношение значимо.
5. Построение линии регрессии
Найдем теоретические значения Ут. Для этого воспользуемся уравнением параболической регрессии:
У=0,042x2-5.202x-497.24
Составим таблицу:
Таблица 4.
Х |
10 |
30 |
50 |
70 |
90 |
110 |
130 |
|
Уп. |
137,6 |
57,846 |
16 |
16 |
57,6 |
136 |
196 |
|
Ут. |
135,424 |
62,048 |
23,04 |
18,4 |
48,128 |
112,224 |
210,688 |
Заключение
Управление корреляционной связи измеряет зависимость между вариацией результативного признака и вариации факторного признака. Меры тесноты связи измеряют долю вариации результативного признака, которая связана корреляционно с вариацией факторного признака. Интерпретировать корреляционные показатели следует строго в терминах вариации ( различий в пространстве) отклонения от средней величины.
Корреляционное отношение измеряет близость эмпирической линии связи к теоретической. В моем случае значение корреляционного отношения ф=0,88 - по шкале Чеддока - это весьма высокая связь.
Список использованной литературы
корреляционный параболический регрессия крамер
1. Статистика: учебник. Под ред. И.И. Елисеевой. - М.: Высшее образование, 2008. - 566 с.
2. Бочаров П.П., Печинкин А.В. Теория вероятностей. Математическая статистика. - М.: Гардарика, 1998. - 328 с.
3. Лекции по теории вероятностей. Елисеев В.М.
4. Лекции по статистике. Елисеев В.М.
5. Яковлева Н.В., Венсковская В.И. теория вероятностей и математическая статистика. - М.: РУДН, 2009 - 130 с.
Размещено на Allbest.ru
...Подобные документы
Cтатистический анализ зависимости давления. Построение диаграммы рассеивания и корреляционной таблицы. Вычисление параметров для уравнений линейной и параболической регрессии, выборочных параметров. Проверка гипотезы о нормальном распределении признака.
курсовая работа [613,3 K], добавлен 24.10.2012Определение вероятности наступления определенного события по законам теории вероятности. Вычисление математического ожидания, дисперсии и среднего квадратичного отклонения. Нахождение выборочного уравнения регрессии по данным корреляционной таблицы.
контрольная работа [212,0 K], добавлен 01.05.2010Оценка надежности аналитической методики. Дисперсионный анализ результатов опытов и аппроксимация результатов эксперимента. Расчет линейного уравнения связи. Определение полного квадратного уравнения. Вычисление типа и объема химического реактора.
курсовая работа [229,2 K], добавлен 06.01.2015Определение вероятности наступления события по формуле Бернулли. Построение эмпирической функции распределения и гистограммы для случайной величины. Вычисление коэффициента корреляции, получение уравнения регрессии. Пример решения задачи симплекс-методом.
контрольная работа [547,6 K], добавлен 02.02.2012Вычисление по классической формуле вероятности. Определение вероятности, что взятая наугад деталь не соответствует стандарту. Расчет и построение графиков функции распределения и случайной величины. Вычисление коэффициента корреляции между величинами.
контрольная работа [708,2 K], добавлен 02.02.2011Характеристика экзогенных и эндогенных переменных. Теорема Гаусса-Маркова. Построение двухфакторного и однофакторных уравнения регрессии. Прогнозирование значения результативного признака. Оценка тесноты связи между результативным признаком и факторами.
курсовая работа [575,5 K], добавлен 19.05.2015Значения коэффициента регрессии (b) и сводного члена уравнения регрессии (а). Определение стандартной ошибки предсказания являющейся мерой качества зависимости величин Y и х с помощью уравнения линейной регрессии. Значимость коэффициента регрессии.
задача [133,0 K], добавлен 21.12.2008Построение диаграммы рассеивания, полигонов, гистограмм нормированных относительных частот, эмпирических функций распределения по X и по Y. Параметры для уравнения параболической регрессии. Проверка гипотезы о нормальном распределении признака Х.
курсовая работа [511,8 K], добавлен 08.12.2013Функциональные и корреляционные зависимости. Сущность корреляционной связи. Методы выявления наличия корреляционной связи между двумя признаками и измерение степени ее тесноты. Построение корреляционной таблицы. Уравнение регрессии и способы его расчета.
контрольная работа [55,2 K], добавлен 23.07.2009Вычисление интеграла, выполнение интегрирования по частям. Применение метода неопределенных коэффициентов, приведение уравнения к системе. Введение вспомогательных функций в процессе поиска решения уравнения и вычисления интеграла, разделение переменных.
контрольная работа [617,2 K], добавлен 08.07.2011Алгоритм построения ранговой оценки неизвестных параметров регрессии. Моделирование регрессионных зависимостей с погрешностями, имеющими распределения с "тяжёлыми" хвостами. Вычисление асимптотической относительной эффективности рангового метода.
курсовая работа [1,2 M], добавлен 05.01.2015Нахождение уравнения гиперболы при заданном значении вещественной полуоси. Вычисление предела функции и ее производных. Составление уравнения нормали к кривой. Решение системы алгебраических уравнений методом Гаусса и при помощи формулы Крамера.
контрольная работа [871,9 K], добавлен 12.10.2014Обработка случайных выборок с нормальным законом распределения. Оценка коэффициентов регрессии и доверительных интервалов. Оценка значимости факторов по доверительным интервалам и корреляционного момента. Построение эмпирической интегральной функции.
курсовая работа [135,7 K], добавлен 03.05.2011Основные этапы и принципы решения системы линейных уравнений с помощью метода Крамара, обратной матрицы. Разрешение матричного уравнения. Вычисление определителя. Расчет параметров пирамиды: длины ребра, площади грани, объема, а также уравнения грани.
контрольная работа [128,1 K], добавлен 06.09.2015Расчет показателей матрицы, ее определителя по строке и столбцу. Решение системы уравнений методом Гаусса, по формулам Крамера, с помощью обратной матрицы. Вычисление предела без использования правила Лопиталя. Частные производные второго порядка функции.
контрольная работа [95,0 K], добавлен 23.02.2012Предпосылки корреляционного анализа - математико-статистического метода выявления взаимозависимости компонентов многомерной случайной величины и оценки их связи. Точечные оценки параметров двумерного распределения. Аппроксимация уравнений регрессии.
контрольная работа [648,3 K], добавлен 03.04.2011Определение корня первого и второго многочлена, вычисление предела функции. Применение правила Лопиталя (предел отношения функций равен пределу отношения их производных). Пример использования замечательного предела, который применяется в виде равенства.
контрольная работа [95,5 K], добавлен 19.03.2015Вычисление пределов и устранение неопределенности. Поиск производных функций. Вычисление приближенного значения 8.051/3. Определение полного дифференциала функции z=3sin(2x+3y). Формула интегрирования по частям. Решение линейного однородного уравнения.
контрольная работа [439,6 K], добавлен 25.03.2014Поиск общего интеграла дифференциального уравнения. Расстановка пределов интегрирования. Координаты вершины параболы. Объем тела, ограниченного поверхностями. Вычисление криволинейного интеграла. Полный дифференциал функции. Вычисление дуги цепной линии.
контрольная работа [298,1 K], добавлен 28.03.2014Основные задачи регрессионного анализа в математической статистике. Вычисление дисперсии параметров уравнения регрессии и дисперсии прогнозирования эндогенной переменной. Установление зависимости между переменными. Применение метода наименьших квадратов.
презентация [100,3 K], добавлен 16.12.2014