Анализ парной корреляционной зависимости
Определение числа и величины интервалов для построения корреляционной таблицы. Определение среднего значения признака-результата по всей совокупности. Анализ парной корреляционной связи с использованием ППП "Статистика". Расчет остаточной дисперсии.
Рубрика | Экономика и экономическая теория |
Вид | лабораторная работа |
Язык | русский |
Дата добавления | 24.05.2016 |
Размер файла | 1,8 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Санкт-Петербургский политехнический университет Петра Великого
Инженерно-экономический институт
Кафедра «Финансы инновационных и производственных систем»
Отчет по лабораторной работе
по дисциплине: «Статистика»
на тему: «Анализ парной корреляционной зависимости»
Санкт -Петербург-2015
1. АНАЛИЗ ПАРНОЙ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ
Для определения числа интервалов и величины интервала для построения корреляционной таблицы можно воспользоваться меню Statistics/Basic Statistics/Tables.
Опираясь на полученные исходные данные (таблица 1.1.), выстраиваем таблицы частот для переменных X и Y.
На рисунке 1.1. показана таблица построения частот для переменной MariaX. Число интервалов равно 7, а шаг - 5.
\
Рис. 1.1 Таблица частот для переменной
На рисунке 1.2 представлена таблица построения частот для переменной. Для данной переменной число интервалов равно 5, а шаг - 500.
Рис. 1.2 Таблица частот для переменной
Далее заносим получившиеся интревалы в корреляционную таблицу, представленую ниже на рисунке 1.3
j = - столбец
i = - строка
Условные средние находятся по следующим формулам:
= = 250
= = 437,5
= = 691,18
= = 1050
= = 1171,05
= = 1583,3
= =1375
X Y |
10:15 |
15;20 |
20;25 |
25;30 |
30;35 |
35;40 |
40;45 |
||||
12,5 |
17,5 |
22,5 |
27,5 |
32,5 |
37,5 |
42,5 |
|||||
2000;2500 |
2250 |
* |
1 |
37,5 |
|||||||
1500;2000 |
1750 |
* |
* |
***** |
* |
8 |
36,25 |
||||
1000;1500 |
1250 |
** |
******** |
************** |
** |
*** |
29 |
31,81 |
|||
500;1000 |
750 |
*** |
*********** |
***** |
**** |
* |
24 |
25,2 |
|||
0;500 |
250 |
**** |
***** |
**** |
* |
14 |
18,21 |
||||
4 |
8 |
17 |
15 |
19 |
9 |
4 |
76 |
||||
250 |
437,5 |
691,18 |
1050 |
1171,05 |
1583,3 |
1375 |
Рис. 1.3 Корреляционная таблица с наложенными линиями эмпирических регрессий
= 37,5
= =
= =31,81
= =25,2
= =18,21
Среднее значение признака-результата по всей совокупности:
= = = = = 973,68
Для оценки тесноты связи между изучаемыми признаками (расчета эмпирического корреляционного отношения) необходимо опрделить значения дисперсий: общей и межгрупповой.
Межгрупповая дисперсия:
=
= = 150205,5
Общая дисперсия:
=
=
= 232860,111
Эмпирическое корреляционное отношение:
= = = 0,803148
Коэффициент детерминации:
= 0,645
Полученное значение корреляционного отношения свидетельствует о наличии тесной корреляционной зависимости между изучаемыми характеристиками.
Построение поля корреляции.
С помощью рекомендаций в методическом пособии построим корреляционное поле (рис.1.) и найдем уравнение линейной регрессии.
Рис. 1.4 Корреляционное поле и основные результаты корреляционно-регрессионного анализа
r - теоретическое корреляционное отношение;
r2 - коэффициент детерминации;
p - расчетный уровень значимости;
y = 15,8358 + 0,0126*x - уравнение линейной регрессии.
2. АНАЛИЗ ПАРНОЙ КОРРЕЛЯЦИОННОЙ СВЯЗИ С ИСПОЛЬЗОВАНИЕМ ППП «СТАТИСТИКА»
Исходные данные к анализу представлены ранее (табл. 1.1). В первую очередь необходимо выявить наличие или отсутствие связи между признаками. Наряду с построением корреляционной таблицы можно воспользоваться и построением корреляционного поля.
Рис. 2.1 Корреляционное поле и основные результаты корреляционно-регрессионного анализа
На основании полученного корреляционного поля можно сделать предположения о направлении связи, форме связи и оценить тесноту связи. По форме расположения точек на корреляционном поле можно уверенно судить о направлении связи - в моем случае прямая. По графику также можно определить форму связи: скорее всего в моем случае, это линейная форма. Чем более узкий корреляционный эллипс, тем теснее связь, можно предположить, что связь достаточно тесная.
2.1 Построение уравнения парной регрессии и расчет показателей корреляции
При построении поля корреляции программа строит и линейное уравнение регрессии. Однако на практике мы не всегда имеем дело с линейной зависимостью и на основе поля корреляции не всегда очевиден вид связи между анализируемыми переменными. Поэтому, как правило, строят несколько уравнений регрессии и на основе описанных выше критериев выбирают модель, наилучшим образом отражающую корреляционную связь х и у. Построим и сравним, например, линейную, степенную и экспоненциальные регрессионные модели.
Первой построим линейную регрессионную модель, используя для этого методические указания и инструкции.
Рис. 2.2 Показатели корреляции и оценка линейного уравнения регрессии
Рис. 2.3 Результаты расчета параметров уравнения линейной регрессии
Линейная модель регрессии:
Рис. 2.4 Результаты дисперсионного анализа линейного уравнения регрессии
В верхней заголовочной строке таблицы выдаются пять оценок:
Sums of Squares - сумма квадратов отклонений;
df - число степеней свободы;
Mean Squares - средний квадрат;
F - критерий Фишера;
p-level - расчетный уровень значимости F - критерия.
В левом столбце указывается источник вариации:
Regression - отклонения теоретических (полученных по уравнению регрессии) значений признака от средней величины;
Residual - отклонения фактических значений от теоретических (полученных по уравнению регрессии);
Total - отклонения фактических значений y от их средней величины.
На пересечении столбцов и строк получаем однозначно определенные показатели:
Regression / Sums of Squares - сумма квадратов отклонений теоретических (полученных по уравнению регрессии) значений признака от средней величины; эта сумма квадратов используется для расчета факторной, объясненной дисперсии зависимой переменной;
Residual / Sums of Squares - сумма квадратов отклонений теоретических и фактических значений y (для расчета остаточной, необъясненной дисперсии);
Total / Sums of Squares - сумма квадратов отклонений фактических значений y от средней величины (для расчета общей дисперсии);
Regression / Mean Squares - факторная, объясненная дисперсия;
Residual / Mean Squares - остаточная, необъясненная дисперсия.
2.5 Корреляционное поле и линия регрессии с 95%-ными доверительными интервалами для линейной модели
Для проверки рассчитаем остаточную дисперсию вручную:
Формула для нахождения остаточной дисперсии:
Рис. 2.6 Сводная таблица разницы наблюдаемых и расчетных отклонении
Расчет остаточной дисперсии
Таблица 1.
Ручной расчет остаточной дисперсии линейной модели
Residuals |
Residuals^2 |
Residuals |
Residuals^2 |
Residuals |
Residuals^2 |
||||
1 |
-392,01 |
153673,487 |
26 |
110,44 |
12196,221 |
51 |
67,33 |
4533,138 |
|
2 |
8,18 |
66,911 |
27 |
36,10 |
1303,446 |
52 |
-452,43 |
204693,267 |
|
3 |
-461,01 |
212533,816 |
28 |
-132,29 |
17501,279 |
53 |
-249,69 |
62346,145 |
|
4 |
-312,05 |
97372,644 |
29 |
123,59 |
15274,216 |
54 |
-76,08 |
5787,896 |
|
5 |
86,49 |
7481,067 |
30 |
-86,27 |
7442,958 |
55 |
115,41 |
13318,937 |
|
6 |
-123,42 |
15233,089 |
31 |
-98,99 |
9798,959 |
56 |
-226,17 |
51155,085 |
|
7 |
397,36 |
157896,321 |
32 |
186,28 |
34698,785 |
57 |
-131,59 |
17316,718 |
|
8 |
-71,73 |
5144,682 |
33 |
734,89 |
540062,871 |
58 |
-1029,32 |
1059495,545 |
|
9 |
51,58 |
2660,215 |
34 |
-205,47 |
42216,935 |
59 |
644,08 |
414842,009 |
|
10 |
-429,11 |
184138,911 |
35 |
-210,84 |
44455,024 |
60 |
190,09 |
36134,094 |
|
11 |
-129,89 |
16870,737 |
36 |
-46,32 |
2145,413 |
61 |
-45,09 |
2033,056 |
|
12 |
163,40 |
26698,612 |
37 |
255,75 |
65409,546 |
62 |
109,87 |
12070,692 |
|
13 |
207,49 |
43050,980 |
38 |
-194,64 |
37884,146 |
63 |
132,52 |
17562,107 |
|
14 |
51,61 |
2663,685 |
39 |
-53,89 |
2904,417 |
64 |
-398,52 |
158818,509 |
|
15 |
94,00 |
8836,780 |
40 |
50,69 |
2569,805 |
65 |
-326,45 |
106570,190 |
|
16 |
645,86 |
417132,815 |
41 |
-152,51 |
23257,958 |
66 |
284,62 |
81007,577 |
|
17 |
156,39 |
24458,583 |
42 |
140,24 |
19667,847 |
67 |
85,18 |
7256,431 |
|
18 |
-298,20 |
88922,166 |
43 |
-230,89 |
53311,531 |
68 |
208,19 |
43341,994 |
|
19 |
116,53 |
13579,521 |
44 |
16,81 |
282,646 |
69 |
33,96 |
1153,328 |
|
20 |
15,42 |
237,814 |
45 |
86,87 |
7547,095 |
70 |
-218,51 |
47746,227 |
|
21 |
-398,31 |
158648,546 |
46 |
14,36 |
206,216 |
71 |
-11,72 |
137,346 |
|
22 |
-351,52 |
123563,498 |
47 |
483,46 |
233737,536 |
72 |
-119,73 |
14334,938 |
|
23 |
214,08 |
45829,347 |
48 |
430,40 |
185248,206 |
73 |
189,07 |
35748,788 |
|
24 |
145,78 |
21253,004 |
49 |
426,60 |
181990,887 |
74 |
212,99 |
45365,464 |
|
25 |
80,38 |
6460,612 |
50 |
-132,89 |
17660,363 |
75 |
74,12 |
5493,693 |
|
76 |
-80,93 |
6550,385 |
|||||||
|
|
1834407,841 |
=1834407,841/(76-2)= 24789,29515
=157,4461659
Расчет модели степенной регрессии.
Степенная функция имеет вид , следовательно, после набора она будет выглядеть следующим образом:
v2 = a0*v1^ a1,
где v2 - это столбец на листе с исходными данными, в котором
находятся значения признака-результата;
а0 и а1 - параметры уравнения;
v1 - столбец на листе с исходными данными, в котором находятся значения признака-фактора.
Степенная модель регрессии выглядит следующим образом
связь парный корреляционный дисперсия
Рис. 2.7 Результаты расчета параметров степенной модели
Соответственно уравнение степенной модели регрессии имеет вид
Рис. 2.8 Результаты дисперсионного анализа степенной модели
Рис. 2.9 Корреляционное поле с наложением линии степенной регрессии
Таблица 2.
Сводная таблица разницы наблюдаемых и расчетных отклонений.
=5894241,926/(76-2)=79651,92
=282,2267
Расчет модели экспоненциальной регрессии
Рис. 2.10 Результаты расчета параметров экспоненциальной модели
Соответственно уравнение экспоненциальной модели регрессии имеет вид
Рис. 2.11 Результаты дисперсионного анализа экспоненциальной модели
Рис. 2.12 Корреляционное поле с наложением линии экспоненциальной регрессии.
Таблица 3.
Сводная таблица разницы наблюдаемых и расчетных отклонений
=6341230,027/(76-2)=85692,3
=292,7325
Расчет модели параболической регрессии
Рис. 2.12 Результаты расчета параметров параболической модели
Соответственно уравнение параболической модели модели регрессии имеет вид
Рис. 2.13 Результаты дисперсионного анализа параболической модели
Рис. 2.14 Корреляционное поле с наложением линии параболической регрессии
Таблица 4.
Сводная таблица разницы наблюдаемых и расчетных отклонений
=58372338,79/(76-2-1)=799621,1
=894,2153
ВЫВОД
Сравниваем характеристики четырех представленных выше моделей в сводной таблице
№ |
Модель |
Уравнение |
|||
1 |
Линейная |
67,98 |
24789,30 |
||
2 |
Степенная |
67,7 |
79651,92 |
||
3 |
Экспоненциальная |
65,27 |
85692,3 |
||
4 |
Параболическая |
68 |
799621,1 |
Таким образом, лучшей регрессионной моделью можно считать параболическую, так как ей соответствует максимальное значение коэффициента детерминации, а остаточная дисперсия почти минимальна. Уравнение в целом по F-критерию Фишера значимо. Параметры уравнения также статистически значимы, поскольку t-статистика по модулю превышает 1,99 (табличное значение).
Размещено на Allbest.ru
...Подобные документы
Графическое изображение данных. Статистические таблицы: общее понятие, виды, основные элементы. Понятие корреляционной связи и предпосылки ее использования. Измерение степени тесноты корреляционной связи в случае парной, множественной зависимости.
контрольная работа [327,5 K], добавлен 19.01.2012Этапы корреляционно-регрессионного анализа, построение корреляционной модели и определение функции, отражающей механизм связи между факторным и результативным признаками. Измерение тесноты корреляционной связи, расчет индекса корреляции и дисперсии.
лекция [38,1 K], добавлен 13.02.2011Построение статистического ряда распределения организаций. Графическое определение значения моды и медианы. Теснота корреляционной связи с использованием коэффициента детерминации. Определение ошибки выборки среднесписочной численности работников.
контрольная работа [82,0 K], добавлен 19.05.2009Определение среднего значения показателя в совокупности. Вариационный анализ статистической совокупности по показателю. Проведение выборочного наблюдения и корреляционно-регрессионного анализа. Построение уравнения парной регрессии, ряды динамики.
курсовая работа [290,2 K], добавлен 29.11.2011Выявление корреляционной связи между факторным и результативным признаками, направления связи и ее тесноты. Расчёт дисперсии, ошибки выборки, индексов среднего товарооборота на душу населения переменного, постоянного состава, структурных сдвигов.
курсовая работа [166,7 K], добавлен 15.01.2014Понятие системы национальных счетов (СНС) и ее значение. Макроэкономические показатели и методы их расчета. Исследование структуры совокупности. Выявление наличия корреляционной связи между признаками, установление направления связи, измерение ее тесноты.
курсовая работа [3,0 M], добавлен 05.05.2011Виды корреляции и регрессии, применяемые в статистическом анализе социально-экономических явлений и процессов. Построение корреляционной модели (уравнения регрессии). Построение корреляционной таблицы, выполнение интервальной группировки по признакам.
курсовая работа [131,7 K], добавлен 03.10.2014Расчет средней дневной заработной платы одного рабочего в каждой группе и в целом по цеху, вида корреляционной зависимости между дневной заработной платой и длительностью производственного стажа. Определение моды и медианы, оценка характера асимметрии.
контрольная работа [121,9 K], добавлен 17.08.2011Назначение рангового коэффициента корреляции, определение силы и направления корреляционной связи между двумя признаками или двумя профилями (иерархиями) признаков. Графическое представление метода ранговой корреляции, расчет эмпирического значения rs.
презентация [46,5 K], добавлен 12.11.2010Анализ, расчет и построение исходных динамических рядов признака-функции и признака-фактора. Расчет показателей вариации динамических рядов. Количественное измерение тесноты связи признака-функции и признаков-факторов методом парной корреляции.
курсовая работа [92,7 K], добавлен 24.09.2014Основные характеристики объекта оценки. Определение его восстановительной стоимости с помощью индексного метода, расчет совокупного износа. Сравнительный подход к оценке. Выявление корреляционной зависимости между ценой и техническими параметрами объекта.
курсовая работа [187,8 K], добавлен 19.12.2011Показатели наличия и использования оборотных фондов. Определение потребности в оборотных фондах. Исследование структуры совокупности организаций по признаку среднегодовая стоимость материальных оборотных фондов. Выявление наличия корреляционной связи.
курсовая работа [119,1 K], добавлен 08.03.2011Определение вида корреляционной зависимости между суммарными активами и объемом вложений акционеров. Построение линейного уравнения регрессии, расчет параметров. Вычисление изменения товарооборота, используя взаимосвязь индексов физического объема и цен.
контрольная работа [145,6 K], добавлен 14.12.2011Параметры уравнений линейной, степенной парной. Оценка тесноты связи с помощью показателей корреляции и детерминации, качества уравнений с помощью средней ошибки аппроксимации. Определение прогнозного значения от среднего значения заданного параметра.
контрольная работа [150,5 K], добавлен 22.02.2016Прибыль и рентабельность как показатели, характеризующие результаты деятельности кредитных организаций. Построение статистического ряда распределения организаций, расчёт моды, медианы, дисперсии, коэффициента вариации, тесноты корреляционной связи.
курсовая работа [599,0 K], добавлен 06.12.2013Анализ деятельности туроператорской компании "Санрайз Тур" при помощи экономических индексов. Расчет точки безубыточности деятельности предприятия. Анализ корреляционной связи и показателей ковариации, оценка изменения фондоотдачи индексным методом.
курсовая работа [251,9 K], добавлен 19.01.2013Статистический анализ экономической информации на примере показателей урожайности. Закон распределения и корреляционной связи, количественная оценка рисков. Построение, сглаживание и анализ структуры временного ряда, выделение тренда и прогнозирование.
курсовая работа [742,8 K], добавлен 03.09.2013Определение уровня фондоотдачи, влияния факторов на изменение ее уровня методом цепных подстановок. Оценка разными способами влияния факторов на валовую продукцию. Расчет тесноты корреляционной связи между объемом товарооборота и оборачиваемостью запасов.
контрольная работа [146,9 K], добавлен 28.08.2011Построение диаграммы рассеивания (корреляционного поля). Группировка данных и построение корреляционной таблицы. Оценка числовых характеристик для негруппированных и группированных данных. Выборочное значение статистики. Параметры линейной регрессии.
контрольная работа [150,5 K], добавлен 14.12.2010Сбор и анализ статистических данных по материалам газеты "Из рук в руки", построение соответствующей таблицы в MS Excel. Определение среднего линейного отклонения, дисперсии, коэффициента вариации. Группировка заработной платы по категориям на заводе "Х".
контрольная работа [192,9 K], добавлен 03.05.2014