Анализ парной корреляционной зависимости

Определение числа и величины интервалов для построения корреляционной таблицы. Определение среднего значения признака-результата по всей совокупности. Анализ парной корреляционной связи с использованием ППП "Статистика". Расчет остаточной дисперсии.

Рубрика Экономика и экономическая теория
Вид лабораторная работа
Язык русский
Дата добавления 24.05.2016
Размер файла 1,8 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Санкт-Петербургский политехнический университет Петра Великого

Инженерно-экономический институт

Кафедра «Финансы инновационных и производственных систем»

Отчет по лабораторной работе

по дисциплине: «Статистика»

на тему: «Анализ парной корреляционной зависимости»

Санкт -Петербург-2015

1. АНАЛИЗ ПАРНОЙ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ

Для определения числа интервалов и величины интервала для построения корреляционной таблицы можно воспользоваться меню Statistics/Basic Statistics/Tables.

Опираясь на полученные исходные данные (таблица 1.1.), выстраиваем таблицы частот для переменных X и Y.

На рисунке 1.1. показана таблица построения частот для переменной MariaX. Число интервалов равно 7, а шаг - 5.

\

Рис. 1.1 Таблица частот для переменной

На рисунке 1.2 представлена таблица построения частот для переменной. Для данной переменной число интервалов равно 5, а шаг - 500.

Рис. 1.2 Таблица частот для переменной

Далее заносим получившиеся интревалы в корреляционную таблицу, представленую ниже на рисунке 1.3

j = - столбец

i = - строка

Условные средние находятся по следующим формулам:

= = 250

= = 437,5

= = 691,18

= = 1050

= = 1171,05

= = 1583,3

= =1375

X

Y

10:15

15;20

20;25

25;30

30;35

35;40

40;45

12,5

17,5

22,5

27,5

32,5

37,5

42,5

2000;2500

2250

*

1

37,5

1500;2000

1750

*

*

*****

*

8

36,25

1000;1500

1250

**

********

**************

**

***

29

31,81

500;1000

750

***

***********

*****

****

*

24

25,2

0;500

250

****

*****

****

*

14

18,21

4

8

17

15

19

9

4

76

250

437,5

691,18

1050

1171,05

1583,3

1375

Рис. 1.3 Корреляционная таблица с наложенными линиями эмпирических регрессий

= 37,5

= =

= =31,81

= =25,2

= =18,21

Среднее значение признака-результата по всей совокупности:

= = = = = 973,68

Для оценки тесноты связи между изучаемыми признаками (расчета эмпирического корреляционного отношения) необходимо опрделить значения дисперсий: общей и межгрупповой.

Межгрупповая дисперсия:

=

= = 150205,5

Общая дисперсия:

=

=

= 232860,111

Эмпирическое корреляционное отношение:

= = = 0,803148

Коэффициент детерминации:

= 0,645

Полученное значение корреляционного отношения свидетельствует о наличии тесной корреляционной зависимости между изучаемыми характеристиками.

Построение поля корреляции.

С помощью рекомендаций в методическом пособии построим корреляционное поле (рис.1.) и найдем уравнение линейной регрессии.

Рис. 1.4 Корреляционное поле и основные результаты корреляционно-регрессионного анализа

r - теоретическое корреляционное отношение;

r2 - коэффициент детерминации;

p - расчетный уровень значимости;

y = 15,8358 + 0,0126*x - уравнение линейной регрессии.

2. АНАЛИЗ ПАРНОЙ КОРРЕЛЯЦИОННОЙ СВЯЗИ С ИСПОЛЬЗОВАНИЕМ ППП «СТАТИСТИКА»

Исходные данные к анализу представлены ранее (табл. 1.1). В первую очередь необходимо выявить наличие или отсутствие связи между признаками. Наряду с построением корреляционной таблицы можно воспользоваться и построением корреляционного поля.

Рис. 2.1 Корреляционное поле и основные результаты корреляционно-регрессионного анализа

На основании полученного корреляционного поля можно сделать предположения о направлении связи, форме связи и оценить тесноту связи. По форме расположения точек на корреляционном поле можно уверенно судить о направлении связи - в моем случае прямая. По графику также можно определить форму связи: скорее всего в моем случае, это линейная форма. Чем более узкий корреляционный эллипс, тем теснее связь, можно предположить, что связь достаточно тесная.

2.1 Построение уравнения парной регрессии и расчет показателей корреляции

При построении поля корреляции программа строит и линейное уравнение регрессии. Однако на практике мы не всегда имеем дело с линейной зависимостью и на основе поля корреляции не всегда очевиден вид связи между анализируемыми переменными. Поэтому, как правило, строят несколько уравнений регрессии и на основе описанных выше критериев выбирают модель, наилучшим образом отражающую корреляционную связь х и у. Построим и сравним, например, линейную, степенную и экспоненциальные регрессионные модели.

Первой построим линейную регрессионную модель, используя для этого методические указания и инструкции.

Рис. 2.2 Показатели корреляции и оценка линейного уравнения регрессии

Рис. 2.3 Результаты расчета параметров уравнения линейной регрессии

Линейная модель регрессии:

Рис. 2.4 Результаты дисперсионного анализа линейного уравнения регрессии

В верхней заголовочной строке таблицы выдаются пять оценок:

Sums of Squares - сумма квадратов отклонений;

df - число степеней свободы;

Mean Squares - средний квадрат;

F - критерий Фишера;

p-level - расчетный уровень значимости F - критерия.

В левом столбце указывается источник вариации:

Regression - отклонения теоретических (полученных по уравнению регрессии) значений признака от средней величины;

Residual - отклонения фактических значений от теоретических (полученных по уравнению регрессии);

Total - отклонения фактических значений y от их средней величины.

На пересечении столбцов и строк получаем однозначно определенные показатели:

Regression / Sums of Squares - сумма квадратов отклонений теоретических (полученных по уравнению регрессии) значений признака от средней величины; эта сумма квадратов используется для расчета факторной, объясненной дисперсии зависимой переменной;

Residual / Sums of Squares - сумма квадратов отклонений теоретических и фактических значений y (для расчета остаточной, необъясненной дисперсии);

Total / Sums of Squares - сумма квадратов отклонений фактических значений y от средней величины (для расчета общей дисперсии);

Regression / Mean Squares - факторная, объясненная дисперсия;

Residual / Mean Squares - остаточная, необъясненная дисперсия.

2.5 Корреляционное поле и линия регрессии с 95%-ными доверительными интервалами для линейной модели

Для проверки рассчитаем остаточную дисперсию вручную:

Формула для нахождения остаточной дисперсии:

Рис. 2.6 Сводная таблица разницы наблюдаемых и расчетных отклонении

Расчет остаточной дисперсии

Таблица 1.

Ручной расчет остаточной дисперсии линейной модели

Residuals

Residuals^2

Residuals

Residuals^2

Residuals

Residuals^2

1

-392,01

153673,487

26

110,44

12196,221

51

67,33

4533,138

2

8,18

66,911

27

36,10

1303,446

52

-452,43

204693,267

3

-461,01

212533,816

28

-132,29

17501,279

53

-249,69

62346,145

4

-312,05

97372,644

29

123,59

15274,216

54

-76,08

5787,896

5

86,49

7481,067

30

-86,27

7442,958

55

115,41

13318,937

6

-123,42

15233,089

31

-98,99

9798,959

56

-226,17

51155,085

7

397,36

157896,321

32

186,28

34698,785

57

-131,59

17316,718

8

-71,73

5144,682

33

734,89

540062,871

58

-1029,32

1059495,545

9

51,58

2660,215

34

-205,47

42216,935

59

644,08

414842,009

10

-429,11

184138,911

35

-210,84

44455,024

60

190,09

36134,094

11

-129,89

16870,737

36

-46,32

2145,413

61

-45,09

2033,056

12

163,40

26698,612

37

255,75

65409,546

62

109,87

12070,692

13

207,49

43050,980

38

-194,64

37884,146

63

132,52

17562,107

14

51,61

2663,685

39

-53,89

2904,417

64

-398,52

158818,509

15

94,00

8836,780

40

50,69

2569,805

65

-326,45

106570,190

16

645,86

417132,815

41

-152,51

23257,958

66

284,62

81007,577

17

156,39

24458,583

42

140,24

19667,847

67

85,18

7256,431

18

-298,20

88922,166

43

-230,89

53311,531

68

208,19

43341,994

19

116,53

13579,521

44

16,81

282,646

69

33,96

1153,328

20

15,42

237,814

45

86,87

7547,095

70

-218,51

47746,227

21

-398,31

158648,546

46

14,36

206,216

71

-11,72

137,346

22

-351,52

123563,498

47

483,46

233737,536

72

-119,73

14334,938

23

214,08

45829,347

48

430,40

185248,206

73

189,07

35748,788

24

145,78

21253,004

49

426,60

181990,887

74

212,99

45365,464

25

80,38

6460,612

50

-132,89

17660,363

75

74,12

5493,693

76

-80,93

6550,385

 

 

1834407,841

=1834407,841/(76-2)= 24789,29515

=157,4461659

Расчет модели степенной регрессии.

Степенная функция имеет вид , следовательно, после набора она будет выглядеть следующим образом:

v2 = a0*v1^ a1,

где v2 - это столбец на листе с исходными данными, в котором

находятся значения признака-результата;

а0 и а1 - параметры уравнения;

v1 - столбец на листе с исходными данными, в котором находятся значения признака-фактора.

Степенная модель регрессии выглядит следующим образом

связь парный корреляционный дисперсия

Рис. 2.7 Результаты расчета параметров степенной модели

Соответственно уравнение степенной модели регрессии имеет вид

Рис. 2.8 Результаты дисперсионного анализа степенной модели

Рис. 2.9 Корреляционное поле с наложением линии степенной регрессии

Таблица 2.

Сводная таблица разницы наблюдаемых и расчетных отклонений.

=5894241,926/(76-2)=79651,92

=282,2267

Расчет модели экспоненциальной регрессии

Рис. 2.10 Результаты расчета параметров экспоненциальной модели

Соответственно уравнение экспоненциальной модели регрессии имеет вид

Рис. 2.11 Результаты дисперсионного анализа экспоненциальной модели

Рис. 2.12 Корреляционное поле с наложением линии экспоненциальной регрессии.

Таблица 3.

Сводная таблица разницы наблюдаемых и расчетных отклонений

=6341230,027/(76-2)=85692,3

=292,7325

Расчет модели параболической регрессии

Рис. 2.12 Результаты расчета параметров параболической модели

Соответственно уравнение параболической модели модели регрессии имеет вид

Рис. 2.13 Результаты дисперсионного анализа параболической модели

Рис. 2.14 Корреляционное поле с наложением линии параболической регрессии

Таблица 4.

Сводная таблица разницы наблюдаемых и расчетных отклонений

=58372338,79/(76-2-1)=799621,1

=894,2153

ВЫВОД

Сравниваем характеристики четырех представленных выше моделей в сводной таблице

Модель

Уравнение

1

Линейная

67,98

24789,30

2

Степенная

67,7

79651,92

3

Экспоненциальная

65,27

85692,3

4

Параболическая

68

799621,1

Таким образом, лучшей регрессионной моделью можно считать параболическую, так как ей соответствует максимальное значение коэффициента детерминации, а остаточная дисперсия почти минимальна. Уравнение в целом по F-критерию Фишера значимо. Параметры уравнения также статистически значимы, поскольку t-статистика по модулю превышает 1,99 (табличное значение).

Размещено на Allbest.ru

...

Подобные документы

  • Графическое изображение данных. Статистические таблицы: общее понятие, виды, основные элементы. Понятие корреляционной связи и предпосылки ее использования. Измерение степени тесноты корреляционной связи в случае парной, множественной зависимости.

    контрольная работа [327,5 K], добавлен 19.01.2012

  • Этапы корреляционно-регрессионного анализа, построение корреляционной модели и определение функции, отражающей механизм связи между факторным и результативным признаками. Измерение тесноты корреляционной связи, расчет индекса корреляции и дисперсии.

    лекция [38,1 K], добавлен 13.02.2011

  • Построение статистического ряда распределения организаций. Графическое определение значения моды и медианы. Теснота корреляционной связи с использованием коэффициента детерминации. Определение ошибки выборки среднесписочной численности работников.

    контрольная работа [82,0 K], добавлен 19.05.2009

  • Определение среднего значения показателя в совокупности. Вариационный анализ статистической совокупности по показателю. Проведение выборочного наблюдения и корреляционно-регрессионного анализа. Построение уравнения парной регрессии, ряды динамики.

    курсовая работа [290,2 K], добавлен 29.11.2011

  • Выявление корреляционной связи между факторным и результативным признаками, направления связи и ее тесноты. Расчёт дисперсии, ошибки выборки, индексов среднего товарооборота на душу населения переменного, постоянного состава, структурных сдвигов.

    курсовая работа [166,7 K], добавлен 15.01.2014

  • Понятие системы национальных счетов (СНС) и ее значение. Макроэкономические показатели и методы их расчета. Исследование структуры совокупности. Выявление наличия корреляционной связи между признаками, установление направления связи, измерение ее тесноты.

    курсовая работа [3,0 M], добавлен 05.05.2011

  • Виды корреляции и регрессии, применяемые в статистическом анализе социально-экономических явлений и процессов. Построение корреляционной модели (уравнения регрессии). Построение корреляционной таблицы, выполнение интервальной группировки по признакам.

    курсовая работа [131,7 K], добавлен 03.10.2014

  • Расчет средней дневной заработной платы одного рабочего в каждой группе и в целом по цеху, вида корреляционной зависимости между дневной заработной платой и длительностью производственного стажа. Определение моды и медианы, оценка характера асимметрии.

    контрольная работа [121,9 K], добавлен 17.08.2011

  • Назначение рангового коэффициента корреляции, определение силы и направления корреляционной связи между двумя признаками или двумя профилями (иерархиями) признаков. Графическое представление метода ранговой корреляции, расчет эмпирического значения rs.

    презентация [46,5 K], добавлен 12.11.2010

  • Анализ, расчет и построение исходных динамических рядов признака-функции и признака-фактора. Расчет показателей вариации динамических рядов. Количественное измерение тесноты связи признака-функции и признаков-факторов методом парной корреляции.

    курсовая работа [92,7 K], добавлен 24.09.2014

  • Основные характеристики объекта оценки. Определение его восстановительной стоимости с помощью индексного метода, расчет совокупного износа. Сравнительный подход к оценке. Выявление корреляционной зависимости между ценой и техническими параметрами объекта.

    курсовая работа [187,8 K], добавлен 19.12.2011

  • Показатели наличия и использования оборотных фондов. Определение потребности в оборотных фондах. Исследование структуры совокупности организаций по признаку среднегодовая стоимость материальных оборотных фондов. Выявление наличия корреляционной связи.

    курсовая работа [119,1 K], добавлен 08.03.2011

  • Определение вида корреляционной зависимости между суммарными активами и объемом вложений акционеров. Построение линейного уравнения регрессии, расчет параметров. Вычисление изменения товарооборота, используя взаимосвязь индексов физического объема и цен.

    контрольная работа [145,6 K], добавлен 14.12.2011

  • Параметры уравнений линейной, степенной парной. Оценка тесноты связи с помощью показателей корреляции и детерминации, качества уравнений с помощью средней ошибки аппроксимации. Определение прогнозного значения от среднего значения заданного параметра.

    контрольная работа [150,5 K], добавлен 22.02.2016

  • Прибыль и рентабельность как показатели, характеризующие результаты деятельности кредитных организаций. Построение статистического ряда распределения организаций, расчёт моды, медианы, дисперсии, коэффициента вариации, тесноты корреляционной связи.

    курсовая работа [599,0 K], добавлен 06.12.2013

  • Анализ деятельности туроператорской компании "Санрайз Тур" при помощи экономических индексов. Расчет точки безубыточности деятельности предприятия. Анализ корреляционной связи и показателей ковариации, оценка изменения фондоотдачи индексным методом.

    курсовая работа [251,9 K], добавлен 19.01.2013

  • Статистический анализ экономической информации на примере показателей урожайности. Закон распределения и корреляционной связи, количественная оценка рисков. Построение, сглаживание и анализ структуры временного ряда, выделение тренда и прогнозирование.

    курсовая работа [742,8 K], добавлен 03.09.2013

  • Определение уровня фондоотдачи, влияния факторов на изменение ее уровня методом цепных подстановок. Оценка разными способами влияния факторов на валовую продукцию. Расчет тесноты корреляционной связи между объемом товарооборота и оборачиваемостью запасов.

    контрольная работа [146,9 K], добавлен 28.08.2011

  • Построение диаграммы рассеивания (корреляционного поля). Группировка данных и построение корреляционной таблицы. Оценка числовых характеристик для негруппированных и группированных данных. Выборочное значение статистики. Параметры линейной регрессии.

    контрольная работа [150,5 K], добавлен 14.12.2010

  • Сбор и анализ статистических данных по материалам газеты "Из рук в руки", построение соответствующей таблицы в MS Excel. Определение среднего линейного отклонения, дисперсии, коэффициента вариации. Группировка заработной платы по категориям на заводе "Х".

    контрольная работа [192,9 K], добавлен 03.05.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.