Построение множественных регрессионных моделей

Подготовка данных и построение модели. Корреляционный анализ экономических показателей. Расчёт частных и множественных коэффициентов корреляции. Построение регрессионной модели и её интерпретация. Проверка исходных данных на мультиколлинеарность.

Рубрика Экономико-математическое моделирование
Вид курсовая работа
Язык русский
Дата добавления 16.01.2016
Размер файла 635,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

1

Содержание

Введение

1. Подготовка данных и построение модели

2. Корреляционный анализ экономических показателей

2.1 Построение матрицы парных коэффициентов корреляции

2.2 Расчёт частных коэффициентов корреляции

2.3 Расчёт множественных коэффициентов корреляции

3. Регрессионный анализ экономических показателей

3.1 Проверка исходных данных на мультиколлинеарность

3.2 Построение регрессионной модели и её интерпретация

3.3 Сравнение исходных данных с рассчитанными по уравнению регрессии

Заключение

Список литературы

Введение

корреляционный экономический мультиколлинеарность

Актуальность темы работы обусловлена тем, что множественная регрессия используется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах и целом ряде других вопросов эконометрики. Множественная регрессия является одним из наиболее распространенных методов в эконометрике. Основной целью множественной регрессии является построение модели с большим числом факторов, при этом определив влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.

Построение множественных регрессионных моделей используется в анализе информации, собираемой в процессе эмпирических социологических исследований, представляет собой не просто совокупность технических приемов и методов, позволяющих в той или иной форме визуализировать полученные данные. Анализ данных является ключевым этапом всего исследования, в ходе которого происходит непосредственная проверка соответствия собранной информации тем моделям социальных явлений, которые, явно или латентно, имеются у социологов. И более того, в ходе анализа формулируются и проверяются новые модели, адекватно отражающие те закономерности, которые есть в собранных данных. Большаков А.А. Методы обработки многомерных данных и временных рядов: учебное пособие для вузов / А.А. Большаков. - М.: Горячая линия-Телеком, 2007. - с. 102.

Методы корреляционного и регрессионного анализов призваны решать такие задачи, как оценка взаимосвязи показателей и моделирование их зависимости для дальнейшего прогнозирования.

Данные методы статистической обработки данных реализованы во многих программных продуктах и статистических пакетах анализа переменных. Но в настоящее время Microsoft Office, в состав которого входит ППП Microsoft Excel, имеет наибольшее распространение и доступен всем пользователям современных компьютеров, в отличие от многих специальных статистических пакетов.

Для анализа взаимосвязи показателей эффективности производства продукции для курсовой работы были предоставлены показатели производственно-хозяйственной деятельности 50 предприятий машиностроения.

В данной курсовой работе будет проводиться анализ взаимосвязи данных экономических показателей и моделирование их зависимости с целью дальнейшего исследования.

Цель работы: рассмотреть уравнение множественной регрессии и условия его применения.

Задачи работы:

- рассмотреть общий вид модели множественной регрессии;

- выявить условия оценки параметров модели с помощью МНК;

- привести методику анализа статистической значимости параметров модели;

- рассмотреть примеры построения регрессионных моделей и оценку их качества.

Объект работы: теория и методы эконометрического анализа.

Предмет работы; уравнение множественной регрессии.

Теоретической и методологической основой исследования являются работы, посвященные теории, методологии и практике анализа данных.

Информационную базу исследования составляют специализированные статистические, официальные и информационные Интернет-материалы и другие информационные источники.

Теоретические знания, практические навыки, основные положения и выводы контрольной работы могут быть использованы при проведении профессиональных исследований в сфере социологии.

1. Подготовка данных и построение модели

Для статистического исследования в рамках курсовой работы необходимо подготовить данные в виде матрицы X размерностью (nЧk), столбцами которой будут k изучаемых переменных (не менее 5 переменных), а строками - их n значений (не менее 30 наблюдений).

Необходимо провести анализ взаимосвязи следующих экономических показателей:

Результативный признак:

Y - рентабельность;

Факторные признаки Xi:

X8 - премии и вознаграждения на одного работника;

X10 - фондоотдача;

X15 - оборачиваемость нормируемых оборотных средств;

X16 - оборачиваемость ненормируемых оборотных средств.

Исходные данные представлены в таблице 1.

Гипотеза. Предположим, что рассматриваемые признаки Y, X8, X10, X15, X16 в генеральной совокупности подчиняются нормальному закону распределения и указанные данные представляют выборку из этой генеральной совокупности.

Таблица 1. Исходные данные

№п/п

Y

X8

X10

X15

X16

1

13,26

1,23

1,45

166,32

10,08

2

10,16

1,04

1,3

92,88

14,76

3

13,72

1,8

1,37

158,04

6,48

4

12,85

0,43

1,65

93,96

21,96

5

10,63

0,88

1,91

173,88

11,88

6

9,12

0,57

1,68

162,3

12,6

7

25,83

1,72

1,94

88,56

11,52

8

23,39

1,7

1,89

101,16

8,28

9

14,68

0,84

1,94

166,32

11,52

10

10,05

0,6

2,06

140,76

32,4

11

13,99

0,82

1,96

128,52

11,52

12

9,68

0,84

1,02

177,84

17,28

13

10,03

0,67

1,85

114,48

16,2

14

9,13

1,04

0,88

93,24

13,32

15

5,37

0,66

0,62

126,72

17,28

16

9,86

0,86

1,09

91,8

9,72

17

12,62

0,79

1,6

69,12

16,2

18

5,02

0,34

1,53

66,24

24,84

19

21,18

1,6

1,4

67,68

14,76

20

25,17

1,46

2,22

50,4

7,56

21

19,4

1,27

1,32

70,56

8,64

22

21

1,58

1,48

72

8,64

23

6,57

0,68

0,68

97,2

9

24

14,19

0,86

2,3

80,28

14,76

25

15,81

1,98

1,37

51,48

10,08

26

5,23

0,33

1,51

105,12

14,76

27

7,99

0,45

1,43

128,52

10,44

28

17,5

0,74

1,82

94,68

14,76

29

17,16

0,03

2,62

85,32

20,52

30

14,54

0,99

1,75

76,32

14,4

31

6,24

0,24

1,54

153

24,84

32

12,08

0,57

2,25

107,64

11,16

33

9,49

1,22

1,07

90,72

6,48

34

9,28

0,68

1,44

82,44

9,72

35

11,42

1

1,4

79,92

3,24

36

10,31

0,81

1,31

120,96

6,48

37

8,65

1,27

1,12

84,6

5,4

38

10,94

1,14

1,16

85,32

6,12

39

9,87

1,89

0,88

101,52

8,64

40

6,14

0,67

1,07

107,64

11,88

41

12,93

0,96

1,24

85,32

7,92

42

9,78

0,67

1,49

131,76

10,08

43

13,22

0,98

2,03

116,64

18,72

44

17,29

1,16

1,84

138,24

13,68

45

7,11

0,54

1,22

156,96

16,56

46

22,49

1,23

1,72

137,52

14,76

47

12,14

0,78

1,75

135,72

7,92

48

15,25

1,16

1,46

155,52

18,36

49

31,34

4,44

1,6

48,6

8,28

50

11,56

1,06

1,47

42,84

14,04

2. Корреляционный анализ экономических показателей

2.1 Построение матрицы парных коэффициентов корреляции

Парные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными на фоне действия остальных показателей и являются самыми распространёнными показателями тесноты связи при статистическом анализе данных.

Отдельный выборочный коэффициент корреляции rij между двумя выбранными признаками Xi и Xj в Excel можно вычислить с помощью встроенных статистических функций КОРРЕЛ или ПИРСОН. Расчёт матрицы выборочных парных коэффициентов корреляции осуществляется в Excel с помощью пакета анализа данных. Елисеева И.И. Общая теория статистики: учебник для вузов / И.И. Елисеева, М.М. Юзбашев; под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2006. - с. 106.

Итак, получаем матрицу парных коэффициентов корреляции размерности kЧk (в нашем случае 5Ч5).

Таблица 2. Матрица парных коэффициентов корреляции исследуемых экономических показателей

Y

X8

X10

X15

X16

Y

1

0,688511

0,450862

-0,32518

-0,21266

X8

0,688511

1

-0,0929

-0,3302

-0,41979

X10

0,450862

-0,0929

1

0,008075

0,278902

X15

-0,32518

-0,3302

0,008075

1

0,206628

X16

-0,21266

-0,41979

0,278902

0,206628

1

Теперь необходимо проверить значимость полученных коэффициентов корреляции, то есть гипотезу H0: с=0. Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле:

и построим матрицу наблюдаемыx значений t-статистик для всех коэффициентов rij (таблица 3).

Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n-2.

Для этого используем встроенную функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность б=0,05 и число степеней свободы н=n-2=50-2=48.

Можно найти значения tкр по таблицам математической статистики. Получаем tкр= 2,010635.

Таблица 3. Матрица наблюдаемыx значений t-статистик парных коэффициентов корреляции исследуемых экономических показателей

tнабл

Y

X8

X10

X15

X16

Y

6,57746

3,49954

-2,38235

-1,50784

X8

6,57746

-0,64641

-2,42367

-3,20439

X10

3,49954

-0,64641

0,05595

2,01213

X15

-2,3824

-2,42367

0,05595

1,46313

X16

-1,50784

-3,20439

2,01213

1,46313

По результатам, представленным в таблице 3, наблюдаемое значение t-статистики больше критического tкр по модулю для парных коэффициентов корреляции . Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, то есть соответствующие коэффициенты значимы.

Для остальных коэффициентов наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается, и это значит, что коэффициенты - незначимы.

Для проверки значимости парных коэффициентов корреляции можно также воспользоваться таблицами Фишера-Иейтса для нахождения критического значения rкр для уровня значимости б=0,05 и числа степеней свободы н=n-2=50-2=48.

По таблице rкр (б=0,05; н=48)=0,273.

Если соответствующий коэффициент |rij|>rкр, то он считается значимым. Отметим в матрице парных коэффициентов корреляции значимые.

Таблица 4. Матрица парных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при б=0,05)

Y

X8

X10

X15

X16

Y

1

0,688511

0,45086

-0,32518

-0,21266

X8

0,688511

1

-0,09290

-0,3302

-0,41979

X10

0,450862

-0,0929

1

0,008075

0,278902

X15

-0,32518

-0,3302

0,00807

1

0,206628

X16

-0,21266

-0,41979

0,27890

0,206628

1

Алгоритм построения интервальной оценки для генерального коэффициента корреляции следующий: Елисеева И.И. Общая теория статистики: учебник для вузов / И.И. Елисеева, М.М. Юзбашев; под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2006. - с. 167.

1). Zr По найденному выборочному коэффициенту корреляции r с помощью Z-преобразования Фишера находят соответствующее значение Zr , являющееся гиперболическим арктангенсом r:

Для этого в Excel есть встроенная функция ATANH, где в качестве аргумента вводится значение соответствующего выборочного коэффициента корреляции r. Следует учитывать, что Z-функция - нечетная, т.е. Z(-r)= - Z(r). Можно найти значение Zr и по таблице Z-преобразования Фишера.

2). ДZ Найдём значение tг, соответствующее заданной надёжности г=0,95. - значение функции Лапласа.

Для нахождения значения tг можно использовать встроенную функцию Excel НОРМСТОБР. Необходимо заметить, что Excel с помощью функции НОРМСТОБР выдаёт не значения функции Лапласа, а значение функции распределения стандартного нормального закона F(t):

.

Поэтому при расчёте всех интервальных оценок нужно пересчитывать г=0,95 в , а по этому значению уже вычислять t.

В нашем случае для надёжности г=0,95: F(t)=0,975; tг =1,959964.

Находим

3). Zmin и Zmax Теперь можно найти Zmin и Zmax:

Zmin = Zr - ДZ; Zmax= Zr + ДZ

4). сmin и сmax Наконец, использовав обратное преобразование Фишера, находят нижнюю и верхнюю границы для генерального коэффициента корреляции сmin и сmax , соответствующие Zmin и Zmax.

Соответствующие значения сmin и сmax являются гиперболическими тангенсами Zmin и Zmax:

.

Для их нахождения в Excel используем встроенную функцию TANH, введя в качестве аргумента значения соответствующих Zmin и Zmax. Можно найти значения сmin и сmax и по таблице Z-преобразования Фишера.

Построим с надёжностью г=0,95 и с учётом найденного доверительные интервалы для всех значимых парных коэффициентов корреляции, полученных нами. Расчёты представим в виде таблицы.

Таблица 5. Расчёт доверительных интервалов для парных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью г=0,95

r

Zr

Zmin

Zmax

сmin

сmax

yx8

0,688511

0,845119

0,559229

1,131009

0,507405

0,811364

yx10

0,450862

0,485782

0,199891

0,771672

0,197271

0,6479

yx15

-0,32518

-0,33742

-0,62331

-0,05153

-0,55343

-0,05149

x8x15

-0,3302

-0,34306

-0,62895

-0,05717

-0,55733

-0,05711

x8x16

-0,41979

-0,44744

-0,73333

-0,16155

-0,6251

-0,16015

x10x16

0,278902

0,286491

0,000601

0,572381

0,000601

0,517106

Таким образом, доверительные интервалы с надёжностью г=0,95 для всех значимых парных генеральных коэффициентов корреляции выглядят следующим образом:

P(-0,507405? сYX8 ? 0,811364)=0,95

P(0,197271? сYX10 ? 0,6479)=0,95

P(-0,55343? сYX15 ? -0,05149)=0,95

P(-0,55733? сX8X15 ? -0,05711)=0,95

P(-0,6251? сX8X16 ? -0,16015)=0,95

P(0,000601? сX10X16 ? 0,517106)=0,95

По полученным данным можно сделать следующие выводы:

Между исследуемыми показателями выявлены значимые корреляционные зависимости.

1) Значимая корреляционная прямая взаимосвязь обнаружена между изучаемым признаком Y - рентабельностью и факторными признаками X8 - премиями и вознаграждениями на одного работника и X10 - фондоотдачей.

2) Между рентабельностью (Y) и оборачиваемостью нормируемых оборотных средств (X15) существует обратная умеренная связь.

3) Более умеренная обратная связь существует между факторным признаком X8 - премиями и вознаграждениями на одного работника и факторными признаками X15 - оборачиваемостью нормируемых оборотных средств и X16 - оборачиваемостью ненормируемых оборотных средств.

4) Так же умеренная прямая взаимосвязь обнаружена между X10 - фондоотдачей и X16 - оборачиваемостью ненормируемых оборотных средств.

2.2 Расчёт частных коэффициентов корреляции

Частные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными при исключении влияния остальных показателей, то есть они характеризуют «чистую» связь только между этими признаками. Они важны для понимания взаимодействия всего комплекса показателей, так как позволяют определить механизмы усиления-ослабления влияния переменных друг на друга.

Частный коэффициент (k-2)-го порядка между переменными, например, между Y и X1, равен:

,

где Rij - алгебраическое дополнение элемента rij корреляционной матрицы R, равное Rij =(-1)i+j ? Mij

Mij - минор элемента rij корреляционной матрицы R, т.е. определитель матрицы на 1 меньшего порядка, полученной из R путём вычёркивания i-й строки и j-го столбца. Таким образом, для расчёта частных коэффициентов корреляции нужно сформировать в Excel соответствующие матрицы размерности (k-1)Ч(k-1) (в нашем случае 4Ч4). Чтобы найти определители этих матриц, воспользуемся встроенной функцией Excel МОПРЕД, указав в качестве массива соответствующую матрицу переменных. Воспользовавшись этой функцией, получаем результаты в таблице 6:

Таблица 6. Алгебраические дополнения корреляционной матрицы

R11

0,670601

R12

-0,4591

R24

0,013062

R22

0,532685

R13

-0,35562

R25

0,05615

R33

0,369498

R14

0,06184

R34

-0,02413

R44

0,194005

R15

0,03629

R35

-0,07265

R55

0,220938

R23

0,240709

R45

-0,01472

Рассчитав выборочные частные коэффициенты корреляции, получаем матрицу следующего вида:

Таблица 7. Матрица выборочных частных коэффициентов корреляции исследуемых экономических показателей

Y

X8

X10

X15

X16

Y

1

0,768136

0,714408

-0,17145

-0,09428

X8

0,768136

1

-0,54256

-0,04063

-0,16368

X10

0,714408

-0,54256

1

0,090117

0,254258

X15

-0,17145

-0,04063

0,090117

1

0,071116

X16

-0,09428

-0,16368

0,254258

0,071116

1

Теперь необходимо проверить значимость полученных частных коэффициентов корреляции, т.е. гипотезу H0: сij/{..} = 0.

Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле:

где l - порядок частного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин, а n - количество наблюдений.

При l = 3 построим матрицу наблюдаемыx значений t-статистик для всех коэффициентов rij/{..} (таблица 8).

Таблица 8. Матрица наблюдаемыx значений t-статистик частных коэффициентов корреляции исследуемых экономических показателей

tнабл

Y

X8

X10

X15

X16

Y

8,047659

6,848919

-1,16739

-0,63529

X8

8,047665

-4,33282

-0,27279

-1,11297

X10

6,848926

-4,33282

0,606996

1,763575

X15

-1,16739

-0,27279

0,606993

0,478273

X16

-0,63529

-1,11298

1,763572

0,478272

Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n - l - 2. Для этого используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность б=0,05 и число степеней свободы н=n-l-2=50-3-2=45. (Можно найти значения tкр по таблицам математической статистики).

Получаем tкр=2,014103.

По результатам, представленным в таблице 7, наблюдаемое значение t-статистики больше критического tкр по модулю для частных коэффициентов корреляции

Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, то есть соответствующие коэффициенты значимы.

Для остальных коэффициентов наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается, то есть они незначимы.

Для проверки значимости частных коэффициентов корреляции можно также воспользоваться таблицами Фишера-Иейтса для нахождения критического значения rкр с учётом уровня значимости б=0,05 и числа степеней свободы н=n-l-2=50-3-2=45. По таблице rкр (б=0,05; н=45)=0,288. Если соответствующий коэффициент |r|> rкр, то он считается значимым.

Отметим в матрице частных коэффициентов корреляции значимые.

Таблица 9. Матрица частных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при б=0,05)

Y

X8

X10

X15

X16

Y

1

0,768136

0,714408

-0,17145

-0,09428

X8

0,768136

1

-0,54256

-0,04063

-0,16368

X10

0,714408

-0,54256

1

0,090117

0,254258

X15

-0,17145

-0,04063

0,090117

1

0,071116

X16

-0,09428

-0,16368

0,254258

0,071116

1

Для значимых частных коэффициентов корреляции можно построить с заданной надёжностью г интервальную оценку сmin ? с ? сmax с помощью Z-преобразования Фишера:

Алгоритм построения интервальной оценки для частного генерального коэффициента корреляции такой же, как и для парного; единственное отличие заключается в расчёте ДZ:

,

где l - порядок частного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=3), а n - количество наблюдений.

Построим с надёжностью г=0,95 и с учётом найденного доверительные интервалы для всех значимых частных коэффициентов корреляции, полученных нами. Расчёты представим в виде таблицы 10.

Таблица 10. Расчёт доверительных интервалов для частных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью г=0,95

r

Zr

Zmin

Zmax

сmin

сmax

yx8

0,768136

1,015765

0,720289

1,311241

0,617089

0,864589

yx10

0,714408

0,896129

0,600654

1,191605

0,537515

0,831076

x8x10

-0,54256

-0,60778

-0,90326

-0,31231

-0,71788

-0,30253

Таким образом, доверительные интервалы с надёжностью г=0,95 для всех значимых частных генеральных коэффициентов корреляции выглядят следующим образом:

P(0,617089? ? 0,864589)=0,95

P(0,537515? ? 0,831076)=0,95

P(-0,71788? ? -0,30253)=0,95

Теперь построим таблицу сравнения выборочных парных и частных коэффициентов корреляции для всех переменных.

Сравнение парных и частных коэффициентов играет важную роль в выявлении механизмов воздействия переменных друг на друга. Парный коэффициент корреляции показывает тесноту связи между двумя признаками на фоне действия остальных переменных, а частный характеризует взаимосвязь этих двух признаков при исключении влияния остальных переменных, то есть их «личную» взаимосвязь.

Таким образом, если оказывается, что парный коэффициент корреляции между двумя переменными по модулю больше соответствующего частного, то остальные переменные усиливают связь между этими двумя признаками. Соответственно, если парный коэффициент корреляции между двумя переменными по абсолютной величине меньше частного, то остальные признаки ослабляют связь между рассматриваемыми двумя.

Далее рассмотрим таблицу сравнения выборочных оценок парных и частных коэффициентов корреляции пар исследуемых показателей с выделением значимых коэффициентов при б=0,05, и по данным сделаем вывод о воздействии переменных друг на друга.

Таблица 11. Таблица сравнения выборочных оценок парных и частных коэффициентов корреляции пар исследуемых показателей с выделением значимых коэффициентов (при б=0,05)

Между переменными

Коэффициент корреляции

парный

частный

Y X8

0,688511

0,768136

Y X10

0,450862

0,714408

Y X15

-0,325176

-0,171447

Y X16

-0,212659

-0,094281

X8 X10

-0,092898

-0,542564

X8 X15

-0,330204

-0,040631

X8 X16

-0,419788

-0,163675

X2 X15

0,008075

0,090117

X10 X16

0,278902

0,254258

X15 X16

0,206628

0,071116

По полученным данным можно сделать вывод, что выявлены следующие механизмы воздействия переменных друг на друга:

1. Наиболее сильная связь присутствует между изучаемым признаком Y - рентабельностью и факторным признаком X8 - премиями и вознаграждениями на одного работника. Эта связь является прямой и весьма сильной и значимой, хотя частный коэффициент по модулю несколько больше парного. Таким образом, можно сделать вывод, что остальные переменные, включённые в корреляционную модель, ослабляют взаимосвязь между указанными факторными признаками.

2. Наиболее тесная связь наблюдается между изучаемым признаком Y - рентабельностью и факторным признаком фондоотдачей X10. Влияние прочих переменных немного ослабляет значимую положительную связь между рентабельностью Y и фондоотдачей X10.

Так же тесная связь наблюдается между изучаемым признаком Y - рентабельностью и факторным признаком X15 - оборачиваемостью нормируемых оборотных средств, при этом наблюдается обратная зависимость. Поскольку парный коэффициент корреляции между двумя переменными по модулю больше соответствующего частного, то остальные переменные будут усиливать связь между данными двумя признаками.

Воздействие других переменных ослабляет отрицательную взаимосвязь между факторными признаками X8 - премиями и вознаграждениями на одного работника и фондоотдачей X10, так как абсолютная величина частного коэффициента корреляции превышает абсолютное значение парного коэффициента корреляции.

Противоположная ситуация наблюдается для обратной связи между рентабельностью Y и оборачиваемостью ненормируемых оборотных средств X16. Поскольку абсолютная величина парного коэффициента корреляции по модулю превышает абсолютное значение частного коэффициента корреляции, отсюда можно сделать вывод, что воздействие других переменных будет усиливать отрицательную взаимосвязь между рентабельностью Y и оборачиваемостью ненормируемых оборотных средств X16, хотя оба коэффициента корреляции являются незначимыми.

Поскольку парный коэффициент корреляции, хоть и не намного, но по модулю несколько больше частного коэффициента корреляции, влияние прочих переменных будет немного усиливать положительную связь между двумя факторными признаками - фондоотдачей X10 и оборачиваемостью ненормируемых оборотных средств X16.

Воздействие остальных переменных будет усиливать отрицательную взаимосвязь между факторным признаком X8 - премиями и вознаграждениями на одного работника и факторным признаком X15 - оборачиваемостью нормируемых оборотных средств.

Такая же ситуация наблюдается и в обратной взаимосвязи между факторными признаками X8 - премиями и вознаграждениями на одного работника и X16 - оборачиваемостью ненормируемых оборотных средств. То есть остальные переменные усиливают данную взаимосвязь.

2.3 Расчёт множественных коэффициентов корреляции

Множественные коэффициенты корреляции Ri/{..} служат мерой связи одной переменной с совместным действием всех остальных показателей.

Вычислим точечные оценки множественных коэффициентов корреляции. Множественный коэффициент корреляции, например, для 1-го показателя Y вычисляется по формуле:

где |R| - определитель корреляционной матрицы R;

Rii - алгебраическое дополнение элемента rii корреляционной матрицы R.

Все алгебраические дополнения Rii были найдены на этапе расчёта частных коэффициентов корреляции, поэтому нам остается вычислить только определитель самой корреляционной матрицы. Чтобы найти определитель корреляционной матрицы, воспользуемся встроенной математической функцией Excel МОПРЕД.

Получим |R| = 0,166346.

Множественный коэффициент детерминации R2i/{..} (и его выборочная оценка r2i/{..}) показывает долю дисперсии рассматриваемой случайной величины, обусловленную влиянием остальных переменных, включённых в корреляционную модель. Соответственно (1- R2i/{..}) показывает долю остаточной дисперсии данной случайной величины, обусловленную влиянием других, не включённых в исследуемую модель факторов. Множественные коэффициенты детерминации получаются возведением соответствующих множественных коэффициентов корреляции в квадрат. Минашкин В.Г. Статистика: учебник для вузов / В.Г. Минашкин и др.; под ред. В.Г. Минашкина. - М.: Проспект, 2006. - с. 201.

Проверим значимость полученных множественных коэффициентов корреляции и детерминации.

Проверка значимости, т.е. гипотезы о равенстве нулю соответствующего множественного коэффициента корреляции, осуществляется с помощью статистики:

,

где l - порядок множественного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=4, например, ), а n - количество наблюдений.

Произведя расчёты, получим результаты в таблице 12.

Для определения значимости множественных коэффициентов корреляции и детерминации нужно найти критическое значение F-распределения для заданного уровня значимости б и числа степеней свободы числителя н1=l и знаменателя н2=n-l-1. Для определения Fкр можно воспользоваться встроенной функцией Excel FРАСПОБР, введя в предложенное меню вероятность б=0,05 и число степеней свободы н1=l=4 и н2=n-l-1=50-4-1=45. Так же можно найти значения Fкр по таблицам математической статистики.

Получаем Fкр(0,05; 4; 25)= 2,578739.

Таблица 12. Множественные коэффициенты корреляции и детерминации исследуемых показателей с выделением значимых коэффициентов (на уровне значимости б=0,05)

R

R2

Fнабл

Ry/{…}=

0,867148

0,751945

34,10287

Rx1/{…}=

0,82929

0,687722

24,77562

Rx2/{…}=

0,741489

0,549806

13,73924

Rx3/{…}=

0,377582

0,142568

1,870579

Rx4/{…}=

0,497085

0,247094

3,692094

Если наблюдаемое значение F-статистики превосходит ее критическое значение Fкр=2,578739, то гипотеза о равенстве нулю соответствующего множественного коэффициента корреляции отвергается с вероятностью ошибки, равной 0,05. Следовательно, у нас все коэффициенты, кроме переменной X15, значимо отличаются от нуля.

Полученные данные позволяют сделать следующие выводы:

Множественный коэффициент корреляции =0,8671 значим и имеет достаточно высокое значение, что говорит о том, показатель Y - рентабельность имеет тесную связь с многомерным массивом факторных признаков X8 - премии и вознаграждения на одного работника, X10 - фондоотдача, X15 - оборачиваемость нормируемых оборотных средств и X16 - оборачиваемость ненормируемых оборотных средств. Это даёт основание для проведения дальнейшего регрессионного анализа.

Множественный коэффициент детерминации r2Y/{..}=0,7519 показывает, что 75,19% доли дисперсии Y - объёма промышленной продукции, обусловлены изменениями факторных признаков.

Факторные признаки тоже имеют достаточно высокие значения множественных коэффициентов корреляции и детерминации, что говорит об их сильной взаимосвязанности, за исключением переменной X15 - её множественный коэффициент не значим, и это подтверждается тем фактом, что только 14,26% доли её дисперсии обусловлены изменениями переменных, включённых в рассматриваемую модель, а, соответственно 85,74% дисперсии обусловлены влиянием других, не включённых в корреляционную модель остаточных факторов.

Итак, полученные результаты корреляционного анализа, показавшие, что показатель Y - рентабельность имеет тесную связь с многомерным массивом факторных признаков, позволяют перейти ко второму этапу статистического исследования - построению регрессионной модели.

3. Регрессионный анализ экономических показателей

После того как с помощью корреляционного анализа выявлено наличие статистически значимых связей между переменными и оценена степень их тесноты, переходят к математическому описанию конкретного вида зависимостей с использованием регрессионного анализа. Для этого подбирают класс функций, связывающий результативный показатель Y и аргументы X1, X2, X3 ,... Xk, отбирают наиболее информативные аргументы, вычисляют оценки неизвестных значений параметров уравнения связи и анализируют точность полученного уравнения.

Наиболее часто используется множественная линейная модель регрессионного анализа, уравнение которой имеет вид:

для всех i=1,2,…n, или в матричной форме:

,

Исследуем на основе линейной регрессионной модели зависимость рентабельности () от премий и вознаграждений на одного работника (X8), фондоотдачи (X10), оборачиваемости нормируемых оборотных средств (X15) и оборачиваемости ненормируемых оборотных средств (X16).

3.1 Проверка исходных данных на мультиколлинеарность

Одним из основных препятствий эффективного применения множественного регрессионного анализа является мультиколлинеарность. Она возникает в случаях существования достаточно тесных линейных статистических связей между объясняющими переменными X1, X2, X3 ,... Xk. В результате мультиколлинеарности матрица парных коэффициентов корреляции становится слабообусловленной, близкой к вырожденной.

Точных количественных критериев для определения наличия или отсутствия мультиколлинеарности не существует. Однако на практике о наличии мультиколлинеарности обычно судят по матрице парных коэффициентов корреляции.

Если один из элементов матрицы R больше 0,8 , т.е. | rij | > 0,8 , то считают, что имеет место мультиколлинеарность и в уравнение регрессии следует включать только один из показателей Xi или Xj (как правило, тот, который имеет наибольшую связь с Y).

Прежде, чем переходить к построению регрессионной модели, необходимо проверить объясняющие переменные на наличие мультиколлинеарности. Для этого рассмотрим матрицу парных коэффициентов корреляции между факторными признаками Xi.

Таблица 13. Матрица парных коэффициентов корреляции факторных признаков

Y3

X8

X10

X15

X16

Y3

1

0,688511

0,450862

-0,32518

-0,21266

X8

0,688511

1

-0,0929

-0,3302

-0,41979

X10

0,450862

-0,0929

1

0,008075

0,278902

X15

-0,32518

-0,3302

0,008075

1

0,206628

X16

-0,21266

-0,41979

0,278902

0,206628

1

Поскольку значения коэффициентов корреляции для всех пар объясняющих переменных не превышают по модулю 0,8, то в нашем случае нет необходимости сокращать набор объясняющих переменных.

3.2 Построение регрессионной модели и её интерпретация

Будем использовать алгоритм пошагового регрессионного анализа с последовательным исключением незначимых регрессоров, пока все входящие в регрессионную модель факторы не будут иметь значимые коэффициенты. Построение и оценка регрессионной модели осуществляется в Excel с помощью модуля регрессии пакета анализа данных.

Приступим к анализу.

I ЭТАП РЕГРЕССИОННОГО АНАЛИЗА.

В модель включены все факторные признаки (X8, X10, X15, X16).

Результаты регрессионного анализа

Регрессионная статистика

Множественный R

0,86715

R-квадрат

0,75195

Нормированный R-квадрат

0,72990

Стандартная ошибка

3,00422

Наблюдения

50

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

4

1231,157

307,7894

34,10287

4,27E-13

Остаток

45

406,1394

9,025321

Итого

49

1637,297

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 98,0%

Верхние 98,0%

Y-пересечение

-2,03350

2,58972

-0,78522

0,43644

-7,24946

3,18246

-8,28020

4,21320

X8

6,01042

0,74685

8,04766

2,9E-10

4,50618

7,51466

4,20892

7,81192

X10

7,32188

1,06906

6,84892

1,7E-08

5,16869

9,47507

4,74319

9,90057

X15

-0,01487

0,01274

-1,16739

0,24920

-0,04054

0,01079

-0,04561

0,01586

X16

-0,05583

0,08789

-0,63529

0,52846

-0,23285

0,12118

-0,26783

0,15616

В регрессионной статистике указываются множественный коэффициент корреляции (Множественный R) и детерминации (R-квадрат) между Y и массивом факторных признаков, что совпадает с полученными ранее значениями в корреляционном анализе.

Средняя часть таблицы (Дисперсионный анализ) необходима для проверки значимости уравнения регрессии.

Нижняя часть таблицы - точечные оценки bi генеральных коэффициентов регрессии вi, проверка их значимости и интервальная оценка.

Оценка вектора коэффициентов b (столбец «Коэффициенты»):

Тогда оценка уравнения регрессии имеет вид:

Необходимо проверить значимость уравнения регрессии и полученных коэффициентов регрессии.

Проверим на уровне б=0,05 значимость уравнения регрессии, т.е. гипотезу H0: в123=…=вk=0. Для этого рассчитывается наблюдаемое значение F-статистики:

Excel выдаёт это в результатах дисперсионного анализа:

В столбце F указывается значение Fнабл.

По таблицам F-распределения или с помощью встроенной статистической функции FРАСПОБР для уровня значимости б=0,05 и числа степеней свободы числителя н1=k=4 и знаменателя н2=n-k-1=45 находим критическое значение F-статистики, равное Fкр = 2,578739.

Так как наблюдаемое значение F-статистики превосходит ее критическое значение 34,10287 > 2,578739, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора в=(в1234...


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.