Построение множественных регрессионных моделей
Подготовка данных и построение модели. Корреляционный анализ экономических показателей. Расчёт частных и множественных коэффициентов корреляции. Построение регрессионной модели и её интерпретация. Проверка исходных данных на мультиколлинеарность.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 16.01.2016 |
Размер файла | 635,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
1
Содержание
Введение
1. Подготовка данных и построение модели
2. Корреляционный анализ экономических показателей
2.1 Построение матрицы парных коэффициентов корреляции
2.2 Расчёт частных коэффициентов корреляции
2.3 Расчёт множественных коэффициентов корреляции
3. Регрессионный анализ экономических показателей
3.1 Проверка исходных данных на мультиколлинеарность
3.2 Построение регрессионной модели и её интерпретация
3.3 Сравнение исходных данных с рассчитанными по уравнению регрессии
Заключение
Список литературы
Введение
корреляционный экономический мультиколлинеарность
Актуальность темы работы обусловлена тем, что множественная регрессия используется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах и целом ряде других вопросов эконометрики. Множественная регрессия является одним из наиболее распространенных методов в эконометрике. Основной целью множественной регрессии является построение модели с большим числом факторов, при этом определив влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.
Построение множественных регрессионных моделей используется в анализе информации, собираемой в процессе эмпирических социологических исследований, представляет собой не просто совокупность технических приемов и методов, позволяющих в той или иной форме визуализировать полученные данные. Анализ данных является ключевым этапом всего исследования, в ходе которого происходит непосредственная проверка соответствия собранной информации тем моделям социальных явлений, которые, явно или латентно, имеются у социологов. И более того, в ходе анализа формулируются и проверяются новые модели, адекватно отражающие те закономерности, которые есть в собранных данных. Большаков А.А. Методы обработки многомерных данных и временных рядов: учебное пособие для вузов / А.А. Большаков. - М.: Горячая линия-Телеком, 2007. - с. 102.
Методы корреляционного и регрессионного анализов призваны решать такие задачи, как оценка взаимосвязи показателей и моделирование их зависимости для дальнейшего прогнозирования.
Данные методы статистической обработки данных реализованы во многих программных продуктах и статистических пакетах анализа переменных. Но в настоящее время Microsoft Office, в состав которого входит ППП Microsoft Excel, имеет наибольшее распространение и доступен всем пользователям современных компьютеров, в отличие от многих специальных статистических пакетов.
Для анализа взаимосвязи показателей эффективности производства продукции для курсовой работы были предоставлены показатели производственно-хозяйственной деятельности 50 предприятий машиностроения.
В данной курсовой работе будет проводиться анализ взаимосвязи данных экономических показателей и моделирование их зависимости с целью дальнейшего исследования.
Цель работы: рассмотреть уравнение множественной регрессии и условия его применения.
Задачи работы:
- рассмотреть общий вид модели множественной регрессии;
- выявить условия оценки параметров модели с помощью МНК;
- привести методику анализа статистической значимости параметров модели;
- рассмотреть примеры построения регрессионных моделей и оценку их качества.
Объект работы: теория и методы эконометрического анализа.
Предмет работы; уравнение множественной регрессии.
Теоретической и методологической основой исследования являются работы, посвященные теории, методологии и практике анализа данных.
Информационную базу исследования составляют специализированные статистические, официальные и информационные Интернет-материалы и другие информационные источники.
Теоретические знания, практические навыки, основные положения и выводы контрольной работы могут быть использованы при проведении профессиональных исследований в сфере социологии.
1. Подготовка данных и построение модели
Для статистического исследования в рамках курсовой работы необходимо подготовить данные в виде матрицы X размерностью (nЧk), столбцами которой будут k изучаемых переменных (не менее 5 переменных), а строками - их n значений (не менее 30 наблюдений).
Необходимо провести анализ взаимосвязи следующих экономических показателей:
Результативный признак:
Y - рентабельность;
Факторные признаки Xi:
X8 - премии и вознаграждения на одного работника;
X10 - фондоотдача;
X15 - оборачиваемость нормируемых оборотных средств;
X16 - оборачиваемость ненормируемых оборотных средств.
Исходные данные представлены в таблице 1.
Гипотеза. Предположим, что рассматриваемые признаки Y, X8, X10, X15, X16 в генеральной совокупности подчиняются нормальному закону распределения и указанные данные представляют выборку из этой генеральной совокупности.
Таблица 1. Исходные данные
№п/п |
Y |
X8 |
X10 |
X15 |
X16 |
|
1 |
13,26 |
1,23 |
1,45 |
166,32 |
10,08 |
|
2 |
10,16 |
1,04 |
1,3 |
92,88 |
14,76 |
|
3 |
13,72 |
1,8 |
1,37 |
158,04 |
6,48 |
|
4 |
12,85 |
0,43 |
1,65 |
93,96 |
21,96 |
|
5 |
10,63 |
0,88 |
1,91 |
173,88 |
11,88 |
|
6 |
9,12 |
0,57 |
1,68 |
162,3 |
12,6 |
|
7 |
25,83 |
1,72 |
1,94 |
88,56 |
11,52 |
|
8 |
23,39 |
1,7 |
1,89 |
101,16 |
8,28 |
|
9 |
14,68 |
0,84 |
1,94 |
166,32 |
11,52 |
|
10 |
10,05 |
0,6 |
2,06 |
140,76 |
32,4 |
|
11 |
13,99 |
0,82 |
1,96 |
128,52 |
11,52 |
|
12 |
9,68 |
0,84 |
1,02 |
177,84 |
17,28 |
|
13 |
10,03 |
0,67 |
1,85 |
114,48 |
16,2 |
|
14 |
9,13 |
1,04 |
0,88 |
93,24 |
13,32 |
|
15 |
5,37 |
0,66 |
0,62 |
126,72 |
17,28 |
|
16 |
9,86 |
0,86 |
1,09 |
91,8 |
9,72 |
|
17 |
12,62 |
0,79 |
1,6 |
69,12 |
16,2 |
|
18 |
5,02 |
0,34 |
1,53 |
66,24 |
24,84 |
|
19 |
21,18 |
1,6 |
1,4 |
67,68 |
14,76 |
|
20 |
25,17 |
1,46 |
2,22 |
50,4 |
7,56 |
|
21 |
19,4 |
1,27 |
1,32 |
70,56 |
8,64 |
|
22 |
21 |
1,58 |
1,48 |
72 |
8,64 |
|
23 |
6,57 |
0,68 |
0,68 |
97,2 |
9 |
|
24 |
14,19 |
0,86 |
2,3 |
80,28 |
14,76 |
|
25 |
15,81 |
1,98 |
1,37 |
51,48 |
10,08 |
|
26 |
5,23 |
0,33 |
1,51 |
105,12 |
14,76 |
|
27 |
7,99 |
0,45 |
1,43 |
128,52 |
10,44 |
|
28 |
17,5 |
0,74 |
1,82 |
94,68 |
14,76 |
|
29 |
17,16 |
0,03 |
2,62 |
85,32 |
20,52 |
|
30 |
14,54 |
0,99 |
1,75 |
76,32 |
14,4 |
|
31 |
6,24 |
0,24 |
1,54 |
153 |
24,84 |
|
32 |
12,08 |
0,57 |
2,25 |
107,64 |
11,16 |
|
33 |
9,49 |
1,22 |
1,07 |
90,72 |
6,48 |
|
34 |
9,28 |
0,68 |
1,44 |
82,44 |
9,72 |
|
35 |
11,42 |
1 |
1,4 |
79,92 |
3,24 |
|
36 |
10,31 |
0,81 |
1,31 |
120,96 |
6,48 |
|
37 |
8,65 |
1,27 |
1,12 |
84,6 |
5,4 |
|
38 |
10,94 |
1,14 |
1,16 |
85,32 |
6,12 |
|
39 |
9,87 |
1,89 |
0,88 |
101,52 |
8,64 |
|
40 |
6,14 |
0,67 |
1,07 |
107,64 |
11,88 |
|
41 |
12,93 |
0,96 |
1,24 |
85,32 |
7,92 |
|
42 |
9,78 |
0,67 |
1,49 |
131,76 |
10,08 |
|
43 |
13,22 |
0,98 |
2,03 |
116,64 |
18,72 |
|
44 |
17,29 |
1,16 |
1,84 |
138,24 |
13,68 |
|
45 |
7,11 |
0,54 |
1,22 |
156,96 |
16,56 |
|
46 |
22,49 |
1,23 |
1,72 |
137,52 |
14,76 |
|
47 |
12,14 |
0,78 |
1,75 |
135,72 |
7,92 |
|
48 |
15,25 |
1,16 |
1,46 |
155,52 |
18,36 |
|
49 |
31,34 |
4,44 |
1,6 |
48,6 |
8,28 |
|
50 |
11,56 |
1,06 |
1,47 |
42,84 |
14,04 |
2. Корреляционный анализ экономических показателей
2.1 Построение матрицы парных коэффициентов корреляции
Парные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными на фоне действия остальных показателей и являются самыми распространёнными показателями тесноты связи при статистическом анализе данных.
Отдельный выборочный коэффициент корреляции rij между двумя выбранными признаками Xi и Xj в Excel можно вычислить с помощью встроенных статистических функций КОРРЕЛ или ПИРСОН. Расчёт матрицы выборочных парных коэффициентов корреляции осуществляется в Excel с помощью пакета анализа данных. Елисеева И.И. Общая теория статистики: учебник для вузов / И.И. Елисеева, М.М. Юзбашев; под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2006. - с. 106.
Итак, получаем матрицу парных коэффициентов корреляции размерности kЧk (в нашем случае 5Ч5).
Таблица 2. Матрица парных коэффициентов корреляции исследуемых экономических показателей
Y |
X8 |
X10 |
X15 |
X16 |
||
Y |
1 |
0,688511 |
0,450862 |
-0,32518 |
-0,21266 |
|
X8 |
0,688511 |
1 |
-0,0929 |
-0,3302 |
-0,41979 |
|
X10 |
0,450862 |
-0,0929 |
1 |
0,008075 |
0,278902 |
|
X15 |
-0,32518 |
-0,3302 |
0,008075 |
1 |
0,206628 |
|
X16 |
-0,21266 |
-0,41979 |
0,278902 |
0,206628 |
1 |
Теперь необходимо проверить значимость полученных коэффициентов корреляции, то есть гипотезу H0: с=0. Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле:
и построим матрицу наблюдаемыx значений t-статистик для всех коэффициентов rij (таблица 3).
Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n-2.
Для этого используем встроенную функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность б=0,05 и число степеней свободы н=n-2=50-2=48.
Можно найти значения tкр по таблицам математической статистики. Получаем tкр= 2,010635.
Таблица 3. Матрица наблюдаемыx значений t-статистик парных коэффициентов корреляции исследуемых экономических показателей
tнабл |
Y |
X8 |
X10 |
X15 |
X16 |
|
Y |
6,57746 |
3,49954 |
-2,38235 |
-1,50784 |
||
X8 |
6,57746 |
-0,64641 |
-2,42367 |
-3,20439 |
||
X10 |
3,49954 |
-0,64641 |
0,05595 |
2,01213 |
||
X15 |
-2,3824 |
-2,42367 |
0,05595 |
1,46313 |
||
X16 |
-1,50784 |
-3,20439 |
2,01213 |
1,46313 |
По результатам, представленным в таблице 3, наблюдаемое значение t-статистики больше критического tкр по модулю для парных коэффициентов корреляции . Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, то есть соответствующие коэффициенты значимы.
Для остальных коэффициентов наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается, и это значит, что коэффициенты - незначимы.
Для проверки значимости парных коэффициентов корреляции можно также воспользоваться таблицами Фишера-Иейтса для нахождения критического значения rкр для уровня значимости б=0,05 и числа степеней свободы н=n-2=50-2=48.
По таблице rкр (б=0,05; н=48)=0,273.
Если соответствующий коэффициент |rij|>rкр, то он считается значимым. Отметим в матрице парных коэффициентов корреляции значимые.
Таблица 4. Матрица парных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при б=0,05)
Y |
X8 |
X10 |
X15 |
X16 |
||
Y |
1 |
0,688511 |
0,45086 |
-0,32518 |
-0,21266 |
|
X8 |
0,688511 |
1 |
-0,09290 |
-0,3302 |
-0,41979 |
|
X10 |
0,450862 |
-0,0929 |
1 |
0,008075 |
0,278902 |
|
X15 |
-0,32518 |
-0,3302 |
0,00807 |
1 |
0,206628 |
|
X16 |
-0,21266 |
-0,41979 |
0,27890 |
0,206628 |
1 |
Алгоритм построения интервальной оценки для генерального коэффициента корреляции следующий: Елисеева И.И. Общая теория статистики: учебник для вузов / И.И. Елисеева, М.М. Юзбашев; под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2006. - с. 167.
1). Zr По найденному выборочному коэффициенту корреляции r с помощью Z-преобразования Фишера находят соответствующее значение Zr , являющееся гиперболическим арктангенсом r:
Для этого в Excel есть встроенная функция ATANH, где в качестве аргумента вводится значение соответствующего выборочного коэффициента корреляции r. Следует учитывать, что Z-функция - нечетная, т.е. Z(-r)= - Z(r). Можно найти значение Zr и по таблице Z-преобразования Фишера.
2). ДZ Найдём значение tг, соответствующее заданной надёжности г=0,95. - значение функции Лапласа.
Для нахождения значения tг можно использовать встроенную функцию Excel НОРМСТОБР. Необходимо заметить, что Excel с помощью функции НОРМСТОБР выдаёт не значения функции Лапласа, а значение функции распределения стандартного нормального закона F(t):
.
Поэтому при расчёте всех интервальных оценок нужно пересчитывать г=0,95 в , а по этому значению уже вычислять t.
В нашем случае для надёжности г=0,95: F(t)=0,975; tг =1,959964.
Находим
3). Zmin и Zmax Теперь можно найти Zmin и Zmax:
Zmin = Zr - ДZ; Zmax= Zr + ДZ
4). сmin и сmax Наконец, использовав обратное преобразование Фишера, находят нижнюю и верхнюю границы для генерального коэффициента корреляции сmin и сmax , соответствующие Zmin и Zmax.
Соответствующие значения сmin и сmax являются гиперболическими тангенсами Zmin и Zmax:
.
Для их нахождения в Excel используем встроенную функцию TANH, введя в качестве аргумента значения соответствующих Zmin и Zmax. Можно найти значения сmin и сmax и по таблице Z-преобразования Фишера.
Построим с надёжностью г=0,95 и с учётом найденного доверительные интервалы для всех значимых парных коэффициентов корреляции, полученных нами. Расчёты представим в виде таблицы.
Таблица 5. Расчёт доверительных интервалов для парных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью г=0,95
r |
Zr |
Zmin |
Zmax |
сmin |
сmax |
||
yx8 |
0,688511 |
0,845119 |
0,559229 |
1,131009 |
0,507405 |
0,811364 |
|
yx10 |
0,450862 |
0,485782 |
0,199891 |
0,771672 |
0,197271 |
0,6479 |
|
yx15 |
-0,32518 |
-0,33742 |
-0,62331 |
-0,05153 |
-0,55343 |
-0,05149 |
|
x8x15 |
-0,3302 |
-0,34306 |
-0,62895 |
-0,05717 |
-0,55733 |
-0,05711 |
|
x8x16 |
-0,41979 |
-0,44744 |
-0,73333 |
-0,16155 |
-0,6251 |
-0,16015 |
|
x10x16 |
0,278902 |
0,286491 |
0,000601 |
0,572381 |
0,000601 |
0,517106 |
Таким образом, доверительные интервалы с надёжностью г=0,95 для всех значимых парных генеральных коэффициентов корреляции выглядят следующим образом:
P(-0,507405? сYX8 ? 0,811364)=0,95
P(0,197271? сYX10 ? 0,6479)=0,95
P(-0,55343? сYX15 ? -0,05149)=0,95
P(-0,55733? сX8X15 ? -0,05711)=0,95
P(-0,6251? сX8X16 ? -0,16015)=0,95
P(0,000601? сX10X16 ? 0,517106)=0,95
По полученным данным можно сделать следующие выводы:
Между исследуемыми показателями выявлены значимые корреляционные зависимости.
1) Значимая корреляционная прямая взаимосвязь обнаружена между изучаемым признаком Y - рентабельностью и факторными признаками X8 - премиями и вознаграждениями на одного работника и X10 - фондоотдачей.
2) Между рентабельностью (Y) и оборачиваемостью нормируемых оборотных средств (X15) существует обратная умеренная связь.
3) Более умеренная обратная связь существует между факторным признаком X8 - премиями и вознаграждениями на одного работника и факторными признаками X15 - оборачиваемостью нормируемых оборотных средств и X16 - оборачиваемостью ненормируемых оборотных средств.
4) Так же умеренная прямая взаимосвязь обнаружена между X10 - фондоотдачей и X16 - оборачиваемостью ненормируемых оборотных средств.
2.2 Расчёт частных коэффициентов корреляции
Частные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными при исключении влияния остальных показателей, то есть они характеризуют «чистую» связь только между этими признаками. Они важны для понимания взаимодействия всего комплекса показателей, так как позволяют определить механизмы усиления-ослабления влияния переменных друг на друга.
Частный коэффициент (k-2)-го порядка между переменными, например, между Y и X1, равен:
,
где Rij - алгебраическое дополнение элемента rij корреляционной матрицы R, равное Rij =(-1)i+j ? Mij
Mij - минор элемента rij корреляционной матрицы R, т.е. определитель матрицы на 1 меньшего порядка, полученной из R путём вычёркивания i-й строки и j-го столбца. Таким образом, для расчёта частных коэффициентов корреляции нужно сформировать в Excel соответствующие матрицы размерности (k-1)Ч(k-1) (в нашем случае 4Ч4). Чтобы найти определители этих матриц, воспользуемся встроенной функцией Excel МОПРЕД, указав в качестве массива соответствующую матрицу переменных. Воспользовавшись этой функцией, получаем результаты в таблице 6:
Таблица 6. Алгебраические дополнения корреляционной матрицы
R11 |
0,670601 |
R12 |
-0,4591 |
R24 |
0,013062 |
|
R22 |
0,532685 |
R13 |
-0,35562 |
R25 |
0,05615 |
|
R33 |
0,369498 |
R14 |
0,06184 |
R34 |
-0,02413 |
|
R44 |
0,194005 |
R15 |
0,03629 |
R35 |
-0,07265 |
|
R55 |
0,220938 |
R23 |
0,240709 |
R45 |
-0,01472 |
Рассчитав выборочные частные коэффициенты корреляции, получаем матрицу следующего вида:
Таблица 7. Матрица выборочных частных коэффициентов корреляции исследуемых экономических показателей
Y |
X8 |
X10 |
X15 |
X16 |
||
Y |
1 |
0,768136 |
0,714408 |
-0,17145 |
-0,09428 |
|
X8 |
0,768136 |
1 |
-0,54256 |
-0,04063 |
-0,16368 |
|
X10 |
0,714408 |
-0,54256 |
1 |
0,090117 |
0,254258 |
|
X15 |
-0,17145 |
-0,04063 |
0,090117 |
1 |
0,071116 |
|
X16 |
-0,09428 |
-0,16368 |
0,254258 |
0,071116 |
1 |
Теперь необходимо проверить значимость полученных частных коэффициентов корреляции, т.е. гипотезу H0: сij/{..} = 0.
Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле:
где l - порядок частного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин, а n - количество наблюдений.
При l = 3 построим матрицу наблюдаемыx значений t-статистик для всех коэффициентов rij/{..} (таблица 8).
Таблица 8. Матрица наблюдаемыx значений t-статистик частных коэффициентов корреляции исследуемых экономических показателей
tнабл |
Y |
X8 |
X10 |
X15 |
X16 |
|
Y |
8,047659 |
6,848919 |
-1,16739 |
-0,63529 |
||
X8 |
8,047665 |
-4,33282 |
-0,27279 |
-1,11297 |
||
X10 |
6,848926 |
-4,33282 |
0,606996 |
1,763575 |
||
X15 |
-1,16739 |
-0,27279 |
0,606993 |
0,478273 |
||
X16 |
-0,63529 |
-1,11298 |
1,763572 |
0,478272 |
Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n - l - 2. Для этого используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность б=0,05 и число степеней свободы н=n-l-2=50-3-2=45. (Можно найти значения tкр по таблицам математической статистики).
Получаем tкр=2,014103.
По результатам, представленным в таблице 7, наблюдаемое значение t-статистики больше критического tкр по модулю для частных коэффициентов корреляции
Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, то есть соответствующие коэффициенты значимы.
Для остальных коэффициентов наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается, то есть они незначимы.
Для проверки значимости частных коэффициентов корреляции можно также воспользоваться таблицами Фишера-Иейтса для нахождения критического значения rкр с учётом уровня значимости б=0,05 и числа степеней свободы н=n-l-2=50-3-2=45. По таблице rкр (б=0,05; н=45)=0,288. Если соответствующий коэффициент |r|> rкр, то он считается значимым.
Отметим в матрице частных коэффициентов корреляции значимые.
Таблица 9. Матрица частных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при б=0,05)
Y |
X8 |
X10 |
X15 |
X16 |
||
Y |
1 |
0,768136 |
0,714408 |
-0,17145 |
-0,09428 |
|
X8 |
0,768136 |
1 |
-0,54256 |
-0,04063 |
-0,16368 |
|
X10 |
0,714408 |
-0,54256 |
1 |
0,090117 |
0,254258 |
|
X15 |
-0,17145 |
-0,04063 |
0,090117 |
1 |
0,071116 |
|
X16 |
-0,09428 |
-0,16368 |
0,254258 |
0,071116 |
1 |
Для значимых частных коэффициентов корреляции можно построить с заданной надёжностью г интервальную оценку сmin ? с ? сmax с помощью Z-преобразования Фишера:
Алгоритм построения интервальной оценки для частного генерального коэффициента корреляции такой же, как и для парного; единственное отличие заключается в расчёте ДZ:
,
где l - порядок частного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=3), а n - количество наблюдений.
Построим с надёжностью г=0,95 и с учётом найденного доверительные интервалы для всех значимых частных коэффициентов корреляции, полученных нами. Расчёты представим в виде таблицы 10.
Таблица 10. Расчёт доверительных интервалов для частных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью г=0,95
r |
Zr |
Zmin |
Zmax |
сmin |
сmax |
||
yx8 |
0,768136 |
1,015765 |
0,720289 |
1,311241 |
0,617089 |
0,864589 |
|
yx10 |
0,714408 |
0,896129 |
0,600654 |
1,191605 |
0,537515 |
0,831076 |
|
x8x10 |
-0,54256 |
-0,60778 |
-0,90326 |
-0,31231 |
-0,71788 |
-0,30253 |
Таким образом, доверительные интервалы с надёжностью г=0,95 для всех значимых частных генеральных коэффициентов корреляции выглядят следующим образом:
P(0,617089? ? 0,864589)=0,95
P(0,537515? ? 0,831076)=0,95
P(-0,71788? ? -0,30253)=0,95
Теперь построим таблицу сравнения выборочных парных и частных коэффициентов корреляции для всех переменных.
Сравнение парных и частных коэффициентов играет важную роль в выявлении механизмов воздействия переменных друг на друга. Парный коэффициент корреляции показывает тесноту связи между двумя признаками на фоне действия остальных переменных, а частный характеризует взаимосвязь этих двух признаков при исключении влияния остальных переменных, то есть их «личную» взаимосвязь.
Таким образом, если оказывается, что парный коэффициент корреляции между двумя переменными по модулю больше соответствующего частного, то остальные переменные усиливают связь между этими двумя признаками. Соответственно, если парный коэффициент корреляции между двумя переменными по абсолютной величине меньше частного, то остальные признаки ослабляют связь между рассматриваемыми двумя.
Далее рассмотрим таблицу сравнения выборочных оценок парных и частных коэффициентов корреляции пар исследуемых показателей с выделением значимых коэффициентов при б=0,05, и по данным сделаем вывод о воздействии переменных друг на друга.
Таблица 11. Таблица сравнения выборочных оценок парных и частных коэффициентов корреляции пар исследуемых показателей с выделением значимых коэффициентов (при б=0,05)
Между переменными |
Коэффициент корреляции |
||
парный |
частный |
||
Y X8 |
0,688511 |
0,768136 |
|
Y X10 |
0,450862 |
0,714408 |
|
Y X15 |
-0,325176 |
-0,171447 |
|
Y X16 |
-0,212659 |
-0,094281 |
|
X8 X10 |
-0,092898 |
-0,542564 |
|
X8 X15 |
-0,330204 |
-0,040631 |
|
X8 X16 |
-0,419788 |
-0,163675 |
|
X2 X15 |
0,008075 |
0,090117 |
|
X10 X16 |
0,278902 |
0,254258 |
|
X15 X16 |
0,206628 |
0,071116 |
По полученным данным можно сделать вывод, что выявлены следующие механизмы воздействия переменных друг на друга:
1. Наиболее сильная связь присутствует между изучаемым признаком Y - рентабельностью и факторным признаком X8 - премиями и вознаграждениями на одного работника. Эта связь является прямой и весьма сильной и значимой, хотя частный коэффициент по модулю несколько больше парного. Таким образом, можно сделать вывод, что остальные переменные, включённые в корреляционную модель, ослабляют взаимосвязь между указанными факторными признаками.
2. Наиболее тесная связь наблюдается между изучаемым признаком Y - рентабельностью и факторным признаком фондоотдачей X10. Влияние прочих переменных немного ослабляет значимую положительную связь между рентабельностью Y и фондоотдачей X10.
Так же тесная связь наблюдается между изучаемым признаком Y - рентабельностью и факторным признаком X15 - оборачиваемостью нормируемых оборотных средств, при этом наблюдается обратная зависимость. Поскольку парный коэффициент корреляции между двумя переменными по модулю больше соответствующего частного, то остальные переменные будут усиливать связь между данными двумя признаками.
Воздействие других переменных ослабляет отрицательную взаимосвязь между факторными признаками X8 - премиями и вознаграждениями на одного работника и фондоотдачей X10, так как абсолютная величина частного коэффициента корреляции превышает абсолютное значение парного коэффициента корреляции.
Противоположная ситуация наблюдается для обратной связи между рентабельностью Y и оборачиваемостью ненормируемых оборотных средств X16. Поскольку абсолютная величина парного коэффициента корреляции по модулю превышает абсолютное значение частного коэффициента корреляции, отсюда можно сделать вывод, что воздействие других переменных будет усиливать отрицательную взаимосвязь между рентабельностью Y и оборачиваемостью ненормируемых оборотных средств X16, хотя оба коэффициента корреляции являются незначимыми.
Поскольку парный коэффициент корреляции, хоть и не намного, но по модулю несколько больше частного коэффициента корреляции, влияние прочих переменных будет немного усиливать положительную связь между двумя факторными признаками - фондоотдачей X10 и оборачиваемостью ненормируемых оборотных средств X16.
Воздействие остальных переменных будет усиливать отрицательную взаимосвязь между факторным признаком X8 - премиями и вознаграждениями на одного работника и факторным признаком X15 - оборачиваемостью нормируемых оборотных средств.
Такая же ситуация наблюдается и в обратной взаимосвязи между факторными признаками X8 - премиями и вознаграждениями на одного работника и X16 - оборачиваемостью ненормируемых оборотных средств. То есть остальные переменные усиливают данную взаимосвязь.
2.3 Расчёт множественных коэффициентов корреляции
Множественные коэффициенты корреляции Ri/{..} служат мерой связи одной переменной с совместным действием всех остальных показателей.
Вычислим точечные оценки множественных коэффициентов корреляции. Множественный коэффициент корреляции, например, для 1-го показателя Y вычисляется по формуле:
где |R| - определитель корреляционной матрицы R;
Rii - алгебраическое дополнение элемента rii корреляционной матрицы R.
Все алгебраические дополнения Rii были найдены на этапе расчёта частных коэффициентов корреляции, поэтому нам остается вычислить только определитель самой корреляционной матрицы. Чтобы найти определитель корреляционной матрицы, воспользуемся встроенной математической функцией Excel МОПРЕД.
Получим |R| = 0,166346.
Множественный коэффициент детерминации R2i/{..} (и его выборочная оценка r2i/{..}) показывает долю дисперсии рассматриваемой случайной величины, обусловленную влиянием остальных переменных, включённых в корреляционную модель. Соответственно (1- R2i/{..}) показывает долю остаточной дисперсии данной случайной величины, обусловленную влиянием других, не включённых в исследуемую модель факторов. Множественные коэффициенты детерминации получаются возведением соответствующих множественных коэффициентов корреляции в квадрат. Минашкин В.Г. Статистика: учебник для вузов / В.Г. Минашкин и др.; под ред. В.Г. Минашкина. - М.: Проспект, 2006. - с. 201.
Проверим значимость полученных множественных коэффициентов корреляции и детерминации.
Проверка значимости, т.е. гипотезы о равенстве нулю соответствующего множественного коэффициента корреляции, осуществляется с помощью статистики:
,
где l - порядок множественного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=4, например, ), а n - количество наблюдений.
Произведя расчёты, получим результаты в таблице 12.
Для определения значимости множественных коэффициентов корреляции и детерминации нужно найти критическое значение F-распределения для заданного уровня значимости б и числа степеней свободы числителя н1=l и знаменателя н2=n-l-1. Для определения Fкр можно воспользоваться встроенной функцией Excel FРАСПОБР, введя в предложенное меню вероятность б=0,05 и число степеней свободы н1=l=4 и н2=n-l-1=50-4-1=45. Так же можно найти значения Fкр по таблицам математической статистики.
Получаем Fкр(0,05; 4; 25)= 2,578739.
Таблица 12. Множественные коэффициенты корреляции и детерминации исследуемых показателей с выделением значимых коэффициентов (на уровне значимости б=0,05)
R |
R2 |
Fнабл |
||
Ry/{…}= |
0,867148 |
0,751945 |
34,10287 |
|
Rx1/{…}= |
0,82929 |
0,687722 |
24,77562 |
|
Rx2/{…}= |
0,741489 |
0,549806 |
13,73924 |
|
Rx3/{…}= |
0,377582 |
0,142568 |
1,870579 |
|
Rx4/{…}= |
0,497085 |
0,247094 |
3,692094 |
Если наблюдаемое значение F-статистики превосходит ее критическое значение Fкр=2,578739, то гипотеза о равенстве нулю соответствующего множественного коэффициента корреляции отвергается с вероятностью ошибки, равной 0,05. Следовательно, у нас все коэффициенты, кроме переменной X15, значимо отличаются от нуля.
Полученные данные позволяют сделать следующие выводы:
Множественный коэффициент корреляции =0,8671 значим и имеет достаточно высокое значение, что говорит о том, показатель Y - рентабельность имеет тесную связь с многомерным массивом факторных признаков X8 - премии и вознаграждения на одного работника, X10 - фондоотдача, X15 - оборачиваемость нормируемых оборотных средств и X16 - оборачиваемость ненормируемых оборотных средств. Это даёт основание для проведения дальнейшего регрессионного анализа.
Множественный коэффициент детерминации r2Y/{..}=0,7519 показывает, что 75,19% доли дисперсии Y - объёма промышленной продукции, обусловлены изменениями факторных признаков.
Факторные признаки тоже имеют достаточно высокие значения множественных коэффициентов корреляции и детерминации, что говорит об их сильной взаимосвязанности, за исключением переменной X15 - её множественный коэффициент не значим, и это подтверждается тем фактом, что только 14,26% доли её дисперсии обусловлены изменениями переменных, включённых в рассматриваемую модель, а, соответственно 85,74% дисперсии обусловлены влиянием других, не включённых в корреляционную модель остаточных факторов.
Итак, полученные результаты корреляционного анализа, показавшие, что показатель Y - рентабельность имеет тесную связь с многомерным массивом факторных признаков, позволяют перейти ко второму этапу статистического исследования - построению регрессионной модели.
3. Регрессионный анализ экономических показателей
После того как с помощью корреляционного анализа выявлено наличие статистически значимых связей между переменными и оценена степень их тесноты, переходят к математическому описанию конкретного вида зависимостей с использованием регрессионного анализа. Для этого подбирают класс функций, связывающий результативный показатель Y и аргументы X1, X2, X3 ,... Xk, отбирают наиболее информативные аргументы, вычисляют оценки неизвестных значений параметров уравнения связи и анализируют точность полученного уравнения.
Наиболее часто используется множественная линейная модель регрессионного анализа, уравнение которой имеет вид:
для всех i=1,2,…n, или в матричной форме:
,
Исследуем на основе линейной регрессионной модели зависимость рентабельности () от премий и вознаграждений на одного работника (X8), фондоотдачи (X10), оборачиваемости нормируемых оборотных средств (X15) и оборачиваемости ненормируемых оборотных средств (X16).
3.1 Проверка исходных данных на мультиколлинеарность
Одним из основных препятствий эффективного применения множественного регрессионного анализа является мультиколлинеарность. Она возникает в случаях существования достаточно тесных линейных статистических связей между объясняющими переменными X1, X2, X3 ,... Xk. В результате мультиколлинеарности матрица парных коэффициентов корреляции становится слабообусловленной, близкой к вырожденной.
Точных количественных критериев для определения наличия или отсутствия мультиколлинеарности не существует. Однако на практике о наличии мультиколлинеарности обычно судят по матрице парных коэффициентов корреляции.
Если один из элементов матрицы R больше 0,8 , т.е. | rij | > 0,8 , то считают, что имеет место мультиколлинеарность и в уравнение регрессии следует включать только один из показателей Xi или Xj (как правило, тот, который имеет наибольшую связь с Y).
Прежде, чем переходить к построению регрессионной модели, необходимо проверить объясняющие переменные на наличие мультиколлинеарности. Для этого рассмотрим матрицу парных коэффициентов корреляции между факторными признаками Xi.
Таблица 13. Матрица парных коэффициентов корреляции факторных признаков
Y3 |
X8 |
X10 |
X15 |
X16 |
||
Y3 |
1 |
0,688511 |
0,450862 |
-0,32518 |
-0,21266 |
|
X8 |
0,688511 |
1 |
-0,0929 |
-0,3302 |
-0,41979 |
|
X10 |
0,450862 |
-0,0929 |
1 |
0,008075 |
0,278902 |
|
X15 |
-0,32518 |
-0,3302 |
0,008075 |
1 |
0,206628 |
|
X16 |
-0,21266 |
-0,41979 |
0,278902 |
0,206628 |
1 |
Поскольку значения коэффициентов корреляции для всех пар объясняющих переменных не превышают по модулю 0,8, то в нашем случае нет необходимости сокращать набор объясняющих переменных.
3.2 Построение регрессионной модели и её интерпретация
Будем использовать алгоритм пошагового регрессионного анализа с последовательным исключением незначимых регрессоров, пока все входящие в регрессионную модель факторы не будут иметь значимые коэффициенты. Построение и оценка регрессионной модели осуществляется в Excel с помощью модуля регрессии пакета анализа данных.
Приступим к анализу.
I ЭТАП РЕГРЕССИОННОГО АНАЛИЗА.
В модель включены все факторные признаки (X8, X10, X15, X16).
Результаты регрессионного анализа
Регрессионная статистика |
|||||||||
Множественный R |
0,86715 |
||||||||
R-квадрат |
0,75195 |
||||||||
Нормированный R-квадрат |
0,72990 |
||||||||
Стандартная ошибка |
3,00422 |
||||||||
Наблюдения |
50 |
||||||||
Дисперсионный анализ |
|||||||||
df |
SS |
MS |
F |
Значимость F |
|||||
Регрессия |
4 |
1231,157 |
307,7894 |
34,10287 |
4,27E-13 |
||||
Остаток |
45 |
406,1394 |
9,025321 |
||||||
Итого |
49 |
1637,297 |
|||||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 98,0% |
Верхние 98,0% |
||
Y-пересечение |
-2,03350 |
2,58972 |
-0,78522 |
0,43644 |
-7,24946 |
3,18246 |
-8,28020 |
4,21320 |
|
X8 |
6,01042 |
0,74685 |
8,04766 |
2,9E-10 |
4,50618 |
7,51466 |
4,20892 |
7,81192 |
|
X10 |
7,32188 |
1,06906 |
6,84892 |
1,7E-08 |
5,16869 |
9,47507 |
4,74319 |
9,90057 |
|
X15 |
-0,01487 |
0,01274 |
-1,16739 |
0,24920 |
-0,04054 |
0,01079 |
-0,04561 |
0,01586 |
|
X16 |
-0,05583 |
0,08789 |
-0,63529 |
0,52846 |
-0,23285 |
0,12118 |
-0,26783 |
0,15616 |
В регрессионной статистике указываются множественный коэффициент корреляции (Множественный R) и детерминации (R-квадрат) между Y и массивом факторных признаков, что совпадает с полученными ранее значениями в корреляционном анализе.
Средняя часть таблицы (Дисперсионный анализ) необходима для проверки значимости уравнения регрессии.
Нижняя часть таблицы - точечные оценки bi генеральных коэффициентов регрессии вi, проверка их значимости и интервальная оценка.
Оценка вектора коэффициентов b (столбец «Коэффициенты»):
Тогда оценка уравнения регрессии имеет вид:
Необходимо проверить значимость уравнения регрессии и полученных коэффициентов регрессии.
Проверим на уровне б=0,05 значимость уравнения регрессии, т.е. гипотезу H0: в1=в2=в3=…=вk=0. Для этого рассчитывается наблюдаемое значение F-статистики:
Excel выдаёт это в результатах дисперсионного анализа:
В столбце F указывается значение Fнабл.
По таблицам F-распределения или с помощью встроенной статистической функции FРАСПОБР для уровня значимости б=0,05 и числа степеней свободы числителя н1=k=4 и знаменателя н2=n-k-1=45 находим критическое значение F-статистики, равное Fкр = 2,578739.
Так как наблюдаемое значение F-статистики превосходит ее критическое значение 34,10287 > 2,578739, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора в=(в1,в2,в3,в4...
Подобные документы
Корреляционный и регрессионный анализ экономических показателей. Построение матрицы парных коэффициентов корреляции. Расчет и сравнение частных и парных коэффициентов корреляции. Построение регрессионной модели и её интерпретация, мультиколлинеарность.
курсовая работа [314,1 K], добавлен 21.01.2011Теоретико-методологический подход к построению множественных регрессионных моделей. Моделирование и прогнозирование основных экономических показателей при использовании панельных данных. Исследование объемов продаж пяти предприятий с течением времени.
курсовая работа [2,0 M], добавлен 02.12.2013Выбор факторных признаков для построения регрессионной модели неоднородных экономических процессов. Построение диаграммы рассеяния. Анализ матрицы коэффициентов парной корреляции. Определение коэффициентов детерминации и средних ошибок аппроксимации.
контрольная работа [547,6 K], добавлен 21.03.2015Анализ построенной модели на мультиколлинеарность на основе показателей, характеризующих социально-экономическое развитие городов и районов Оренбургской области. Построение линейной зависимости или корреляции между двумя и более объясняющими переменными.
лабораторная работа [99,6 K], добавлен 03.02.2015Определение парных коэффициентов корреляции и на их основе факторов, оказывающих наибольшее влияние на результативный показатель. Анализ множественных коэффициентов корреляции и детерминации. Оценка качества модели на основе t-статистики Стьюдента.
лабораторная работа [890,1 K], добавлен 06.12.2014Статистический и корреляционный анализ активов, пассивов, прибыли, ВВП. Выбор формы моделей, отражающих зависимости между показателями. Построение и анализ регрессионной модели на основании реальных статистических данных, построение уравнения регрессии.
курсовая работа [494,7 K], добавлен 20.11.2013Эконометрика как одна из базовых дисциплин экономического образования во всем мире. Прогноз социально-экономических показателей, характеризующих состояние и развитие анализируемой системы. Понятие и построение модели парной регрессии и корреляции.
контрольная работа [633,2 K], добавлен 10.12.2013Построение качественной и адекватной эконометрической модели по методу наименьших квадратов и ее анализ на наличие автокорреляции, мультиколлинеарности, гетероскедастичности с применением статистики Дарвина-Уотсона, тестов Парка и Голдфелда-Квандта.
курсовая работа [434,0 K], добавлен 04.12.2013Построение и анализ однофакторной и многофакторной эконометрической модели. Вычисление парных и частичных коэффициентов корреляции. Проверка адекватности модели по критерию Фишера. Исследование наличия мультиколлениарности по алгоритму Феррара-Глобера.
контрольная работа [172,4 K], добавлен 28.05.2010- Использование корреляционно-регрессионного анализа для обработки экономических статистических данных
Расчет стоимости оборудования с использованием методов корреляционного моделирования. Метод парной и множественной корреляции. Построение матрицы парных коэффициентов корреляции. Проверка оставшихся факторных признаков на свойство мультиколлинеарности.
задача [83,2 K], добавлен 20.01.2010 Статистический анализ по выборке. Проведение регрессионного анализа исходных данных и выбор аналитической формы записи производственной функции. Выполнение экономического анализа в выбранной регрессионной модели на основе коэффициентов эластичности.
курсовая работа [2,2 M], добавлен 22.07.2015Построение линейной модели зависимости цены товара в торговых точках. Расчет матрицы парных коэффициентов корреляции, оценка статистической значимости коэффициентов корреляции, параметров регрессионной модели, доверительного интервала для наблюдений.
лабораторная работа [214,2 K], добавлен 17.10.2009Построение уравнения регрессии, учитывающего взаимодействия факторов, проверка полученной модели на адекватность. Построение математической модели и нахождение численных значений параметров этой модели. Вычисление коэффициентов линейной модели.
курсовая работа [1005,0 K], добавлен 07.08.2013Изучение методов моделирования и анализа панельных данных. Построение ABC-XYZ классификации среди данных широкой номенклатуры по товарным запасам торгового предприятия. Виды исходных данных и построение на их основе модели регрессии по панельным данным.
курсовая работа [363,2 K], добавлен 23.02.2015Выбор факторных признаков для двухфакторной модели с помощью корреляционного анализа. Расчет коэффициентов регрессии, корреляции и эластичности. Построение модели линейной регрессии производительности труда от факторов фондо- и энерговооруженности.
задача [142,0 K], добавлен 20.03.2010Построение уравнения регрессии. Эластичность степенной модели. Уравнение равносторонней гиперболы. Оценка тесноты связи, качества и точности модели. Индекс корреляции и коэффициент детерминации. Оценка статистической значимости регрессионных уравнений.
курсовая работа [1,3 M], добавлен 25.03.2015Правила построения экономико-математической модели влияния технико-экономических показателей работы предприятия на фондоотдачу. Проверка отсутствия мультиколлинеарности. Расчет коэффициента автокорреляции. Построение модели в стандартизированном виде.
контрольная работа [193,1 K], добавлен 18.11.2010Выявление производственных связей на основе регрессионных моделей. Расчет прогнозных значений показателей, при уровне факторных показателей, на 30% превышающем средние величины исходных данных. Использование коэффициента корреляции рангов Спирмэна.
задача [58,5 K], добавлен 11.07.2010Оценка тесноты связи с помощью показателей корреляции и детерминации. Построение поля корреляции и расчёт параметров линейной регрессии. Результаты вычисления функций и нахождение коэффициента детерминации. Регрессионный анализ и прогнозирование.
курсовая работа [1,1 M], добавлен 07.08.2011Построение эконометрической модели, описывающей линейную зависимость результативного признака факторов, входящих в нее, методом матрицы. Проверка ее на адекватность по критерию Фишера. Определение дисперсии, ковариации, корреляции и детерминации.
контрольная работа [180,5 K], добавлен 03.12.2014