Главная Коллекция "Revolution" Экономико-математическое моделирование Построение множественных регрессионных моделей

Построение множественных регрессионных моделей

Подготовка данных и построение модели. Корреляционный анализ экономических показателей. Расчёт частных и множественных коэффициентов корреляции. Построение регрессионной модели и её интерпретация. Проверка исходных данных на мультиколлинеарность.

Рубрика	Экономико-математическое моделирование
Вид	курсовая работа
Язык	русский
Дата добавления	16.01.2016
Размер файла	635,9 K

посмотреть текст работы

скачать работу можно здесь

полная информация о работе

весь список подобных работ

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Страница:

Размещено на http://www.allbest.ru/

Содержание

Введение

1. Подготовка данных и построение модели

2. Корреляционный анализ экономических показателей

2.1 Построение матрицы парных коэффициентов корреляции

2.2 Расчёт частных коэффициентов корреляции

2.3 Расчёт множественных коэффициентов корреляции

3. Регрессионный анализ экономических показателей

3.1 Проверка исходных данных на мультиколлинеарность

3.2 Построение регрессионной модели и её интерпретация

3.3 Сравнение исходных данных с рассчитанными по уравнению регрессии

Заключение

Список литературы

Введение

корреляционный экономический мультиколлинеарность

Актуальность темы работы обусловлена тем, что множественная регрессия используется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах и целом ряде других вопросов эконометрики. Множественная регрессия является одним из наиболее распространенных методов в эконометрике. Основной целью множественной регрессии является построение модели с большим числом факторов, при этом определив влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.

Построение множественных регрессионных моделей используется в анализе информации, собираемой в процессе эмпирических социологических исследований, представляет собой не просто совокупность технических приемов и методов, позволяющих в той или иной форме визуализировать полученные данные. Анализ данных является ключевым этапом всего исследования, в ходе которого происходит непосредственная проверка соответствия собранной информации тем моделям социальных явлений, которые, явно или латентно, имеются у социологов. И более того, в ходе анализа формулируются и проверяются новые модели, адекватно отражающие те закономерности, которые есть в собранных данных. Большаков А.А. Методы обработки многомерных данных и временных рядов: учебное пособие для вузов / А.А. Большаков. - М.: Горячая линия-Телеком, 2007. - с. 102.

Методы корреляционного и регрессионного анализов призваны решать такие задачи, как оценка взаимосвязи показателей и моделирование их зависимости для дальнейшего прогнозирования.

Данные методы статистической обработки данных реализованы во многих программных продуктах и статистических пакетах анализа переменных. Но в настоящее время Microsoft Office, в состав которого входит ППП Microsoft Excel, имеет наибольшее распространение и доступен всем пользователям современных компьютеров, в отличие от многих специальных статистических пакетов.

Для анализа взаимосвязи показателей эффективности производства продукции для курсовой работы были предоставлены показатели производственно-хозяйственной деятельности 50 предприятий машиностроения.

В данной курсовой работе будет проводиться анализ взаимосвязи данных экономических показателей и моделирование их зависимости с целью дальнейшего исследования.

Цель работы: рассмотреть уравнение множественной регрессии и условия его применения.

Задачи работы:

- рассмотреть общий вид модели множественной регрессии;

- выявить условия оценки параметров модели с помощью МНК;

- привести методику анализа статистической значимости параметров модели;

- рассмотреть примеры построения регрессионных моделей и оценку их качества.

Объект работы: теория и методы эконометрического анализа.

Предмет работы; уравнение множественной регрессии.

Теоретической и методологической основой исследования являются работы, посвященные теории, методологии и практике анализа данных.

Информационную базу исследования составляют специализированные статистические, официальные и информационные Интернет-материалы и другие информационные источники.

Теоретические знания, практические навыки, основные положения и выводы контрольной работы могут быть использованы при проведении профессиональных исследований в сфере социологии.

1. Подготовка данных и построение модели

Для статистического исследования в рамках курсовой работы необходимо подготовить данные в виде матрицы X размерностью (nЧk), столбцами которой будут k изучаемых переменных (не менее 5 переменных), а строками - их n значений (не менее 30 наблюдений).

Необходимо провести анализ взаимосвязи следующих экономических показателей:

Результативный признак:

Y - рентабельность;

Факторные признаки X_i:

X₈- премии и вознаграждения на одного работника;

X₁₀- фондоотдача;

X₁₅- оборачиваемость нормируемых оборотных средств;

X₁₆- оборачиваемость ненормируемых оборотных средств.

Исходные данные представлены в таблице 1.

Гипотеза. Предположим, что рассматриваемые признаки Y, X₈, X₁₀, X₁₅, X₁₆ в генеральной совокупности подчиняются нормальному закону распределения и указанные данные представляют выборку из этой генеральной совокупности.

Таблица 1. Исходные данные

№п/п	Y	X₈	X₁₀	X₁₅	X₁₆
1	13,26	1,23	1,45	166,32	10,08
2	10,16	1,04	1,3	92,88	14,76
3	13,72	1,8	1,37	158,04	6,48
4	12,85	0,43	1,65	93,96	21,96
5	10,63	0,88	1,91	173,88	11,88
6	9,12	0,57	1,68	162,3	12,6
7	25,83	1,72	1,94	88,56	11,52
8	23,39	1,7	1,89	101,16	8,28
9	14,68	0,84	1,94	166,32	11,52
10	10,05	0,6	2,06	140,76	32,4
11	13,99	0,82	1,96	128,52	11,52
12	9,68	0,84	1,02	177,84	17,28
13	10,03	0,67	1,85	114,48	16,2
14	9,13	1,04	0,88	93,24	13,32
15	5,37	0,66	0,62	126,72	17,28
16	9,86	0,86	1,09	91,8	9,72
17	12,62	0,79	1,6	69,12	16,2
18	5,02	0,34	1,53	66,24	24,84
19	21,18	1,6	1,4	67,68	14,76
20	25,17	1,46	2,22	50,4	7,56
21	19,4	1,27	1,32	70,56	8,64
22	21	1,58	1,48	72	8,64
23	6,57	0,68	0,68	97,2	9
24	14,19	0,86	2,3	80,28	14,76
25	15,81	1,98	1,37	51,48	10,08
26	5,23	0,33	1,51	105,12	14,76
27	7,99	0,45	1,43	128,52	10,44
28	17,5	0,74	1,82	94,68	14,76
29	17,16	0,03	2,62	85,32	20,52
30	14,54	0,99	1,75	76,32	14,4
31	6,24	0,24	1,54	153	24,84
32	12,08	0,57	2,25	107,64	11,16
33	9,49	1,22	1,07	90,72	6,48
34	9,28	0,68	1,44	82,44	9,72
35	11,42	1	1,4	79,92	3,24
36	10,31	0,81	1,31	120,96	6,48
37	8,65	1,27	1,12	84,6	5,4
38	10,94	1,14	1,16	85,32	6,12
39	9,87	1,89	0,88	101,52	8,64
40	6,14	0,67	1,07	107,64	11,88
41	12,93	0,96	1,24	85,32	7,92
42	9,78	0,67	1,49	131,76	10,08
43	13,22	0,98	2,03	116,64	18,72
44	17,29	1,16	1,84	138,24	13,68
45	7,11	0,54	1,22	156,96	16,56
46	22,49	1,23	1,72	137,52	14,76
47	12,14	0,78	1,75	135,72	7,92
48	15,25	1,16	1,46	155,52	18,36
49	31,34	4,44	1,6	48,6	8,28
50	11,56	1,06	1,47	42,84	14,04

2. Корреляционный анализ экономических показателей

2.1 Построение матрицы парных коэффициентов корреляции

Парные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными на фоне действия остальных показателей и являются самыми распространёнными показателями тесноты связи при статистическом анализе данных.

Отдельный выборочный коэффициент корреляции r_ij между двумя выбранными признаками X_i и X_j в Excel можно вычислить с помощью встроенных статистических функций КОРРЕЛ или ПИРСОН. Расчёт матрицы выборочных парных коэффициентов корреляции осуществляется в Excel с помощью пакета анализа данных. Елисеева И.И. Общая теория статистики: учебник для вузов / И.И. Елисеева, М.М. Юзбашев; под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2006. - с. 106.

Итак, получаем матрицу парных коэффициентов корреляции размерности kЧk (в нашем случае 5Ч5).

Таблица 2. Матрица парных коэффициентов корреляции исследуемых экономических показателей

	Y	X₈	X₁₀	X₁₅	X₁₆
Y	1	0,688511	0,450862	-0,32518	-0,21266
X₈	0,688511	1	-0,0929	-0,3302	-0,41979
X₁₀	0,450862	-0,0929	1	0,008075	0,278902
X₁₅	-0,32518	-0,3302	0,008075	1	0,206628
X₁₆	-0,21266	-0,41979	0,278902	0,206628	1

Теперь необходимо проверить значимость полученных коэффициентов корреляции, то есть гипотезу H₀: с=0. Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле:

и построим матрицу наблюдаемыx значений t-статистик для всех коэффициентов r_ij (таблица 3).

Наблюдаемые значения t-статистик необходимо сравнить с критическим значением t_кр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n-2.

Для этого используем встроенную функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность б=0,05 и число степеней свободы н=n-2=50-2=48.

Можно найти значения t_кр по таблицам математической статистики. Получаем t_кр= 2,010635.

Таблица 3. Матрица наблюдаемыx значений t-статистик парных коэффициентов корреляции исследуемых экономических показателей

t_набл	Y	X₈	X₁₀	X₁₅	X₁₆
Y		6,57746	3,49954	-2,38235	-1,50784
X₈	6,57746		-0,64641	-2,42367	-3,20439
X₁₀	3,49954	-0,64641		0,05595	2,01213
X₁₅	-2,3824	-2,42367	0,05595		1,46313
X₁₆	-1,50784	-3,20439	2,01213	1,46313

По результатам, представленным в таблице 3, наблюдаемое значение t-статистики больше критического t_кр по модулю для парных коэффициентов корреляции . Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, то есть соответствующие коэффициенты значимы.

Для остальных коэффициентов наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H₀ не отвергается, и это значит, что коэффициенты - незначимы.

Для проверки значимости парных коэффициентов корреляции можно также воспользоваться таблицами Фишера-Иейтса для нахождения критического значения r_кр для уровня значимости б=0,05 и числа степеней свободы н=n-2=50-2=48.

По таблице r_кр (б=0,05; н=48)=0,273.

Если соответствующий коэффициент |r_ij|>r_кр, то он считается значимым. Отметим в матрице парных коэффициентов корреляции значимые.

Таблица 4. Матрица парных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при б=0,05)

	Y	X₈	X₁₀	X₁₅	X₁₆
Y	1	0,688511	0,45086	-0,32518	-0,21266
X₈	0,688511	1	-0,09290	-0,3302	-0,41979
X₁₀	0,450862	-0,0929	1	0,008075	0,278902
X₁₅	-0,32518	-0,3302	0,00807	1	0,206628
X₁₆	-0,21266	-0,41979	0,27890	0,206628	1

Алгоритм построения интервальной оценки для генерального коэффициента корреляции следующий: Елисеева И.И. Общая теория статистики: учебник для вузов / И.И. Елисеева, М.М. Юзбашев; под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2006. - с. 167.

1). Z_r По найденному выборочному коэффициенту корреляции r с помощью Z-преобразования Фишера находят соответствующее значение Z_r , являющееся гиперболическим арктангенсом r:

Для этого в Excel есть встроенная функция ATANH, где в качестве аргумента вводится значение соответствующего выборочного коэффициента корреляции r. Следует учитывать, что Z-функция - нечетная, т.е. Z(-r)= - Z(r). Можно найти значение Z_r и по таблице Z-преобразования Фишера.

2). ДZ Найдём значение t_г, соответствующее заданной надёжности г=0,95. - значение функции Лапласа.

Для нахождения значения t_г можно использовать встроенную функцию Excel НОРМСТОБР. Необходимо заметить, что Excel с помощью функции НОРМСТОБР выдаёт не значения функции Лапласа, а значение функции распределения стандартного нормального закона F(t):

Поэтому при расчёте всех интервальных оценок нужно пересчитывать г=0,95 в , а по этому значению уже вычислять t.

В нашем случае для надёжности г=0,95: F(t)=0,975; t_г =1,959964.

Находим

3). Z_min и Z_max Теперь можно найти Z_min и Z_max:

Z_min = Z_r - ДZ; Z_max= Z_r + ДZ

4). с_min и с_max Наконец, использовав обратное преобразование Фишера, находят нижнюю и верхнюю границы для генерального коэффициента корреляции с_min и с_max , соответствующие Z_min и Z_max_.

Соответствующие значения с_min и с_maxявляются гиперболическими тангенсами Z_min и Z_max:

Для их нахождения в Excel используем встроенную функцию TANH, введя в качестве аргумента значения соответствующих Z_min и Z_max. Можно найти значения с_min и с_maxи по таблице Z-преобразования Фишера.

Построим с надёжностью г=0,95 и с учётом найденного доверительные интервалы для всех значимых парных коэффициентов корреляции, полученных нами. Расчёты представим в виде таблицы.

Таблица 5. Расчёт доверительных интервалов для парных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью г=0,95

	r	Z_r	Z_min	Z_max	с_min	с_max
yx₈	0,688511	0,845119	0,559229	1,131009	0,507405	0,811364
yx₁₀	0,450862	0,485782	0,199891	0,771672	0,197271	0,6479
yx₁₅	-0,32518	-0,33742	-0,62331	-0,05153	-0,55343	-0,05149
x₈x₁₅	-0,3302	-0,34306	-0,62895	-0,05717	-0,55733	-0,05711
x₈x₁₆	-0,41979	-0,44744	-0,73333	-0,16155	-0,6251	-0,16015
x₁₀x₁₆	0,278902	0,286491	0,000601	0,572381	0,000601	0,517106

Таким образом, доверительные интервалы с надёжностью г=0,95 для всех значимых парных генеральных коэффициентов корреляции выглядят следующим образом:

P(-0,507405? с_YX₈ ? 0,811364)=0,95

P(0,197271? с_YX₁₀ ? 0,6479)=0,95

P(-0,55343? с_YX₁₅ ? -0,05149)=0,95

P(-0,55733? с_X₈_X₁₅ ? -0,05711)=0,95

P(-0,6251? с_X₈_X₁₆ ? -0,16015)=0,95

P(0,000601? с_X₁₀_X₁₆ ? 0,517106)=0,95

По полученным данным можно сделать следующие выводы:

Между исследуемыми показателями выявлены значимые корреляционные зависимости.

1) Значимая корреляционная прямая взаимосвязь обнаружена между изучаемым признаком Y - рентабельностью и факторными признаками X₈ - премиями и вознаграждениями на одного работника и X₁₀ - фондоотдачей.

2) Между рентабельностью (Y) и оборачиваемостью нормируемых оборотных средств (X₁₅) существует обратная умеренная связь.

3) Более умеренная обратная связь существует между факторным признаком X₈ - премиями и вознаграждениями на одного работника и факторными признаками X₁₅ - оборачиваемостью нормируемых оборотных средств и X₁₆ - оборачиваемостью ненормируемых оборотных средств.

4) Так же умеренная прямая взаимосвязь обнаружена между X₁₀ - фондоотдачей и X₁₆ - оборачиваемостью ненормируемых оборотных средств.

2.2 Расчёт частных коэффициентов корреляции

Частные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными при исключении влияния остальных показателей, то есть они характеризуют «чистую» связь только между этими признаками. Они важны для понимания взаимодействия всего комплекса показателей, так как позволяют определить механизмы усиления-ослабления влияния переменных друг на друга.

Частный коэффициент (k-2)-го порядка между переменными, например, между Y и X₁, равен:

где R_ij - алгебраическое дополнение элемента r_ij корреляционной матрицы R, равное R_ij =(-1)^i+j ? M_ij

M_ij - минор элемента r_ij корреляционной матрицы R, т.е. определитель матрицы на 1 меньшего порядка, полученной из R путём вычёркивания i-й строки и j-го столбца. Таким образом, для расчёта частных коэффициентов корреляции нужно сформировать в Excel соответствующие матрицы размерности (k-1)Ч(k-1) (в нашем случае 4Ч4). Чтобы найти определители этих матриц, воспользуемся встроенной функцией Excel МОПРЕД, указав в качестве массива соответствующую матрицу переменных. Воспользовавшись этой функцией, получаем результаты в таблице 6:

Таблица 6. Алгебраические дополнения корреляционной матрицы

R11	0,670601	R12	-0,4591	R24	0,013062
R22	0,532685	R13	-0,35562	R25	0,05615
R33	0,369498	R14	0,06184	R34	-0,02413
R44	0,194005	R15	0,03629	R35	-0,07265
R55	0,220938	R23	0,240709	R45	-0,01472

Рассчитав выборочные частные коэффициенты корреляции, получаем матрицу следующего вида:

Таблица 7. Матрица выборочных частных коэффициентов корреляции исследуемых экономических показателей

	Y	X₈	X₁₀	X₁₅	X₁₆
Y	1	0,768136	0,714408	-0,17145	-0,09428
X₈	0,768136	1	-0,54256	-0,04063	-0,16368
X₁₀	0,714408	-0,54256	1	0,090117	0,254258
X₁₅	-0,17145	-0,04063	0,090117	1	0,071116
X₁₆	-0,09428	-0,16368	0,254258	0,071116	1

Теперь необходимо проверить значимость полученных частных коэффициентов корреляции, т.е. гипотезу H₀: с_ij_/{..}= 0.

Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле:

где l - порядок частного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин, а n - количество наблюдений.

При l = 3 построим матрицу наблюдаемыx значений t-статистик для всех коэффициентов r_ij_/{..}(таблица 8).

Таблица 8. Матрица наблюдаемыx значений t-статистик частных коэффициентов корреляции исследуемых экономических показателей

t_набл	Y	X₈	X₁₀	X₁₅	X₁₆
Y		8,047659	6,848919	-1,16739	-0,63529
X₈	8,047665		-4,33282	-0,27279	-1,11297
X₁₀	6,848926	-4,33282		0,606996	1,763575
X₁₅	-1,16739	-0,27279	0,606993		0,478273
X₁₆	-0,63529	-1,11298	1,763572	0,478272

Наблюдаемые значения t-статистик необходимо сравнить с критическим значением t_кр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n - l - 2. Для этого используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность б=0,05 и число степеней свободы н=n-l-2=50-3-2=45. (Можно найти значения t_кр по таблицам математической статистики).

Получаем t_кр=2,014103.

По результатам, представленным в таблице 7, наблюдаемое значение t-статистики больше критического t_кр по модулю для частных коэффициентов корреляции

Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, то есть соответствующие коэффициенты значимы.

Для остальных коэффициентов наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H₀ не отвергается, то есть они незначимы.

Для проверки значимости частных коэффициентов корреляции можно также воспользоваться таблицами Фишера-Иейтса для нахождения критического значения r_кр с учётом уровня значимости б=0,05 и числа степеней свободы н=n-l-2=50-3-2=45. По таблице r_кр (б=0,05; н=45)=0,288. Если соответствующий коэффициент |r|> r_кр, то он считается значимым.

Отметим в матрице частных коэффициентов корреляции значимые.

Таблица 9. Матрица частных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при б=0,05)

	Y	X₈	X₁₀	X₁₅	X₁₆
Y	1	0,768136	0,714408	-0,17145	-0,09428
X₈	0,768136	1	-0,54256	-0,04063	-0,16368
X₁₀	0,714408	-0,54256	1	0,090117	0,254258
X₁₅	-0,17145	-0,04063	0,090117	1	0,071116
X₁₆	-0,09428	-0,16368	0,254258	0,071116	1

Для значимых частных коэффициентов корреляции можно построить с заданной надёжностью г интервальную оценку с_min ? с ? с_maxс помощью Z-преобразования Фишера:

Алгоритм построения интервальной оценки для частного генерального коэффициента корреляции такой же, как и для парного; единственное отличие заключается в расчёте ДZ:

где l - порядок частного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=3), а n - количество наблюдений.

Построим с надёжностью г=0,95 и с учётом найденного доверительные интервалы для всех значимых частных коэффициентов корреляции, полученных нами. Расчёты представим в виде таблицы 10.

Таблица 10. Расчёт доверительных интервалов для частных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью г=0,95

	r	Z_r	Z_min	Z_max	с_min	с_max
yx₈	0,768136	1,015765	0,720289	1,311241	0,617089	0,864589
yx₁₀	0,714408	0,896129	0,600654	1,191605	0,537515	0,831076
x₈x₁₀	-0,54256	-0,60778	-0,90326	-0,31231	-0,71788	-0,30253

Таким образом, доверительные интервалы с надёжностью г=0,95 для всех значимых частных генеральных коэффициентов корреляции выглядят следующим образом:

P(0,617089? ? 0,864589)=0,95

P(0,537515? ? 0,831076)=0,95

P(-0,71788? ? -0,30253)=0,95

Теперь построим таблицу сравнения выборочных парных и частных коэффициентов корреляции для всех переменных.

Сравнение парных и частных коэффициентов играет важную роль в выявлении механизмов воздействия переменных друг на друга. Парный коэффициент корреляции показывает тесноту связи между двумя признаками на фоне действия остальных переменных, а частный характеризует взаимосвязь этих двух признаков при исключении влияния остальных переменных, то есть их «личную» взаимосвязь.

Таким образом, если оказывается, что парный коэффициент корреляции между двумя переменными по модулю больше соответствующего частного, то остальные переменные усиливают связь между этими двумя признаками. Соответственно, если парный коэффициент корреляции между двумя переменными по абсолютной величине меньше частного, то остальные признаки ослабляют связь между рассматриваемыми двумя.

Далее рассмотрим таблицу сравнения выборочных оценок парных и частных коэффициентов корреляции пар исследуемых показателей с выделением значимых коэффициентов при б=0,05, и по данным сделаем вывод о воздействии переменных друг на друга.

Таблица 11. Таблица сравнения выборочных оценок парных и частных коэффициентов корреляции пар исследуемых показателей с выделением значимых коэффициентов (при б=0,05)

Между переменными	Коэффициент корреляции
	парный	частный
Y X₈	0,688511	0,768136
Y X₁₀	0,450862	0,714408
Y X₁₅	-0,325176	-0,171447
Y X₁₆	-0,212659	-0,094281
X₈ X₁₀	-0,092898	-0,542564
X₈ X₁₅	-0,330204	-0,040631
X₈ X₁₆	-0,419788	-0,163675
X₂ X₁₅	0,008075	0,090117
X₁₀ X₁₆	0,278902	0,254258
X₁₅ X₁₆	0,206628	0,071116

По полученным данным можно сделать вывод, что выявлены следующие механизмы воздействия переменных друг на друга:

1. Наиболее сильная связь присутствует между изучаемым признаком Y - рентабельностью и факторным признаком X₈ - премиями и вознаграждениями на одного работника. Эта связь является прямой и весьма сильной и значимой, хотя частный коэффициент по модулю несколько больше парного. Таким образом, можно сделать вывод, что остальные переменные, включённые в корреляционную модель, ослабляют взаимосвязь между указанными факторными признаками.

2. Наиболее тесная связь наблюдается между изучаемым признаком Y - рентабельностью и факторным признаком фондоотдачей X₁₀. Влияние прочих переменных немного ослабляет значимую положительную связь между рентабельностью Y и фондоотдачей X₁₀.

Так же тесная связь наблюдается между изучаемым признаком Y - рентабельностью и факторным признаком X₁₅ - оборачиваемостью нормируемых оборотных средств, при этом наблюдается обратная зависимость. Поскольку парный коэффициент корреляции между двумя переменными по модулю больше соответствующего частного, то остальные переменные будут усиливать связь между данными двумя признаками.

Воздействие других переменных ослабляет отрицательную взаимосвязь между факторными признаками X₈ - премиями и вознаграждениями на одного работника и фондоотдачей X₁₀, так как абсолютная величина частного коэффициента корреляции превышает абсолютное значение парного коэффициента корреляции.

Противоположная ситуация наблюдается для обратной связи между рентабельностью Y и оборачиваемостью ненормируемых оборотных средств X₁₆. Поскольку абсолютная величина парного коэффициента корреляции по модулю превышает абсолютное значение частного коэффициента корреляции, отсюда можно сделать вывод, что воздействие других переменных будет усиливать отрицательную взаимосвязь между рентабельностью Y и оборачиваемостью ненормируемых оборотных средств X₁₆, хотя оба коэффициента корреляции являются незначимыми.

Поскольку парный коэффициент корреляции, хоть и не намного, но по модулю несколько больше частного коэффициента корреляции, влияние прочих переменных будет немного усиливать положительную связь между двумя факторными признаками - фондоотдачей X₁₀ и оборачиваемостью ненормируемых оборотных средств X₁₆.

Воздействие остальных переменных будет усиливать отрицательную взаимосвязь между факторным признаком X₈ - премиями и вознаграждениями на одного работника и факторным признаком X₁₅ - оборачиваемостью нормируемых оборотных средств.

Такая же ситуация наблюдается и в обратной взаимосвязи между факторными признаками X₈ - премиями и вознаграждениями на одного работника и X₁₆ - оборачиваемостью ненормируемых оборотных средств. То есть остальные переменные усиливают данную взаимосвязь.

2.3 Расчёт множественных коэффициентов корреляции

Множественные коэффициенты корреляции R_i_/{..} служат мерой связи одной переменной с совместным действием всех остальных показателей.

Вычислим точечные оценки множественных коэффициентов корреляции. Множественный коэффициент корреляции, например, для 1-го показателя Y вычисляется по формуле:

где |R| - определитель корреляционной матрицы R;

R_i_i - алгебраическое дополнение элемента r_i_iкорреляционной матрицы R.

Все алгебраические дополнения R_i_i были найдены на этапе расчёта частных коэффициентов корреляции, поэтому нам остается вычислить только определитель самой корреляционной матрицы. Чтобы найти определитель корреляционной матрицы, воспользуемся встроенной математической функцией Excel МОПРЕД.

Получим |R| = 0,166346.

Множественный коэффициент детерминации R²_i_/{..} (и его выборочная оценка r²_i_/{..}) показывает долю дисперсии рассматриваемой случайной величины, обусловленную влиянием остальных переменных, включённых в корреляционную модель. Соответственно (1- R²_i_/{..}) показывает долю остаточной дисперсии данной случайной величины, обусловленную влиянием других, не включённых в исследуемую модель факторов. Множественные коэффициенты детерминации получаются возведением соответствующих множественных коэффициентов корреляции в квадрат. Минашкин В.Г. Статистика: учебник для вузов / В.Г. Минашкин и др.; под ред. В.Г. Минашкина. - М.: Проспект, 2006. - с. 201.

Проверим значимость полученных множественных коэффициентов корреляции и детерминации.

Проверка значимости, т.е. гипотезы о равенстве нулю соответствующего множественного коэффициента корреляции, осуществляется с помощью статистики:

где l - порядок множественного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=4, например, ), а n - количество наблюдений.

Произведя расчёты, получим результаты в таблице 12.

Для определения значимости множественных коэффициентов корреляции и детерминации нужно найти критическое значение F-распределения для заданного уровня значимости б и числа степеней свободы числителя н₁=l и знаменателя н₂=n-l-1. Для определения F_кр можно воспользоваться встроенной функцией Excel FРАСПОБР, введя в предложенное меню вероятность б=0,05 и число степеней свободы н₁=l=4 и н₂=n-l-1=50-4-1=45. Так же можно найти значения F_кр по таблицам математической статистики.

Получаем F_кр(0,05; 4; 25)= 2,578739.

Таблица 12. Множественные коэффициенты корреляции и детерминации исследуемых показателей с выделением значимых коэффициентов (на уровне значимости б=0,05)

	R	R²	Fнабл
R_y/{…}=	0,867148	0,751945	34,10287
R_x1/{…}=	0,82929	0,687722	24,77562
R_x2/{…}=	0,741489	0,549806	13,73924
R_x3/{…}=	0,377582	0,142568	1,870579
R_x4/{…}=	0,497085	0,247094	3,692094

Если наблюдаемое значение F-статистики превосходит ее критическое значение F_кр=2,578739, то гипотеза о равенстве нулю соответствующего множественного коэффициента корреляции отвергается с вероятностью ошибки, равной 0,05. Следовательно, у нас все коэффициенты, кроме переменной X₁₅, значимо отличаются от нуля.

Полученные данные позволяют сделать следующие выводы:

Множественный коэффициент корреляции =0,8671 значим и имеет достаточно высокое значение, что говорит о том, показатель Y - рентабельность имеет тесную связь с многомерным массивом факторных признаков X₈ - премии и вознаграждения на одного работника, X₁₀- фондоотдача, X₁₅- оборачиваемость нормируемых оборотных средств и X₁₆ - оборачиваемость ненормируемых оборотных средств. Это даёт основание для проведения дальнейшего регрессионного анализа.

Множественный коэффициент детерминации r²_Y_/{..}=0,7519 показывает, что 75,19% доли дисперсии Y - объёма промышленной продукции, обусловлены изменениями факторных признаков.

Факторные признаки тоже имеют достаточно высокие значения множественных коэффициентов корреляции и детерминации, что говорит об их сильной взаимосвязанности, за исключением переменной X₁₅ - её множественный коэффициент не значим, и это подтверждается тем фактом, что только 14,26% доли её дисперсии обусловлены изменениями переменных, включённых в рассматриваемую модель, а, соответственно 85,74% дисперсии обусловлены влиянием других, не включённых в корреляционную модель остаточных факторов.

Итак, полученные результаты корреляционного анализа, показавшие, что показатель Y - рентабельность имеет тесную связь с многомерным массивом факторных признаков, позволяют перейти ко второму этапу статистического исследования - построению регрессионной модели.

3. Регрессионный анализ экономических показателей

После того как с помощью корреляционного анализа выявлено наличие статистически значимых связей между переменными и оценена степень их тесноты, переходят к математическому описанию конкретного вида зависимостей с использованием регрессионного анализа. Для этого подбирают класс функций, связывающий результативный показатель Y и аргументы X₁, X₂, X₃_,...X_k, отбирают наиболее информативные аргументы, вычисляют оценки неизвестных значений параметров уравнения связи и анализируют точность полученного уравнения.

Наиболее часто используется множественная линейная модель регрессионного анализа, уравнение которой имеет вид:

для всех i=1,2,…n, или в матричной форме:

Исследуем на основе линейной регрессионной модели зависимость рентабельности () от премий и вознаграждений на одного работника (X₈), фондоотдачи (X₁₀), оборачиваемости нормируемых оборотных средств (X₁₅) и оборачиваемости ненормируемых оборотных средств (X₁₆).

3.1 Проверка исходных данных на мультиколлинеарность

Одним из основных препятствий эффективного применения множественного регрессионного анализа является мультиколлинеарность. Она возникает в случаях существования достаточно тесных линейных статистических связей между объясняющими переменными X₁, X₂, X₃_,...X_k. В результате мультиколлинеарности матрица парных коэффициентов корреляции становится слабообусловленной, близкой к вырожденной.

Точных количественных критериев для определения наличия или отсутствия мультиколлинеарности не существует. Однако на практике о наличии мультиколлинеарности обычно судят по матрице парных коэффициентов корреляции.

Если один из элементов матрицы R больше 0,8 , т.е. | r_ij | > 0,8 , то считают, что имеет место мультиколлинеарность и в уравнение регрессии следует включать только один из показателей X_iили X_j(как правило, тот, который имеет наибольшую связь с Y).

Прежде, чем переходить к построению регрессионной модели, необходимо проверить объясняющие переменные на наличие мультиколлинеарности. Для этого рассмотрим матрицу парных коэффициентов корреляции между факторными признаками X_i.

Таблица 13. Матрица парных коэффициентов корреляции факторных признаков

	Y3	X₈	X₁₀	X₁₅	X₁₆
Y3	1	0,688511	0,450862	-0,32518	-0,21266
X₈	0,688511	1	-0,0929	-0,3302	-0,41979
X₁₀	0,450862	-0,0929	1	0,008075	0,278902
X₁₅	-0,32518	-0,3302	0,008075	1	0,206628
X₁₆	-0,21266	-0,41979	0,278902	0,206628	1

Поскольку значения коэффициентов корреляции для всех пар объясняющих переменных не превышают по модулю 0,8, то в нашем случае нет необходимости сокращать набор объясняющих переменных.

3.2 Построение регрессионной модели и её интерпретация

Будем использовать алгоритм пошагового регрессионного анализа с последовательным исключением незначимых регрессоров, пока все входящие в регрессионную модель факторы не будут иметь значимые коэффициенты. Построение и оценка регрессионной модели осуществляется в Excel с помощью модуля регрессии пакета анализа данных.

Приступим к анализу.

I ЭТАП РЕГРЕССИОННОГО АНАЛИЗА.

В модель включены все факторные признаки (X₈, X₁₀, X_15,X₁₆).

Результаты регрессионного анализа

Регрессионная статистика
Множественный R	0,86715
R-квадрат	0,75195
Нормированный R-квадрат	0,72990
Стандартная ошибка	3,00422
Наблюдения	50
Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	4	1231,157	307,7894	34,10287	4,27E-13
Остаток	45	406,1394	9,025321
Итого	49	1637,297

	Коэффициенты	Стандартная ошибка	t-статистика	P-Значение	Нижние 95%	Верхние 95%	Нижние 98,0%	Верхние 98,0%
Y-пересечение	-2,03350	2,58972	-0,78522	0,43644	-7,24946	3,18246	-8,28020	4,21320
X8	6,01042	0,74685	8,04766	2,9E-10	4,50618	7,51466	4,20892	7,81192
X10	7,32188	1,06906	6,84892	1,7E-08	5,16869	9,47507	4,74319	9,90057
X15	-0,01487	0,01274	-1,16739	0,24920	-0,04054	0,01079	-0,04561	0,01586
X16	-0,05583	0,08789	-0,63529	0,52846	-0,23285	0,12118	-0,26783	0,15616

В регрессионной статистике указываются множественный коэффициент корреляции (Множественный R) и детерминации (R-квадрат) между Y и массивом факторных признаков, что совпадает с полученными ранее значениями в корреляционном анализе.

Средняя часть таблицы (Дисперсионный анализ) необходима для проверки значимости уравнения регрессии.

Нижняя часть таблицы - точечные оценки b_iгенеральных коэффициентов регрессии в_i, проверка их значимости и интервальная оценка.

Оценка вектора коэффициентов b (столбец «Коэффициенты»):

Тогда оценка уравнения регрессии имеет вид:

Необходимо проверить значимость уравнения регрессии и полученных коэффициентов регрессии.

Проверим на уровне б=0,05 значимость уравнения регрессии, т.е. гипотезу H₀: в₁=в₂=в₃=…=в_k=0. Для этого рассчитывается наблюдаемое значение F-статистики:

Excel выдаёт это в результатах дисперсионного анализа:

В столбце F указывается значение F_набл.

По таблицам F-распределения или с помощью встроенной статистической функции FРАСПОБР для уровня значимости б=0,05 и числа степеней свободы числителя н₁=k=4 и знаменателя н₂=n-k-1=45 находим критическое значение F-статистики, равное F_кр= 2,578739.

Так как наблюдаемое значение F-статистики превосходит ее критическое значение 34,10287 > 2,578739, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора в=(в₁,в₂,в₃,в₄...

Страница:

курсовая работа "Построение множественных регрессионных моделей" скачать

Подобные документы

Пакет программ Майкрософт, как эффективное средство эконометрического анализа
Корреляционный и регрессионный анализ экономических показателей. Построение матрицы парных коэффициентов корреляции. Расчет и сравнение частных и парных коэффициентов корреляции. Построение регрессионной модели и её интерпретация, мультиколлинеарность.

курсовая работа [314,1 K], добавлен 21.01.2011
Построение регрессионной модели по панельным данным с помощью Excel
Теоретико-методологический подход к построению множественных регрессионных моделей. Моделирование и прогнозирование основных экономических показателей при использовании панельных данных. Исследование объемов продаж пяти предприятий с течением времени.

курсовая работа [2,0 M], добавлен 02.12.2013
Построение регрессионной модели экономической деятельности компаний нефтегазовой отрасли
Выбор факторных признаков для построения регрессионной модели неоднородных экономических процессов. Построение диаграммы рассеяния. Анализ матрицы коэффициентов парной корреляции. Определение коэффициентов детерминации и средних ошибок аппроксимации.

контрольная работа [547,6 K], добавлен 21.03.2015
Построение модели на мультиколлинеарность
Анализ построенной модели на мультиколлинеарность на основе показателей, характеризующих социально-экономическое развитие городов и районов Оренбургской области. Построение линейной зависимости или корреляции между двумя и более объясняющими переменными.

лабораторная работа [99,6 K], добавлен 03.02.2015
Построение классической линейной регрессии
Определение парных коэффициентов корреляции и на их основе факторов, оказывающих наибольшее влияние на результативный показатель. Анализ множественных коэффициентов корреляции и детерминации. Оценка качества модели на основе t-статистики Стьюдента.

лабораторная работа [890,1 K], добавлен 06.12.2014
Экономические модели зависимости величины активов, подверженных кредитному риску, от пассивов, прибыли (убытков), ВВП
Статистический и корреляционный анализ активов, пассивов, прибыли, ВВП. Выбор формы моделей, отражающих зависимости между показателями. Построение и анализ регрессионной модели на основании реальных статистических данных, построение уравнения регрессии.

курсовая работа [494,7 K], добавлен 20.11.2013
Корреляционно-регрессионный анализ, построение многофакторной регрессионной модели, ряд Фурье. Критерий Дарбина-Уотсона
Эконометрика как одна из базовых дисциплин экономического образования во всем мире. Прогноз социально-экономических показателей, характеризующих состояние и развитие анализируемой системы. Понятие и построение модели парной регрессии и корреляции.

контрольная работа [633,2 K], добавлен 10.12.2013
Построение и анализ качества регрессионной модели
Построение качественной и адекватной эконометрической модели по методу наименьших квадратов и ее анализ на наличие автокорреляции, мультиколлинеарности, гетероскедастичности с применением статистики Дарвина-Уотсона, тестов Парка и Голдфелда-Квандта.

курсовая работа [434,0 K], добавлен 04.12.2013
Построение и анализ однофакторной эконометрической модели
Построение и анализ однофакторной и многофакторной эконометрической модели. Вычисление парных и частичных коэффициентов корреляции. Проверка адекватности модели по критерию Фишера. Исследование наличия мультиколлениарности по алгоритму Феррара-Глобера.

контрольная работа [172,4 K], добавлен 28.05.2010
Использование корреляционно-регрессионного анализа для обработки экономических статистических данных
Расчет стоимости оборудования с использованием методов корреляционного моделирования. Метод парной и множественной корреляции. Построение матрицы парных коэффициентов корреляции. Проверка оставшихся факторных признаков на свойство мультиколлинеарности.

задача [83,2 K], добавлен 20.01.2010
Построение эконометрической модели производственной функции и ее анализ в среде Excel
Статистический анализ по выборке. Проведение регрессионного анализа исходных данных и выбор аналитической формы записи производственной функции. Выполнение экономического анализа в выбранной регрессионной модели на основе коэффициентов эластичности.

курсовая работа [2,2 M], добавлен 22.07.2015
Определение зависимости цены товара
Построение линейной модели зависимости цены товара в торговых точках. Расчет матрицы парных коэффициентов корреляции, оценка статистической значимости коэффициентов корреляции, параметров регрессионной модели, доверительного интервала для наблюдений.

лабораторная работа [214,2 K], добавлен 17.10.2009
Регрессионный анализ. Факторный эксперимент
Построение уравнения регрессии, учитывающего взаимодействия факторов, проверка полученной модели на адекватность. Построение математической модели и нахождение численных значений параметров этой модели. Вычисление коэффициентов линейной модели.

курсовая работа [1005,0 K], добавлен 07.08.2013
Модели панельных данных для групп складских запасов торгового предприятия, построенных на основе ABC-XYZ классификации
Изучение методов моделирования и анализа панельных данных. Построение ABC-XYZ классификации среди данных широкой номенклатуры по товарным запасам торгового предприятия. Виды исходных данных и построение на их основе модели регрессии по панельным данным.

курсовая работа [363,2 K], добавлен 23.02.2015
Построение двухфакторной модели, моделей парной линейной прогрессии и множественной линейной регрессии
Выбор факторных признаков для двухфакторной модели с помощью корреляционного анализа. Расчет коэффициентов регрессии, корреляции и эластичности. Построение модели линейной регрессии производительности труда от факторов фондо- и энерговооруженности.

задача [142,0 K], добавлен 20.03.2010
Эконометрика. Корреляционный анализ
Построение уравнения регрессии. Эластичность степенной модели. Уравнение равносторонней гиперболы. Оценка тесноты связи, качества и точности модели. Индекс корреляции и коэффициент детерминации. Оценка статистической значимости регрессионных уравнений.

курсовая работа [1,3 M], добавлен 25.03.2015
Взаимосвязь технико-экономических показателей работы предприятия и фондоотдачи
Правила построения экономико-математической модели влияния технико-экономических показателей работы предприятия на фондоотдачу. Проверка отсутствия мультиколлинеарности. Расчет коэффициента автокорреляции. Построение модели в стандартизированном виде.

контрольная работа [193,1 K], добавлен 18.11.2010
Прогнозирование на основе регрессионных моделей
Выявление производственных связей на основе регрессионных моделей. Расчет прогнозных значений показателей, при уровне факторных показателей, на 30% превышающем средние величины исходных данных. Использование коэффициента корреляции рангов Спирмэна.

задача [58,5 K], добавлен 11.07.2010
Однофакторный регрессионно-корреляционный анализ экономической модели
Оценка тесноты связи с помощью показателей корреляции и детерминации. Построение поля корреляции и расчёт параметров линейной регрессии. Результаты вычисления функций и нахождение коэффициента детерминации. Регрессионный анализ и прогнозирование.

курсовая работа [1,1 M], добавлен 07.08.2011
Построение многофакторной модели. Прогнозирование по однофакторной модели
Построение эконометрической модели, описывающей линейную зависимость результативного признака факторов, входящих в нее, методом матрицы. Проверка ее на адекватность по критерию Фишера. Определение дисперсии, ковариации, корреляции и детерминации.

контрольная работа [180,5 K], добавлен 03.12.2014

Другие документы, подобные "Построение множественных регрессионных моделей"

весь список подобных работ

скачать работу можно здесь

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.