Построение модели множественной регрессии экономического процесса
Изучение влияния факторов на производительность труда. Построение уравнения регрессии и распределения. Определение значимости коэффициентов парной корреляции. Проверка случайности колебаний уровней остаточной последовательности. Оценка точности модели.
Рубрика | Экономико-математическое моделирование |
Вид | лабораторная работа |
Язык | русский |
Дата добавления | 04.10.2016 |
Размер файла | 81,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://allbest.ru
Автономное образовательное учреждение высшего профессионального образования Ленинградской области «Государственный институт экономики, финансов, права и технологий»
Кафедра информационных технологий и высшей математики
Дисциплина: Эконометрика
Лабораторная работа
Тема: «Построение модели множественной регрессии экономического процесса
Выполнила студентка 3 курса
Паршева Анастасия
Руководитель: Пучков В.Ф.
г. Гатчина
2016 г.
Содержание
Введение
Глава 1. Постановка задачи
Глава 2. Алгоритм вычисления показателей уравнения линейной регрессии
2.1 Сравнительная оценка влияния факторов (хji) на производительность труда (у) и взаимосвязь факторов (хji) между собой
2.2 Проверка значимости коэффициентов парной корреляции
2.3 Построение уравнения регрессии
Глава 3. Алгоритм расчетов по проверке свойств остаточной последовательности
3.1 Проверка случайности колебаний уровней остаточной последовательность
3.2 Проверка соответствия распределения случайной компоненты нормальному закону распределения
3.3 Проверка равенства математического ожидания случайной компоненты нулю
3.4 Проверка независимости значений уровней случайной компоненты
3.5 Определение точности модели
Заключение
Список использованной литературы
Введение
В настоящее время анализ хозяйственной деятельности осуществляется с применением математических методов и ЭВМ, при этом широко используется экономико-математическое моделирование реальных экономических процессов.
Центральной проблемой эконометрии является построение математической модели и определение возможностей ее использования для описания, анализа и прогнозирования реальных экономических процессов. Получение уравнения регрессии фактически означает построение математической модели изучаемого объекта.
Математические модели широко применяются в бизнесе, экономике, общественных науках, исследовании экономической активности и даже в исследовании политических процессов.
Задачей данной работы является построение модели множественной регрессии экономического процесса и проведение последующего анализа как самой модели, так и исследуемого процесса при различных исходных данных.
производительность регрессия корреляция
Глава 1. Постановка задачи
Анализ хозяйственной деятельности с применением математических методов и вычислительной техники - одно из направлений оптимизации планирования и анализа функционирования экономики.
Сущность этого направления состоит в экономической постановке рассматриваемых задач и последующем переводе их описания с естественно-экономического языка на язык формально-математический путем построения экономико-математических моделей, адекватных основному содержанию экономического процесса.
Методика экономико-математического анализа основывается на построении многофакторных корреляционных моделей формирования уровня основных экономических показателей и включает в себя следующие этапы:
1. Выбор, исходя из целей исследования, изучаемого показателя эффективности хозяйственной деятельности, принимаемого за функциональный, то есть результативный признак.
2. Отбор факториальных показателей, то есть аргументов, находящихся предположительно в корреляционной связи с выбранным функциональным показателем.
3. Выбор и обоснование типа поверхности регрессии, то есть определение формы связи функционального и факториальных показателей.
4. Сбор и первичная обработка необходимых статистических данных, определение объема совокупности.
5. Решение полученной многофакторной корреляционной линейной модели на ЭВМ.
6. Экономико-математический анализ результатов решений.
В нашем случае имеется довольно обширная генеральная совокупность предприятий некоторой однородной с точки зрения основных экономических показателей отрасли.
Из этой совокупности произведена случайная выборка 20 предприятий. По каждому предприятию известны следующие показатели:
1. y - производительность труда (тыс. руб./чел.)
2. x - энерговооруженность (кВт/чел.)
3. x - фондовооруженность труда (тыс. руб./чел.)
4. x - % прибыли (тыс. руб./чел.)
Производительность труда - эффективность конкретного труда, которая измеряется количеством изделий, операций, созданных или совершенных в единицу времени, или величиной времени, затрачиваемого на единицу продукта труда.
Энерговооруженность труда - показатель, характеризующий вооруженность труда всеми видами энергии. Используют потенциальный и фактический коэффициенты энерговооруженности труда.
Фондовооруженность - показатель, характеризующий оснащенность работников предприятия или отрасли сферы материального производства основными производственными фондами.
% прибыли - это доля прибыли, которая идёт на дополнительную оплату труда.
Производительность труда принимается за функциональный, т.е. результативный признак и обозначается через y. Фондовооруженность, энерговооруженность и % прибыли - факториальные показатели, т.е. аргументы, находящиеся в корреляционной связи с выбранным функциональным показателем. Энерговооруженность, фондовооруженность и % прибыли обозначаются соответственно через x,x,x.
Заданное уравнение регрессии имеет вид:
y=a+bx+bx+bx
Цель задачи для выбранного варианта совокупности предприятий - найти: коэффициенты линейной регрессии в заданном уравнении (a, b, b, b), т.е. доказать, что энерговооруженность, фондовооруженность и % прибыли находятся в корреляционной связи с производительностью труда.
Значения yi , x1i, x2i, x3i представлены в таблице №1(исходные данные).
Таблица №1
№ набл. |
Производительность (y) |
Энерговооружённсоть (x1) |
Фондовооружённость (x2) |
Процент прибыли(х3) |
|
1 |
78,33 |
30 |
100 |
4,4 |
|
2 |
66,639 |
32 |
120 |
3,3 |
|
3 |
92,07 |
37 |
170 |
6,05 |
|
4 |
183,5 |
55 |
230 |
12,1 |
|
5 |
245,3 |
65 |
350 |
19,25 |
|
6 |
95,42 |
33 |
170 |
4,95 |
|
7 |
65,63 |
35 |
150 |
1,815 |
|
8 |
158,3 |
40 |
260 |
12,1 |
|
9 |
257,2 |
69 |
470 |
17,05 |
|
10 |
373,65 |
77 |
550 |
24,2 |
|
11 |
214,15 |
65 |
356 |
13,75 |
|
12 |
342,38 |
80 |
771 |
22,55 |
|
13 |
400,13 |
63 |
333 |
36 |
|
14 |
352,8 |
41 |
128 |
39,05 |
|
15 |
337,68 |
95 |
781 |
15,4 |
|
16 |
312,67 |
71 |
357 |
25,85 |
|
17 |
405,25 |
67 |
444 |
31,35 |
|
18 |
264,3 |
45 |
269 |
19,8 |
|
19 |
494,654 |
79 |
666 |
39,05 |
|
20 |
140,6 |
34 |
212 |
9,9 |
Глава 2. Алгоритм решения
2.1 Оценка влияния энерговооруженности, фондовооруженности и % прибыли на производительность труда. Расчет матрицы коэффициентов парной корреляции
Введем исходные данные и представим таблицу исходных данных как указано в методическом указании.
Произведем сравнительную оценку влияния различных факторов (x) на производительность труда (y). Для оценки необходимо использовать значения парной корреляции (r).
Для нахождения матрицы коэффициентов парной корреляции используем «Сервис» - «Анализ данных» - «Корреляция».
Затем в диалоговом окне «Корреляция» в поле «Входной интервал» вводим ссылку на ячейки, содержащие анализируемые данные, включая названия реквизитов.
Ссылка должна состоять как минимум из двух смежных диапазонов данных, организованных в виде столбцов или строк.
В данном случае мы выделяем Таблицу 2, исключая столбец «№ наблюдения».
Устанавливаем метки в окне «Метки в первой строке», так как первая строка во входном диапазоне содержит название столбцов, и «По столбцам».
Выбираем параметры вывода «Новый рабочий лист». В результате проделанных действий получаем результаты анализа в виде Таблицы 2.
Основная задача, стоящая при выборе факторов включаемых в корреляционную модель, заключается в том, чтобы ввести в анализ все основные факторы, влияющие на уровень изучаемого явления так, чтобы колеблемость этих факторов объясняла подавляющую часть колеблемости результативного признака.
Однако, введение в модель большого числа факторов нецелесообразно, правильнее отобрать только сравнительно небольшое число основных факторов, находящихся предположительно в корреляционной связи с выбранным функциональным показателем.
Таблица №2 Матрица коэффициентов парной корреляции
Производительность (у) |
Энерговооруженность(х1) |
Фондовооруженность (х2) |
% прибыли(х3) |
||
Производительность (у) |
1 |
||||
Энерговоруженность (х1) |
0,78865635 |
1 |
|||
Фондовооруженность (х2) |
0,720611977 |
0,927487834 |
1 |
||
%прибыли(х3) |
0,93589131 |
0,559713688 |
0,456713809 |
1 |
Это можно сделать с помощью двухстадийного отбора. В соответствии с ним в модель включаются все предварительно отобранные факторы. Затем среди них на основе специальной количественной оценки и дополнительно качественного анализа выявляются несущественно влияющие факторы, которые постепенно отбрасываются пока не останутся те, относительно которых можно утверждать, что имеющийся статистический материал согласуется с гипотезой об их совместном существенном влиянии на зависимую переменную при выбранной форме связи.
2.2 Проверка значимости коэффициентов парной корреляции
Для проверки значимости коэффициентов парной корреляции используют t-критерий Стьюдента.
Для этой цели требуется найти для каждого коэффициента парной корреляции значение t-критерия Стьюдента, который рассчитывается по формуле:
где r - значение коэффициента парной корреляции;
n - число наблюдений (n = 20).
Значения коэффициентов парной корреляции представлены в Таблице 3
Таблица №3 Проверка значимости коэффициентов парной корреляции, используя t - критерий Стьюдента
Производительность (у) |
Энерговооруженность (х1) |
Фондовооруженность (х2) |
%прибыли(х3) |
||
Производительность (у) |
1 |
||||
Энерговоруженность(х1) |
0,839184 |
1 |
|||
Фондовооруженность(х2) |
0,787004 |
0,927488 |
1 |
||
% прибыли(х3) |
0,89576 |
0,559056 |
0,455702 |
1 |
Затем сравним tф для каждого коэффициента парной корреляции с t-критическим (табличное значение) для 5 % уровня значимости (двустороннего) и числа степеней свободы v = n - 2 (в данном случае v = 18).
Если tф > tкр, то найденный коэффициент парной корреляции признается значимым. В модель включаются только те факторы, которые имеют коэффициент парной корреляции ryxj > 0,5. В случае, если между самими факторами коэффициент парной корреляции ryixj ? 0,8, для избежания мультиколлинеарности, в модель включается только один фактор, тот у которого больше ryxj.
В данной задаче все факторы имеют коэффициент парной корреляции ryxj > 0,5, следовательно в модель необходимо включить все факторы, однако у факторов энерговооруженности и фондовооруженности ryixj ? 0,8, поэтому их одновременное включение в модель нецелесообразно, т. к. они в определенной степени дублируют друг друга. Поэтому в данном случае в уравнение регрессии включаются факторы фондовооруженности и процента прибыли.
2.3 Построение уравнения регрессии
Для нахождения коэффициентов уравнения регрессии и статистических критериев, характеризующих значимость и точность найденного уравнения, применяем команды «Сервер» - «Анализ данных» - «Регрессия».
В диалоговом окне «Регрессия» в поле «Входной интервал Y» вводим ссылку на диапазон анализируемых, включая название реквизита. В нашем случае вводим данные по выбранным влияющим факторам (% прибыли и энерговооруженность). Устанавливаем «галочки» в окне «Метки», (так как первая строка входного интервала содержит заголовки) и «Уровень надежности». Затем устанавливаем переключатель: «Новый рабочий лист», и ставим «галочки» в окошках «Остатки» (для включения остатков в выходной диапазон) и «График остатков» (для построения диаграммы остатков для каждой независимой переменной).
После всех вышеперечисленных действий нажимаем кнопку «ОК» в диалоговом окне «Регрессия». Далее производим форматирование полученных результатов расчетов коэффициентов уравнения регрессии и статистических характеристик. Получаем следующие таблицы:
Таблица №4 Вывод итогов
Регрессионная статистика |
||
Множественный R |
0,992219571 |
|
R-квадрат |
0,984499676 |
|
Нормированный R-квадрат |
0,982676109 |
|
Стандартная ошибка |
17,18973281 |
|
Наблюдения |
20 |
R-квадрат - (коэффициент множественной детерминации). Он характеризует долю вариации (разброса) зависимой переменной (производительности труда), объясненной с помощью данного уравнения, т. е. обусловленной влиянием на нее отобранных, то есть включенных в модель факторов (процент прибыли и фондовооруженность).
Множественный R - коэффициент множественной корреляции, который служит основным показателем тесноты корреляционной связи. Данный коэффициент изменяется от 0 до 1. Если R=1, то связь между y с одной стороны и аргументами х2, х3 с другой стороны является функциональной и линейной. Если R=0, то отсутствует линейная корреляционная связь, что не исключает, однако наличие в этом случае нелинейной зависимости. Во всех случаях, то есть 0<R<1, считается, что между У и х2, х3 имеется более или менее сильная корреляционная зависимость.
Стандартная ошибка - это допустимое отклонение теоретического результатирующего фактора от фактического.
Таблица №5 Дисперсионный анализ
Дисперсионный анализ |
||||||
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
2 |
319052,3804 |
159526,1902 |
539,8756514 |
4,14855E-16 |
|
Остаток |
17 |
5023,277539 |
295,486914 |
|||
Итого |
19 |
324075,6579 |
В приведенной выше таблице df - число степеней свободы, которое определяется по формуле:
df = n- (k + 1),
где n - число строк в таблице исходных данных (в моем случае n = 20); k - число аргументов.
F - критерий Фишера. Значимость F - вероятность принятия «нулевой гипотезы» по всему уравнению в целом. Смысл заключается в том, что все коэффициенты линейной регрессии за исключением свободного члена равны нулю, и, следовательно, фактор хi не оказывает влияния на результат у.
Значение F-критерия признается достоверным, если оно больше табличного, тогда нулевая гипотеза отклоняется и уравнение регрессии признается значимым.
В данной задаче вероятность принятия нулевой гипотезы близка к нулю.
В таблице № 6 Р-Значение - это вероятность принятия «нулевой гипотезы» по каждому коэффициенту. В рассматриваемой задаче нулевую гипотезу можно отвергнуть.
Коэффициенты представляют собой значения свободного члена уравнения регрессии и коэффициентов уравнения регрессии.
t-статистика находится как отношение столбца «Коэффициенты» к столбцу «Стандартная ошибка».
Оценивается значимость коэффициентов регрессии. Эта оценка проводится путем проверки гипотезы о равенстве нулю k-го коэффициента регрессии (k = 1,2,..., m).
Таблица №6
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
||
Y-пересечение |
13,25158589 |
8,241763223 |
1,607858116 |
0,126278825 |
-4,137014393 |
30,64018616 |
-4,137014393 |
30,64018616 |
|
Фондовооружённость (x2) |
0,229630385 |
0,021040018 |
10,91398251 |
4,23358E-09 |
0,185239828 |
0,274020941 |
0,185239828 |
0,274020941 |
|
Процент прибыли (х3) |
8,477311156 |
0,37529758 |
22,58823826 |
4,05991E-14 |
7,685502483 |
9,26911983 |
7,685502483 |
9,26911983 |
Расчетное значение t-критерия с числом степеней свободы (n-m-1) находят путем деления k-го коэффициента регрессии на среднеквадратическое отклонение этого коэффициента, которое в свою очередь вычисляется как квадратная дисперсия остаточной компоненты и k-го диагонального элемента матрицы, обратной матрице системы нормальных уравнений относительно параметров модели.
Нижние 95% и верхние 95% - границы нахождения значений коэффициентов регрессии. Значения считаются экономически достоверными, если лежат в достаточно узком однознаковом диапазоне. Коэффициенты рассматриваемой регрессии удовлетворяют этому требованию.
Таблица №7 Вывод остатка
Наблюдение |
Предсказанное Производительность(y) |
Остатки |
|
1 |
73,51479345 |
4,815206552 |
|
2 |
68,78235887 |
-2,143358871 |
|
3 |
103,5764838 |
-11,50648379 |
|
4 |
168,6420394 |
14,85796063 |
|
5 |
256,8104603 |
-11,51046031 |
|
6 |
94,25144152 |
1,168558483 |
|
7 |
63,08246335 |
2,547536653 |
|
8 |
175,5309509 |
-17,23095091 |
|
9 |
265,7160219 |
-8,516021933 |
|
10 |
344,6992275 |
28,95077252 |
|
11 |
211,5630313 |
2,586968744 |
|
12 |
381,4599791 |
-39,0799791 |
|
13 |
394,9017056 |
5,228294364 |
|
14 |
373,6832758 |
-20,88327579 |
|
15 |
323,1435082 |
14,53649182 |
|
16 |
314,3681266 |
-1,698126633 |
|
17 |
380,9711815 |
24,27881853 |
|
18 |
242,8729203 |
21,42707972 |
|
19 |
497,2244228 |
-2,570422784 |
|
20 |
145,8586079 |
-5,2586079 |
Уравнение линейной регрессии будем определять для выбранных влияющих факторов:
у - производительность труда (тыс. руб./чел.)
х2 - фондовооруженность труда (квт/час)
х3 - % прибыли (тыс. руб./тыс. руб.)
Таким образом, искомое уравнение регрессии имеет вид:
Полученное уравнение описывает зависимость производительности труда от фондовооруженности и % прибыли.
После определения уравнения регрессии необходимо установить адекватность и точность полученной зависимости.
Четыре обязательных свойства «Остатков»: Для того чтобы полученное уравнение регрессии было адекватным необходимо, чтобы остаточная компонента удовлетворяла следующим свойствам:
1. Случайность колебаний уровней остаточной последовательности;
2. Соответствие распределения случайной компоненты нормальному закону распределения;
3. Равенство нулю математического ожидания случайной компоненты;
4. Независимость значений уровней случайной компоненты. Рассмотрим способы проверки этих свойств остаточной последовательности.
Глава 3. Алгоритм расчетов по проверке свойств остаточной последовательности
3.1 Проверка случайности колебаний уровней остаточной последовательности
Проверка случайности колебаний уровней остаточной последовательности означает проверку гипотезы о правильности выбора уравнения регрессии.
Используя найденное уравнение множественной регрессии, находим отклонение теоретически вычисленных значений производительности труда от фактических значений.
Для исследования случайности отклонений от уравнения регрессии находятся разности:
(i=1, 2,…,n)
?i - теоретически вычисленные значения производительности труда,
- остаточная компонента.
Характер этих отклонений изучается с помощью ряда непараметрических критериев. Одним из таких критериев является критерий серий, основанный на медиане выборки.
Ряд из величин располагают в порядке возрастания их значений и находят медиану полученного вариационного ряда, то есть серединное значение при n нечетном или среднюю арифметическую из 2-х соседних серединных значений при четном n.
Возвращаясь к исходной последовательности и сравнивая значения этой последовательности с , ставим знак "+", если значение превосходит медиану ( > ), и знак "-", если оно меньше медианы( < ). Соответственно, значение опускается, если =
Таким образом, получаем последовательность, состоящую из "+" и "-", общее число, которых не превосходит n.
Последовательность подряд идущих плюсов или минусов называется серией.
Для того чтобы последовательность была случайной выборкой, протяженность самой длинной серии не должна быть слишком большой, а общее количество серий слишком малым.
Обозначим протяженность самой длинной серии как kmax, а общее число серий через н. Выборка признается случайной, если выполняются следующие неравенства для 5%-ого уровня значимости:
Kmax < [3, 3 lg (n+1)]
где:
Kmax - протяженность самой длинной серии;
- общее число серий;
Если хотя бы одно из этих неравенств нарушается, то гипотеза о случайном характере отклонений уровней ряда от теоретических уровней отвергается и модель признается неадекватной.
Найдя описанным выше способом середину ряда, мы получили:
Em=-0,264784075
Расставив знаки, строим таблицу 7.
Таблица №7 Вывод остатка с расстановкой знаков
Наблюдение |
Предсказанное Производительность(y) |
Остатки |
||
1 |
73,51479345 |
4,815206552 |
+ |
|
2 |
68,78235887 |
-2,143358871 |
- |
|
3 |
103,5764838 |
-11,50648379 |
- |
|
4 |
168,6420394 |
14,85796063 |
+ |
|
5 |
256,8104603 |
-11,51046031 |
- |
|
6 |
94,25144152 |
1,168558483 |
+ |
|
7 |
63,08246335 |
2,547536653 |
+ |
|
8 |
175,5309509 |
-17,23095091 |
- |
|
9 |
265,7160219 |
-8,516021933 |
- |
|
10 |
344,6992275 |
28,95077252 |
+ |
|
11 |
211,5630313 |
2,586968744 |
+ |
|
12 |
381,4599791 |
-39,0799791 |
- |
|
13 |
394,9017056 |
5,228294364 |
+ |
|
14 |
373,6832758 |
-20,88327579 |
- |
|
15 |
323,1435082 |
14,53649182 |
+ |
|
16 |
314,3681266 |
-1,698126633 |
- |
|
17 |
380,9711815 |
24,27881853 |
+ |
|
18 |
242,8729203 |
21,42707972 |
+ |
|
19 |
497,2244228 |
-2,570422784 |
- |
|
20 |
145,8586079 |
-5,2586079 |
- |
Протяженность самой длиной серии Kmax = 2. Количество серий =14. Мы получаем:
Kmax = 2 < 4
Общее число серий = 14 > 6
Поскольку оба неравенства выполняются, то гипотеза о случайном характере отклонений уровней остаточной компоненты принимается и, следовательно, модель признается адекватной.
3.2 Проверка соответствия распределения случайной компоненты нормальному закону распределения
Проверка соответствия распределения случайной компоненты нормальному закону распределения производится обычно приближенно с помощью нахождения показателей асимметрии (г1) и эксцесса (г2). Так как изучаемые ряды, как правило, не очень велики, то это производится на основании сравнения найденных показателей с теоретическими. При нормальном распределении некоторой генеральной совокупности показатели ассиметрии и эксцесса должны быть равны 0 (г1 = 0, г2 = 0). При конечной выборке из генеральной совокупности показатели ассиметрии и эксцесса имеют отклонения от 0.
Для оценки соответствия выбранной совокупности данных нормальному закону распределения используется так называемая оценка показателей эксцесса и ассиметрии.
В качестве оценки ассиметрии и оценки эксцесса используются формулы:
где: 1 - выборочная характеристика асимметрии
2 - выборочная характеристика эксцесса
у - среднеквадратические ошибки ассиметрии и эксцесса.
Если одновременно выполняются неравенства:
Гипотеза о нормальном распределении случайной компоненты принимается.
При проверке соответствия распределения случайной компоненты нормальному закону распределения выполняются неравенства:
Следовательно, гипотеза о нормальном характере распределения случайной компоненты принимается и модель признается адекватной.
3.3 Проверка равенства математического ожидания случайной компоненты нулю
Проверка равенства математического ожидания случайной компоненты нулю осуществляется на основе t-критерия Стьюдента. Расчетное значение этого критерия находится по формуле:
где: -стандартное среднеквадратическое отклонение для этой последовательности;
Если расчетное значение t меньше табличного значения по статистике Стьюдента с заданным уровнем значимости и числом степеней свободы k = n-1, то гипотеза о равенстве нулю математического ожидания случайной последовательности принимается. В противном случае - отвергается, и модель считается неадекватной.
=8,24E-14
=16,25985942
=-7,32858E-15
T- критическое для 5% уровня значимости и числа свободы =n-2: 2,101
Полученное нами расчетное значение t меньше табличного значения t-статистики Стьюдента (tтабл=2,101). Следовательно, гипотеза о равенстве нулю математического ожидания случайной последовательности принимается, модель считается адекватной.
3.4 Проверка независимости значений уровней случайной компоненты
Проверка независимости значений уровней случайной компоненты осуществляется с целью выявления существующей автокорреляции остаточной последовательности, то есть зависимости последующего значения отклонения от предыдущего. Эта проверка может производиться по ряду критериев.
Наиболее распространенным является d-критерий Дарбина - Уотсона. Расчетное значение этого критерия определяется по формуле:
Расчетное значение d-критерия в интервале от 2 до 4 свидетельствует об отрицательной связи. В этом случае его надо преобразовать по формуле:
и в дальнейшем использовать значение d`. Расчетное значение критерия d или d' сравнивается с верхним d2 и нижним d1 критическими значениями статистики Дарбина-Уотсона.
Для 5%-го уровня значимости эти значения для ряда количества определяемых параметров р приведены в таблице № 8:
Таблица №8
n |
p = 1 |
p = 2 |
p = 3 |
||||
d1 |
d2 |
d1 |
d2 |
d1 |
d2 |
||
15 |
1,08 |
1,36 |
0,95 |
1,54 |
0,82 |
1,75 |
|
20 |
1,20 |
1,41 |
1,10 |
1,54 |
1,00 |
1,68 |
|
30 |
1,35 |
1,49 |
1,28 |
1,57 |
1,21 |
1,65 |
Если расчетное значение критерия d больше верхнего табличного значения d2, то гипотеза о независимости уровней остаточной последовательности, то есть об отсутствии в ней автокорреляции, принимается.
Если расчетное значение d меньше нижнего табличного значения d1, то эта гипотеза отвергается и модель считается неадекватной.
Если значение d находится между значениями d1 и d2, включая сами эти значения, то считается, что нет достаточных оснований сделать тот или иной вывод и необходимы дальнейшие исследования, например, по большему числу наблюдений.
При проверке независимости значений уровней случайной компоненты расчеты по формуле d-критерия Дарбина - Уотсона дают следующее значение этого критерия:
Таблица №9
d |
2,279002847 |
|
d' |
1,720997153 |
|
d1 |
1,1 |
|
d2 |
1,54 |
Так как расчетное значение критерия d больше верхнего табличного значения d2, то гипотеза о независимости уровней остаточной последовательности, то есть об отсутствии в ней автокорреляции принимается.
Вывод об адекватности модели делается, если все 4 проверки свойств остаточной последовательности дают положительный результат. Для адекватных моделей имеет смысл ставить задачу оценки их точности.
3.5 Определение точности модели
Точность модели характеризуется величиной отклонения выхода модели от реального значения моделируемых переменных.
Если имеется табличный ряд моделируемой переменной, точность определяется как разность между значениями фактического уровня табличного ряда с его оценкой, полученной расчетным путем. При этом, в качестве статистических показателей точности, применяют следующие:
Среднеквадратичное отклонение:
где: yi - фактическое значение ряда
?i - теоретическое значение ряда
n - количество наблюдений
р - количество независимых параметров.
Недостаток данного показателя в том, что он зависит от масштаба результативного признака.
Средняя относительная ошибка аппросимации:
Коэффициент сходимости:
Коэффициент сходимости показывает долю изменения у, которая не объясняется изменением, включенных в уравнение регрессии факторов.
Коэффициент детерминации:
R2 = 1 -
Этот коэффициент показывает какой % изменения y объясняется изменением включенных в уравнение регрессии факторов х.
Таблица №10
у |
16,70541752 |
|
еоm |
134828,9 |
|
ц2 |
0,0165181 |
|
R2 |
0,983482 |
Полученное значение R2 = 0,983482 подтверждает достоверность наличия зависимости между у и х. Также равенство коэффициента детерминации, полученного при определении точности модели с его значением в таблице «Регрессионная статистика» свидетельствует о правильности произведенных вычислений.
На основании указанных показателей можно сделать выбор из нескольких адекватных моделей наиболее точную. Хотя может встретиться случай, когда по некоторому показателю более точна одна модель, а по другому - другая модель.
Заключение
Множественная регрессия широко используется для решения целого ряда вопросов эконометрики.
Мы провели экономический анализ полученных результатов и убедились в том, что:
наличие зависимости между Xi и Y является достоверной;
имеется сильная корреляционная зависимость между Y и Xi;
коэффициенты регрессии являются значимыми.
Таким образом, модель может быть признана адекватной. В целом данное уравнение можно использовать для определения по нему расчетного значения производительности труда, так как случайные ошибки коэффициентов будут взаимопогашаться.
При проверке свойств остаточной последовательности, которые были выделены существенными для исследуемого явления, принимаются:
гипотеза о случайном характере отклонений уровней остаточной последовательности;
гипотеза о характере распределения случайной компоненты по нормальному закону распределения;
гипотеза о равенстве нулю математического ожидания случайной последовательности;
гипотеза о независимости уровней случайной компоненты.
Таким образом, остаточная последовательность удовлетворяет всем свойствам случайной компоненты временного ряда.
Модель можно использовать только для ориентировочных расчетов, т.к. она дает лишь некоторую оценку истинного значения этих величин в генеральной совокупности.
Список использованной литературы
1. Доугерти К. «Введение в эконометрику»: Пер. с анг. - М.: ИНФРА-М, 2010.
2. Елисеева И.И. «Эконометрика»: Учебник - М.: Финансы и статистика, 2001.
3. Пучков В.Ф. «Решение управленческих задач средствами экономико-математического моделирования»: Уч. Пособие. Ч.1. - Гатчина: Изд-во ГИЭФПТ, 2012.
Размещено на Allbest.ru
...Подобные документы
Описание классической линейной модели множественной регрессии. Анализ матрицы парных коэффициентов корреляции на наличие мультиколлинеарности. Оценка модели парной регрессии с наиболее значимым фактором. Графическое построение интервала прогноза.
курсовая работа [243,1 K], добавлен 17.01.2016Выбор факторных признаков для двухфакторной модели с помощью корреляционного анализа. Расчет коэффициентов регрессии, корреляции и эластичности. Построение модели линейной регрессии производительности труда от факторов фондо- и энерговооруженности.
задача [142,0 K], добавлен 20.03.2010Построение модели множественной линейной регрессии по заданным параметрам. Оценка качества модели по коэффициентам детерминации и множественной корреляции. Определение значимости уравнения регрессии на основе F-критерия Фишера и t-критерия Стьюдента.
контрольная работа [914,4 K], добавлен 01.12.2013Определение параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel. Методика расчета показателей парной нелинейной регрессии и корреляции. Вычисление значений линейных коэффициентов множественной детерминации.
контрольная работа [110,4 K], добавлен 28.07.2012Построение уравнения множественной регрессии в линейной форме с полным набором факторов, отбор информативных факторов. Проверка значимости уравнения регрессии по критерию Фишера и статистической значимости параметров регрессии по критерию Стьюдента.
лабораторная работа [217,9 K], добавлен 17.10.2009Построение линейной модели и уравнения регрессии зависимости цены на квартиры на вторичном рынке жилья в Москве в 2006 г. от влияющих факторов. Методика составления матрицы парных коэффициентов корреляции. Экономическая интерпретация модели регрессии.
лабораторная работа [1,8 M], добавлен 25.05.2009Построение эконометрической модели спроса в виде уравнений парной и множественной регрессии. Отбор факторов для построения функции потребления. Расчет коэффициентов корреляции и детерминации, проверка правильности выбранных факторов и формы связи.
контрольная работа [523,7 K], добавлен 18.08.2010Расчет матрицы парных коэффициентов корреляции и статистической значимости коэффициентов регрессии. Оценка статистической значимости параметров регрессионной модели с помощью t-критерия. Уравнение множественной регрессии со статистически факторами.
лабораторная работа [30,9 K], добавлен 05.12.2010Определение количественной зависимости массы пушного зверька от его возраста. Построение уравнения парной регрессии, расчет его параметров и проверка адекватности. Оценка статистической значимости параметров регрессии, расчет их доверительного интервала.
лабораторная работа [100,5 K], добавлен 02.06.2014Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.
контрольная работа [1,6 M], добавлен 14.05.2008Анализ метода наименьших квадратов для парной регрессии, как метода оценивания параметров линейной регрессии. Рассмотрение линейного уравнения парной регрессии. Исследование множественной линейной регрессии. Изучение ошибок коэффициентов регрессии.
контрольная работа [108,5 K], добавлен 28.03.2018Построение уравнения регрессии, учитывающего взаимодействия факторов, проверка полученной модели на адекватность. Построение математической модели и нахождение численных значений параметров этой модели. Вычисление коэффициентов линейной модели.
курсовая работа [1005,0 K], добавлен 07.08.2013Основы построения и тестирования адекватности экономических моделей множественной регрессии, проблема их спецификации и последствия ошибок. Методическое и информационное обеспечение множественной регрессии. Числовой пример модели множественной регрессии.
курсовая работа [3,4 M], добавлен 10.02.2014Основные параметры уравнения регрессии, оценка их параметров и значимость. Интервальная оценка для коэффициента корреляции. Анализ точности определения оценок коэффициентов регрессии. Показатели качества уравнения регрессии, прогнозирование данных.
контрольная работа [222,5 K], добавлен 08.05.2014Факторы, формирующие цену квартир в строящихся домах в Санкт-Петербурге. Составление матрицы парных коэффициентов корреляции исходных переменных. Тестирование ошибок уравнения множественной регрессии на гетероскедастичность. Тест Гельфельда-Квандта.
контрольная работа [1,2 M], добавлен 14.05.2015Построение модели для зависимой переменной, используя пошаговую множественную регрессию. Рассчет индекса корреляции, оценка качества полученного уравнения регрессии с помощью коэффициента детерминации. Оценка статистической значимости уравнения регрессии.
лабораторная работа [2,1 M], добавлен 25.05.2009Понятие регрессии. Оценка параметров модели. Показатели качества регрессии. Проверка статистической значимости в парной линейной регрессии. Реализация регрессионного анализа в программе MS Excel. Условия Гаусса-Маркова. Свойства коэффициента детерминации.
курсовая работа [233,1 K], добавлен 21.03.2015Расчет параметров уравнения линейной регрессии, экономическая интерпретация ее коэффициента. Проверка равенства математического ожидания уровней ряда остатков нулю. Построение степенной модели парной регрессии. Вариация объема выпуска продукции.
контрольная работа [771,6 K], добавлен 28.04.2016Построение доверительного интервала для коэффициента регрессии. Определение ошибки аппроксимации, индекса корреляции и F-критерия Фишера. Оценка эластичности изменения материалоемкости продукции. Построение линейного уравнения множественной регрессии.
контрольная работа [250,5 K], добавлен 11.04.2015Построение уравнения регрессии. Эластичность степенной модели. Уравнение равносторонней гиперболы. Оценка тесноты связи, качества и точности модели. Индекс корреляции и коэффициент детерминации. Оценка статистической значимости регрессионных уравнений.
курсовая работа [1,3 M], добавлен 25.03.2015