Регрессионный анализ влияния ВВП на уровень безработицы
Сущность, виды и причины безработицы в России. Построение модели парной регрессии. Определение показателя эластичности. Вычисления критерия Дарбина-Уотсона и индекса Ласпейреса. Исследование остатков с применением предпосылок метода наименьших квадратов.
Рубрика | Экономико-математическое моделирование |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 18.06.2014 |
Размер файла | 501,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
(2.26)
Таким образом, принимается гипотеза об отсутствии гетероскедантичности остатков.
Один из более распространенных методов определения автокорреляции в остатках - это расчет критерия Дарбина-Уотсона.
Широко известная статистика Дарбина-Уотсона имеет следующий вид:
(2.27)
Таким образом, величина d=DW есть отношение суммы квадратов, разностей последовательных значений остатков к остаточной сумме квадратов по модели регрессии.
Итак, алгоритм выявления автокорреляции остатков на основе критерия Дарбина-Уотсона следующий:
- выдвигается гипотеза Н0 об отсутствии автокорреляции остатков. Альтернативные гипотезы Н1 и Н1* состоят, соответственно, в наличии положительной или отрицательной автокорреляции в остатках;
- далее по специальным таблицам определяются критические значения критерия Дарбина-Уотсона dl и du для заданного числа наблюдений п, числа независимых переменных модели т и уровня значимости б. По этим значениям числовой промежуток [0; 4] разбивают на пять отрезков;
- принятие или отклонение каждой из гипотез с вероятностью Р=1-б осуществляется следующим образом: 0 < d < dl - есть положительная автокорреляция остатков, Н0 отклоняется, с вероятностью Р=1-б принимается Н1; dl < d < du - зона неопределенности; du < d < 4 - du - нет оснований отклонять Н0, т.е. автокорреляция остатков отсутствует; 4 - du < d < 4 - dl - зона неопределенности; 4- dl < d < 4 - есть отрицательная автокорреляция остатков, Н0 отклоняется, с вероятностью Р=1-б принимается Н1*.
Если фактическое значение критерия Дарбина-Уотсона попадает в зону неопределенности, то на практике предполагают существование автокорреляции остатков и отклоняют гипотезу Н0.
Отсутствие автокорреляции остаточных величин обеспечивает состоятельность и эффективность оценок коэффициентов регрессии. Особенно актуально соблюдение данной предпосылки МНК при построении регрессионных моделей по рядам динамики, где ввиду наличия тенденции последующие уровни динамического ряда, как правило, зависят от своих предыдущих уровней.
Исследование остатков на наличие нормальности распределения производится с помощью теста ШапироУилка.
Процедура теста ШапироУилка представляется следующим образом:
1. Остатки упорядочиваются по возрастанию.
2. Рассчитывается значение статистики:
(2.28)
где -- целая часть числа an-t+1--коэффициенты ШапироУилка.
1. Из таблиц теста ШапироВилька для принятого уровня значимости выбирается критическое значение W*.
2. Если , то можно говорить о нормальном распределении случайных отклонений. Если же ,то распределение отклонений нельзя считать нормальным .
При несоблюдении основных предпосылок МНК приходится корректировать модель, изменяя ее спецификацию, добавлять (исключать) некоторые факторы, преобразовывать исходные данные для того, чтобы получить оценки коэффициентов регрессии, которые обладают свойством несмещённости, имеют меньшее значение дисперсии остатков и обеспечивают в связи с этим более эффективную статистическую проверку значимости параметров регрессии.
Таким образом, построив окончательное статистически значимое уравнение регрессии уровня безработицы в Российской Федерации, обязательно необходимо проверить выполнение всех предпосылок метода наименьших квадратов. [Э. Ферстер с. 304]
2.5 Интервальный прогноз на основе линейного уравнения регрессии
В прогнозных расчетах по уравнению регрессии определяется предсказываемое значение как точечный прогноз при то есть путем подстановки в линейное уравнение регрессии соответствующего значения x. Однако точечный прогноз явно нереален, поэтому он дополняется расчетом стандартной ошибки то есть , и соответственно мы получаем интервальную оценку прогнозного значения :
(2.29)
Для того чтобы понять, как строится формула для определения величин стандартной ошибки тогда уравнение регрессии примет вид:
(2.30)
Отсюда следует, что стандартная ошибка зависит от ошибки и ошибки коэффициента регрессии b, то есть:
(2.31)
Из теории выборки известно, что
Используя в качестве оценки остаточную дисперсию на одну степень свободы , получим формулу расчета ошибки среднего значения переменной y:
(2.32)
Ошибки коэффициента регрессии, как уже было показано, определяется формулой
(2.33)
Считая, что прогнозное значение фактора , получим следующую формулу расчета стандартной ошибки предсказываемого по линии регрессии значения, то есть
. (2.34)
Соответственно имеет выражение:
( 2.35)
Рассмотренная формула стандартной ошибки предсказываемого среднего значения y при заданном значении характеризует ошибку положения линии регрессии. Величина стандартной ошибки достигает минимума при и возрастает по мере того, как «удаляется» от в любом направлении. Иными словами, чем больше разность между и , тем больше ошибки , с которой предсказывается среднее значение y для заданного значения . Можно ожидать наилучшие результаты прогноза, если признак-фактор х находится в центре области наблюдений х, и нельзя ожидать хороших результатов прогноза при удалении от . Если же значение оказывается за пределами наблюдаемых значений х, используемых при построении линейной регрессии, то результаты прогноза ухудшаются в зависимости от того, насколько отклоняется от области наблюдаемых значений фактора х. [И. И. Елисеева с. 72]
2.6 Нелинейная регрессия
Если между экономическими явлениями существуют нелинейные соотношения, то они выражаются с помощью соответствующих нелинейных функций: например, равносторонней гиперболы
параболы второй степени
и др.
Различают два класса нелинейных регрессий:
· регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам;
· регрессии, нелинейные по оцениваемым параметрам;
Примером нелинейной регрессии по включенным в нее объясняющим переменным могут служить следующие функции:
· полиномы разных степеней
;
· равносторонняя гипербола
К нелинейным регрессиям по оцениваемым параметрам относятся функции:
· степенная
· показательная
· экспоненциальная
.
Нелинейная регрессия по включенным переменным не имеет никаких сложностей для оценки ее параметров. Они определяются, как и в линейной регрессии, методом наименьших квадратов, ибо эти функции линейны по параметрам. Так, в параболе второй степени заменив переменные получим двухфакторное уравнение линейной регрессии:
Для оценки параметров которого используется МНК.
Полином любого порядка сводится к линейной регрессии с ее способами оценивания характеристик и проверки гипотез. Как показывает опыт большинства исследователей, между нелинейной полиномиальной регрессии наиболее часто употребляется парабола второй степени; в отдельных вариантах - полином третьего порядка. Ограничения в использовании полиномов наиболее высоких степеней связаны с требованием односторонности исследуемой совокупности: чем выше порядок полинома, тем больше изгибов имеет кривая и в соответствии с этим меньше односторонность совокупности по результативному признаку.
Парабола второй степени целесообразна к использованию, если для конкретного промежутка значений фактора изменяется характер взаимосвязи рассматриваемых показателей: прямая взаимосвязь меняется на обратную или обратная на прямую. В такой ситуации определяется значение фактора, при котором достигается максимальное (или минимальное) значение результативного признака: приравниваем к нулю первую производную параболы второй степени:
b+2cx=0
Если же исходные данные не обнаруживают изменения направленности связи, то параметры параболы второго порядка становятся трудно интерпретируемыми, а форма связи часто заменяется другими нелинейными моделями.
Применение МНК для оценки параметров параболы второй степени приводит к следующей системе нормальных уравнений:
(2.36)
Решить ее относительно параметров a, b, c можно методом определителей:
где - определитель системы;
a, b, c - частные определители для каждого из параметров.
При b>0 и c>0 кривая симметрична относительно высшей точки, то есть точки перелома кривой, изменяющей направление взаимосвязи, а конкретно подъем на падение. Такого рода функцию можно наблюдать в экономике труда при исследовании зависимости заработной платы работников физического труда от возраста - с повышением возраста увеличивается заработная плата ввиду одновременного роста опыта и повышения квалификации работника. При b<0 и c>0 парабола второго порядка симметрична относительно своего минимума, что позволяет определять минимум функции в точке, меняющей направление связи, то есть снижение на рост.
Ввиду симметричности кривой параболу второй степени не всегда возможно применить в конкретных случаях.
Параметры параболической взаимосвязи не всегда могут быть логически объяснены. Таким образом, график зависимости не показывает четко выраженной параболы второго порядка, то она может быть заменена другой нелинейной функцией.
В группе нелинейных функций, параметры которых будут оценены МНК, в эконометрике хорошо известна равносторонняя гипербола Она может быть использована для объяснения взаимосвязи удельных расходов. Стандартным примером является кривая Филлипса, объясняющая нелинейное соотношение между нормой безработицы x и процентом прироста заработной платы y.
Британский экономист А. В. Филлипс установил обратную взаимозависимость процента прироста заработной платы от уровня безработицы.
Если в уравнении равносторонней гиперболы заменить на z, получим линейное уравнение регрессии y= a+bz+e, параметры будут оценены с помощью МНК. Система нормальных уравнений имеет вид:
(2.37)
При b>0 имеем обратную зависимость, которая при х стремящемуся к бесконечности объясняется нижней асимптотой, то есть минимальным предельным значением y, оценкой которого служит параметр a.
При b<0 имеем медленно повышающуюся функцию с верхней асимптотой при х стремящемуся к бесконечности, то есть с максимальным предельным уровнем y, оценку которого в уравнении дает параметр а.
Среди нелинейных функций в эконометрических исследованиях глубоко используется степенная функция
Это связано с тем, что параметр b в функции имеет четкое экономическое объяснение, то есть является коэффициентом эластичности.
Это говорит о том, что величина коэффициента b показывает, на сколько процентов изменится в средним итог, если фактор изменится на 1%. Формула расчета коэффициента эластичности:
(2.38)
где f'(x) - первая производная, характеризующая соотношение приростов результата для соответствующей формы связи.
В связи с тем, что коэффициент эластичности для линейной функции не является величиной постоянной обычно рассчитывается средний показатель эластичности по формуле:
(2.39)
Для оценки параметров степенной функции применяется МНК к линеаризованному уравнению и решается система нормальных уравнений. Параметр b определяется из системы, а параметр а - после потенцирования величины ln a.
В моделях, нелинейных по оцениваемым параметрам, но приводимых к линейному виду, МНК применяется к преобразованным уравнениям.
Поскольку в линейной модели и моделях, нелинейных по переменным, при оценке параметров появляются из критерия то в моделях, нелинейных по оцениваемым параметрам, требование МНК применяется не к исходным данным результативного признака, а их преобразованным величинам. Это поясняется тем, что оценка параметров основывается на минимизации суммы квадратов отклонений в логарифмах.
При использовании связей среди функций, применяющих ln y, в эконометрике преобладают степенные зависимости - это и кривые спроса и предложения, и кривые Энгеля, и производственные функции, и критерии освоения для характеристики связи между трудоемкостью продукции и размерами производства в период освоения выпуска нового вида изделий, и зависимость валового национального дохода от уровня занятости.
При применении линеаризуемых функций, затрагивающих преобразования зависимой переменной y, следует проверить присутствие предпосылок МНК, что бы они не нарушались при преобразовании.
При нелинейных отношениях рассматриваемых признаков, приводимых к линейному виду, возможно интервальное оценивание параметров нелинейной функции.
Для внутренне нелинейных моделей, которые путем несложных преобразований не приводятся к линейному виду, оценка параметров не может быть дана привычным МНК. Здесь используются иные подходы. [И. И. Елисеева с. 77]
ГЛАВА 3. ПАРНЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ ВЗАИМОДЕЙСТВИЯ УРОВНЯ БЕЗРАБОТИЦЫ И ВВП В РОССИЙСКОЙ ФЕДЕРАЦИИ
3.1 Построение модели парной регрессии
Линейная регрессия находит широкое применение в эконометрике ввиду четкой экономической интерпретации ее параметров.
Линейная регрессия сводится к нахождению уравнения вида:
или
Уравнение позволяет по заданным значениям фактора x иметь теоретические значения результативного признака подстановкой в него фактических значений фактора x.
Расчет параметров уравнения линейной регрессии.
Таблица 1. Исходные данные.
t |
Уровень безработицы, % |
ВВП, в млрд.руб |
||
Y |
Х |
|||
2000 |
1 |
10,6 |
7305,6 |
|
2001 |
2 |
9,0 |
8943,6 |
|
2002 |
3 |
7,9 |
10830,5 |
|
2003 |
4 |
8,2 |
13208,2 |
|
2004 |
5 |
7,8 |
17027,2 |
|
2005 |
6 |
7,1 |
21609,8 |
|
2006 |
7 |
7,1 |
26917,2 |
|
2007 |
8 |
6,0 |
33247,5 |
|
2008 |
9 |
6,2 |
41276,8 |
|
2009 |
10 |
8,3 |
38807,2 |
|
2010 |
11 |
7,3 |
46308,5 |
|
2011 |
12 |
6,5 |
55644,0 |
|
2012 |
13 |
5,5 |
61810,8 |
|
2013 |
14 |
5,5 |
66689,1 |
Примечание: Данные граф 3, 4 взяты из статистики Госкомстат и Статинфо.
С помощью табличного процессора Excel, вычислим коэффициенты модели парной регрессии и проверим значимость уравнения регрессии (таблица 2).
Таблица 2. Уравнение регрессии y = a + bx
Регрессионная статистика |
||
Множественный R |
0,79108027 |
|
R-квадрат |
0,85994365 |
|
Нормированный R-квадрат |
0,594625327 |
|
Стандартная ошибка |
0,904808628 |
|
Наблюдения |
14 |
Дисперсионный анализ |
||||||
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
1 |
16,43014187 |
16,43014187 |
20,06909769 |
0,000752611 |
|
Остаток |
12 |
9,824143841 |
0,818678653 |
|||
Итого |
13 |
26,25428571 |
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
||
Y-пересечение |
9,146954439 |
0,467008408 |
19,586273552 |
0,000000000178 |
|
Переменная X1 |
-0,000055729 |
0,000012440 |
-4,479854651 |
0,000752611 |
Примечание: режим регрессия, пакет анализа Microsoft Excel
С помощью СТЬЮДРАСПОБР tкр, tкр= 2,144. Сравнивая значения t- статистики с рассчитанным критерием, получаем: значение всех переменных (X= -4,48) по модулю больше чем tкр= 2,144, а значит, фактор значим. Итоговое уравнение имеет вид:
Y= 9,14695 - 0,00006X.
Коэффициент этого уравнения показывает, что снижение ВВП способствует снижению уровня безработицы.
Далее следует выявить значимость выбранного фактора. Для этого следует определить адекватность построенной модели.
Рассмотрим коэффициент детерминации .
Данный коэффициент показывает долю полной вариации объясняемой переменной, она детерминирована объясняющими переменными. Для полученной нами регрессии коэффициент детерминации это означает что модель примерно на 86% раскрывает степень влияния фактора, то есть модель имеет высокую значимость.
Коэффициент множественной регрессии R=0,93, он показывает тесноту связи зависимой переменной (уровень безработицы) с объясняющим фактором, входящим в модель регрессии.
Далее оценим адекватность модели по F-критерию Фишера.
Для этого воспользуемся функцией FРАСПОБР в программе Microsoft Excel. Получаем , =4,75.
Получаем что табличное значение меньше, следовательно, модель адекватна и пригодна для использования.
Найдем среднюю ошибку аппроксимации.
Средняя ошибка аппроксимации - это среднее отклонение расчетных значений от фактических.
Для этого воспользуемся остатками модели
Таблица 3. Вывод остатков
ВЫВОД ОСТАТКА |
||||
Наблюдение |
Предсказанное Y |
Остатки |
Стандартные остатки |
|
1 |
8,739815768 |
1,860184232 |
2,13983496 |
|
2 |
8,64853471 |
0,35146529 |
0,404302812 |
|
3 |
8,543376129 |
-0,643376129 |
-0,740098056 |
|
4 |
8,410868605 |
-0,210868605 |
-0,242569529 |
|
5 |
8,19804074 |
-0,39804074 |
-0,45788018 |
|
6 |
7,94265699 |
-0,84265699 |
-0,969337798 |
|
7 |
7,646877219 |
-0,546877219 |
-0,629091986 |
|
8 |
7,29409327 |
-1,29409327 |
-1,488640734 |
|
9 |
6,846623869 |
-0,646623869 |
-0,743834045 |
|
10 |
6,984254694 |
1,315745306 |
1,513547828 |
|
11 |
6,566211116 |
0,733788884 |
0,844103009 |
|
12 |
6,045951383 |
0,454048617 |
0,522307999 |
|
13 |
5,702278662 |
-0,202278662 |
-0,232688217 |
|
14 |
5,430416845 |
0,069583155 |
0,080043936 |
Примечание: режим регрессия, пакет анализа Microsoft Excel
Таблица 4. Расчетная таблица для вычисления средней ошибки аппроксимации.
t |
Уровень безработицы, % |
ВВП, в млрд.руб |
|||||
Y |
Х |
||||||
1 |
10,6 |
7305,6 |
8,739816 |
1,9 |
1,9 |
0,179245 |
|
2 |
9,0 |
8943,6 |
8,648535 |
0,4 |
0,4 |
0,044444 |
|
3 |
7,9 |
10830,5 |
8,543376 |
-0,6 |
0,6 |
0,055949 |
|
4 |
8,2 |
13208,2 |
8,410869 |
0,2 |
0,2 |
0,02439 |
|
5 |
7,8 |
17027,2 |
8,198041 |
-0,4 |
0,4 |
0,051282 |
|
6 |
7,1 |
21609,8 |
7,942657 |
-0,8 |
0,8 |
0,012676 |
|
7 |
7,1 |
26917,2 |
7,646877 |
-0,5 |
0,5 |
0,070423 |
|
8 |
6,0 |
33247,5 |
7,294093 |
-1,3 |
1,3 |
0,016667 |
|
9 |
6,2 |
41276,8 |
6,846624 |
-0,6 |
0,6 |
0,096774 |
|
10 |
8,3 |
38807,2 |
6,984255 |
1,3 |
1,3 |
0,156627 |
|
11 |
7,3 |
46308,5 |
6,566211 |
0,7 |
0,7 |
0,09589 |
|
12 |
6,5 |
55644,0 |
6,045951 |
0,5 |
0,5 |
0,076923 |
|
13 |
5,5 |
61810,8 |
5,702279 |
-0,2 |
0,2 |
0,036364 |
|
14 |
5,5 |
66689,1 |
5,430417 |
0,1 |
0,1 |
0,018182 |
Примечание: данные графы 2, 3 взяты из статистики Госкомстат и Статинфо; данные графы 4 предсказанное Y из таблицы 3; данные графы 5 получены путем вычитания из графы 2 графу 5; данные графы 6 это данные графы 5 по модулю; данные графы 7 получены путем деления графы 6 на графу 2.
Таким образом, по формуле (2.22), получаем
Поскольку ошибка меньше 10%, то можно говорить о хорошем подборе модели к исходным данным.
Проанализируем уравнение регрессии полностью, то есть проверим выполняются ли предпосылки метода наименьших квадратов (МНК).
Исследование остатков предполагает проверку присутствие следующих пяти предпосылок МНК:
§ случайный характер остатков;
§ нулевая средняя величина остатков, не зависящая от ;
§ гомоскедастичность - дисперсия каждого отклонения одинакова для всех значений
§ отсутствие автокорреляции остатков - значения распределены независимо друг от друга;
§ остатки подчинены нормальному распределению.
Для анализа используем таблицу 3.
Остатки исследуемого тренда образуют S= 5 серии, уровень значимости равен 0,05. В таблице «Критерии значения для количества серий» находим критические значения (Таблицы, стр. 354). Получаем, что , следовательно, аналитическая форма модели выбрана удачно.
Определим случайный характер остатков.
Построим график отклонений фактических значений от теоретических значений признака.
Рисунок 3.1. Фактические и теоретические значения уровня безработицы в Российской Федерации с 2000 по 2013 гг.
На рис. 3.1 показано как построенная модель парной регрессии аппроксимирует уровень безработицы в Российской Федерации с 2000 по 2013 года.
Рисунок 3.2 График остатков.
На рисунке 3.2 показан график остатков, получена горизонтальная полоса, которая показывает, что остатки представляют собой случайные величины и применение МНК оправдано.
Далее нужно определить присутствие зависимости остатков от . Рассмотрим нулевую величину остатков, которая не зависит от . В качестве критерия рассмотрим статистику:
где - среднее арифметическое остатков - стандартное отклонение.
Рассчитаем критерий t-теста Стьюдента для m=n-1, m=14-1=13 степеней свободы и для уровня значимости 0,05. Определим с помощью функции СТЬЮДРАСПОБР в Microsoft Excel. Если I*I, то математическое ожидание случайных отклонений несущественно отличается от 0, то есть отклонение признается несмещенным. В противно случае мат ожидание отличается от 0, значит отклонение признается смещенным. Так как модель линейная и построена по МНК, то значит и I тоже равно 0. Получились такие результаты: I*= 2,160, значит I* является критическим значением. Получается, что I*I, то есть отклонение несмещенное.
Далее проверим отсутствие автокорреляции остатков с помощью критерия Дарбина - Уотсона в нашем случае.
Таблица 5. Вспомогательная таблица для вычисления критерия Дарбина-Уотсона
t |
Y |
||||||
1 |
10,6 |
8,739815768 |
1,860184 |
- |
- |
3,460285 |
|
2 |
9,0 |
8,64853471 |
0,351465 |
-1,50872 |
2,2762328 |
0,123528 |
|
3 |
7,9 |
8,543376129 |
-0,64338 |
-0,99484 |
0,9897094 |
0,413933 |
|
4 |
8,2 |
8,410868605 |
-0,21087 |
0,432508 |
0,1870628 |
0,044466 |
|
5 |
7,8 |
8,19804074 |
-0,39804 |
-0,18717 |
0,0350334 |
0,158436 |
|
6 |
7,1 |
7,94265699 |
-0,84266 |
-0,44462 |
0,1976836 |
0,710071 |
|
7 |
7,1 |
7,646877219 |
-0,54688 |
0,29578 |
0,0874857 |
0,299075 |
|
8 |
6,0 |
7,29409327 |
-1,29409 |
-0,74722 |
0,5583318 |
1,674677 |
|
9 |
6,2 |
6,846623869 |
-0,64662 |
0,647469 |
0,4192166 |
0,418122 |
|
10 |
8,3 |
6,984254694 |
1,315745 |
1,962369 |
3,8508928 |
1,731186 |
|
11 |
7,3 |
6,566211116 |
0,733789 |
-0,58196 |
0,3386733 |
0,538446 |
|
12 |
6,5 |
6,045951383 |
0,454049 |
-0,27974 |
0,0782546 |
0,20616 |
|
13 |
5,5 |
5,702278662 |
-0,20228 |
-0,65633 |
0,4307655 |
0,040917 |
|
14 |
5,5 |
5,430416845 |
0,069583 |
0,271862 |
0,0739088 |
0,004842 |
|
Итого |
9,5232512 |
9,824144 |
Примечание: данные графы 2 взяты из статистики Госкомстат и Статинфо; данные графы 2 это предсказанное Y взяты из таблицы 3; данные графы 4 остатки взяты из таблицы 3; данные графы 5 получены путем вычитания из последующего значения предыдущего; данные графы 6 получены путем возведения в квадрат графы 5; данные графы 7 получены путем возведения в квадрат графы 4.
Таким образом, получаем из (2.27), что .
Из таблицы «Значения статистики Дарбина-Уотсона» [Елисеева стр. 566] определим критические значения критерия Дарбина-Уотсона 1,05 и для заданного числа наблюдений 14 и числа независимых переменных модели равного 1, уровня значимости б=0,05.
Получаем, что 1,34<0,97<-0,34, это говорит о том, что нет оснований отклонять гипотезу об отсутствии автокорреляции в остатках.
Проверим наличие гетероскедастичности в остатках регрессии с помощью рангового коэффициента Спирмена. Суть этой проверки заключается в том, что в случае гетероскедастичности абсолютные остатки коррелированы со значением фактора . В таблице 6 показан расчет рангового коэффициента Спирмена.
Таблица 6. Расчет рангового коэффициента корреляции Спирмена.
№ |
|||
1 |
1 |
14 |
|
2 |
2 |
13 |
|
3 |
3 |
4 |
|
4 |
4 |
2 |
|
5 |
5 |
5 |
|
6 |
6 |
12 |
|
7 |
7 |
7 |
|
8 |
8 |
3 |
|
9 |
10 |
9 |
|
10 |
9 |
11 |
|
11 |
11 |
6 |
|
12 |
12 |
8 |
|
13 |
13 |
10 |
|
14 |
14 |
1 |
|
Итого |
105 |
105 |
Примечание: данные графы 2 получены путем ранжирования от большего к меньшему графы 4 таблицы 1; данные графы 3 получены путем ранжирования значений, взятых по модулю от меньшего к большему графы 4 таблицы 2.
После присвоения х рангов (табл. 6), нужно найти абсолютные разности между ними, возвести их в квадрат и просуммировать, затем полученные значения подставить в формулу (2.25) для расчета коэффициента ранговой корреляции Спирмена по каждому фактору.
Таблица 7. Расчет коэффициента ранговой корреляции Спирмена.
№ |
|||
1 |
13 |
169 |
|
2 |
11 |
121 |
|
3 |
1 |
1 |
|
4 |
-2 |
4 |
|
5 |
0 |
0 |
|
6 |
6 |
36 |
|
7 |
0 |
0 |
|
8 |
-5 |
25 |
|
9 |
-1 |
1 |
|
10 |
2 |
4 |
|
11 |
-5 |
25 |
|
12 |
-4 |
16 |
|
13 |
-3 |
9 |
|
14 |
-13 |
169 |
|
Итого |
0 |
580 |
Примечание: данные графы 2 получены путем вычитания из графы 3 таблицы 6 графы 2 таблицы 6; данные графы 3 получены путем возведения в квадрат графы 2.
Коэффициент ранговой корреляции Спирмена для Х равен:
Статистическую значимость коэффициента можно определить с помощью t-критерия (2.26).
Таким образом, получаем:
Далее сравним эту величину с табличной величиной, рассчитанной с помощью функции в Microsoft Exel СТЬЮДРАСПОБР при б=0,05 и числе степеней свободы n=2=14-2=12;
Получается что, , тогда принимается гипотеза об отсутствии гетероскедастичности остатков.
Далее исследуем остатки на наличие нормальности распределения с помощью теста Шапиро-Уилка.
Таблица 8. Расчетная таблица для вычисления статистики W
№ |
|||||||
1 |
1,8602 |
-1,2941 |
1,6747 |
0,7251 |
-1,7906 |
2,5157 |
|
2 |
0,3515 |
-0,8427 |
0,7101 |
1,3318 |
-0,5537 |
1,8855 |
|
3 |
-0,6434 |
-0,6466 |
0,4181 |
0,7460 |
1,0974 |
-0,3514 |
|
4 |
-0,2109 |
-0,6434 |
0,4139 |
0,1802 |
1,1318 |
-0,9516 |
|
5 |
-0,3980 |
-0,5469 |
0,2991 |
0,1240 |
1,7138 |
-1,5898 |
|
6 |
-0,8427 |
-0,3980 |
0,1584 |
0,9727 |
0,1960 |
0,7767 |
|
7 |
-0,5469 |
-0,2109 |
0,0445 |
0,0240 |
-0,7472 |
0,7712 |
|
8 |
-1,2941 |
-0,2023 |
0,0409 |
||||
9 |
-0,6466 |
0,0696 |
0,0048 |
||||
10 |
1,3157 |
0,3515 |
0,1235 |
||||
11 |
0,7338 |
0,4540 |
0,2062 |
||||
12 |
0,4540 |
0,7338 |
0,5384 |
||||
13 |
-0,2023 |
1,3157 |
1,7312 |
||||
14 |
0,0696 |
1,8602 |
3,4603 |
||||
Итого |
9,8241 |
3,0563 |
Примечание: данные графы 2 - это остатки из табл.2, данные графы 3 получены путем ранжирования от меньшего к большему графы 2, данные графы 4 получены путем возведения квадрат графы 3, данные графы 5 взяты из табл. [http://www.machinelearning.ru/wiki/index.php?title], данные графы 6 получены путем вычитания соответствующего, но номеру значения из графы 3, данные графы 7 получены путем умножения графы5 на графу 6.
Так как
Из таблицы выбираем критическое значение W*, для n=14 и уровня значимости б = 0,05, W*= 0,874. Так как W>W*, то можно утверждать о том, что распределение случайных отклонений нормальное. Все предпосылки МНК выполнены, что говорит о качестве полученных оценок параметров эконометрической модели.
Рассчитаем средний коэффициент эластичности по формуле (2.10):
Таким образом, ВВП является статистически значимым фактором, оказывающим влияние на уровень безработицы в Российской Федерации.
3.2 Прогноз уровня безработицы в Российской Федерации на 2014 и 2015 года
Для того, чтобы сделать прогноз для уровня безработицы нужно спрогнозировать ВВП.
Для этого снова проделаем процедуру по выявлению значимости.
С помощью табличного процессора Excel, вычислим коэффициенты множественной регрессии и проверим значимость уравнения регрессии (таблица 9).
Таблица 9. Уравнение регрессии
ВЫВОД ИТОГОВ |
|||||
Регрессионная статистика |
|||||
Множественный R |
0,985723 |
||||
R-квадрат |
0,971649 |
||||
Нормированный R-квадрат |
0,969286 |
||||
Стандартная ошибка |
3535,343 |
||||
Наблюдения |
14 |
||||
Дисперсионный анализ |
|||||
df |
SS |
MS |
F |
||
Регрессия |
1 |
5140238077,8641800 |
5140238077,8641800 |
411,2634027 |
|
Остаток |
12 |
149983821,8681630 |
12498651,8223469 |
||
Итого |
13 |
5290221899,7323400 |
|||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
||
Y-пересечение |
-3534,06 |
1995,767232 |
-1,770776654 |
0,10197189 |
|
Переменная X 1 |
4753,362 |
234,3909744 |
20,27963024 |
1,186E-10 |
Примечание: режим регрессия, пакет анализа Microsoft Excel
С помощью функции СТЬЮДРАСПОБР рассчитаем 2,144.
Аналогично сравнивая значения t-статистики с рассчитанным критерием, получаем значение переменной х= 20,28, больше чем , следовательно фактор значим.
Итоговое уравнение имеет вид:
X = -3534,06+4753,362t
Далее необходимо определить адекватность построенной модели. Модель адаптирована к данным лучше, когда коэффициент детерминации ближе к 1. Значение его лежит в пределах от 0 до 1.
В данном случае коэффициент детерминации это означает что модель примерно на 97% раскрывает степень влияния факторов, значит модель имеет высокую значимость.
Коэффициент регрессии R= 0,98, он показывает тесноту связи зависимой переменной (ВВП) с объясняющими факторами, включенными в модель регрессии.
Затем оценим степень адекватности модели по F-критерию Фишера, для этого применим функцию FРАСПОБР в программе Microsoft Excel.
Получили = 4,75, находим (из таблицы значений F-критерия Фишера). После сравнения со значением , получаем что табличное значение меньше, значит модель адекватна и пригодна для использования.
Оценим качество уравнения с помощью ошибки абсолютной аппроксимации. Для этого рассмотрим остатки модели (таблица 2).
Таблица 10. Вывод остатка
ВЫВОД ОСТАТКА |
||||
Наблюдение |
Предсказанное Х |
Остатки |
Стандартные остатки |
|
1 |
1219,304 |
6086,342028 |
1,791867211 |
|
2 |
5972,667 |
2970,915835 |
0,874661109 |
|
3 |
10726,03 |
104,5061951 |
0,03076745 |
|
4 |
15479,39 |
-2271,157372 |
-0,668646686 |
|
5 |
20232,75 |
-3205,562584 |
-0,943742968 |
|
6 |
24986,12 |
-3376,350248 |
-0,994024206 |
|
7 |
29739,48 |
-2822,276656 |
-0,83090056 |
|
8 |
34492,84 |
-1245,327095 |
-0,366634142 |
|
9 |
39246,2 |
2030,64657 |
0,597838404 |
|
10 |
43999,56 |
-5192,346335 |
-1,528667811 |
|
11 |
48752,93 |
-2444,386013 |
-0,719646567 |
|
12 |
53506,29 |
2137,72844 |
0,629364153 |
|
13 |
58259,65 |
3551,18724 |
1,045497599 |
|
14 |
63013,01 |
3676,079995 |
1,082267013 |
Примечание: режим регрессия, пакет анализа Microsoft Excel
Вспомогательная таблица для расчета ошибки аппроксимации (таблица 11).
Таблица 11. Расчетная таблица для нахождения ошибки аппроксимации
t |
ВВП, в млрд.руб |
|||||
X |
||||||
1 |
7305,6 |
1219,304 |
6086,3 |
6086,3 |
0,033101 |
|
2 |
8943,6 |
5972,667 |
2970,9 |
2970,9 |
0,032184 |
|
3 |
10830,5 |
10726,03 |
104,5 |
104,5 |
0,009649 |
|
4 |
13208,2 |
15479,39 |
-2271,2 |
2271,2 |
0,171953 |
|
5 |
17027,2 |
20232,75 |
-3205,6 |
3205,6 |
0,188264 |
|
6 |
21609,8 |
24986,12 |
-3376,4 |
3376,4 |
0,156244 |
|
7 |
26917,2 |
29739,48 |
-2822,3 |
2822,3 |
0,104851 |
|
8 |
33247,5 |
34492,84 |
-1245,3 |
1245,3 |
0,037455 |
|
9 |
41276,8 |
39246,2 |
2030,6 |
2030,6 |
0,049196 |
|
10 |
38807,2 |
43999,56 |
-5192,3 |
5192,3 |
0,033797 |
|
11 |
46308,5 |
48752,93 |
-2444,4 |
2444,4 |
0,052785 |
|
12 |
55644,0 |
53506,29 |
2137,7 |
2137,7 |
0,038417 |
|
13 |
61810,8 |
58259,65 |
3551,2 |
3551,2 |
0,057453 |
|
14 |
66689,1 |
63013,01 |
3676,1 |
3676,1 |
0,055123 |
|
Всего |
1,220473 |
Примечание: данные графы 2, 3 взяты из статистики Госкомстат и Статинфо; данные графы 4 предсказанное Y из таблицы 10; данные графы 5 получены путем вычитания из графы 2 графу 5; данные графы 6 это данные графы 7 по модулю; данные графы 7 получены путем деления графы 6 на графу 2.
Тогда на основании формулы (2.22) получаем 8,7177.
Ошибка меньше 10%, значит уравнение можно использовать в качестве регрессии.
Проанализируем полученное уравнение регрессии с помощью метода наименьших квадратов (МНК).
Для анализа используем таблицу 2.
Остатки образуют S= 5 серии, уровень значимости равен 0,05. В таблице «Критерии значения для количества серий» находим критические значения , (таблица, стр. 354). Получили . Значит, аналитическая форма модели выбрана удачно.
Построим график отклонений фактических значений от теоретических значений признака.
Рисунок 3.3 Фактические и теоретические значения ВВП за 2000-2013 гг.
Рассмотри присутствие зависимости остатков от . Рассмотрим нулевую величину остатков, которая не зависит от Несмещенность является желательным свойством и означает, что математическое ожидание значений ошибок равно нулю. В качестве критерия возьмем статистику:
где - среднее арифметическое остатков - стандартное отклонение.
Рассчитаем критерий t-теста Стьюдента для m=n-1, m=14-1=13 степеней свободы и для уровня значимости 0,05. Определим с помощью функции СТЬЮДРАСПОБР в Microsoft Excel. Если I*I, то математическое ожидание случайных отклонений несущественно отличается от 0, то есть отклонение признается несмещенным. В противно случае мат ожидание отличается от 0, значит отклонение признается смещенным. Так как модель линейная и построена по МНК, то значит и I тоже равно 0. Получились такие результаты: I*= 2,160, значит I* является критическим значением. Получается, что I*I, то есть отклонение несмещенное.
Далее проверим отсутствие автокорреляции остатков с помощью критерия Дарбина - Уотсона в нашем случае.
Таблица 12. Вспомогательная таблица для вычисления критерия Дарбина-Уотсона.
t |
Х |
||||||
1 |
7305,6 |
1219,304272 |
6086,342 |
- |
- |
37043559,28 |
|
2 |
8943,6 |
5972,666565 |
2970,916 |
-3115,43 |
9705880,4 |
8826340,898 |
|
3 |
10830,5 |
10726,02886 |
104,5062 |
-2866,41 |
8216304,2 |
10921,54481 |
|
4 |
13208,2 |
15479,39115 |
-2271,16 |
-2375,66 |
5643777,4 |
5158155,808 |
|
5 |
17027,2 |
20232,75344 |
-3205,56 |
-934,405 |
873113,1 |
10275631,48 |
|
6 |
21609,8 |
24986,11574 |
-3376,35 |
-170,788 |
29168,426 |
11399741 |
|
7 |
26917,2 |
29739,47803 |
-2822,28 |
554,0736 |
306997,55 |
7965245,52 |
|
8 |
33247,5 |
34492,84032 |
-1245,33 |
1576,95 |
2486769,9 |
1550839,573 |
|
9 |
41276,8 |
39246,20262 |
2030,647 |
3275,974 |
10732003 |
4123525,493 |
|
10 |
38807,2 |
43999,56491 |
-5192,35 |
-7222,99 |
52171627 |
26960460,46 |
|
11 |
46308,5 |
48752,9272 |
-2444,39 |
2747,96 |
7551285,9 |
5975022,981 |
|
12 |
55644,0 |
53506,2895 |
2137,728 |
4582,114 |
20995773 |
4569882,883 |
|
13 |
61810,8 |
58259,65179 |
3551,187 |
1413,459 |
1997865,8 |
12610930,81 |
|
14 |
66689,1 |
63013,01408 |
3676,08 |
124,8928 |
15598,2 |
13513564,13 |
|
Всего |
120726164 |
149983821,86816 |
Примечание: данные графы 2 взяты из статистики Госкомстат и Статинфо; данные графы 2 это предсказанное Y взяты из таблицы 3; данные графы 4 остатки взяты из таблицы 10; данные графы 5 получены путем вычитания из последующего значения предыдущего; данные графы 6 получены путем возведения в квадрат графы 5; данные графы 7 получены путем возведения в квадрат графы 4.
Таким образом, получаем из (2.27) что:
Из таблицы «Значения статистики Дарбина-Уотсона» (Елисеева) определим критические значения критерия Дарбина-Уотсона 1,05 и для заданного числа наблюдений 14 и числа независимых переменных модели равного 1, уровня значимости б=0,05.
Получаем, что 1,34<0,97<-0,34, это говорит о том, что нет оснований отклонять гипотезу об отсутствии автокорреляции в остатках.
Проверим наличие гетероскедастичности в остатках регрессии с помощью рангового коэффициента Спирмена. Суть этой проверки заключается в том, что в случае гетероскедастичности абсолютные остатки коррелированы со значением фактора . В таблице 6 показан расчет рангового коэффициента Спирмена.
Таблица 13. Расчет рангового коэффициента корреляции Спирмена.
№ |
|||
1 |
1 |
3 |
|
2 |
2 |
6 |
|
3 |
3 |
14 |
|
4 |
4 |
8 |
|
5 |
5 |
9 |
|
6 |
6 |
Подобные документы
Анализ метода наименьших квадратов для парной регрессии, как метода оценивания параметров линейной регрессии. Рассмотрение линейного уравнения парной регрессии. Исследование множественной линейной регрессии. Изучение ошибок коэффициентов регрессии.
контрольная работа [108,5 K], добавлен 28.03.2018Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.
контрольная работа [141,3 K], добавлен 05.05.2010Эконометрика как одна из базовых дисциплин экономического образования во всем мире. Прогноз социально-экономических показателей, характеризующих состояние и развитие анализируемой системы. Понятие и построение модели парной регрессии и корреляции.
контрольная работа [633,2 K], добавлен 10.12.2013Статистическая адекватность и проверка модели линейной регрессии на мультиколлинеарность. Исследование автокорреляции с помощью критерия Дарбина-Уотсона, тестов Сведа-Эйзенхарта и Бреуша-Годфри. Анализ гетероскедастичности и корректировка модели.
курсовая работа [1,5 M], добавлен 29.03.2015Определение параметров уравнения линейной регрессии. Экономическая интерпретация коэффициента регрессии. Вычисление остатков, расчет остаточной суммы квадратов. Оценка дисперсии остатков и построение графика остатков. Проверка выполнения предпосылок МНК.
контрольная работа [1,4 M], добавлен 25.06.2010Исследование причин возникновения, последствий и основных видов безработицы. Моделирование и прогнозирование численности безработных в Российской Федерации. Определение доли экономически активного населения. Построение регрессионной модели безработицы.
курсовая работа [203,8 K], добавлен 31.03.2015Показатели статистики занятости и безработицы, а также баланс трудовых ресурсов. Изучение межрегиональной вариации уровня безработицы. Построение уравнения регрессии. Регрессионная модель зависимости уровня безработицы и внутреннего валового продукта.
курсовая работа [604,2 K], добавлен 16.09.2014Построение качественной и адекватной эконометрической модели по методу наименьших квадратов и ее анализ на наличие автокорреляции, мультиколлинеарности, гетероскедастичности с применением статистики Дарвина-Уотсона, тестов Парка и Голдфелда-Квандта.
курсовая работа [434,0 K], добавлен 04.12.2013Построение доверительного интервала для коэффициента регрессии. Определение ошибки аппроксимации, индекса корреляции и F-критерия Фишера. Оценка эластичности изменения материалоемкости продукции. Построение линейного уравнения множественной регрессии.
контрольная работа [250,5 K], добавлен 11.04.2015Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.
контрольная работа [248,4 K], добавлен 26.12.2010Основные методы анализа линейной модели парной регрессии. Оценки неизвестных параметров для записанных уравнений парной регрессии по методу наименьших квадратов. Проверка значимости всех параметров модели (уравнения регрессии) по критерию Стьюдента.
лабораторная работа [67,8 K], добавлен 26.12.2010Публикация данных: источники информации и влияние факторов на деятельность. Статистическая автокоррелированность ряда и проверка ее порядков, статистика Дарбина–Уотсона. Регрессионные зависимости и леммы эконометрической модели, доверительный интервал.
практическая работа [327,4 K], добавлен 15.03.2009Применение метода наименьших квадратов при оценке параметров уравнения регрессии. Зависимость случайных остатков. Предпосылка о нормальном распределении остатков. Особенности определения наличия гомо- и гетероскедастичности. Расчет основных коэффициентов.
курсовая работа [252,1 K], добавлен 26.04.2012Эффективная оценка по методу наименьших квадратов. Корелляционно-регрессионный анализ в эконометрическом моделировании. Временные ряды в эконометрических исследованиях. Моделирование тенденции временного ряда. Расчет коэффициента автокорреляции.
контрольная работа [163,7 K], добавлен 19.06.2015Эконометрические регрессионные модели и прогнозирование на их основе. Построение множественной линейной регрессии с использованием метода наименьших квадратов. Расчет минеральных удобрений сельскохозяйственной организации по полям и кормовым угодьям.
курсовая работа [2,6 M], добавлен 29.11.2014Построение поля рассеяния, его визуальный анализ. Определение точечных оценок параметров методом наименьших квадратов. Расчет относительной ошибки аппроксимации. Построение доверительных полос для уравнения регрессии при доверительной вероятности У.
контрольная работа [304,0 K], добавлен 21.12.2013Выбор факторных признаков для двухфакторной модели с помощью корреляционного анализа. Расчет коэффициентов регрессии, корреляции и эластичности. Построение модели линейной регрессии производительности труда от факторов фондо- и энерговооруженности.
задача [142,0 K], добавлен 20.03.2010Оценка коэффициентов парной линейной регрессии, авторегрессионное преобразование. Трехшаговый и двухшаговый метод наименьших квадратов, его гипотеза и предпосылки. Системы одновременных уравнений в статистическом моделировании экономических ситуаций.
курсовая работа [477,2 K], добавлен 05.12.2009Построение доверительного интервала для коэффициента регрессии в заданной модели. Оценка качества модели по анализу ошибки аппроксимации, индекса корреляции и F-критерия Фишера. Оценка эластичности спроса в зависимости от цены. Уравнение авторегрессии.
контрольная работа [156,8 K], добавлен 28.02.2011Построение классической нормальной линейной регрессионной модели. Проведение корреляционно-регрессионного анализа уровня безработицы - социально-экономической ситуации, при которой часть активного, трудоспособного населения не может найти работу.
реферат [902,8 K], добавлен 15.03.2015