Построение эконометрической модели и исследование проблемы выявления и коррекции гетероскедастичности с помощью тестов Голдфельда-Квандта и Глейзера

Особенности построения эконометрической модели зависимости одной переменной от двух или более независимых переменных. Суть графического метода проверки гипотезы о причинно-следственной связи, сравнение результатов тестов Голдфельда-Квандта и Глейзера.

Рубрика Экономико-математическое моделирование
Вид курсовая работа
Язык русский
Дата добавления 29.08.2013
Размер файла 1,6 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Построение эконометрической модели и исследование проблемы выявления и коррекции гетероскедастичности с помощью тестов Голдфельда-Квандта и Глейзера

Введение

С тех пор как экономика стала серьезной самостоятельной наукой, исследователи пытаются дать свое представление о возможных путях экономического развития, спрогнозировать ту или иную ситуацию, предвидеть будущие значения экономических показателей, указать инструменты изменения ситуации в желательном направлении. Однако в подавляющем большинстве случаев между экономическими переменными нет строгих зависимостей.

Целью данной работы является выявление взаимосвязи между такими факторами как: потребление мяса, молока и молочных продуктов и среднедушевых доходов населения, проживающего на территории Российской Федерации (79 регионов).

Для проверки гипотезы о причинно-следственной связи между исследуемыми признаками использованы следующие методы: графический, корреляционная таблица, регрессионная модель. Построена эконометрическая модель, произведена оценка ее качества и исследована проблема гетероскедастичности остатков. На основании этих методов сформулированы выводы о связях между исследуемыми признаками.

Теоретическая часть

эконометрическая модель

Множественный регрессионный анализ - это метод установления зависимости одной переменной от двух или более независимых переменных. Обычная форма представления данных - прямоугольная таблица, т.е. матрица, каждая строка которой есть результат n-наблюдений к-признака на 1 объекте. Естественное требование, чтобы значения элементов этой матрицы были однотипные.

Пусть Y результативный признак зависит от k факторных признаков. Необходимо определить y=f(x1,x2… xk), в частности, при линейной форме связи

С помощью МНК необходимо оценить значение коэффициента ai таких, чтобы

При нахождении неизвестных коэффициентов уравнения методом МНК получим формулу для их определения:

Для определения значимости коэффициента aj используется статистика:

где Sбj - дисперсия j-го коэффициента:

,

тогда

,

- диагональный элемент матрицы, ошибка уравнения.

Эти расчетные значения в предположении справедливости нулевой гипотезы Н0: b1=b0=0 (т.е. коэффициенты не значимы) распределены по закону Стьюдента с (n-k-1) степенями свободы, где n - объем выборки; k -количество факторов.

,

где n - размерность Х,

m - количество коэффициентов уравнения регрессии.

Проверка качества уравнения регрессии заключается в следующих действиях:

1) проверка значимости всех aj;

2) проверка общего качества уравнения регрессии с помощью коэффициента множественной детерминации R2.

3) Проверка свойств данных, выполнение которых предполагалось при оценивании уравнений. Ошибки ej распределены по нормальному закону, нормированному закону.

s2=const.

Для проверки общего качества уравнения регрессии используется коэффициент:

.

Проверка значимости коэффициента детерминации осуществляется с помощью F-распределения:

где L - количество фиксированных признаков.

F - это рассчетное значение, которое вычисляется для проверки значимости коэффициента детерминации. Проверяется нулевая гиппотеза о том, что коэффициент детерминации незначим, а именно Н0: RІ=0. В предположении справедливости нулевой гиппотезы статистика F распределена по закону Фишера со степенями свободы .

Найденное критическое значение сравниваем с расчетным и делаем вывод о значимости всего уравнения. Если Fp<Fкр, то нулевая гипотеза принимается, т.е. RІ=0, и делается вывод о том, что уравнение регрессии не значимо. Если Fp>Fкр, то нулевая гипотеза отвергается и делается вывод о том, что уравнение регрессии значимо.

Оценить качество уравнения регрессии можно и с помощью Значимости F, которую сравниваем с 0,05. Если Значимость F<0,05, то уравнение регрессии качественное. Если Значимость F>0,05, то уравнение регрессии некачественное.

Важную роль при оценке влияния факторов играют коэффициенты регрессионного анализа. Однако непосредственно с их помощью нельзя сопоставить факторы по степени их влияния на зависимую переменную из-за различия единиц измерения и разной степени колеблемости. Для устранения таких различий при интерпретации применяются средние частные коэффициенты эластичности Э(j) и бетта-коэффициенты (j), которые рассчитываются по формулам:

где - среднестатистическое отклонение фактора j.

Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора j на один процент, но не учитывает степень колеблемости факторов.

Бетта-коэффициент показывает, на какую часть величины среднего квадратического отклонения Sy измениться зависимая переменная Y с изменением соответствующей независимой переменной Xj на величину своего среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных. Указанные коэффициенты позволяют упорядочить факторы по степени влияния факторов на зависимую переменную.

Одна из важнейших целей моделирования заключается в прогнозировании поведения исследуемого объекта. При использовании построенной модели для прогнозирования делается предположение о сохранении в период прогнозирования существования ранее взаимосвязей переменных.

Нарушение предпосылок МНК

Неоднородность дисперсий ошибок (гетероскедастичность, heteroscedasticity).

Этот вид нарушений стандартных предположений характерен для статистических данных, относящихся к одному моменту времени, но собранных по различным регионам, различным предприятиям, различным социальным группам (данные в сечениях, cross-section data). Неоднородность дисперсий возникает также как результат тех или иных структурных изменений в экономике, например связанных с мировыми экономическими кризисами. Последний пример как раз и иллюстрирует подобную ситуацию: резкое возрастание абсолютных величин остатков в этом примере относится к периоду глобального нефтяного кризиса.

Последствия неоднородности дисперсий ошибок:

Оценки дисперсий случайных величин (оценок коэффициентов линейной модели) оказываются смещенными.

Построенные доверительные интервалы для не соответствуют заявленным уровням значимости.

Вычисленные значения - и - отношений уже нельзя рассматривать как наблюдаемые значения случайных величин, имеющих - и -распределения, соответствующие стандартным предположениям. Поэтому сравнение вычисленных значений - и - отношений с квантилями указанных - и -распределений может приводить к ошибочным статистическим выводам в отношении гипотез о значениях коэффициентов линейной модели.

В тестах на гетероскедастичность проверяется основная гипотеза (т.е. модель гомоскедастична) против альтернативной гипотезы Н1: не Н0 (т.е. модель гетероскедастична).

Помимо графических, существует довольно много процедур, предназначенных для проверки выполнения стандартных предположений о линейной модели наблюдений, использующих статистические критерии проверки гипотез. Мы остановимся только на нескольких таких процедурах. В каждой из этих процедур в качестве нулевой гипотезы берется гипотеза

.

Однако приспособлены соответствующие критерии для выявления специфических нарушений стандартных предположений, что делает каждый из критериев особо чувствительным именно к тем нарушениям, на которые он «настроен».

Критерий Голдфелда-Квандта (Goldfeld-Quandt). Если графический анализ остатков указывает на возможную неоднородность дисперсий ошибок , то наблюдения, насколько это возможно,

- упорядочивают в порядке предполагаемого возрастания дисперсий случайных ошибок;

- отбрасывают центральных наблюдений (для более надежного разделения групп с малыми и большими дисперсиями случайных ошибок), так что для дальнейшего анализа остается наблюдений;

- производят оценивание выбранной модели отдельно по первым и по последним наблюдениям;

- вычисляют отношение остаточных сумм квадратов, полученных при подборе модели по последним (остаточная сумма квадратов ) и по первым (остаточная сумма квадратов ) наблюдениям.

При принятии решения учитывают, что если все же , (дисперсии однородны) и выполнены остальные стандартные предположения о модели наблюдений, включая предположение о нормальности ошибок, то тогда отношение

имеет-- распределение Фишера

с и

степенями свободы.

Гипотеза

, (дисперсии однородны) отвергается, если вычисленное значение -отношения «слишком велико», т. е. превышает критический уровень

соответствующий выбранному уровню значимости .

Тест Глейзера

Здесь предполагается, что дисперсии связаны с фактором пропорциональности Z в виде: Т.к. средние квадратические отклонения неизвестны, то их заменяют модулями оценок отклонений.

Алгоритм применения

1. Строится уравнение регрессии: и вычисляются остатки

2. Выбирается фактор пропорциональности Z и оценивают вспомогательное уравнение регрессии:

Изменяя , строят несколько моделей:

3. Статистическая значимость коэффициента 1 в каждом случае означает наличие гетероскедастичности.

4. Если для нескольких моделей будет получена значимая оценка 1,то характер гетероскедастичности определяют по наиболее значимой из них.

Если гипотеза гомоскедастичности отвергается, необходимо дать оценку матрице . где - вещественная, симметрическая положительно определенная матрица (структура ковариации ошибок). Совместить проверку этой гипотезы с оценкой данной матрицы можно следующим образом.

Рассмотрим использование обобщенного метода наименьших квадратов для корректировки гетероскедастичности возмущений. Пусть строится линейная регрессионная модель

Будем считать, что модель гетероскедастична, т. е. дисперсии возмущений (i=1, 2, …, n) не равны между собой, а сами возмущения не коррелированны и их математические ожидания равны нулю. Это означает, что ковариационная матрица вектора возмущений будет диагональной:

.

(1)

Для оценки параметров такой модели используется взвешенный метод наименьших квадратов (Weighted Least Squares), являющийся частным случаем обобщенного МНК.

Сущность взвешенного метода наименьших квадратов состоит в том, что каждый квадрат остатка (i=1, 2, …, n) «взвешивается» с помощью коэффициента , где (i) -- среднее квадратическое отклонение i-го возмущения. Тем самым добиваются равномерного вклада остатков в остаточную сумму квадратов, что приводит, в конечном счете к получению несмещенных и наиболее эффективных оценок параметров модели.

Условие взвешенного метода наименьших квадратов имеет вид:

.

(2)

Вектор b* оценок параметров модели определяется по формуле

.

На практике, однако, средние квадратические отклонения возмущений (i) почти никогда не бывают известны. Поэтому для применения взвешенного метода наименьших квадратов, необходимо сделать предположение о значениях (i). Весьма часто считают, что среднее квадратическое отклонение возмущений пропорционально значениям одного из факторов, предположительно делающих выборочную совокупность неоднородной.

Проверка автокоррелированности остатков

Для проверки автокорреляции остатков чаще всего используют коэффициент Дарбина-Уотсона. Численное значение коэффициента равно

(41)

где ei - остатки.

Таким образом, значение статистики Дарбина -Уотсона распределено в интервале

Рисунок Е - Распределение статистики Дарбина - Уотсона

Соответственно, идеальное значение статистики - 2 (автокорреляция отсутствует). Меньшие значения соответствуют положительной автокорреляции остатков, большие - отрицательной. Статистика учитывает только автокорреляцию первого порядка.

Проверка статистической значимости статистики DW:

Н0: DW=0

если , то возмущения признаются некоррелированными;

если , то имеется положительная автокорреляция возмущений;

если , то существует отрицательная автокорреляция;

если или , то это указывает на неопределенность ситуации.

Практическая часть

Анализируются данные о государственных расходах G, инвестициях I, валовом внутреннем продукте Y и численности населения P для 31 страны в ??? 2011 г.(Источник : сайт МВФ режим доступа ССЫЛКА.

Рассмотрим вопрос, происходит ли «вытеснение» инвестиций государственными расходами.

Исходные данные представлены в приложении А.

Рисунок 1 - Зависимость величины потребления мяса от потребления молока и молочных продуктов

Рисунок 2 - Зависимость величины потребления мяса от среднедушевых денежных доходов

По построенным графикам видно, что у нас отсутствуют аномальные объекты. Исходная совокупность является однородной

Исчислим описательные статистики анализируемой совокупности с помощью ППП STATISTICA, результаты представим в таблице 2.

Таблица 2

Проанализируем, как влияют на объем инвестиций объем ВВП в текущих ценах,( млрд.долл.) государственные расходы, (млрд.долл.)

Построим корреляционную матрицу исходных признаков для выявления наличия линейной связи между регрессором и предикторами.

Связь может быть признана значимой на уровне значимости 0,05.

Рассчитав матрицу частных коэффициентов корреляции, представленную на рисунке

Делаем вывод о мультиколлинеарности регрессоров, однако связь между инвестициями и госрасходами признается отрицательной.

Построим уравнение линейной регрессии и оценим его качество с помощью ППП STATISTICA.

Оценим качество построенной модели:

I=56,59+0,371Y-1,306G+е, где

I - объем инвестиций

Y-ВВП в текущих ценах,

G государственные расходы

Коэффициент множественной корреляции R= 0, 969,детминации R2=0, 934, который по Фишеру признается значимым, т.е. отличным от нуля (расчетное значение критерия 96, 347, критическое при степенях свободы 2 и 28 равно 3,34). Можно утверждать с вероятностью, близкой к 1,что 93 % вариации объема инвестиций обусловлено вариацией выбранных предикторов.

Коэффициенты модели также могут быть признанными отличными от нуля (расчетные значения t-статистик все больше критического для распределения Стьюдента с 28 степенями свободы при уровни значимости 0,05 (tкр=1,71).

Исследуем остатки модели на нормальность, отсутствие гетероскедастичности и автокорреляции.

Построим гистограмму остатков и проверим их распределение на нормальность.

Рисунок - гистограмма распределения остатков

Анализируя гистограмму нельзя утверждать,что остатки распределены по нормальному закону.

О нормальности остатков можно судить также по графику остатков на нормальной вероятностной бумаге. Чем ближе распределение к нормальному виду, тем лучше значения остатков ложатся на прямую линию.

Рисунок - График остатков на нормальной вероятностной бумаге

На данном графике видим, что значения остатков не очень хорошо ложатся на прямую линию, следовательно распределение не яявляется нормальным.

Для выявления нестабильности дисперсии ошибки создаем график зависимости квадратов регрессионных остатков от предсказанного значения зависимой переменной.

Построим в декартовой системе координат квадрат остатков модели в зависимости от от каждого предиктора.

Рисунок -зависимость квадрата остатков от G

Рисунок --Зависимость квадрата остатков от Y

Графически видна зависимость между квадратами остатков и каждым регрессором.

Проверим модель на гетероскедастичность с помощью тестов Глейзера и Гольдтфельдта-Квандта

Тест Гольдтфельдта-Квандта

Проведем тестирование по фактору G.Данные упорядочиваются в порядке возрастания величины G.2. Оценим регрессию снова для 11 стран с наибольшими расходами G и для 11 стран с наименьшми расходами G, используя ту же спецификацию модели регрессии.

Результаты оценивания модели по первым 11 наблюдениям представлены на рисунке

Рисунок -Результаты оценивания регрессии по первой и третьей подвыборках

Проверяем гипотезу о равенстве дисперсий с помощью статистики Фишера.

Берем суммы квадратов остатков для регрессий по первой трети RSS1=1267,5 и последней трети RSS3= 512368.

Рассчитаем их отношение (большей к меньшей ):=404,24

Табличное значение

Сравнивая расчетное и табличное значения критерия делаем вывод о том что у нас нулевую гипотезу о гомоскедастичности остатков следует отклонить.

Проведем тестирование на гетероскедастичность остатков с помощью теста Глейзера.

Для этого будем предполагаеть, что дисперсии связаны с фактором пропорциональности Z в виде:

Т.к. средние квадратические отклонения неизвестны, то их заменяют модулями оценок отклонений

В качестве фактора пропорциональности возьмем теоретические значения результирующей переменной оценим вспомогательные уравнения регрессии :

Изменяя , строим несколько моделей:

Результаты представлены на рисунках

Рисунок Результат оценивания при г=1

Коэффициент при регрессоре значим, следовательно, присутствует зависимость такой формы.

Таким образом, в векторе ошибок гетероскедастичность присутствует, что подтвердилось статистическими тестами, необходимо предпринять меры по ее устранению.

Проведем этот тест отдельно для каждой переменной.

Попробуем скорректировать модель,найдя оценки следующего уравнения :

Модель незначима по всем критериям.

Используем в качестве масштабирующего множителя показатель численности населения и оценим модель в расчете на душу населения

Получили модель

Коэффициенты при переменных G/P и Y/P значимы,

Коэффициент детерминации значим по Фишеру ,

Однако проведение теста Глейзера показывает, что гетероскедастичность не устранена

Можно попытаться удалить из выборки наблюдение с объемом инвестиций, сильно отличающимся от среднего -Китай и переоценить модель

Получим результат, представленный на рисунке

Но в этом случае, графический анализ зависимости квадрата остатков от регрессоров не дает оснований утверждать,что проблема устранена.

Устранение гетероскедастичности в моделях множественной регрессии -трудная задача и на реальных данных плохо решаемая ручными методами, Поэтому воспользуемся эконометрическим пакетом MATRIXER, находящемся в свободном доступе по адресу http://soft.mail.ru/program/matrixer/5.1 и устраним с его помощью гетероскедастичность.

Рисунок. Результаты оценивания исходной модели рисунке

Тест на гетероскедастичность утверждает, что она подтверждается ( критическое значение Хи квадрат с одной степенью свободы 3,84).

Устраним гетероскедастичность, указав в качестве регрессоров гетероскедастичности обе переменные. Получим результат, представленный на рисунке

Рисунок.

Гетероскедастичность устранена. Поверим модель на отсутствие автокорреляции в остатках с помощью статистики Дарбина -Уотсона. авторреляция в остатках отсутствует.

Статистика Дарбина-Уотсона: dL и dU, уровень значимости 5% и двух объясняющих переменных

dL

dU

1,3

1,57

4-dl=2,7

4-du=2,43

Вычисленное значение лежит ближе к правой границе интревала 0<dw<d1, при заданном уровне значимости можно предположить наличие положительной автокорреляции, но в целом модель может быть признана в целом статистически значимой и интерпретировать ее коэффициенты следующим образом :

Таким образом, модель, описывающая зависимость между объемом инвестиций, объемом ВВП и госрасходами является следующее уравнение

На основании полученных коэффициентов можно предполагать, что увеличение на 1млрд $ объема ВВП вызывает увеличение на 375 млн $ инвестиционные поступления, в то время как увеличение госрасходов на 1млрд $ вызывает снижение инвестиционных поступлений на 34млн$.

Заключение

В данной курсовой работе была оценена модель множественной регрессии, которая позволила сделать вывод о том, что между объемом ВВП и инвестициями в экономику сильная прямая связь (страны с развитой экономикой имеют возможность ее развивать и дальше ), а вот увеличение госрасходов «вытесняет » инвестиции. Между объемом ВВП и инвестициями присутствует прямая связь, между госрасходами и объемом инвестиций тоже сильная линейная прямая связь.

Список используемой литературы

1. Магнус Я.Р. Эконометрика. Начальный курс / Магнус Я.Р., Катышев П.К., Пересецкий - М.: Дело, 2000.

2. С.А. Бородич Эконометрика.- Мн.: ООО Новое знание.-2001.- 407с. :ил.

3. Доугерти К. Введение в эконометрику.-М: ИНФРА-М, 2004.-415с. :ил.

4. Практикум по эконометрике: Учеб. пособие/ И.И. Елисеева, С.В. Курышева, Н.М. Гордеенко и др.; Под ред. И.И. Елисеевой.- М: Финансы и статистика, 2001.- 192с. : с ил.

5. Айвазян С.А. Прикладная статистика и основы эконометрики/ Айвазян С.А., Мхитарян B.C. М.: ЮНИТИ, 1998.

6. сайт МВФ

7. http://soft.mail.ru/program/matrixer/5.1

8. http://www.nsu.ru/ef/tsy/ecmr/index.html. Эконометрическая страничка Цыплакова А.

9. http://molchanov.narod.ru/ Персональный сайт Молчанова И.Н.

Приложение

эконометрическая модель

I общие инвестиции,млрд.долл

ВВП в текущих ценах, млрд.долл. Y

государственные расходы, млрд.долл. G

110,0828798

435,179

172,2394964

420,0978634

1507,402

552,8999796

96,67419522

425,091

220,0228507

499,0279521

2517,927

987,3295352

408,8931

1758,68

743,9919872

3400,030424

6988,47

1567,933129

53,95909032

270,553

145,8010117

595,7172545

2808,265

1586,950552

693,2847104

3628,623

1661,437613

693,3512717

1843,382

470,3389173

274,4461549

834,335

162,5868615

49,00905212

245,266

106,9065441

447,8386905

2245,706

1122,111917

1250,651255

5855,383

2443,802649

327,6694844

1163,847

243,1858307

54,0533421

247,565

76,76743085

166,4466283

858,282

424,84959

101,2131475

479,297

218,1520296

28,22236149

204,081

40,14885513

114,5513084

531,758

243,5079409

42,54664627

241,921

116,2285252

427,6656417

1884,903

720,9565485

113,9413878

560,294

231,8384513

69,31346482

266,498

51,91647538

81,84141504

422,037

134,093816

335,5977432

1536,479

659,6872587

117,8399684

571,567

276,3583602

133,6057747

665,898

228,6960091

176,6719859

763,096

265,374265

348,7510775

2480,978

1131,499636

2384,308428

15064,816

6213,634007

Размещено на Allbest.ru

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.