Основы эконометрики
Оценка параметров уравнения линейной регрессии по методу наименьших квадратов. Определение выборочного коэффициента корреляции. Частичная как вид мультиколлинеарности, при которой факторные переменные связаны некоторой стохастической зависимостью.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 05.02.2016 |
Размер файла | 441,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
Размещено на http://www.allbest.ru
1. По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (Y , млн. руб.) от объема капиталовложений (X , млн. руб.)
Требуется:
1. Построить корреляционное поле и по его виду определить формулу зависимости между X и Y.
2. Оценить параметры уравнения линейной регрессии по методу наименьших квадратов, дать экономическую интерпретацию коэффициента регрессии.
3. Вычислить выборочный коэффициент корреляции.
4. Вычислить коэффициент детерминации . Сделать вывод о качестве модели. (Критерий Фишера).
5. Осуществить прогнозирование среднего значения объёма выпуска продукции, если прогнозное значения фактора Х составит 80% от его максимального значения.
6. Построить график полученного уравнения регрессии в той же системе координат, что и поле корреляции.
X 17 22 10 7 12 21 14 7 20 3
Y 26 27 22 19 21 26 20 15 30 13
Решение.
Рассмотрим зависимость объема выпуска продукции (Y, млн. руб.) от объема капиталовложений (X, млн. руб.) на 10 предприятиях легкой промышленности (n=10).
Коэффициент корреляции положительный, это свидетельствует о наличии прямой статистической связи, то есть с увеличением x - y в сущности увеличивается.
Оценим значимость полученного коэффициента с помощью t-критерия Стьюдента.
Расчетное значение t-критерия определяем по формуле:
tтабл. = 2,306
tрасч.=6,916 > tтабл.=2,306
Значит, коэффициент корреляции значим.
1. Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
Для оценки параметров линейного уравнения парной регрессии используем метод наименьших квадратов (МНК).Для расчетов используется программа «Регрессия» надстройки «Анализ данных» пакета Excel.
Таким образом, получим уравнение регрессии вида .
Параметр b является коэффициентом регрессии. Он равен 0,761, то есть, с увеличением объема капиталовложений на 1 млн. руб. объем выпускаемой продукции по предприятиям легкой промышленности увеличится в среднем на 761 тыс. руб., что свидетельствует об эффективности работы предприятий.
2. Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков ; построить график остатков.
Проверка адекватности построенной модели регрессии проводится на основе анализа остатков - ei.
Остатки рассчитываются по формуле:
Расчет остатков произведен с помощью прикладной программы Excel в таблице «Вывод остатка».
Рис. 1
Остаточная сумма квадратов рассчитывается по формуле (использована функция СУММКВ Мастера функций Excel):
Дисперсия остатков рассчитывается по формуле (использована функция ДИСП Мастера функций Excel):
3. Проверить выполнение предпосылок МН
Проверить выполнение предпосылок МНК, т.е. оценить адекватность построенной модели, можно на основе исследования свойств остатков.
1. Нулевое или близкое к нулю среднее значение остатков.
Это свойство означает, что ?(yi - yi) = 0 или может быть величиной близкой к нулю. В данной задаче просуммированные остатки равны нулю, то есть первое свойство выполняется.
2. Случайный характер остатков.
Проверить это свойство можно на основе критерия поворотных точек. В соответствии с этим критерием в случайном ряду остатков должно выполняться строгое неравенство:
Поскольку P=6 больше 2, то свойство случайности остатков выполняется.
3. Независимость остатков (отсутствие автокорреляции).
Проверку этого свойства можно провести с помощью коэффициента автокорреляции, который рассчитывается по формуле (использована функция КОРРЕЛ Мастера функций Excel):
Проверим полученный коэффициент автокорреляции на значимость с помощью t-критерия Стьюдента.
tрасч.=1,147 < tтабл.=2,306, значит коэффициент корреляции не значим, т.е. остатки неавтокоррелированны. Это означает, что свойство независимости остатков выполняется.
4. Соответствие ряда остатков нормальному закону распределения.
Данное свойство проверяется с помощью R/S критерия.
С помощью функции СТАНДОТКЛОН Мастера функций Excel по таблице остатков найдем среднее квадратическое отклонение.
Sе = 2,054
Расчетное значение этого R/S критерия определяется по формуле:
Для данной задачи n=10 и б=0,05, значит границы интервала равны 2,67 и 3,57. Расчетное значение R/S - критерия попадает в интервал 2,67<2,647< 3,57, следовательно, свойство нормальности остатков выполняется.
5. Гомоскедастичность (постоянство) дисперсии остатков.
Для обнаружения гетероскедастичности (то есть нарушение гомоскедастичности), используем тест Гольдфельда-Квандта:
а) Упорядочим выборку из n-наблюдений по мере возрастания факторного признака x.
б) Совокупность наблюдений разделим на 2 группы, соответственно с малыми и большими значениями факторного признака х.
Определим по каждой из групп уравнения регрессии:
- для первой группы с помощью программы Регрессия надстройки Анализ данных пакета Excel получим уравнение регрессии:
- для второй группы, так же, с помощью программы Регрессия пакета Анализ данных в среде Excel получим уравнение регрессии:
в) Вычислим остаточную сумму квадратов:
- для первой регрессии, она определяется по формуле (использована функция СУММКВ Мастера функций Excel):
- для второй регрессии, она определяется по формуле (использована функция СУММКВ Мастера функций Excel):
Далее используем F-критерий Фишера. Расчетное значение этого Критерия определяется по формуле:
Табличное значение F-критерия Фишера находим при помощи функции FРАСПОБР Мастера функций Excel.
Поскольку Fрасч=1,653<Fтабл=5,391, то свойство гетероскедастичности не имеет места, т.е. остатки обладают свойством гомоскедастичности.
Таким образом, выполняются все условия проверки (предпосылки МНК), это значит, что построенная регрессионная модель является адекватной реальному процессу, а, следовательно, её можно использовать для построения прогнозных оценок.
4. Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента
Для оценки статистической значимости, существенности параметров модели парной регрессии , используется t-критерий Стьюдента. Расчетные значения t-статистики получаются путем сопоставления значения параметров a и b с величинами случайных ошибок этих параметров Sa и Sb:
Случайные ошибки определяются по формулам:
Воспользуемся результатами, полученными программой Регрессия надстройки Анализ данных пакета Excel.
Далее, полученные расчетные значения: = 7,285 ; =6,916 сравниваем с табличным значением tтабл . Табличное значение t-критерия определяется при (n-2) - в нашем случае n-2=10-2=8 степеней свободы и соответственно уровнем значимости б=0,05; рассчитаем tтабл = 2,306.
Таким образом, значение > tтабл, следовательно, параметр а значим, и >tтабл - параметр b также значим.
5. Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью - критерия Фишера , найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
Коэффициент детерминации рассчитывается по формуле:
Используя программу Регрессия надстройки Анализ данных пакета Excel, получим R-квадрат=0,857.
Таким образом, все изменения объема выпуска продукции в среднем обусловлены на 85,7% изменениями объема капиталовложений и на 14,3% - изменениями факторов, неучтенных в модели.
Для проверки значимости модели регрессии используют F-критерий Фишера. С этой целью выполняется сравнение расчетного Fрасч значения и табличного значения Fтабл критерия Фишера.
Fрасч рассчитывают по формуле:
Fтабл=(б, m, n-m-1) рассчитывают с помощью функции FРАСПОБР Мастера функций Excel:
Fтабл =5,32.
Так как, Fрасч > Fтабл , то уравнение регрессии в целом значимо.
Оценку качества построенной модели (её точности) даёт также средняя относительная ошибка аппроксимации (средняя относительная ошибка модели), которая рассчитывается по формуле:
Произведем расчеты с помощью программы Excel. Чтобы найти воспользуемся функцией ABS Мастера функций Excel.
.
Это означает, что в среднем расчетные значения отличаются от фактических значений на 8,40%.
Так как =8,40% < 10%, то ошибка считается приемлемой, что говорит о хорошей точности модели.
6. Осуществить прогнозирование среднего значения показателя при уровне значимости , если прогнозное значения фактора Х составит 80% от его максимального значения.
Осуществим прогнозирование при . Прогнозное значение признака y получается при подстановке в уравнение регрессии соответствующего прогнозного значения факторного признака x:
Такой прогноз называется точечным. Значение факторного признака xпрог не должно значительно отличаться от входящих в исследуемую выборку (по которой определено уравнение регрессии). Точечный прогноз обычно сопровождают интервальным, поскольку трудно ожидать совпадения в будущем фактического значения y с прог. Интервальный прогноз задается с помощью доверительного интервала: , где U - величина отклонения от линии регрессии.
Доверительный интервал - это интервал, в котором с заданной вероятностью можно ожидать появление фактического значения прогнозируемого показателя.
Величина U оценивается по формуле:
Стандартная ошибка - Se =2,178; рассчитаем с помощью программы Excel - Мастера функций - СТЬЮДРАСПОБР (0,1;8); его значение составит =1,86.
Находим недостающие данные для расчета интервального прогноза.
В результате имеем точечный прогноз (25,176 ; 17,6)
Нижняя граница = 25,176-4,34=20,84
Верхняя граница =25,176+4,34=29,51
Таким образом, с вероятностью 80% объем выпуска продукции (Y, млн.руб.) при ожидаемых объемах капиталовложений (X, млн.руб.), будет находиться в пределах от 20,84 млн.руб. до 29,51 млн.руб.
7. Представить графически: фактические и модельные значения точки прогноза.
С помощью Мастер диаграмм пакета Excel графически отразим фактические и модельные значения Y, точки прогноза.
Для этого преобразуем сформированный программой Регрессия График подбора:
- Выберем тип диаграммы «точечная», на которой значения соединены отрезками;
- Далее на графике изобразим результаты прогнозирования. Для этого «кликнем» правой кнопкой мышки по точкам на графике, и в появившемся меню выберем Исходные данные. Затем на закладке «Ряд» нажмем кнопку «Добавить» и укажем диапазон размещения данных. Фактические значения Y отмечены на графике синим цветом, модельные - лиловым.
- Затем таким же образом добавляем прогнозные значения Y.
Рис. 2. Фактические, модельные значения Y и прогноз
8. Составить уравнения нелинейной регрессии:
· гиперболической;
· степенной;
· показательной.
Привести графики построенных уравнений регрессии.
а) Гиперболическая функция.
Уравнение гиперболической функции имеет вид:
Это уравнение приводится к линейному виду с помощью замены
Z=1/x
В результате получается линейное уравнение
Используя программу Регрессия надстройки Анализ данных пакета Excel, найдем параметры этого уравнения:
В полученное уравнение регрессии подставим имеющиеся значения х, таким образом найдем теоретические значения у. Затем по этим данным построим график гиперболической модели регрессии.
Рис. 3
б) Степенная функция.
Уравнение степенной модели имеет вид:
Приведем это уравнение к линейному виду. Для этого произведем логарифмирование обеих частей уравнения (использована функция LOG10 Мастера функций пакета Excel):
Обозначим . Тогда уравнение примет вид Y=A+bX - линейное уравнение регрессии.
Используя программу Регрессия надстройки Анализ данных пакета Excel, найдем параметры линейного уравнения регрессии степенной функции:
Перейдем к исходным переменным х и у, выполнив потенцирование данного уравнения:
Использовав функцию СТЕПЕНЬ Мастера функций Excel, получим уравнение степенной модели регрессии:
Найдем теоретические значения y, подставив имеющиеся значения х в полученное уравнение регрессии. По этим данным построим график степенной модели регрессии.
Рис. 4
в) Показательная функция.
Уравнение показательной кривой:
Приведем это уравнение к линейному виду. Для этого также произведем логарифмирование обеих частей уравнения (использована функция LOG10 Мастера функций пакета Excel):
.
Введем обозначения .
С учетом этих обозначений получим линейное уравнение регрессии: Y=A+Bx.
Используя программу Регрессия надстройки Анализ данных пакета Excel, найдем параметры линейного уравнения регрессии показательной функции:
.
Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения:
Использовав функцию СТЕПЕНЬ Мастера функций Excel, получим уравнение степенной модели регрессии:
Чтобы найти теоретические значения у, подставим в полученное уравнение имеющиеся значения х. Построим график показательной модели регрессии.
Рис. 5
9. Для указанных моделей найти коэффициенты детерминации, коэффициенты эластичности и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.
а) Линейная модель
Коэффициент детерминации рассчитывается по формуле (также его можно найти с помощью программы Регрессия надстройки Анализ данных пакета Excel):
Это означает, что все изменения в объеме выпуска продукции обусловлены в среднем на 85,7% изменениями объема капиталовложений и на 14,3% - вариациями неучтенных в модели факторов.
Коэффициент эластичности для линейной функции рассчитывается по формуле:
Значит, если увеличить объем капиталовложений на 1%, то объем выпуска продукции увеличится в среднем на 462 тыс. руб.
Средняя относительная ошибка аппроксимации для линейной модели была найдена выше (см. пункт 5)
б) Гиперболическая функция
Коэффициент детерминации рассчитывается по формуле (также его можно найти с помощью программы Регрессия надстройки Анализ данных пакета Excel):
Это означает, что все изменения в объеме выпуска продукции обусловлены в среднем на 67,2% изменениями объема капиталовложений и на 32,8% - вариациями неучтенных в модели факторов.
Коэффициент эластичности для гиперболы рассчитывается по формуле:
Значит, если увеличить объем капиталовложений на 1%, то объем выпуска продукции увеличится в среднем на 163 тыс. руб.
Средняя относительная ошибка аппроксимации определяется по формуле:
Произведем расчеты с помощью программы Excel. Чтобы найти воспользуемся функцией ABS Мастера функций Excel. Тогда:
Это означает, что в среднем расчетные значения для гиперболической модели отличаются от фактических значений на 12,47%.
Так как =12,47%, то ошибка считается приемлемой, что говорит о хорошем уровне точности модели.
в) Степенная функция
Коэффициент детерминации рассчитывается по формуле (также его можно найти с помощью программы Регрессия надстройки Анализ данных пакета Excel):
Это означает, что все изменения в объеме выпуска продукции обусловлены в среднем на 87,5% изменениями объема капиталовложений и на 12,5% - вариациями неучтенных в модели факторов.
Коэффициент эластичности для степенной функции рассчитывается по формуле:
Значит, если увеличить объем капиталовложений на 1%, то объем выпуска продукции увеличится в среднем на 394 тыс. руб.
Средняя относительная ошибка аппроксимации определяется по формуле:
Произведем расчеты с помощью программы Excel. Чтобы найти воспользуемся функцией ABS Мастера функций Excel. Тогда:
.
Это означает, что в среднем расчетные значения для гиперболической модели отличаются от фактических значений на 7,65%.
Так как =7,65%, то ошибка считается приемлемой, что говорит о хорошем уровне точности модели.
г) Показательная функция
Коэффициент детерминации рассчитывается по формуле (также его можно найти с помощью программы Регрессия надстройки Анализ данных пакета Excel):
Это означает, что все изменения в объеме выпуска продукции обусловлены в среднем на 84,2% изменениями объема капиталовложений и на 15,8% - вариациями неучтенных в модели факторов.
Коэффициент эластичности для показательной функции рассчитывается по формуле:
Значит, если увеличить объем капиталовложений на 1%, то объем выпуска продукции увеличится в среднем на 215 тыс. руб.
Средняя относительная ошибка аппроксимации определяется по формуле:
Произведем расчеты с помощью программы Excel. Чтобы найти воспользуемся функцией ABS Мастера функций Excel. Тогда:
.
Это означает, что в среднем расчетные значения для гиперболической модели отличаются от фактических значений на 9,54%.
Так как =9,54%, то ошибка считается приемлемой, что говорит о хорошем уровне точности модели.
Для сравнения моделей построим сводную таблицу результатов.
Табл. 1
Параметры Модель |
Коэффициент детерминацииR2 |
Коэффициент эластичности Э |
Средняя относительная ошибка , % |
|
Линейная |
0,857 |
0,462 |
8,4 |
|
Гиперболическая |
0,672 |
0,163 |
12,47 |
|
Степенная |
0,875 |
0,394 |
7,65 |
|
Показательная |
0,842 |
0,215 |
9,54 |
Сравнивая эти четыре модели можно сделать вывод, что степенная наилучшим образом подходит для построения прогноза, т.к. она имеет наилучшие значения коэффициента детерминации и средней относительной ошибки аппроксимации (т.е. 2-х параметров из 3-х).
2. По следующим статистическим данным постройте четыре регрессионные модели:
Табл. 2
T |
Y |
|||
1 |
18 |
11 |
2,0 |
|
2 |
20 |
12 |
2,1 |
|
3 |
23 |
13 |
2,2 |
|
4 |
23,5 |
14 |
2,4 |
|
5 |
24 |
15 |
3,0 |
Решение
1. Оценка уравнения регрессии. Определим вектор оценок коэффициентов регрессии. Согласно методу наименьших квадратов, вектор s получается из выражения: s = (XTX)-1XTY
К матрице с переменными Xj добавляем единичный столбец:
Табл. 3
1 |
11 |
2 |
|
1 |
12 |
2.1 |
|
1 |
13 |
2.2 |
|
1 |
14 |
2.4 |
|
1 |
15 |
3 |
Табл. 4. Матрица Y
18 |
|
20 |
|
23 |
|
23.5 |
Табл. 5. Матрица XT
1 |
1 |
1 |
1 |
1 |
|
11 |
12 |
13 |
14 |
15 |
|
2 |
2.1 |
2.2 |
2.4 |
3 |
В матрице, (XTX) число 5, лежащее на пересечении 1-й строки и 1-го столбца, получено как сумма произведений элементов 1-й строки матрицы XT и 1-го столбца матрицы X. Уравнение регрессии (оценка уравнения регрессии)
Y = -1.32 + 2.57X1-4.42X2
2. Матрица парных коэффициентов корреляции R. Число наблюдений n = 5. Число независимых переменных в модели равно 2, а число регрессоров с учетом единичного вектора равно числу неизвестных коэффициентов. С учетом признака Y, размерность матрицы становится равным 4. Матрица, независимых переменных Х имеет размерность (5 х 4).
Табл. 6. Матрица, составленная из Y и X
1 |
18 |
11 |
2 |
|
1 |
20 |
12 |
2.1 |
|
1 |
23 |
13 |
2.2 |
|
1 |
23.5 |
14 |
2.4 |
|
1 |
24 |
15 |
3 |
Табл. 7. Транспонированная матрица
1 |
1 |
1 |
1 |
1 |
|
18 |
20 |
23 |
23.5 |
24 |
|
11 |
12 |
13 |
14 |
15 |
|
2 |
2.1 |
2.2 |
2.4 |
3 |
Табл. 8. Матрица XTX
5 |
108.5 |
65 |
11.7 |
|
108.5 |
2381.25 |
1426 |
257 |
|
65 |
1426 |
855 |
154.4 |
|
11.7 |
257 |
154.4 |
28.01 |
Полученная матрица имеет следующее соответствие:
Табл. 9
?n |
?y |
?x1 |
?x2 |
|
?y |
?y2 |
?x1 y |
?x2 y |
|
?x1 |
?yx1 |
?x1 2 |
?x2 x1 |
|
?x2 |
?yx2 |
?x1 x2 |
?x2 2 |
Найдем парные коэффициенты корреляции.
регрессия стохастический мультиколлинеарность
Табл. 10
Признаки x и y |
?xi |
?yi |
?xiyi |
||||
Для y и x1 |
65 |
13 |
108.5 |
21.7 |
1426 |
285.2 |
|
Для y и x2 |
11.7 |
2.34 |
108.5 |
21.7 |
257 |
51.4 |
|
Для x1 и x2 |
11.7 |
2.34 |
65 |
13 |
154.4 |
30.88 |
Коллинеарность - зависимость между факторами. В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств:
r(xjy) > r(xkxj) ; r(xky) > r(xkxj).
Если одно из неравенств не соблюдается, то исключается тот параметр xk или xj, связь которого с результативным показателем Y оказывается наименее тесной.
Для отбора наиболее значимых факторов xi учитываются следующие условия:
- связь между результативным признаком и факторным должна быть выше межфакторной связи;
- связь между факторами должна быть не более 0.7. Если в матрице есть межфакторный коэффициент корреляции rxjxi > 0.7, то в данной модели множественной регрессии существует мультиколлинеарность.;
- при высокой межфакторной связи признака отбираются факторы с меньшим коэффициентом корреляции между ними.
Если факторные переменные связаны строгой функциональной зависимостью, то говорят о полной мультиколлинеарности. В этом случае среди столбцов матрицы факторных переменных Х имеются линейно зависимые столбцы, и, по свойству определителей матрицы, det(XTX = 0).
Вид мультиколлинеарности, при котором факторные переменные связаны некоторой стохастической зависимостью, называется частичной. Если между факторными переменными имеется высокая степень корреляции, то матрица (XTX) близка к вырожденной, т. е. det(XTX ? 0) (чем ближе к 0 определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии).
Вычисление определителя показано в шаблоне решения Excel
В нашем случае rx1 x2 имеют |r|>0.7, что говорит о мультиколлинеарности факторов и о необходимости исключения одного из них из дальнейшего анализа.
Модель регрессии в стандартном масштабе.
Модель регрессии в стандартном масштабе предполагает, что все значения исследуемых признаков переводятся в стандарты (стандартизованные значения) по формулам:
где хji - значение переменной хji в i-ом наблюдении.
Таким образом, начало отсчета каждой стандартизованной переменной совмещается с ее средним значением, а в качестве единицы изменения принимается ее среднее квадратическое отклонение S.
Если связь между переменными в естественном масштабе линейная, то изменение начала отсчета и единицы измерения этого свойства не нарушат, так что и стандартизованные переменные будут связаны линейным соотношением:
ty = ?вjtxj
Для оценки в-коэффициентов применим МНК. При этом система нормальных уравнений будет иметь вид:
rx1y=в1+rx1x2*в2 + ... + rx1xm*вm
rx2y=rx2x1*в1 + в2 + ... + rx2xm*вm
rxmy=rxmx1*в1 + rxmx2*в2 + ... + вm
Для наших данных (берем из матрицы парных коэффициентов корреляции):
0.947 = в1 + 0.915в2
0.756 = 0.915в1 + в2
Данную систему линейных уравнений решаем методом Гаусса: в1 = 1.567; в2 = -0.678;
Искомое уравнение в стандартизованном масштабе: ty=в1tx1+в2tx2
Расчет в-коэффициентов можно выполнить и по формулам:
Стандартизированная форма уравнения регрессии имеет вид:
y0 = 1.567x1 -0.678x2
Найденные из данной системы в-коэффициенты позволяют определить значения коэффициентов в регрессии в естественном масштабе по формулам:
3. Анализ параметров уравнения регрессии.
Перейдем к статистическому анализу полученного уравнения регрессии: проверке значимости уравнения и его коэффициентов, исследованию абсолютных и относительных ошибок аппроксимации
Для несмещенной оценки дисперсии проделаем следующие вычисления:
Средняя ошибка аппроксимации
Оценка дисперсии равна:
se2 = (Y - X*Y(X))T(Y - X*Y(X)) = 0.77
Несмещенная оценка дисперсии равна:
Оценка среднеквадратичного отклонения (стандартная ошибка для оценки Y):
Дисперсии параметров модели определяются соотношением S2i = Kii, т.е. это элементы, лежащие на главной диагонали
Сравнительная оценка влияния анализируемых факторов на результативный признак.
5. Сравнительная оценка влияния анализируемых факторов на результативный признак производится:
- средним коэффициентом эластичности, показывающим на сколько процентов среднем по совокупности изменится результат y от своей средней величины при изменении фактора xi на 1% от своего среднего значения;
- в-коэффициенты, показывающие, что, если величина фактора изменится на одно среднеквадратическое отклонение Sxi, то значение результативного признака изменится в среднем на в своего среднеквадратического отклонения;
- долю каждого фактора в общей вариации результативного признака определяют коэффициенты раздельной детерминации (отдельного определения):
d2i = ryxiвi.
d21 = 0.95 * 1.567 = 1.48
d22 = 0.76 * (-0.678) = -0.51
При этом должно выполняться равенство:
?d2i = R2 = 0.97
6. Проверка общего качества уравнения множественной регрессии.
Оценка значимости уравнения множественной регрессии осуществляется путем проверки гипотезы о равенстве нулю коэффициент детерминации рассчитанного по данным генеральной совокупности: R2 или b1 = b2 =... = bm = 0 (гипотеза о незначимости уравнения регрессии, рассчитанного по данным генеральной совокупности).
Для ее проверки используют F-критерий Фишера.
При этом вычисляют фактическое (наблюдаемое) значение F-критерия, через коэффициент детерминации R2, рассчитанный по данным конкретного наблюдения.
По таблицам распределения Фишера-Снедоккора находят критическое значение F-критерия (Fкр). Для этого задаются уровнем значимости б (обычно его берут равным 0,05) и двумя числами степеней свободы k1=m и k2=n-m-1.
2) F-статистика. Критерий Фишера.
Чем ближе этот коэффициент к единице, тем больше уравнение регрессии объясняет поведение Y.
Более объективной оценкой является скорректированный коэффициент детерминации:
Добавление в модель новых объясняющих переменных осуществляется до тех пор, пока растет скорректированный коэффициент детерминации.
Проверим гипотезу об общей значимости - гипотезу об одновременном равенстве нулю всех коэффициентов регрессии при объясняющих переменных:
H0: R2 = 0; в1 = в2 = ... = вm = 0.
H1: R2 ? 0.
Проверка этой гипотезы осуществляется с помощью F-статистики распределения Фишера (правосторонняя проверка).
Если F < Fkp = Fб ; n-m-1, то нет оснований для отклонения гипотезы H0.
Табличное значение при степенях свободы k1 = 2 и k2 = n-m-1 = 5 - 2 - 1 = 2, Fkp(2;2) = 19.
Размещено на Allbest.ru
...Подобные документы
Поле корреляции и гипотеза о виде уравнения регрессии. Оценка величины влияния фактора на исследуемый показатель с помощью коэффициента корреляции и детерминации. Определение основных параметров линейной модели с помощью метода наименьших квадратов.
контрольная работа [701,1 K], добавлен 29.03.2011Моделирование экономических процессов с помощью однофакторной регрессии. Оценка параметров проекта методом наименьших квадратов. Расчет коэффициента линейной корреляции. Исследование множественной эконометрической линейной схемы на мультиколлинеарность.
курсовая работа [326,5 K], добавлен 19.01.2011Параметры уравнения и экономическое толкование коэффициента линейной регрессии. Расчет коэффициентов детерминации и средних относительных ошибок аппроксимации. Построение структурной формы модели с использованием косвенного метода наименьших квадратов.
контрольная работа [99,2 K], добавлен 27.04.2011Определение параметров уравнения линейной регрессии. Экономическая интерпретация коэффициента регрессии. Вычисление остатков, расчет остаточной суммы квадратов. Оценка дисперсии остатков и построение графика остатков. Проверка выполнения предпосылок МНК.
контрольная работа [1,4 M], добавлен 25.06.2010Основные методы анализа линейной модели парной регрессии. Оценки неизвестных параметров для записанных уравнений парной регрессии по методу наименьших квадратов. Проверка значимости всех параметров модели (уравнения регрессии) по критерию Стьюдента.
лабораторная работа [67,8 K], добавлен 26.12.2010Поля корреляции, характеризующие зависимость ВРП на душу населения от размера инвестиций в основной капитал. Оценка параметров уравнения парной линейной регрессии. Коэффициент множественной корреляции. Способы оценки параметров структурной модели.
контрольная работа [215,1 K], добавлен 22.11.2010Анализ метода наименьших квадратов для парной регрессии, как метода оценивания параметров линейной регрессии. Рассмотрение линейного уравнения парной регрессии. Исследование множественной линейной регрессии. Изучение ошибок коэффициентов регрессии.
контрольная работа [108,5 K], добавлен 28.03.2018Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.
контрольная работа [248,4 K], добавлен 26.12.2010Расчет параметров A и B уравнения линейной регрессии. Оценка полученной точности аппроксимации. Построение однофакторной регрессии. Дисперсия математического ожидания прогнозируемой величины. Тестирование ошибок уравнения множественной регрессии.
контрольная работа [63,3 K], добавлен 19.04.2013Понятие модели множественной регрессии. Сущность метода наименьших квадратов, который используется для определения параметров уравнения множественной линейной регрессии. Оценка качества подгонки регрессионного уравнения к данным. Коэффициент детерминации.
курсовая работа [449,1 K], добавлен 22.01.2015Основные параметры уравнения регрессии, оценка их параметров и значимость. Интервальная оценка для коэффициента корреляции. Анализ точности определения оценок коэффициентов регрессии. Показатели качества уравнения регрессии, прогнозирование данных.
контрольная работа [222,5 K], добавлен 08.05.2014Построение поля корреляции и формулирование гипотезы о форме связи. Параметры уравнений линейной, степенной и гиперболической регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Оценка средней ошибки аппроксимации уравнения.
контрольная работа [136,3 K], добавлен 25.09.2014Расчет параметров линейной регрессии. Сравнительная оценка тесноты связи с помощью показателей корреляции, детерминации, коэффициента эластичности. Построение поля корреляции. Определение статистической надежности результатов регрессионного моделирования.
контрольная работа [71,7 K], добавлен 17.09.2016Оценка корреляционной матрицы факторных признаков. Оценки собственных чисел матрицы парных коэффициентов корреляции. Анализ полученного уравнения регрессии, определение значимости уравнения и коэффициентов регрессии, их экономическая интерпретация.
контрольная работа [994,1 K], добавлен 29.06.2013Нахождение уравнения линейной регрессии, парного коэффициента корреляции. Вычисление точечных оценок для математического ожидания, дисперсии, среднеквадратического отклонения показателей x и y. Построение точечного прогноза для случая расходов на рекламу.
контрольная работа [216,6 K], добавлен 12.05.2010Расчет зависимости товарооборота за месяц. Параметры уравнения множественной регрессии, их оценка методом наименьших квадратов. Получение системы нормальных уравнений, ее решение по методу Крамера. Экономическая интерпретация параметров уравнения.
контрольная работа [45,6 K], добавлен 13.04.2014Понятие корреляционной связи. Связь между качественными признаками на основе таблиц сопряженности. Показатели тесноты связи между двумя количественными признаками. Определение коэффициентов уравнения линейной регрессии методом наименьших квадратов.
контрольная работа [418,7 K], добавлен 22.09.2010Оценка влияния разных факторов на среднюю ожидаемую продолжительность жизни по методу наименьших квадратов. Анализ параметров линейной двухфакторной эконометрической модели с помощью метода наименьших квадратов. Графическое изображение данной зависимости.
практическая работа [79,4 K], добавлен 20.10.2015Определение параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel. Методика расчета показателей парной нелинейной регрессии и корреляции. Вычисление значений линейных коэффициентов множественной детерминации.
контрольная работа [110,4 K], добавлен 28.07.2012Экономическая интерпретация коэффициента регрессии. Нахождение статочной суммы квадратов и оценка дисперсии остатков. Проверка значимости параметров уравнения регрессии с помощью t-критерия Стьюдента. Расчет средней относительной ошибки аппроксимации.
контрольная работа [261,1 K], добавлен 23.03.2010