Дисперсионный анализ
Применение графического метода отображения связи между признаками генеральной совокупности. Расчет параметров уравнения линейной регрессии и коэффициента эластичности. Анализ дисперсии зависимой переменной. Интервальная оценка для коэффициента корреляции.
Рубрика | Экономика и экономическая теория |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 26.04.2015 |
Размер файла | 109,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Провести корреляционно-регрессионный анализ исходных данных:
x |
161 |
183 |
149 |
119 |
230 |
201 |
278 |
219 |
180 |
185 |
139 |
129 |
91 |
132 |
160 |
|
y |
790 |
570 |
860 |
1010 |
520 |
650 |
570 |
620 |
730 |
730 |
690 |
1060 |
1860 |
840 |
800 |
x |
290 |
160 |
231 |
316 |
213 |
138 |
139 |
180 |
230 |
180 |
210 |
290 |
270 |
210 |
150 |
|
y |
490 |
800 |
510 |
450 |
540 |
820 |
690 |
580 |
510 |
740 |
630 |
480 |
560 |
550 |
810 |
Для облегчения расчетов составляется корреляционная таблица:
Таблица 1
45 |
48 |
49 |
51 |
52 |
54 |
55 |
56 |
57 |
58 |
62 |
63 |
65 |
69 |
73 |
74 |
79 |
80 |
81 |
82 |
84 |
86 |
101 |
106 |
186 |
|||
91 |
1 |
1 |
|||||||||||||||||||||||||
119 |
1 |
1 |
|||||||||||||||||||||||||
129 |
1 |
1 |
|||||||||||||||||||||||||
132 |
1 |
1 |
|||||||||||||||||||||||||
138 |
1 |
1 |
|||||||||||||||||||||||||
139 |
2 |
2 |
|||||||||||||||||||||||||
149 |
1 |
1 |
|||||||||||||||||||||||||
150 |
1 |
1 |
|||||||||||||||||||||||||
160 |
2 |
2 |
|||||||||||||||||||||||||
161 |
1 |
1 |
|||||||||||||||||||||||||
180 |
1 |
1 |
1 |
3 |
|||||||||||||||||||||||
183 |
1 |
1 |
|||||||||||||||||||||||||
185 |
1 |
1 |
|||||||||||||||||||||||||
201 |
1 |
1 |
|||||||||||||||||||||||||
210 |
1 |
1 |
2 |
||||||||||||||||||||||||
213 |
1 |
1 |
|||||||||||||||||||||||||
219 |
1 |
1 |
|||||||||||||||||||||||||
230 |
1 |
1 |
2 |
||||||||||||||||||||||||
231 |
1 |
1 |
|||||||||||||||||||||||||
270 |
1 |
1 |
|||||||||||||||||||||||||
278 |
1 |
1 |
|||||||||||||||||||||||||
290 |
1 |
1 |
2 |
||||||||||||||||||||||||
316 |
1 |
1 |
|||||||||||||||||||||||||
1 |
1 |
1 |
2 |
1 |
1 |
1 |
1 |
2 |
1 |
1 |
1 |
1 |
2 |
2 |
1 |
1 |
2 |
1 |
1 |
1 |
1 |
1 |
1 |
30 |
1. Графический метод и линейная регрессия
графический корреляция регрессия интервальный
Графический метод применяют для наглядного изображения формы связи между изучаемыми признаками генеральной совокупности. Для этого в прямоугольной системе координат строят график, откладывая по оси ординат индивидуальные значения результативного признака Y, а по оси абсцисс - индивидуальные значения факторного (объясняющего) признака X. Совокупность получающихся точек называется полем корреляции или корреляционным полем.
На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер: . В результате имеем
, (1)
где и - оценки параметров б и в, - случайная ошибка (отклонение, возмущение).
Так как отклонения для каждого конкретного -го наблюдения случайны и их значения в выборке неизвестны, то обычно считается, что - случайная величина с независимыми значениями и характеристиками , .
Оценки а и b параметров б и в проводятся по результатам выборки , с помощью метода наименьших квадратов (МНК), дающего состоятельные, эффективные и несмещенные оценки этих параметров. Формально критерий МНК можно записать так:
. (2)
Из необходимых условий этого экстремума , следует система уравнений, определяющая искомые оценки а и b:
(3)
где использованы обозначения
.
Из (3) получается, что оценки b и а равны
, . (4)
С учетом (2) далее имеем
, , , , .
Выборочное уравнение линейной регрессии в этих обозначениях имеет вид:
. (6)
1.1 Расчет параметров уравнения линейной регрессии
С помощью данных, приведенных в таблице 1, проводятся соответствующие расчеты.
Выборочные средние:
; ;
.
Выборочные дисперсии:
,
.
Выборочные среднеквадратические отклонения:
; .
Выборочная ковариация:
.
Выборочный коэффициент корреляции:
.
Коэффициент корреляции принимает значения от -1 до +1. Связи между признаками могут быть слабыми и высокими (тесными). Их критерии оцениваются по шкале Чеддока:
0,1<<0,3 |
0,3<<0,5 |
0,5<<0,7 |
0,7<<0,9 |
0,9<<1 |
|
слабая |
умеренная |
заметная |
высокая |
весьма высокая |
Связь между признаками также характеризует и знак коэффициента регрессии b (или ): если , то связь между признаком Y и фактором X прямая, иначе - обратная. В нашем примере связь между Y и X высокая и обратная ().
Уравнение линейной регрессии для исходных данных имеет вид
или
Приведем график этой линейной регрессии на корреляционном поле:
Коэффициентам уравнения линейной регрессии можно придать экономический смысл. Коэффициент b = -3,46 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y понижается в среднем на -3,46. Коэффициент a = 1379,33 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко к выборочным значениям. Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже, если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.
Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.
1.2 Коэффициент эластичности
Коэффициент линейной регрессии b нежелательно использовать для непосредственной оценки влияния факторов на результативный признак в том случае, если существует различие единиц измерения результативного показателя у и факторного признака х. Для этих целей вычисляются коэффициент эластичности и бета - коэффициент. Средний коэффициент эластичности E показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора x на 1% от своего среднего значения. Коэффициент эластичности находится по формуле:
,
откуда . Коэффициент эластичности меньше 1. Следовательно, при изменении Х на 1% Y изменится менее чем на 1%. Другими словами - влияние Х на Y не существенно.
Бета - коэффициент.
Бета - коэффициент показывает, на какую часть величины своего среднего квадратичного отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину его среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных:
.
Т.е. увеличение x на величину среднеквадратического отклонения приведет к уменьшению среднего значения Y на 0,74 среднеквадратичного отклонения .
Ошибка аппроксимации.
Оценим качество уравнения линейной регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:
,
Поскольку ошибка меньше 15%, то данное уравнение можно использовать в качестве регрессии.
2. Дисперсионный анализ
Задача дисперсионного анализа состоит в анализе дисперсии зависимой переменной c использованием тождества
,
в котором - общая сумма квадратов отклонений, - сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная»); - остаточная сумма квадратов отклонений.
Степень близости связи признака и фактора к линейной связи характеризуется коэффициентом парной корреляции rxy. Для любой формы корреляционной зависимости теснота связи определяется с помощью выборочного корреляционного отношения
.
При линейной регрессии на выборочное корреляционное отношение равно , т.к. согласно (2) и (5) .
2.1 Коэффициент детерминации
Квадрат выборочного корреляционного отношения называется коэффициентом детерминации, который показывает долю вариации результативного признака, объясненную вариацией факторного признака. Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.
В рассматриваемом случае R2=1-(-0.74)2 = 0.5413, т.е. в 54.13 % случаев изменения х приводят к изменению y. Другими словами, точность подбора уравнения регрессии - средняя. Остальные 45.87 % изменения Y объясняются факторами, не учтенными в модели
3. Оценки параметров уравнения регрессии
3.1 Значимость коэффициента корреляции
Согласно нашим данным
.
По таблице Стьюдента с уровнем значимости б=0.05 и степенями свободы k=28 находим tкрит(n-m-1;б/2) = tкрит(28;0.025) = 2.048, где m = 1 - количество объясняющих переменных. Если tнабл > tкрит, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается). Поскольку в нашем случае tнабл > tкрит, то отклоняем гипотезу о равенстве нулю коэффициента корреляции. Другими словами, коэффициент корреляции статистически значим.
3.2 Интервальная оценка для коэффициента корреляции (доверительный интервал)
Доверительный интервал для коэффициента корреляции определяется формулой
.
В нашем случае имеем
, (-0,9072; -0,.5642) .
3.3 Анализ точности определения оценок коэффициентов регрессии
Несмещенной оценкой дисперсии возмущений является величина:
.
S2y = 33699,64 - необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии); - стандартная ошибка оценки (стандартная ошибка регрессии).
Sa - стандартное отклонение случайной величины a и
.
Sb - стандартное отклонение случайной величины b и
.
3.4 Доверительные интервалы для зависимой переменной
Экономическое прогнозирование на основе построенной модели предполагает, что сохраняются ранее существовавшие взаимосвязи переменных и на период упреждения. Для прогнозирования зависимой переменной результативного признака необходимо знать прогнозные значения всех входящих в модель факторов. Прогнозные значения факторов подставляют в модель и получают интервальные прогнозные оценки изучаемого показателя:
, где .
Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при достаточно большом числе наблюдений и xp = 211: , (1379,33-3,46211 ± 72.48). С вероятностью 95% можно гарантировать, что значения Y при достаточно большом числе наблюдений не выйдет за пределы интервала .
Индивидуальные доверительные интервалы для Y при данном значении X.
(a + b ± ), где
.
xi |
y = 1379.33 -3.46xi |
еi |
ymin |
ymax |
|
161 |
822.83 |
384.09 |
438.74 |
1206.92 |
|
183 |
746.79 |
382.34 |
364.45 |
1129.13 |
|
149 |
864.31 |
385.84 |
478.46 |
1250.15 |
|
119 |
968 |
392.64 |
575.37 |
1360.64 |
|
230 |
584.33 |
385.02 |
199.32 |
969.35 |
|
201 |
684.57 |
382.33 |
302.24 |
1066.9 |
|
278 |
418.42 |
396.55 |
21.87 |
814.97 |
|
219 |
622.35 |
383.61 |
238.75 |
1005.96 |
|
180 |
757.16 |
382.47 |
374.69 |
1139.62 |
|
185 |
739.87 |
382.28 |
357.6 |
1122.15 |
|
139 |
898.87 |
387.73 |
511.14 |
1286.6 |
|
129 |
933.44 |
390 |
543.44 |
1323.43 |
|
91 |
1064.78 |
401.95 |
662.84 |
1466.73 |
|
132 |
923.07 |
389.28 |
533.79 |
1312.35 |
|
160 |
826.29 |
384.21 |
442.07 |
1210.5 |
|
290 |
376.94 |
400.74 |
-23.8 |
777.69 |
|
160 |
826.29 |
384.21 |
442.07 |
1210.5 |
|
231 |
580.88 |
385.17 |
195.71 |
966.04 |
|
316 |
287.07 |
411.51 |
-124.44 |
698.59 |
|
213 |
643.09 |
383.04 |
260.05 |
1026.13 |
|
138 |
902.33 |
387.94 |
514.39 |
1290.27 |
|
139 |
898.87 |
387.73 |
511.14 |
1286.6 |
|
180 |
757.16 |
382.47 |
374.69 |
1139.62 |
|
230 |
584.33 |
385.02 |
199.32 |
969.35 |
|
180 |
757.16 |
382.47 |
374.69 |
1139.62 |
|
210 |
653.46 |
382.81 |
270.65 |
1036.27 |
|
290 |
376.94 |
400.74 |
-23.8 |
777.69 |
|
270 |
446.07 |
394.03 |
52.04 |
840.11 |
|
210 |
653.46 |
382.81 |
270.65 |
1036.27 |
С вероятностью 95% можно гарантировать, что значения Y при достаточно большом числе наблюдений не выйдет за пределы найденных интервалов.
Доверительный интервал для коэффициентов уравнения регрессии.
Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:
, (1379,3255 - 2,048*120,28; 1379,3255 + 2.048*120.28),
или (-3,4565- 2,048*0,6; -3,4565 + 2,048*0.6).
С вероятностью 95% можно утверждать, что значения параметров a и b будут лежать в найденных[ интервалах (1132,9836; 1625,6673) и (-4,6881; -2,2249), соответственно.
4. Проверка гипотез относительно уравнения линейной регрессии
4.1 F-статистика. Критерий Фишера
Проверка значимости модели линейной регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.
Если расчетное значение Fтабл с k1=(m) и k2=(n-m-1) степенями свободы больше фактического значения при заданном уровне значимости, то модель считается значимой, где m - число факторов в модели.
Оценка статистической значимости линейной регрессии производится по следующему алгоритму:
1. Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо: H0: R2=0 на уровне значимости б.
2. Далее определяется фактическое значение F-критерия:
, ,
где учтено, что m=1 для парной регрессии.
3. Табличное значение определяется по таблицам распределения Фишера для заданного уровня значимости, принимая во внимание, что число степеней свободы для общей суммы квадратов (большей дисперсии) равно 1 и число степеней свободы остаточной суммы квадратов (меньшей дисперсии) при линейной регрессии равно n-2. Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости б. Уровень значимости б - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно б принимается равной 0,05 или 0,01. Табличное значение критерия со степенями свободы k1=1 и k2=28 и уровнем значимости 0,05 равно 4.
Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу. В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-б) принимается альтернативная гипотеза о статистической значимости уравнения в целом. Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
4.2 t-статистика. Критерий Стьюдента
Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 - не равно нулю) на уровне значимости б=0.05. В случае если основная гипотеза окажется неверной, принимается альтернативная гипотеза.
Для проверки основной (нулевой) гипотезы используется t-критерий Стьюдента. Найденное по данным наблюдений значение t -критерия (его еще называют наблюдаемым или фактическим) сравнивается с табличным (критическим) значением , определяемым по таблицам распределения Стьюдента. Табличное значение определяется в зависимости от уровня значимости (б) и числа степеней свободы, которое в случае линейной регрессии равно n-2, где n-число наблюдений.
Если фактическое значение t -критерия больше табличного (по модулю), то основную гипотезу отвергают и считают, что с вероятностью (1-б) рассматриваемый параметр или статистическая характеристика в генеральной совокупности значимо отличается от нуля.
Если фактическое значение t-критерия меньше табличного (по модулю), то нет оснований отвергать основную гипотезу, т.е. параметр или статистическая характеристика в генеральной совокупности незначимо отличается от нуля при уровне значимости б.
В нашем случае
, .
Поскольку 5.75 > 2.048, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Далее имеем
.
Поскольку 11.47 > 2.048, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Размещено на Allbest.ru
...Подобные документы
Виды и способы статистического наблюдения. Построение и анализ вариационных рядов распределения. Оценка параметров генеральной совокупности банков на основе выборочных данных. Расчет парного коэффициента корреляции и уравнения однофакторной регрессии.
контрольная работа [712,1 K], добавлен 30.03.2014Сущность и применение метода наименьших квадратов для однофакторной линейной регрессии. Нахождение коэффициента эластичности для указанной модели в заданной точке X и его экономический анализ. Прогноз убыточности на основании линейной регрессии.
контрольная работа [47,3 K], добавлен 15.06.2009Расчет параметров уравнения линейной регрессии, экономическая интерпретация регрессии. Определение остаточной суммы квадратов. Выполнение предпосылок МНК. Расчет коэффициента детерминации, проверка значимости уравнения регрессии с помощью критерия Фишера.
контрольная работа [317,0 K], добавлен 11.05.2009Назначение рангового коэффициента корреляции, определение силы и направления корреляционной связи между двумя признаками или двумя профилями (иерархиями) признаков. Графическое представление метода ранговой корреляции, расчет эмпирического значения rs.
презентация [46,5 K], добавлен 12.11.2010Исследование типа регрессии между случайными переменными. Построение эмпирического уравнения регрессии. Расчет выборочных средних, дисперсий и среднеквадратического отклонения. Определение показателя тесноты связи как линейного коэффициента корреляции.
контрольная работа [513,5 K], добавлен 02.05.2015Эффективность оборотных средств. Оценка тесноты связи между факторным и результативным показателями на основе корреляционного анализа. Проверка значимости коэффициента корреляции. Оценка значимости уравнения линейной регрессии. Формы связи показателей.
курсовая работа [143,2 K], добавлен 15.03.2015Изучение зависимости доли сельского населения от величины среднедушевых денежных доходов. Расчет параметров линейной функции на основании исходных данных по областям. Определение среднего коэффициента эластичности. Расчет коэффициента корреляции.
методичка [55,1 K], добавлен 02.06.2012Парная линейная регрессия. Полный регрессионный анализ. Коэффициент корреляции и теснота линейной связи. Стандартная ошибка регрессии. Значимость уравнения регрессии. Расположение доверительных интервалов. Расчет параметров множественной регрессии.
контрольная работа [932,7 K], добавлен 09.06.2012Расчет показателей динамики стоимости имущества ОАО "Сургутнефтегаз". Построение линейного уравнения тренда роста балансовой стоимости имущества. Однофакторный дисперсионный анализ. Параметры уравнения регрессии. Значимость коэффициента корреляции.
дипломная работа [146,6 K], добавлен 29.11.2014Понятие и основные виды выборочного наблюдения. Ошибки выборочного статистического наблюдения. Определение генеральной совокупности, проблема соотношения выборки и совокупности. Точечная и интервальная оценка параметров генеральной совокупности.
контрольная работа [32,6 K], добавлен 02.12.2015Расчет параметров линейного уравнения множественной регрессии с перечнем факторов по данным о деятельности компаний США. Оценка силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности. Доверительный интервал прогноза.
лабораторная работа [666,9 K], добавлен 21.04.2015Методика построения графика зависимости между величиной капитала и чистыми активами банков, определение уравнения регрессии зависимости чистых активов и капитала коммерческих банков. Вычисление показателей тесноты связи между изучаемыми признаками.
контрольная работа [89,5 K], добавлен 04.02.2009Понятие, виды производственных средств. Расчет линейного коэффициента корреляции. Аналитическое выражение связи между факторным и результативным показателем на основе регрессионного анализа. Расчет параметров уравнения тренда методом наименьших квадратов.
курсовая работа [80,9 K], добавлен 07.03.2016Средние статистические величины и аналитическая группировка данных предприятия. Результаты расчета коэффициента Фехнера по цехам. Измерение степени тесноты связи в статистике с помощью показателя корреляции. Поля корреляции и уравнения регрессии для цеха.
практическая работа [495,9 K], добавлен 26.11.2012Порядок построения линейного уравнения парной регрессии, расчет коэффициентов и оценка статической значимости параметров регрессии и корреляции. Точность прогноза. Множественная регрессия и корреляция. Системы эконометрических уравнений. Временные ряды.
контрольная работа [1,3 M], добавлен 24.09.2013Этапы корреляционно-регрессионного анализа, построение корреляционной модели и определение функции, отражающей механизм связи между факторным и результативным признаками. Измерение тесноты корреляционной связи, расчет индекса корреляции и дисперсии.
лекция [38,1 K], добавлен 13.02.2011Статистический ряд распределения фермерских хозяйств по удою от одной коровы. Определение ошибки выборки и границ для среднего удоя в генеральной совокупности. Связь между признаками методом аналитической группировки. Расчет межгрупповой дисперсии.
контрольная работа [535,7 K], добавлен 14.11.2013Проверка выполнения предпосылок МНК. Значимость параметров уравнения регрессии с помощью t-критерия Стьюдента и F-критерия Фишера. Средняя относительная ошибка аппроксимации. Гиперболические, степенные и показательные уравнения нелинейной регрессии.
контрольная работа [253,4 K], добавлен 17.03.2011Эконометрическое моделирование динамики экспорта и импорта РФ: построение регрессии, дисперсионный анализ для линейной регрессии, эластичность показательной регрессии, изучение качества линейной регрессии, колеблемость признака. Доверительные интервалы.
курсовая работа [367,5 K], добавлен 21.08.2008Статистика розничного и оптового товарооборота: показательная регрессия, построение регрессии. Дисперсионный анализ для линейной регрессии, изучение ее качества. Доверительные интервалы для оцененных параметров и критерий Фишера значимости регрессии.
контрольная работа [300,4 K], добавлен 21.08.2008