Дисперсионный анализ

Применение графического метода отображения связи между признаками генеральной совокупности. Расчет параметров уравнения линейной регрессии и коэффициента эластичности. Анализ дисперсии зависимой переменной. Интервальная оценка для коэффициента корреляции.

Рубрика Экономика и экономическая теория
Вид контрольная работа
Язык русский
Дата добавления 26.04.2015
Размер файла 109,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Провести корреляционно-регрессионный анализ исходных данных:

x

161

183

149

119

230

201

278

219

180

185

139

129

91

132

160

y

790

570

860

1010

520

650

570

620

730

730

690

1060

1860

840

800

x

290

160

231

316

213

138

139

180

230

180

210

290

270

210

150

y

490

800

510

450

540

820

690

580

510

740

630

480

560

550

810

Для облегчения расчетов составляется корреляционная таблица:

Таблица 1

45

48

49

51

52

54

55

56

57

58

62

63

65

69

73

74

79

80

81

82

84

86

101

106

186

91

1

1

119

1

1

129

1

1

132

1

1

138

1

1

139

2

2

149

1

1

150

1

1

160

2

2

161

1

1

180

1

1

1

3

183

1

1

185

1

1

201

1

1

210

1

1

2

213

1

1

219

1

1

230

1

1

2

231

1

1

270

1

1

278

1

1

290

1

1

2

316

1

1

1

1

1

2

1

1

1

1

2

1

1

1

1

2

2

1

1

2

1

1

1

1

1

1

30

1. Графический метод и линейная регрессия

графический корреляция регрессия интервальный

Графический метод применяют для наглядного изображения формы связи между изучаемыми признаками генеральной совокупности. Для этого в прямоугольной системе координат строят график, откладывая по оси ординат индивидуальные значения результативного признака Y, а по оси абсцисс - индивидуальные значения факторного (объясняющего) признака X. Совокупность получающихся точек называется полем корреляции или корреляционным полем.

На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер: . В результате имеем

, (1)

где и - оценки параметров б и в, - случайная ошибка (отклонение, возмущение).

Так как отклонения для каждого конкретного -го наблюдения случайны и их значения в выборке неизвестны, то обычно считается, что - случайная величина с независимыми значениями и характеристиками , .

Оценки а и b параметров б и в проводятся по результатам выборки , с помощью метода наименьших квадратов (МНК), дающего состоятельные, эффективные и несмещенные оценки этих параметров. Формально критерий МНК можно записать так:

. (2)

Из необходимых условий этого экстремума , следует система уравнений, определяющая искомые оценки а и b:

(3)

где использованы обозначения

.

Из (3) получается, что оценки b и а равны

, . (4)

С учетом (2) далее имеем

, , , , .

Выборочное уравнение линейной регрессии в этих обозначениях имеет вид:

. (6)

1.1 Расчет параметров уравнения линейной регрессии

С помощью данных, приведенных в таблице 1, проводятся соответствующие расчеты.

Выборочные средние:

; ;

.

Выборочные дисперсии:

,

.

Выборочные среднеквадратические отклонения:

; .

Выборочная ковариация:

.

Выборочный коэффициент корреляции:

.

Коэффициент корреляции принимает значения от -1 до +1. Связи между признаками могут быть слабыми и высокими (тесными). Их критерии оцениваются по шкале Чеддока:

0,1<<0,3

0,3<<0,5

0,5<<0,7

0,7<<0,9

0,9<<1

слабая

умеренная

заметная

высокая

весьма высокая

Связь между признаками также характеризует и знак коэффициента регрессии b (или ): если , то связь между признаком Y и фактором X прямая, иначе - обратная. В нашем примере связь между Y и X высокая и обратная ().

Уравнение линейной регрессии для исходных данных имеет вид

или

Приведем график этой линейной регрессии на корреляционном поле:

Коэффициентам уравнения линейной регрессии можно придать экономический смысл. Коэффициент b = -3,46 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y понижается в среднем на -3,46. Коэффициент a = 1379,33 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко к выборочным значениям. Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже, если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.

Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.

1.2 Коэффициент эластичности

Коэффициент линейной регрессии b нежелательно использовать для непосредственной оценки влияния факторов на результативный признак в том случае, если существует различие единиц измерения результативного показателя у и факторного признака х. Для этих целей вычисляются коэффициент эластичности и бета - коэффициент. Средний коэффициент эластичности E показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора x на 1% от своего среднего значения. Коэффициент эластичности находится по формуле:

,

откуда . Коэффициент эластичности меньше 1. Следовательно, при изменении Х на 1% Y изменится менее чем на 1%. Другими словами - влияние Х на Y не существенно.

Бета - коэффициент.

Бета - коэффициент показывает, на какую часть величины своего среднего квадратичного отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину его среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных:

.

Т.е. увеличение x на величину среднеквадратического отклонения приведет к уменьшению среднего значения Y на 0,74 среднеквадратичного отклонения .

Ошибка аппроксимации.

Оценим качество уравнения линейной регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:

,

Поскольку ошибка меньше 15%, то данное уравнение можно использовать в качестве регрессии.

2. Дисперсионный анализ

Задача дисперсионного анализа состоит в анализе дисперсии зависимой переменной c использованием тождества

,

в котором - общая сумма квадратов отклонений, - сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная»); - остаточная сумма квадратов отклонений.

Степень близости связи признака и фактора к линейной связи характеризуется коэффициентом парной корреляции rxy. Для любой формы корреляционной зависимости теснота связи определяется с помощью выборочного корреляционного отношения

.

При линейной регрессии на выборочное корреляционное отношение равно , т.к. согласно (2) и (5) .

2.1 Коэффициент детерминации

Квадрат выборочного корреляционного отношения называется коэффициентом детерминации, который показывает долю вариации результативного признака, объясненную вариацией факторного признака. Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.

В рассматриваемом случае R2=1-(-0.74)2 = 0.5413, т.е. в 54.13 % случаев изменения х приводят к изменению y. Другими словами, точность подбора уравнения регрессии - средняя. Остальные 45.87 % изменения Y объясняются факторами, не учтенными в модели

3. Оценки параметров уравнения регрессии

3.1 Значимость коэффициента корреляции

Согласно нашим данным

.

По таблице Стьюдента с уровнем значимости б=0.05 и степенями свободы k=28 находим tкрит(n-m-1;б/2) = tкрит(28;0.025) = 2.048, где m = 1 - количество объясняющих переменных. Если tнабл > tкрит, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается). Поскольку в нашем случае tнабл > tкрит, то отклоняем гипотезу о равенстве нулю коэффициента корреляции. Другими словами, коэффициент корреляции статистически значим.

3.2 Интервальная оценка для коэффициента корреляции (доверительный интервал)

Доверительный интервал для коэффициента корреляции определяется формулой

.

В нашем случае имеем

, (-0,9072; -0,.5642) .

3.3 Анализ точности определения оценок коэффициентов регрессии

Несмещенной оценкой дисперсии возмущений является величина:

.

S2y = 33699,64 - необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии); - стандартная ошибка оценки (стандартная ошибка регрессии).

Sa - стандартное отклонение случайной величины a и

.

Sb - стандартное отклонение случайной величины b и

.

3.4 Доверительные интервалы для зависимой переменной

Экономическое прогнозирование на основе построенной модели предполагает, что сохраняются ранее существовавшие взаимосвязи переменных и на период упреждения. Для прогнозирования зависимой переменной результативного признака необходимо знать прогнозные значения всех входящих в модель факторов. Прогнозные значения факторов подставляют в модель и получают интервальные прогнозные оценки изучаемого показателя:

, где .

Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при достаточно большом числе наблюдений и xp = 211: , (1379,33-3,46211 ± 72.48). С вероятностью 95% можно гарантировать, что значения Y при достаточно большом числе наблюдений не выйдет за пределы интервала .

Индивидуальные доверительные интервалы для Y при данном значении X.

(a + b ± ), где

.

xi

y = 1379.33 -3.46xi

еi

ymin

ymax

161

822.83

384.09

438.74

1206.92

183

746.79

382.34

364.45

1129.13

149

864.31

385.84

478.46

1250.15

119

968

392.64

575.37

1360.64

230

584.33

385.02

199.32

969.35

201

684.57

382.33

302.24

1066.9

278

418.42

396.55

21.87

814.97

219

622.35

383.61

238.75

1005.96

180

757.16

382.47

374.69

1139.62

185

739.87

382.28

357.6

1122.15

139

898.87

387.73

511.14

1286.6

129

933.44

390

543.44

1323.43

91

1064.78

401.95

662.84

1466.73

132

923.07

389.28

533.79

1312.35

160

826.29

384.21

442.07

1210.5

290

376.94

400.74

-23.8

777.69

160

826.29

384.21

442.07

1210.5

231

580.88

385.17

195.71

966.04

316

287.07

411.51

-124.44

698.59

213

643.09

383.04

260.05

1026.13

138

902.33

387.94

514.39

1290.27

139

898.87

387.73

511.14

1286.6

180

757.16

382.47

374.69

1139.62

230

584.33

385.02

199.32

969.35

180

757.16

382.47

374.69

1139.62

210

653.46

382.81

270.65

1036.27

290

376.94

400.74

-23.8

777.69

270

446.07

394.03

52.04

840.11

210

653.46

382.81

270.65

1036.27

С вероятностью 95% можно гарантировать, что значения Y при достаточно большом числе наблюдений не выйдет за пределы найденных интервалов.

Доверительный интервал для коэффициентов уравнения регрессии.

Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:

, (1379,3255 - 2,048*120,28; 1379,3255 + 2.048*120.28),

или (-3,4565- 2,048*0,6; -3,4565 + 2,048*0.6).

С вероятностью 95% можно утверждать, что значения параметров a и b будут лежать в найденных[ интервалах (1132,9836; 1625,6673) и (-4,6881; -2,2249), соответственно.

4. Проверка гипотез относительно уравнения линейной регрессии

4.1 F-статистика. Критерий Фишера

Проверка значимости модели линейной регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.

Если расчетное значение Fтабл с k1=(m) и k2=(n-m-1) степенями свободы больше фактического значения при заданном уровне значимости, то модель считается значимой, где m - число факторов в модели.

Оценка статистической значимости линейной регрессии производится по следующему алгоритму:

1. Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо: H0: R2=0 на уровне значимости б.

2. Далее определяется фактическое значение F-критерия:

, ,

где учтено, что m=1 для парной регрессии.

3. Табличное значение определяется по таблицам распределения Фишера для заданного уровня значимости, принимая во внимание, что число степеней свободы для общей суммы квадратов (большей дисперсии) равно 1 и число степеней свободы остаточной суммы квадратов (меньшей дисперсии) при линейной регрессии равно n-2. Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости б. Уровень значимости б - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно б принимается равной 0,05 или 0,01. Табличное значение критерия со степенями свободы k1=1 и k2=28 и уровнем значимости 0,05 равно 4.

Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу. В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-б) принимается альтернативная гипотеза о статистической значимости уравнения в целом. Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).

4.2 t-статистика. Критерий Стьюдента

Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 - не равно нулю) на уровне значимости б=0.05. В случае если основная гипотеза окажется неверной, принимается альтернативная гипотеза.

Для проверки основной (нулевой) гипотезы используется t-критерий Стьюдента. Найденное по данным наблюдений значение t -критерия (его еще называют наблюдаемым или фактическим) сравнивается с табличным (критическим) значением , определяемым по таблицам распределения Стьюдента. Табличное значение определяется в зависимости от уровня значимости (б) и числа степеней свободы, которое в случае линейной регрессии равно n-2, где n-число наблюдений.

Если фактическое значение t -критерия больше табличного (по модулю), то основную гипотезу отвергают и считают, что с вероятностью (1-б) рассматриваемый параметр или статистическая характеристика в генеральной совокупности значимо отличается от нуля.

Если фактическое значение t-критерия меньше табличного (по модулю), то нет оснований отвергать основную гипотезу, т.е. параметр или статистическая характеристика в генеральной совокупности незначимо отличается от нуля при уровне значимости б.

В нашем случае

, .

Поскольку 5.75 > 2.048, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).

Далее имеем

.

Поскольку 11.47 > 2.048, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).

Размещено на Allbest.ru

...

Подобные документы

  • Виды и способы статистического наблюдения. Построение и анализ вариационных рядов распределения. Оценка параметров генеральной совокупности банков на основе выборочных данных. Расчет парного коэффициента корреляции и уравнения однофакторной регрессии.

    контрольная работа [712,1 K], добавлен 30.03.2014

  • Сущность и применение метода наименьших квадратов для однофакторной линейной регрессии. Нахождение коэффициента эластичности для указанной модели в заданной точке X и его экономический анализ. Прогноз убыточности на основании линейной регрессии.

    контрольная работа [47,3 K], добавлен 15.06.2009

  • Расчет параметров уравнения линейной регрессии, экономическая интерпретация регрессии. Определение остаточной суммы квадратов. Выполнение предпосылок МНК. Расчет коэффициента детерминации, проверка значимости уравнения регрессии с помощью критерия Фишера.

    контрольная работа [317,0 K], добавлен 11.05.2009

  • Назначение рангового коэффициента корреляции, определение силы и направления корреляционной связи между двумя признаками или двумя профилями (иерархиями) признаков. Графическое представление метода ранговой корреляции, расчет эмпирического значения rs.

    презентация [46,5 K], добавлен 12.11.2010

  • Исследование типа регрессии между случайными переменными. Построение эмпирического уравнения регрессии. Расчет выборочных средних, дисперсий и среднеквадратического отклонения. Определение показателя тесноты связи как линейного коэффициента корреляции.

    контрольная работа [513,5 K], добавлен 02.05.2015

  • Эффективность оборотных средств. Оценка тесноты связи между факторным и результативным показателями на основе корреляционного анализа. Проверка значимости коэффициента корреляции. Оценка значимости уравнения линейной регрессии. Формы связи показателей.

    курсовая работа [143,2 K], добавлен 15.03.2015

  • Изучение зависимости доли сельского населения от величины среднедушевых денежных доходов. Расчет параметров линейной функции на основании исходных данных по областям. Определение среднего коэффициента эластичности. Расчет коэффициента корреляции.

    методичка [55,1 K], добавлен 02.06.2012

  • Парная линейная регрессия. Полный регрессионный анализ. Коэффициент корреляции и теснота линейной связи. Стандартная ошибка регрессии. Значимость уравнения регрессии. Расположение доверительных интервалов. Расчет параметров множественной регрессии.

    контрольная работа [932,7 K], добавлен 09.06.2012

  • Расчет показателей динамики стоимости имущества ОАО "Сургутнефтегаз". Построение линейного уравнения тренда роста балансовой стоимости имущества. Однофакторный дисперсионный анализ. Параметры уравнения регрессии. Значимость коэффициента корреляции.

    дипломная работа [146,6 K], добавлен 29.11.2014

  • Понятие и основные виды выборочного наблюдения. Ошибки выборочного статистического наблюдения. Определение генеральной совокупности, проблема соотношения выборки и совокупности. Точечная и интервальная оценка параметров генеральной совокупности.

    контрольная работа [32,6 K], добавлен 02.12.2015

  • Расчет параметров линейного уравнения множественной регрессии с перечнем факторов по данным о деятельности компаний США. Оценка силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности. Доверительный интервал прогноза.

    лабораторная работа [666,9 K], добавлен 21.04.2015

  • Методика построения графика зависимости между величиной капитала и чистыми активами банков, определение уравнения регрессии зависимости чистых активов и капитала коммерческих банков. Вычисление показателей тесноты связи между изучаемыми признаками.

    контрольная работа [89,5 K], добавлен 04.02.2009

  • Понятие, виды производственных средств. Расчет линейного коэффициента корреляции. Аналитическое выражение связи между факторным и результативным показателем на основе регрессионного анализа. Расчет параметров уравнения тренда методом наименьших квадратов.

    курсовая работа [80,9 K], добавлен 07.03.2016

  • Средние статистические величины и аналитическая группировка данных предприятия. Результаты расчета коэффициента Фехнера по цехам. Измерение степени тесноты связи в статистике с помощью показателя корреляции. Поля корреляции и уравнения регрессии для цеха.

    практическая работа [495,9 K], добавлен 26.11.2012

  • Порядок построения линейного уравнения парной регрессии, расчет коэффициентов и оценка статической значимости параметров регрессии и корреляции. Точность прогноза. Множественная регрессия и корреляция. Системы эконометрических уравнений. Временные ряды.

    контрольная работа [1,3 M], добавлен 24.09.2013

  • Этапы корреляционно-регрессионного анализа, построение корреляционной модели и определение функции, отражающей механизм связи между факторным и результативным признаками. Измерение тесноты корреляционной связи, расчет индекса корреляции и дисперсии.

    лекция [38,1 K], добавлен 13.02.2011

  • Статистический ряд распределения фермерских хозяйств по удою от одной коровы. Определение ошибки выборки и границ для среднего удоя в генеральной совокупности. Связь между признаками методом аналитической группировки. Расчет межгрупповой дисперсии.

    контрольная работа [535,7 K], добавлен 14.11.2013

  • Проверка выполнения предпосылок МНК. Значимость параметров уравнения регрессии с помощью t-критерия Стьюдента и F-критерия Фишера. Средняя относительная ошибка аппроксимации. Гиперболические, степенные и показательные уравнения нелинейной регрессии.

    контрольная работа [253,4 K], добавлен 17.03.2011

  • Эконометрическое моделирование динамики экспорта и импорта РФ: построение регрессии, дисперсионный анализ для линейной регрессии, эластичность показательной регрессии, изучение качества линейной регрессии, колеблемость признака. Доверительные интервалы.

    курсовая работа [367,5 K], добавлен 21.08.2008

  • Статистика розничного и оптового товарооборота: показательная регрессия, построение регрессии. Дисперсионный анализ для линейной регрессии, изучение ее качества. Доверительные интервалы для оцененных параметров и критерий Фишера значимости регрессии.

    контрольная работа [300,4 K], добавлен 21.08.2008

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.