Парная регрессия и корреляция

Построение поля корреляции, формулирование гипотезы о форме связи. Расчет параметров уровней линейной парной регрессии. Оценка тесноты связи с помощью показателя линейной парной корреляции. Анализ качества уравнений с помощью средней ошибки аппроксимации.

Рубрика Экономико-математическое моделирование
Вид контрольная работа
Язык русский
Дата добавления 10.10.2016
Размер файла 169,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

РОССИЙСКАЯ АКАДЕМИЯ ГОСУДАРСТВЕННОЙ СЛУЖБЫ

ПРИ ПРЕЗИДЕНТЕ РОССИЙСКОЙ ФЕДЕРАЦИИ

ВЛАДИМИРСКИЙ ФИЛИАЛ

Кафедра информационных технологий

КОНТРОЛЬНАЯ РАБОТА

по курсу: Эконометрика

Выполнила:

Фролова Н.В..

студент вечернего обучения,

курс III (группа ВФв108),

специальность

финансы и кредит

Владимир, 2009 г.

Парная регрессия и корреляция

I. ИСХОДНЫЕ ДАННЫЕ для анализа приведены в таблице 1.

Таблица 1

Исходные данные

№ п/п

Чистый доход, млрд долл. США, у

Численность служащих, тыс. чел., х

1

0,9

43

2

1,7

64,7

3

0,7

24

4

1,7

50,2

5

2,6

106

6

1,3

96,6

7

4,1

347

8

1,6

85,6

9

6,9

745

10

0,4

4,1

11

1,3

26,8

12

1,9

42,7

13

1,9

61,8

14

1,4

212

15

0,4

105

16

0,8

33,5

17

1,8

142

18

0,9

96

19

1,1

140

20

1,9

59,3

21

-0,9

131

22

1,3

70,7

23

2

65,4

24

0,6

23,1

25

0,7

80,8

II. ПОСТАНОВКА ЗАДАЧИ:

1. Постройте поле корреляции и сформируйте гипотезу о форме связи.

2. Рассчитайте параметры уровней линейной парной регрессии.

3. Оцените тесноту связи с помощью показателя линейной парной корреляции. регрессия корреляция линейный уравнение

4. Оцените качество уравнений с помощью средней ошибки аппроксимации.

5. Дайте с помощью общего (среднего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.

6. Выполнить дисперсионный анализ, для чего вычислить коэффициент детерминации и F-критерия Фишера и сделать заключение по вычисленным показателям.

7. Оцените статистическую надежность (значимость) результатов регрессионного моделирования (коэффициентов регрессии) и коэффициента корреляции с помощью t-критерия Стъюдента. Вычислить доверительные интервалы каждого из показателей.

8. Рассчитайте ожидаемое значение результата, если значение фактор увеличится на 5% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости б = 0,05.

9. Оцените полученные результаты и сделать выводы.

III. РЕШЕНИЕ

1. Построение поля корреляции, нахождение медиан и анализ распределения точек по квадрантам

1.1. Исходные данные

На рис. 1 представлена диаграмма поля корреляции y = f (x), построенная средствами MS Exсel. На ней же прямыми линиями показаны медианы (величины изучаемого признака, которая находится в середине упорядоченной совокупности) совокупностей значений, найденные с применением статистических функций MS Exсel.

Рис. 1. Поле корреляции исходной совокупности

Оценку связи определили по разности числа точек в первом, третьем квадратах (ответственных за прямую-положительную связь) и во втором, четвертом квадратах (ответственных за обратную-отрицательную связь), отнесенной к общему числу точек корреляционного поля.

Распределение точек по квадрантам (3 точки из 25 лежат на линии Me(y)):

6

6

5

5

Число точек в 1-ом и 3-ом квадрантах равно числу точек во 2-ом и 4-ом квадрантах, и, основываясь на распределении точек, невозможно сделать предварительный вывод о наличии связи. Коэффициент корреляции, рассчитанный средствами MS Exсel, составляет 0,830, что намного превышает критический для выборки размером 22 - 27 точек при доверительной вероятности 0,05 (0,4227 и 0,3809 соответственно). Следовательно, переменные положительно коррелируют - заметная прямая связь.

1.2. Данные после отброса выпадающей точки

Предположительно, точки (131; -0,9), (347; 4,1) и (745; 6,9) выпадают из общей выборки. Точка (745; 6,9) отпадает наверняка как сильно отстоящая от основного массива, точки (131; -0,9) и (347; 4,1) - под сомнением. Тем не менее, субъективно отбросив три точки по визуальной оценке поля корреляции, получим совокупность точек, приведенную в таблице 2.

Таблица 2

Исходные данные для анализа

№ п/п

Чистый доход, млрд долл. США, у

Численность служащих, тыс. чел., х

1

43

0,9

2

64,7

1,7

3

24

0,7

4

50,2

1,7

5

106

2,6

6

96,6

1,3

7

85,6

1,6

8

4,1

0,4

9

26,8

1,3

10

42,7

1,9

11

61,8

1,9

12

212

1,4

13

105

0,4

14

33,5

0,8

15

142

1,8

16

96

0,9

17

140

1,1

18

59,3

1,9

19

70,7

1,3

20

65,4

2

21

23,1

0,6

22

80,8

0,7

На рисунке 2 представлена диаграмма, аналогичная приведенной на рис. 1.

Рис. 2. Поле корреляции

На рис. 2 также приведена аппроксимирующая прямая, построенная средствами MS Exсel, уравнение аппроксимации и величина ее достоверности.

Распределение точек по квадрантам (3 точки из 25 лежат на линии Me(y)) показывает очень слабую положительную связь.

5

5

5

4

Коэффициент корреляции - 0,245 меньше критического (0,4227), следовательно, высокиое значение коэффициента корреляции при анализе полной выборке исходных данных свидетельствует о наличии выпадов в исходной выборке. Так как при построении прямой регрессии используется сумма квадратов расстояний наблюдаемых точек до прямой, то выбросы могут существенно повлиять на наклон прямой и, следовательно, на значение коэффициента корреляции. Поэтому единичный выброс (значение которого возводится в квадрат) способен существенно изменить наклон прямой и, следовательно, значение корреляции.

2. Расчет параметров линейной парной регрессии

2.1. Уравнение линейной парной регрессии имеет вид y = a + bx, где

и

Таблица 3

Расчет коэффициентов линейной парной регрессии

n

xi

yi

xiyi

xi2

1

43

0,9

38,700

1849,000

2

64,7

1,7

109,990

4186,090

3

24

0,7

16,800

576,000

4

50,2

1,7

85,340

2520,040

5

106

2,6

275,600

11236,000

6

96,6

1,3

125,580

9331,560

7

85,6

1,6

136,960

7327,360

8

4,1

0,4

1,640

16,810

9

26,8

1,3

34,840

718,240

10

42,7

1,9

81,130

1823,290

11

61,8

1,9

117,420

3819,240

12

212

1,4

296,800

44944,000

13

105

0,4

42,000

11025,000

14

33,5

0,8

26,800

1122,250

15

142

1,8

255,600

20164,000

16

96

0,9

86,400

9216,000

17

140

1,1

154,000

19600,000

18

59,3

1,9

112,670

3516,490

19

70,7

1,3

91,910

4998,490

20

65,4

2

130,800

4277,160

21

23,1

0,6

13,860

533,610

22

80,8

0,7

56,560

6528,640

среднее значение

74,241

1,314

104,155

7696,785

среднее значение в квадрате

5511,713

-

-

-

, .

Уравнение имеет вид y = 1,0884 + 0,0030x.

2.2. Коэффициент корреляции rxy - 0,245 (рассчитан средствами MS Exсel) меньше критического (0,4227), но больше нуля, следовательно, возможна очень слабая прямая положительная связь.

2.3. Расчет средней ошибки аппроксимации А

Таблица 4

Расчет средней ошибки аппроксимации

n

yi

yiрасч

(уi-yiрасч)/yi

1

0,9

1,219

0,354

2

1,7

1,285

0,244

3

0,7

1,161

0,659

4

1,7

1,241

0,270

5

2,6

1,410

0,458

6

1,3

1,381

0,063

7

1,6

1,348

0,157

8

0,4

1,101

1,752

9

1,3

1,170

0,100

10

1,9

1,218

0,359

11

1,9

1,276

0,328

12

1,4

1,732

0,237

13

0,4

1,407

2,517

14

0,8

1,190

0,488

15

1,8

1,519

0,156

16

0,9

1,380

0,533

17

1,1

1,513

0,376

18

1,9

1,268

0,332

19

1,3

1,303

0,002

20

2

1,287

0,357

21

0,6

1,158

0,931

22

0,7

1,334

0,905

среднее значение

0,526

А = 52,6 %.

Полученное значение А намного превосходит допустимые пределы (8 - 10 %), расчетные данные существенно отклоняются от фактических.

3. Оценка силы связи фактора с результатом с помощью общего (среднего) коэффициента эластичности

Коэффициент эластичности определяют как произведение производной функции «y = a + bx» на отношение средних арифметических значений «х» к «у»:

Очевидно, что , тогда

Следовательно, средний размер чистого дохода изменится на 0,17 % при изменении численности служащих на 1 %, что показывает слабую связь результата с изменяемым фактором.

4. Дисперсионный анализ

Задача дисперсионного анализа состоит в анализе дисперсии зависимой переменной:

где - общая сумма квадратов отклонений;

- сумма квадратов отклонений «факторная»;

- остаточная сумма квадратов отклонений.

Таблица 5

Расчет суммы квадратов отклонений

n

yi

yiрасч

(yi - yср)2

(уi - yiрасч)2

(yiрасч - yср)2

1

0,9

1,219

0,1711

0,1017

0,0090

2

1,7

1,285

0,1493

0,1725

0,0008

3

0,7

1,161

0,3765

0,2127

0,0232

4

1,7

1,241

0,1493

0,2110

0,0053

5

2,6

1,410

1,6547

1,4161

0,0093

6

1,3

1,381

0,0002

0,0066

0,0046

7

1,6

1,348

0,0820

0,0635

0,0012

8

0,4

1,101

0,8347

0,4912

0,0453

9

1,3

1,170

0,0002

0,0170

0,0207

10

1,9

1,218

0,3438

0,4652

0,0092

11

1,9

1,276

0,3438

0,3895

0,0014

12

1,4

1,732

0,0075

0,1099

0,1747

13

0,4

1,407

0,8347

1,0140

0,0087

14

0,8

1,190

0,2638

0,1521

0,0153

15

1,8

1,519

0,2365

0,0788

0,0423

16

0,9

1,380

0,1711

0,2301

0,0044

17

1,1

1,513

0,0456

0,1707

0,0398

18

1,9

1,268

0,3438

0,3990

0,0021

19

1,3

1,303

0,0002

0,0000

0,0001

20

2

1,287

0,4711

0,5086

0,0007

21

0,6

1,158

0,5093

0,3119

0,0241

22

0,7

1,334

0,3765

0,4014

0,0004

Сумма квадратов отклонений

7,366

6,923

0,442

4.1. Долю дисперсии, определяемой регрессией, в общей дисперсии результативного признака у характеризует коэффициент детерминации R2 :

.

Коэффициент детерминации можно найти и как квадрат коэффициента корреляции. Для анализируемых данных R2 = (0,245)2 = 0,060.

При линейной аппроксимации данных средствами MS Exсel коэффициент выводится как оценка достоверности аппроксимации (показан на рис. 2).

4.2. Проверка гипотезы о статистической незначимости уравнения регрессии и показателя тесноты связи по критерию Фишера

Фактическое значение F-критерия Фишера рассчитывают как

= 1,278.

Табличное значение критерия Фишера Fтабл = 2 при данном объеме выборки и доверительной вероятности б = 0,05. Табличное значение превышает фактическое, следовательно, уравнение регрессии статистически не значимо.

5. Оценка статистической значимости коэффициентов регрессии и корреляции

5.1. Оценка с помощью t-критерия Стьюдента производится путем сопоставления значений коэффициентов с величиной случайной ошибки:

Случайные ошибки m определяют по формулам:

Результаты расчета по этим формулам представлены в таблице 6.

Таблица 6

Расчет t-критериев Стьюдента

Коэффициент

Случайная ошибка m

Расчетный t-критерий Стьюдента

Сравнение с табличным 2,0860

(n = 22, = 0,05)

b

0,0027

1,1305

<

a

0,2459

4,4263

>

rху

0,2168

1,1305

<

Таким образом, расчетный t-критерий Стьюдента для коэффициента b (характеризует угол наклона линейной зависимости) и коэффициента корреляции r меньше табличного, следовательно, они статистически незначимы. Для коэффициента а (характеризует положение массива данных относительно оси ординат - у) наблюдаем обратную ситуацию, и следует полагать его статистически значимым, что подтверждает внешний вид поля корреляции.

5.2. Расчет границ доверительных интервалов для коэффициентов регрессии

Границы доверительного интервала определяют умножением значения коэффициента на табличное значение t-коэффициента Стьюдента (результаты расчета - см. в табл. 7):

Таблица 7

Расчет границ доверительных интервалов

Коэффициент k

a

b

k

1,0884

0,0030

k

0,5129

0,0056

k - k

0,5755

-0,0026

k + k

1,6013

0,0086

Таким образом, в границы доверительного интервала коэффициента b попадает нуль (верхняя граница положительна, нижняя - отрицательна) и его полагаем нулевыми, что свидетельствует о статистически незначимом характере полученного уравнения регрессии.

Границы доверительного интервала коэффициента а = 1,0884 ± 0,5129.

8. Расчет ожидаемого значения результата, при увеличении фактора на 5% от его среднего уровня. Определение доверительного интервала прогноза для уровня значимости б = 0,05.

Полученное уравнение регрессии статистически незначимо и вычисление прогнозного значения носит формальный характер.

Прогнозное значение

Прогнозное значение .

Средняя стандартная ошибка прогноза определяется как

где .

n - число точек (22), m - число параметров при переменных х (1 - в случае линейной регрессии).

Вычисленная по эти формулам средняя стандартная ошибка прогноза - 0,602. При доверительной вероятности 0,05 и t-коэффициенте Стьюдента 2,0860 предельная ошибка прогноза, которая в 95 % случаев не будет превышена, составит Таким образом, границы доверительно интервала прогноза составят ур = 1,325 ± 1,225. Выполненный прогноз оказался формальным и неточным, так как отношение верхней и нижней границ доверительного интервала составляет

раз, а нижняя граница очень близка к нулю.

ВЫВОДЫ

Практически симметричное распределение точек по квадрантам свидетельствует об отсутствии или очень слабой связи между фактором и результатом

Коэффициент корреляции rxy - 0,245 меньше критического (0,4227).

Значение ошибки аппроксимации А = 52,6 % намного превосходит допустимые пределы (8 - 10 %).

Невысокое значение коэффициента эластичности (0,17 %) показывает слабую связь результата с изменяемым фактором.

Значение коэффициента детерминации (0,006) мало и, следовательно, аппроксимации недостоверна.

Табличное значение критерия Фишера (2) превышает фактическое (1,278), значит, уравнение регрессии статистически не значимо.

Расчетный t-критерий Стьюдента для коэффициента b и коэффициента корреляции rxy меньше табличного, следовательно, они статистически незначимы.

В границы доверительного интервала коэффициента b попадает нуль (верхняя граница положительна, нижняя - отрицательна) и его полагаем нулевыми, что свидетельствует о статистически незначимом характере полученного уравнения регрессии.

Выполненный прогноз результата при изменении фактора на 5 % оказался формальным и неточным, так как отношение верхней и нижней границ доверительного интервала составляет 37 раз, а нижняя граница очень близка к нулю.

Таким образом, проведенные исследования массива данных показали, что размер чистого дохода не имеет достоверной связи с численностью служащих.

Размещено на Allbest.ru

...

Подобные документы

  • Построение поля корреляции и формулирование гипотезы о форме связи. Параметры уравнений линейной, степенной и гиперболической регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Оценка средней ошибки аппроксимации уравнения.

    контрольная работа [136,3 K], добавлен 25.09.2014

  • Построение гипотезы о форме связи денежных доходов на душу населения с потребительскими расходами в Уральском и Западно-Сибирском регионах РФ. Расчет параметров уравнений парной регрессии, оценка их качества с помощью средней ошибки аппроксимации.

    контрольная работа [4,5 M], добавлен 05.11.2014

  • Построение поля корреляции. Расчет параметров уравнений парной регрессии. Зависимость средней ожидаемой продолжительности жизни от некоторых факторов. Изучение "критерия Фишера". Оценка тесноты связи с помощью показателей корреляции и детерминации.

    контрольная работа [173,8 K], добавлен 22.11.2010

  • Построение поля корреляции с формулировкой гипотезы о форме связи. Построение моделей парной регрессии. Оценка тесноты связи с помощью коэффициента (индекса) корреляции. Расчет прогнозного значения результата и доверительного интервала прогноза.

    контрольная работа [157,9 K], добавлен 06.08.2010

  • Исследование зависимости часового заработка одного рабочего от общего стажа работы после окончания учебы с помощью построения уравнения парной линейной регрессии. Вычисление описательных статистик. Построение поля корреляции и гипотезы о форме связи.

    контрольная работа [226,6 K], добавлен 11.08.2015

  • Расчет уравнений линейной и нелинейной парной регрессии. Оценка тесноты связи расходов на перевозки и грузооборота с помощью показателей корреляции и детерминации. Оценка ошибки аппроксимации уравнений регрессии. Расчет прогнозного значения расходов.

    курсовая работа [2,5 M], добавлен 26.12.2014

  • Расчет параметров уравнения линейной регрессии, оценка тесноты связи с помощью показателей корреляции и детерминации. Определение средней ошибки аппроксимации. Статистическая надежность моделирования с помощью F-критерия Фишера и t-критерия Стьюдента.

    контрольная работа [58,3 K], добавлен 17.10.2009

  • Расчет параметров линейной регрессии. Сравнительная оценка тесноты связи с помощью показателей корреляции, детерминации, коэффициента эластичности. Построение поля корреляции. Определение статистической надежности результатов регрессионного моделирования.

    контрольная работа [71,7 K], добавлен 17.09.2016

  • Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.

    контрольная работа [141,3 K], добавлен 05.05.2010

  • Расчет параметров уравнений линейной и нелинейной парной регрессии, порядок проведения дисперсионного анализа. Оценка тесноты связи между ценами первичного рынка и себестоимостью с помощью показателей корреляции и детерминации, ошибки аппроксимации.

    курсовая работа [923,5 K], добавлен 07.08.2013

  • Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.

    контрольная работа [1,6 M], добавлен 14.05.2008

  • Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.

    контрольная работа [681,9 K], добавлен 03.08.2010

  • Расчет параметров уравнения линейной регрессии, оценка тесноты связи с помощью показателей корреляции и детерминации; определение средней ошибки аппроксимации. Статистическая надежность регрессионного моделирования с помощью критериев Фишера и Стьюдента.

    контрольная работа [34,7 K], добавлен 14.11.2010

  • Построение поля корреляции. Оценка данной зависимости линейной, степенной и гиперболической регрессией. Оценка тесноты связи с помощью показателей корреляции и детерминации. Расчет коэффициента эластичности. Определение доверительного интервала прогноза.

    контрольная работа [508,1 K], добавлен 13.11.2011

  • Расчет линейного коэффициента парной и частной корреляции. Статистическая значимость параметров регрессии и корреляции. Анализ корреляционного поля данных. Точность прогноза, расчет ошибки и доверительный интервал. Коэффициент множественной детерминации.

    контрольная работа [155,8 K], добавлен 11.12.2010

  • Выбор факторных признаков для двухфакторной модели с помощью корреляционного анализа. Расчет коэффициентов регрессии, корреляции и эластичности. Построение модели линейной регрессии производительности труда от факторов фондо- и энерговооруженности.

    задача [142,0 K], добавлен 20.03.2010

  • Оценка тесноты связи с помощью показателей корреляции и детерминации. Построение поля корреляции и расчёт параметров линейной регрессии. Результаты вычисления функций и нахождение коэффициента детерминации. Регрессионный анализ и прогнозирование.

    курсовая работа [1,1 M], добавлен 07.08.2011

  • Построение уравнения множественной регрессии в линейной форме, расчет интервальных оценок его коэффициентов. Создание поля корреляции, определение средней ошибки аппроксимации. Анализ статистической надежности показателей регрессионного моделирования.

    контрольная работа [179,4 K], добавлен 25.03.2014

  • Поля корреляции, характеризующие зависимость ВРП на душу населения от размера инвестиций в основной капитал. Оценка параметров уравнения парной линейной регрессии. Коэффициент множественной корреляции. Способы оценки параметров структурной модели.

    контрольная работа [215,1 K], добавлен 22.11.2010

  • Этапы и проблемы эконометрических исследований. Параметры парной линейной регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Расчет коэффициентов автокорреляции второго порядка для временного ряда расходов на потребление.

    контрольная работа [60,3 K], добавлен 05.01.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.