Корреляционный и регрессионный анализ

Рассчет линейного коэффициента парной корреляции и коэффициента детерминации. Оценка статистической значимости параметров регрессии и корреляции. Критерий Дарбина-Уотсона для проверки независимости остатков. Ошибка прогноза и его доверительный интервал.

Рубрика Математика
Вид контрольная работа
Язык русский
Дата добавления 28.05.2018
Размер файла 1,1 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Задание

По группе предприятий, выпускающих один и тот же вид продукции, приведены данные о затратах на производство y (тыс. д. е.) и выпуск продукции x (тыс. ед.).

Вариант 5

1

9

69

2

11

73

3

12

99

4

13

88

5

14

91

6

15

100

7

17

114

8

18

103

9

20

109

10

22

125

Требуется:

1. Построить линейное уравнение парной регрессии на .

2. Рассчитать линейный коэффициент парной корреляции и коэффициент детерминации. Сделать выводы.

3. Оценить модель через среднюю ошибку аппроксимации.

4. Оценить статистическую значимость уравнения регрессии в целом.

5. Оценить статистическую значимость параметров регрессии и корреляции.

5. Выполнить прогноз при x0 равном 195% от среднего уровня x.

6. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.

Корреляционный анализ ставит задачу измерить тесноту связи между варьирующими переменными и оценить факторы, оказывающие наибольшее влияние на результативный признак.

Регрессионный анализ предназначен для выбора формы связи и типа модели для определения расчетных значений зависимой переменной (результативного признака).

Результаты корреляционно - регрессионного анализа могут быть использованы для планирования и прогнозирования уровня результативного показателя.

Фактор, включаемый в модель, должен соответствовать следующим требованиям:

­ иметь количественное выражение, между фактором и результирующим показателями должна быть логическая, причинная связь;

­ факторы не должны быть тесно связаны между собой, то есть между факторами не должна существовать мультиколлинеарность.

Одна из основных задач корреляционного анализа является определение влияния факторов на величину результативного показателя. Для решения этой задачи подбирается соответствующий тип математического уравнения, которое наилучшим образом отражает характер изучаемой связи. Это играет важную роль в корреляционном анализе, потому что от правильного выбора уравнения регрессии зависит ход решения задач и результат расчетов.

Наиболее простым уравнением, которое характеризует прямолинейную зависимость между показателями, является уравнение прямой:

Y = а + а1х+а2х+ ….+апхп,(1)

где Y - результирующий признак;

а - свободный член уравнения регрессии;

х - факторы;

а1,.. - коэффициенты при факторах.

Значимость коэффициентов корреляции проверяется по критерию Стьюдента:

,(2)

где - среднеквадратическая ошибка коэффициента корреляции, которая определяется по формуле:

(3)

Если расчетное значение t выше табличного, то можно сделать заключение о том, что величина коэффициента корреляции является значимой. Табличное значение t находится по таблице значений критериев Стьюдента. При этом учитывается количество степеней свободы (v = n-1) и уровень доверительной вероятности (в экономических расчетах обычно 0,05 или 0,01).

Одним из этапов корреляционного анализа является расчет уравнения связи (регрессии). Решение проводится обычно шаговым способом. Сначала в расчет принимается один фактор, который оказывает наиболее значимое влияние на результативный показатель, потом второй, третий и так далее. И на каждом шаге рассчитывается уравнение связи, множественный коэффициент корреляции и детерминации, F-отношение (критерий Фишера), стандартная ошибка и другие показатели, с помощью которых оценивается надежность уравнения связи. Чем выше величина коэффициентов множественной корреляции, детерминации и критерия Фишера и чем ниже величина стандартной ошибки, тем точнее уравнение связи описывает зависимости, сложившиеся между исследуемыми показателями.

Цель данного анализа определить основные моменты построения модели и анализа полученных результатов при обработке модели в системе электронных таблиц Microsoft Excel.

Построение экономико-математической модели для проведения корреляционно-регрессионного анализа начался с подбора показателей, участвующих в модели. Корреляционный анализ предназначен для изучения тесноты связи между факторными и результативными показателями, а регрессионный анализ для нахождения корреляционной связи, оценки их точности и надежности.

В качестве:

y - затраты на производство;

х - выпуск продукции.

Исходные данные для расчета значений представлены в таблице 1, по которым сделан график на рисунке 1.

Рис.1. Расчет параметров корреляции

В результате обработки данных по предприятию были получены следующие значения, показанные в таблице 2.

Таблица 2. Матрица парных коэффициентов корреляции

Столбец 1

Столбец 2

Столбец 1

1

Столбец 2

0,910897827

1

Делая анализ первого столбца, оценивается степень влияния фактора на результирующий показатель y, в данном случае влияние на затраты на производство оказывает факторы х - выпуск продукции (коэффициент корреляции равен 0,9109).

Задачами регрессионного анализа являются выбор типа модели (формы связи), установления степени влияния независимых переменных на зависимую и определение расчетных значений зависимой переменной (функции регрессии).

Далее произведем выбор вида модели и оценим ее параметры.

Таким образом, линейная модель множественной регрессии будет иметь вид:

, (4)

где у - затраты на производство, тыс. руб.,

а0 - свободный член;

а1 - коэффициент регрессии;

х - выпуск продукции, тыс. руб.;

Одним из этапов корреляционного анализа является расчет уравнения связи (регрессии). Решение проводится обычно шаговым способом. В расчет принимается фактор, который оказывает значимое влияние на результативный показатель.

Рассчитывается уравнение связи, множественный коэффициент корреляции и детерминации, F-отношение (критерий Фишера), стандартная ошибка и другие показатели, с помощью которых оценивается надежность уравнения связи. Чем выше величина коэффициентов множественной корреляции, детерминации и критерия Фишера и чем ниже величина стандартной ошибки, тем точнее уравнение связи описывает зависимости, сложившиеся между исследуемыми показателями.

Результаты регрессионного анализа позволяют определить уравнение регрессии, а также точность и качество построенной модели. Оценку параметров регрессии осуществим при помощи инструмента «Регрессия».

Рис.2. Расчет параметров регрессии

Результаты представлены на рисунке 3.

Рис.3. Лист Excel с результатами расчета коэффициентов регрессии

В столбце коэффициенты содержатся коэффициенты уравнения регрессии а0, а1. Значит а0 = 38,843; а1= 3,8581.

Анализируя остатки, можно сделать ряд практических выводов. Значения остатков имеют как положительные, так и отрицательные отклонения от расчетного уровня затрат.

Рис.4. Вывод остатка

Рис.5. Сравнение расчетных данных с исходными

Таким образом, уравнение регрессии зависимости затрат предприятия от объема выпуска, полученное с помощью EXCEL, имеет вид:

Уравнение регрессии:

У=38,843+3,8581х(5)

Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:

(6)

x

y

x2

y2

x * y

y(x)

(yi-ycp) 2

(y-y(x))2

|y - yx|:y

9

69

81

4761

621

73,5659

789,61

20,84744

0,066172

11

73

121

5329

803

81,2821

580,81

68,59318

0,113453

12

99

144

9801

1188

85,1402

3,61

192,0941

0,139998

13

88

169

7744

1144

88,9983

82,81

0,996603

0,011344

14

91

196

8281

1274

92,8564

37,21

3,446221

0,0204

15

100

225

10000

1500

96,7145

8,41

10,79451

0,032855

17

114

289

12996

1938

104,4307

285,61

91,5715

0,083941

18

103

324

10609

1854

108,2888

34,81

27,97141

0,051348

20

109

400

11881

2180

116,005

141,61

49,07002

0,064266

22

125

484

15625

2750

123,7212

778,41

1,635329

0,01023

Итого 151

971

2433

97027

15252

971,0031

2742,9

467,0203

0,594008

В среднем

15,1

97,1

243,3

9702,7

1525,2

97,10031

274,29

46,70203

0,059401

0,594/10=0,0594 или 5,94%

Поскольку ошибка меньше 15%, то данное уравнение можно использовать в качестве регрессии.

Качество модели оценивается стандартным для математических моделей образом: по адекватности и точности на основе анализа остатков регрессии (е). Расчетные значения получаются путем подстановки в модель фактических значений всех включенных факторов. Анализ остатков позволяет получить представление, насколько хорошо подобрана сама модель и насколько правильно выбран метод оценки коэффициентов. Согласно общим предположениям регрессионного анализа, остатки должны вести себя как независимые (в действительности почти независимые), одинаково распределенные случайные величины. В классических методах регрессионного анализа предполагается также нормальный закон распределения остатков.

Экономический интерес представляют значения периодов: 2; 3; 7; 8; 9, поскольку их значения отличаются наибольшими отклонениями от расчетной величины. В итоге положительные отклонения значения затрат производства уравновешиваются отрицательными отклонениями, то есть, Уei равно 0.

Рис.6. График остатков

Независимость остатков проверяется с помощью критерия Дарбина-Уотсона ( табл. 2).

Таблица 2. Критерий Дарбина - Уотсона

№ п/п

Фактическое Y

Предсказанное Y

Остатки

(е(t)-е(t-1))^2

е(t)^2

1

69

74

-4,57

-

21

2

73

81

-8,28

14

69

3

99

85

13,86

490

192

4

88

89

-1,00

221

1

5

91

93

-1,86

1

3

6

100

97

3,29

26

11

7

114

104

9,57

39

92

8

103

108

-5,29

221

28

9

109

116

-7,00

3

49

10

125

124

1,28

69

2

Итого

971

-

-

1084

467

Ср.знач.

97

-

-

108

47

Рассчитаем значение d- критерия по формуле (6):

, (6)

где d - критерий Дарбина-Уотсона;

е (t) - остаток последовательности уровня ряда;

е (t-1) - предыдущий остаток последовательности уровня ряда;

е (y) - остаточная последовательность ряда y;

n - число периодов.

(Значение знаменателя (2=467). Значение числителя

(=1084) (см. табл. 18). d = 2,3207.

Так как расчетное значение больше d2, то модель адекватна.

Далее необходимо вычислить для модели коэффициент детерминации (коэффициент множественной корреляции, возведенный в квадрат), который показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, то есть определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов.

Так как коэффициент корреляции R2 равно 0,8297, то, следовательно, около 82,97% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.

Множественный R - множественный коэффициент корреляции, который показывает степень совместного влияния всех факторов включаемых в модель на результирующий показатель.

R-квадрат - коэффициент детерминации, показывает долю построенной модели в реальном процессе. Считается, что точность модели хороша, если значение коэффициента детерминации R-квадрат 0,7.

По рисунку 3 видно, что R = 0,9109 - это значение свидетельствует о существенной связи между показателями, включенными в модель и результирующим показателем. R-квадрат = 0,8297 0,7, что свидетельствует о том, что качество построенной модели можно признать хорошим.

Проверку значимости уравнения регрессии произведем на основе вычисления F-критерия Фишера. Расчетное значение F равно 38,98554.

Табличное значение F-критерия при доверительной вероятности 0,95; двух факторах и степенях свободы 10 - 2 - 1 равно 7 составляет 3,346 (найдено с помощью функции FРАСПОБР).

Поскольку Fpac больше Fтабл, уравнение регрессии следует признать адекватным.

Оценим статистическую значимость коэффициента уравнения регрессии.

Значимость коэффициента уравнения регрессии оценивается по показателю t - статистики Стьюдента. Расчетные значения t - статистики необходимо сравнить с их табличными значениями ( табл.3).

Значимость коэффициента уравнения регрессии а1 оценим с использованием t-критерия Стьюдента.

Таблица 3. Итоговые значения регрессионного анализа

Коэффициенты

Стандартная ошибка

t-статистика

Y-пересечение

38,84303466

9,638072431

4,030166295

Переменная X 1

3,858077175

0,617901332

6,243840199

Значимость коэффициента уравнения регрессии а1 оценим с использованием t-критерия Стьюдента.

Табличное значение t-критерия при уровне значимости 5 % и степенях свободы (10-2-1=7) составляет 2,364 (найдено с помощью функции СТЬЮДРАСПОБР). прогноз корреляция коэффициент регрессия

Так как абсолютное значение tа.рас больше tтабл, то коэффициент а1 существенен (значим), поэтому делается вывод о том, что между исследуемыми переменными есть тесная статистическая взаимосвязь.

Так как параметры уравнения регрессии значимы, уравнение значимо, показатели тесноты значимы, ошибка аппроксимации равна 0,5%, коэффициент детерминации 0,8297, то можно сделать заключение, что построенная регрессионная модель планирования затрат предприятия может быть использована для анализа и прогноза.

Расчет прогнозных значений выпуска продукции:

Среднее значение х = 15,1 тыс.ед.

15,1 * 1,95 = 29,445 тыс.ед.

У=38,843+3,8581х

У = 38,843+3,8581*29,445 = 152 тыс. ед.

Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.

Стандартная ошибка оценки равна

S = 18,51

Индивидуальные значения затрат у0 принадлежат промежутку

Выполненный прогноз затрат производства является точным, так как в доверительный интервал не входит 0.

Размещено на Allbest.ru

...

Подобные документы

  • Методика и основные этапы расчета параметров линейного уравнения парной регрессии с помощью программы Excel. Анализ качества построенной модели, с использованием коэффициента парной корреляции, коэффициента детерминации и средней ошибки аппроксимации.

    лабораторная работа [22,3 K], добавлен 15.04.2014

  • Адекватная линейная регрессионная модель. Правило проверки адекватности. Определение математического ожидания, коэффициента детерминации, множественного коэффициента корреляции по характеристикам случайных величин. Оценка дисперсии случайной ошибки.

    контрольная работа [160,0 K], добавлен 13.08.2013

  • Построение уравнения регрессии. Оценка параметров линейной парной регрессии. F-критерий Фишера и t-критерий Стьюдента. Точечный и интервальный прогноз по уравнению линейной регрессии. Расчет и оценка ошибки прогноза и его доверительного интервала.

    презентация [387,8 K], добавлен 25.05.2015

  • Сортировка размера пенсии по возрастанию прожиточного минимума. Параметры уравнений парных регрессий. Значения параметров логарифмической регрессии. Оценка гетероскедастичности линейного уравнения с помощью проведения теста ранговой корреляции Спирмена.

    контрольная работа [178,0 K], добавлен 23.11.2013

  • Классификация взаимосвязи явлений, различаемых в статистике, их разновидности и характеристика, отличительные признаки. Сущность коэффициента парной корреляции, его особенности и методика оценки достоверности, применение доверительных интервалов.

    реферат [1,3 M], добавлен 30.04.2009

  • Механизм и основные этапы нахождения необходимых параметров методом наименьших квадратов. Графическое сравнение линейной и квадратичной зависимостей. Проверка гипотезы о значимости выборочного коэффициента корреляции при заданном уровне значимости.

    курсовая работа [782,6 K], добавлен 19.05.2014

  • Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.

    задача [409,0 K], добавлен 17.10.2012

  • Установление корреляционных связей между признаками многомерной выборки. Статистические параметры регрессионного анализа линейных и нелинейных выборок. Нахождение функций регрессии и проверка гипотезы о значимости выборочного коэффициента корреляции.

    курсовая работа [304,0 K], добавлен 02.03.2017

  • Обработка и анализ статистической информации. Выборочная теория; интервальные оценки и графическое представление параметров распределения. Точечные оценки характеристик положения и мер изменчивости. Корреляционная зависимость; уравнение регрессии.

    курсовая работа [1023,9 K], добавлен 21.03.2015

  • Знакомство с уравнениями линейной регрессии, рассмотрение распространенных способов решения. Общая характеристика метода наименьших квадратов. Особенности оценки статистической значимости парной линейной регрессии. Анализ транспонированной матрицы.

    контрольная работа [380,9 K], добавлен 05.04.2015

  • Обоснование оценок прямых и косвенных измерений и их погрешностей. Введение доверительного интервала в асимптотическом приближении бесконечно большого числа экспериментов. Вычисление коэффициента корреляции для оценки зависимости случайных величин.

    реферат [151,5 K], добавлен 19.08.2015

  • Обработка случайных выборок с нормальным законом распределения. Оценка коэффициентов регрессии и доверительных интервалов. Оценка значимости факторов по доверительным интервалам и корреляционного момента. Построение эмпирической интегральной функции.

    курсовая работа [135,7 K], добавлен 03.05.2011

  • Значения коэффициента регрессии (b) и сводного члена уравнения регрессии (а). Определение стандартной ошибки предсказания являющейся мерой качества зависимости величин Y и х с помощью уравнения линейной регрессии. Значимость коэффициента регрессии.

    задача [133,0 K], добавлен 21.12.2008

  • Вычисление математического ожидания, дисперсии и коэффициента корреляции. Определение функции распределения и его плотности. Нахождение вероятности попадания в определенный интервал. Особенности построения гистограммы частот. Применение критерия Пирсона.

    задача [140,0 K], добавлен 17.11.2011

  • Длина интервала группирования. Графическое описание выборки. Гистограмма относительных частот. Кусочно-постоянная функция. Границы доверительного интервала математического ожидания. Вычисление коэффициента корреляции. Эмпирическая функция распределения.

    практическая работа [737,5 K], добавлен 14.02.2009

  • Алгебраический расчет плотности случайных величин, математических ожиданий, дисперсии и коэффициента корреляции. Распределение вероятностей одномерной случайной величины. Составление выборочных уравнений прямой регрессии, основанное на исходных данных.

    задача [143,4 K], добавлен 31.01.2011

  • Нахождение выборочной средней и дисперсии. Построение гистограммы продолжительности телефонных разговоров и нормальной кривой Гаусса. Нахождение групповых средних и коэффициента корреляции. Выборочные характеристики и параметры уравнений регрессии.

    контрольная работа [87,8 K], добавлен 30.11.2013

  • Определение вероятности наступления события по формуле Бернулли. Построение эмпирической функции распределения и гистограммы для случайной величины. Вычисление коэффициента корреляции, получение уравнения регрессии. Пример решения задачи симплекс-методом.

    контрольная работа [547,6 K], добавлен 02.02.2012

  • Основные производственные фонды как объект статистического изучения. Система показателей, характеризующих основные производственные фонды. Главные особенности применения индексного метода. Оценка статистической значимости коэффициента детерминации.

    курсовая работа [341,3 K], добавлен 09.06.2014

  • Случайная выборка значений двух случайных величин для исследования их совместного распределения. Диаграмма рассеяния опытных данных для четырех видов распределения. Вычисление коэффициента корреляции при большом объеме выборок; проверка его значимости.

    реферат [811,7 K], добавлен 27.01.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.