Построение модели линейной регрессии для несгруппированных данных

Характер расположения точек в корреляционном поле. Построение моделей линейной регрессии для несгруппированных данных. Оценка надежности коэффициента корреляции, адекватности уравнения регрессии. Коэффициент детерминации, его смысловое значение.

Рубрика Экономика и экономическая теория
Вид лабораторная работа
Язык русский
Дата добавления 21.01.2015
Размер файла 104,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Построение модели линейной регрессии для несгруппированных данных

Цель работы: овладение способами построения моделей линейной регрессии для несгруппированных данных, выработка умения и навыков оценки надежности коэффициента корреляции, уравнения регрессии и его коэффициентов. несгруппированный корреляция регрессия детерминация

Содержание работы: на основании опытных данных требуется:

1. Построить корреляционное поле. По характеру расположения точек в корреляционном поле выбрать общий вид регрессии.

2. Вычислить числовые характеристики , , , , , .

3. Определить значимость коэффициента корреляции и найти для него доверительный интервал с надежностью .

4. Написать эмпирические уравнения линий регрессий на и на .

5. Вычислить коэффициент детерминации и объяснить его смысловое значение.

6. Проверить адекватность уравнения регрессии на .

7. Провести оценку величины погрешности уравнения регрессии на и его коэффициентов.

8. Построить уравнение регрессии на в первоначальной системе координат.

Суть лабораторной работы отражает следующая задача.

Задача. Скорость Y(м/час) бурения в твердых породах от нагрузки X (атм.) на долото характеризуется следующими данными Таблица 1:

X

10

10,5

11

11,5

12

12,5

13

13,5

13,8

15,5

16

16,5

16,8

16,9

Y

3,5

2,5

2,5

1,5

1

0,5

1

0,5

1,2

3,5

1

0,5

1,2

3,5

Найти эмпирическую формулу зависимости Y от X.

Для решения поставленной задачи методами корреляционного анализа определим, какой из указанных в условии показателей выбрать за факторный признак, а какой за результативный. На основании, например, анализа зависимости скорости бурения от нагрузки на долото следует, что за факторный признак следует принять нагрузку на долото, а скорость бурения за результативный признак .

Для определения формы связи между признаками и строим на координатной плоскости точки , пользуясь табл. 1. Около построенных точек проводим так называемую линию тренда (на рис. 1 -- пунктирная линия) так, чтобы построенные точки были расположены как можно ближе к ней. По расположению точек около линии тренда делаем вывод о том, что связь между нагрузкой на долото и скоростью бурения может носить линейный характер. Произведем расчет статистик , , , , , которые войдут в уравнения линий регрессий. Составим расчетную табл.

Рис. 1 Линия тренда

x2

10

-3,54

12,50

3,5

1,79

3,21

100

35

10,5

-3,04

9,22

2,5

0,79

0,63

110,25

26,25

11

-2,54

6,43

2,5

0,79

0,63

121

27,5

11,5

-2,04

4,14

1,5

-0,21

0,04

132,25

17,25

12

-1,54

2,36

1

-0,71

0,50

144

12

12,5

-1,04

1,07

0,5

-1,21

1,46

156,25

6,25

13

-0,54

0,29

1

-0,71

0,50

169

13

13,5

-0,04

0,00

0,5

-1,21

1,46

182,25

6,75

13,8

0,26

0,07

1,2

-0,51

0,26

190,44

16,56

15,5

1,96

3,86

3,5

1,79

3,21

240,25

54,25

16

2,46

6,07

1

-0,71

0,50

256

16

16,5

2,96

8,79

0,5

-1,21

1,46

272,25

8,25

16,8

3,26

10,66

1,2

-0,51

0,26

282,24

20,16

16,9

3,36

11,32

3,5

1,79

3,21

285,61

59,15

189,5

76,7721

23,9

17,3292

2641,79

318,37

Пользуясь результатами последней строки табл., находим:

-- средняя нагрузка на долото.

-- средняя скорость бурения,

,

,

,

.

Проверяем значимость коэффициента корреляции. Вычислим статистику tp по формуле (59):

.

По таблице критических точек распределения Стьюдента (приложение 6) по уровню значимости и числу степеней свободы

находим

.

Так как , то -- незначимый (мало отличается от нуля) и признаки и некоррелированы. Следовательно, можно предположить, что скорость бурения Y и нагрузка на долото X не связаны линейной регрессионной зависимостью. (рис.2).

Находим доверительный интервал для выборочного коэффициента корреляции с надежностью . Так как объем выборки , то доверительный интервал находим по формуле:

.

Так как по условию надежность (доверительная вероятность) равна , то по таблице функции Лапласа (приложение 2) находим . Вычисляем среднюю квадратическую ошибку по формуле (60):

.

-- коэффициент парной линейной корреляции, -- объем выборки

Записываем доверительный интервал:

или . Следовательно, с вероятностью 0,95 линейный коэффициент корреляции генеральной совокупности находится в пределах от -0,723 до 0,374.

Найдем эмпирические линейные уравнения регрессии на и на , которые являются приближенными уравнениями для истинных уравнений регрессий.

Уравнение регрессии на :

.

Уравнение регрессии на :

.

Контроль вычислений:

,

.

Так как условие выполняется, то вычисления выполнены верно.

Из уравнения

следует, что при увеличении нагрузки на долото на 100 т. средняя скорость бурения упадет на 8,2 м/час. Подставляя , в уравнения регрессий, получаем точки, координаты которых совпадают с координатами центра распределения . Следовательно, линии регрессий пересекаются в точке .

Найдем коэффициент детерминации. Для линейной регрессии при вычисленном коэффициенте он равен . У нас .

Это означает, что 3 % рассеивания средней скорости проходки объясняется линейной регрессионной зависимостью между средней зарплатой и производительностью труда, и 97 % рассеивания средней скорости проходки остались необъяснимыми.

Такое положение могло произойти из-за того, что в модель не включены другие факторы, влияющие на изменение средней скорости проходки, либо опытных данных в данной выборке не достаточно, чтобы построить более надежное уравнение регрессии.

Проверим адекватность уравнения линейной регрессии на по критерию Фишера -- Снедекора. Вычислим статистику по формуле (64):

, где .

3,5

1,9990

1,5010

2,2531

2,5

1,9576

0,5424

0,2942

2,5

1,9163

0,5837

0,3407

1,5

1,8750

-0,3750

0,1406

1

1,8336

-0,8336

0,6949

0,5

1,7923

-1,2923

1,6700

1

1,7510

-0,7510

0,5639

0,5

1,7096

-1,2096

1,4632

1,2

1,6848

-0,4848

0,2351

3,5

1,5443

1,9557

3,8248

1

1,5030

-0,5030

0,2530

0,5

1,4616

-0,9616

0,9247

1,2

1,4368

-0,2368

0,0561

3,5

1,4286

2,0714

4,2909

17,0052

Для нахождения суммы составляем табл. 8. Из табл. 8 и 9 находим: , . Тогда

, .

При уровне значимости и числах степеней свободы ,

по таблице критических точек распределения Фишера -- Снедекора находим

.

Так как , то заключаем, что уравнение линейной регрессии не согласуется с данными опыта.

Проведем оценку величины погрешности уравнения регрессии

.

Найдем относительную погрешность уравнения по формуле (67):

,

, , .

Так как , то . Для нахождения суммы составляем табл. 3.

Тогда , . Так как величина велика, то уравнение линейной регрессии

плохо описывает опытные данные.

Оценим коэффициенты уравнения регрессии. У нас , . Для нахождения отношений и вычислим средние квадратические ошибки коэффициентов по формулам:

1,5010

0,2864

0,0820

0,5424

-0,6723

0,4520

0,5837

-0,6310

0,3981

-0,3750

-1,5896

2,5269

-0,8336

-2,0483

4,1955

-1,2923

-2,5069

6,2848

-0,7510

-1,9656

3,8636

-1,2096

-2,4243

5,8771

-0,4848

-1,6995

2,8882

1,9557

0,7411

0,5492

-0,5030

-1,7176

2,9502

-0,9616

-2,1763

4,7362

-0,2368

-1,4515

2,1068

2,0714

0,8568

0,7341

37,6446

, , .

По табл. находим: , . Учитывая, что , и , находим:

,

,

.

Так как и ,

Размещено на Allbest.ru

...

Подобные документы

  • Построение диаграммы рассеивания (корреляционного поля). Группировка данных и построение корреляционной таблицы. Оценка числовых характеристик для негруппированных и группированных данных. Выборочное значение статистики. Параметры линейной регрессии.

    контрольная работа [150,5 K], добавлен 14.12.2010

  • Сущность и применение метода наименьших квадратов для однофакторной линейной регрессии. Нахождение коэффициента эластичности для указанной модели в заданной точке X и его экономический анализ. Прогноз убыточности на основании линейной регрессии.

    контрольная работа [47,3 K], добавлен 15.06.2009

  • Проверка выполнения предпосылок МНК. Значимость параметров уравнения регрессии с помощью t-критерия Стьюдента и F-критерия Фишера. Средняя относительная ошибка аппроксимации. Гиперболические, степенные и показательные уравнения нелинейной регрессии.

    контрольная работа [253,4 K], добавлен 17.03.2011

  • Расчет параметров уравнения линейной регрессии, экономическая интерпретация регрессии. Определение остаточной суммы квадратов. Выполнение предпосылок МНК. Расчет коэффициента детерминации, проверка значимости уравнения регрессии с помощью критерия Фишера.

    контрольная работа [317,0 K], добавлен 11.05.2009

  • Эконометрическое моделирование динамики экспорта и импорта РФ: построение регрессии, дисперсионный анализ для линейной регрессии, эластичность показательной регрессии, изучение качества линейной регрессии, колеблемость признака. Доверительные интервалы.

    курсовая работа [367,5 K], добавлен 21.08.2008

  • Парная линейная регрессия. Полный регрессионный анализ. Коэффициент корреляции и теснота линейной связи. Стандартная ошибка регрессии. Значимость уравнения регрессии. Расположение доверительных интервалов. Расчет параметров множественной регрессии.

    контрольная работа [932,7 K], добавлен 09.06.2012

  • Расчет корреляции между экономическими показателями. Построение линейной и не линейной множественной регрессии. Проверка на гетероскедастичность моделей с использованием теста Бреуша-Пагана. Корреляция между наблюдаемыми экономическими показателями.

    курсовая работа [82,2 K], добавлен 23.03.2011

  • Расчет коэффициентов корреляции Пирсона и ранговой корреляции Спирмена по регионам Российской Федерации для заданных показателей. Построение линейной и нелинейной (квадратической) модели регрессии. Проведение проверки значимости для полученных данных.

    контрольная работа [464,0 K], добавлен 28.05.2012

  • Статистика розничного и оптового товарооборота: показательная регрессия, построение регрессии. Дисперсионный анализ для линейной регрессии, изучение ее качества. Доверительные интервалы для оцененных параметров и критерий Фишера значимости регрессии.

    контрольная работа [300,4 K], добавлен 21.08.2008

  • Составление матрицы парных коэффициентов корреляции переменных. Построение линейного уравнения регрессии, характеризирующее зависимость цены от факторов. Оценка статистической значимости параметров в регрессионной модели с помощью t-критерия Стьюдента.

    лабораторная работа [1,6 M], добавлен 13.04.2010

  • Исследование типа регрессии между случайными переменными. Построение эмпирического уравнения регрессии. Расчет выборочных средних, дисперсий и среднеквадратического отклонения. Определение показателя тесноты связи как линейного коэффициента корреляции.

    контрольная работа [513,5 K], добавлен 02.05.2015

  • Экономическая интерпретация коэффициентов регрессии. Графическое представление фактических и модельных значений точки прогноза, уравнений регрессии (гиперболической, степенной, показательной). Нахождение коэффициентов детерминации и эластичности.

    контрольная работа [324,1 K], добавлен 13.04.2010

  • Оценка статистической значимости параметров регрессии. Построение экономического прогноза прибыли при прогнозном значении произведенной валовой продукции. Статистическая оценка параметров уравнения регрессии. Построение мультипликативной модели тренда.

    контрольная работа [132,1 K], добавлен 10.03.2013

  • Порядок построения линейного уравнения парной регрессии, расчет коэффициентов и оценка статической значимости параметров регрессии и корреляции. Точность прогноза. Множественная регрессия и корреляция. Системы эконометрических уравнений. Временные ряды.

    контрольная работа [1,3 M], добавлен 24.09.2013

  • Изучение и оценка коэффициентов и уравнения линейной регрессии показателей грузоперевозок по РБ за 2011-2012 гг. Проверка гипотез о значениях коэффициентов регрессии, построение доверительных интервалов, анализ статистической однородности и независимости.

    курсовая работа [773,3 K], добавлен 23.10.2012

  • Расчет параметров линейной и степенной парной регрессии. Показатели корреляции и детерминации, методика их расчета. Средняя ошибка аппроксимации. Оценка с помощью F-критерия Фишера статистической надежности результатов регрессионного моделирования.

    контрольная работа [25,2 K], добавлен 20.11.2014

  • Виды корреляции и регрессии, применяемые в статистическом анализе социально-экономических явлений и процессов. Построение корреляционной модели (уравнения регрессии). Построение корреляционной таблицы, выполнение интервальной группировки по признакам.

    курсовая работа [131,7 K], добавлен 03.10.2014

  • Составление матрицы парных коэффициентов корреляции. Построение уравнения регрессии, характеризующего зависимость цены от всех факторов. Проведение регрессионного анализа с помощью пакета SPSS. Экономическая интерпретация коэффициентов модели регрессии.

    лабораторная работа [2,5 M], добавлен 27.09.2012

  • Классификация показателей тесноты связи. Основные способы расчета показателей и определение их значимости. Линейный коэффициент корреляции для несгруппированных данных. Принятие решений о тесноте связи на основе линейного коэффициента корреляции.

    презентация [146,4 K], добавлен 16.03.2014

  • Проверка статистической гипотезы о значимости коэффициента функции регрессии. Практическое применение интерполирования. Применение процедуры линеаризации в решении нелинейной задачи регрессии. Построение квадратичной модели полулогарифмической функции.

    курсовая работа [291,1 K], добавлен 23.03.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.