Построение модели линейной регрессии для несгруппированных данных
Характер расположения точек в корреляционном поле. Построение моделей линейной регрессии для несгруппированных данных. Оценка надежности коэффициента корреляции, адекватности уравнения регрессии. Коэффициент детерминации, его смысловое значение.
Рубрика | Экономика и экономическая теория |
Вид | лабораторная работа |
Язык | русский |
Дата добавления | 21.01.2015 |
Размер файла | 104,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Построение модели линейной регрессии для несгруппированных данных
Цель работы: овладение способами построения моделей линейной регрессии для несгруппированных данных, выработка умения и навыков оценки надежности коэффициента корреляции, уравнения регрессии и его коэффициентов. несгруппированный корреляция регрессия детерминация
Содержание работы: на основании опытных данных требуется:
1. Построить корреляционное поле. По характеру расположения точек в корреляционном поле выбрать общий вид регрессии.
2. Вычислить числовые характеристики , , , , , .
3. Определить значимость коэффициента корреляции и найти для него доверительный интервал с надежностью .
4. Написать эмпирические уравнения линий регрессий на и на .
5. Вычислить коэффициент детерминации и объяснить его смысловое значение.
6. Проверить адекватность уравнения регрессии на .
7. Провести оценку величины погрешности уравнения регрессии на и его коэффициентов.
8. Построить уравнение регрессии на в первоначальной системе координат.
Суть лабораторной работы отражает следующая задача.
Задача. Скорость Y(м/час) бурения в твердых породах от нагрузки X (атм.) на долото характеризуется следующими данными Таблица 1:
X |
10 |
10,5 |
11 |
11,5 |
12 |
12,5 |
13 |
13,5 |
13,8 |
15,5 |
16 |
16,5 |
16,8 |
16,9 |
|
Y |
3,5 |
2,5 |
2,5 |
1,5 |
1 |
0,5 |
1 |
0,5 |
1,2 |
3,5 |
1 |
0,5 |
1,2 |
3,5 |
Найти эмпирическую формулу зависимости Y от X.
Для решения поставленной задачи методами корреляционного анализа определим, какой из указанных в условии показателей выбрать за факторный признак, а какой за результативный. На основании, например, анализа зависимости скорости бурения от нагрузки на долото следует, что за факторный признак следует принять нагрузку на долото, а скорость бурения за результативный признак .
Для определения формы связи между признаками и строим на координатной плоскости точки , пользуясь табл. 1. Около построенных точек проводим так называемую линию тренда (на рис. 1 -- пунктирная линия) так, чтобы построенные точки были расположены как можно ближе к ней. По расположению точек около линии тренда делаем вывод о том, что связь между нагрузкой на долото и скоростью бурения может носить линейный характер. Произведем расчет статистик , , , , , которые войдут в уравнения линий регрессий. Составим расчетную табл.
Рис. 1 Линия тренда
x2 |
||||||||
10 |
-3,54 |
12,50 |
3,5 |
1,79 |
3,21 |
100 |
35 |
|
10,5 |
-3,04 |
9,22 |
2,5 |
0,79 |
0,63 |
110,25 |
26,25 |
|
11 |
-2,54 |
6,43 |
2,5 |
0,79 |
0,63 |
121 |
27,5 |
|
11,5 |
-2,04 |
4,14 |
1,5 |
-0,21 |
0,04 |
132,25 |
17,25 |
|
12 |
-1,54 |
2,36 |
1 |
-0,71 |
0,50 |
144 |
12 |
|
12,5 |
-1,04 |
1,07 |
0,5 |
-1,21 |
1,46 |
156,25 |
6,25 |
|
13 |
-0,54 |
0,29 |
1 |
-0,71 |
0,50 |
169 |
13 |
|
13,5 |
-0,04 |
0,00 |
0,5 |
-1,21 |
1,46 |
182,25 |
6,75 |
|
13,8 |
0,26 |
0,07 |
1,2 |
-0,51 |
0,26 |
190,44 |
16,56 |
|
15,5 |
1,96 |
3,86 |
3,5 |
1,79 |
3,21 |
240,25 |
54,25 |
|
16 |
2,46 |
6,07 |
1 |
-0,71 |
0,50 |
256 |
16 |
|
16,5 |
2,96 |
8,79 |
0,5 |
-1,21 |
1,46 |
272,25 |
8,25 |
|
16,8 |
3,26 |
10,66 |
1,2 |
-0,51 |
0,26 |
282,24 |
20,16 |
|
16,9 |
3,36 |
11,32 |
3,5 |
1,79 |
3,21 |
285,61 |
59,15 |
|
189,5 |
76,7721 |
23,9 |
17,3292 |
2641,79 |
318,37 |
Пользуясь результатами последней строки табл., находим:
-- средняя нагрузка на долото.
-- средняя скорость бурения,
,
,
,
.
Проверяем значимость коэффициента корреляции. Вычислим статистику tp по формуле (59):
.
По таблице критических точек распределения Стьюдента (приложение 6) по уровню значимости и числу степеней свободы
находим
.
Так как , то -- незначимый (мало отличается от нуля) и признаки и некоррелированы. Следовательно, можно предположить, что скорость бурения Y и нагрузка на долото X не связаны линейной регрессионной зависимостью. (рис.2).
Находим доверительный интервал для выборочного коэффициента корреляции с надежностью . Так как объем выборки , то доверительный интервал находим по формуле:
.
Так как по условию надежность (доверительная вероятность) равна , то по таблице функции Лапласа (приложение 2) находим . Вычисляем среднюю квадратическую ошибку по формуле (60):
.
-- коэффициент парной линейной корреляции, -- объем выборки
Записываем доверительный интервал:
или . Следовательно, с вероятностью 0,95 линейный коэффициент корреляции генеральной совокупности находится в пределах от -0,723 до 0,374.
Найдем эмпирические линейные уравнения регрессии на и на , которые являются приближенными уравнениями для истинных уравнений регрессий.
Уравнение регрессии на :
.
Уравнение регрессии на :
.
Контроль вычислений:
,
.
Так как условие выполняется, то вычисления выполнены верно.
Из уравнения
следует, что при увеличении нагрузки на долото на 100 т. средняя скорость бурения упадет на 8,2 м/час. Подставляя , в уравнения регрессий, получаем точки, координаты которых совпадают с координатами центра распределения . Следовательно, линии регрессий пересекаются в точке .
Найдем коэффициент детерминации. Для линейной регрессии при вычисленном коэффициенте он равен . У нас .
Это означает, что 3 % рассеивания средней скорости проходки объясняется линейной регрессионной зависимостью между средней зарплатой и производительностью труда, и 97 % рассеивания средней скорости проходки остались необъяснимыми.
Такое положение могло произойти из-за того, что в модель не включены другие факторы, влияющие на изменение средней скорости проходки, либо опытных данных в данной выборке не достаточно, чтобы построить более надежное уравнение регрессии.
Проверим адекватность уравнения линейной регрессии на по критерию Фишера -- Снедекора. Вычислим статистику по формуле (64):
, где .
3,5 |
1,9990 |
1,5010 |
2,2531 |
|
2,5 |
1,9576 |
0,5424 |
0,2942 |
|
2,5 |
1,9163 |
0,5837 |
0,3407 |
|
1,5 |
1,8750 |
-0,3750 |
0,1406 |
|
1 |
1,8336 |
-0,8336 |
0,6949 |
|
0,5 |
1,7923 |
-1,2923 |
1,6700 |
|
1 |
1,7510 |
-0,7510 |
0,5639 |
|
0,5 |
1,7096 |
-1,2096 |
1,4632 |
|
1,2 |
1,6848 |
-0,4848 |
0,2351 |
|
3,5 |
1,5443 |
1,9557 |
3,8248 |
|
1 |
1,5030 |
-0,5030 |
0,2530 |
|
0,5 |
1,4616 |
-0,9616 |
0,9247 |
|
1,2 |
1,4368 |
-0,2368 |
0,0561 |
|
3,5 |
1,4286 |
2,0714 |
4,2909 |
|
17,0052 |
Для нахождения суммы составляем табл. 8. Из табл. 8 и 9 находим: , . Тогда
, .
При уровне значимости и числах степеней свободы ,
по таблице критических точек распределения Фишера -- Снедекора находим
.
Так как , то заключаем, что уравнение линейной регрессии не согласуется с данными опыта.
Проведем оценку величины погрешности уравнения регрессии
.
Найдем относительную погрешность уравнения по формуле (67):
,
, , .
Так как , то . Для нахождения суммы составляем табл. 3.
Тогда , . Так как величина велика, то уравнение линейной регрессии
плохо описывает опытные данные.
Оценим коэффициенты уравнения регрессии. У нас , . Для нахождения отношений и вычислим средние квадратические ошибки коэффициентов по формулам:
1,5010 |
0,2864 |
0,0820 |
|
0,5424 |
-0,6723 |
0,4520 |
|
0,5837 |
-0,6310 |
0,3981 |
|
-0,3750 |
-1,5896 |
2,5269 |
|
-0,8336 |
-2,0483 |
4,1955 |
|
-1,2923 |
-2,5069 |
6,2848 |
|
-0,7510 |
-1,9656 |
3,8636 |
|
-1,2096 |
-2,4243 |
5,8771 |
|
-0,4848 |
-1,6995 |
2,8882 |
|
1,9557 |
0,7411 |
0,5492 |
|
-0,5030 |
-1,7176 |
2,9502 |
|
-0,9616 |
-2,1763 |
4,7362 |
|
-0,2368 |
-1,4515 |
2,1068 |
|
2,0714 |
0,8568 |
0,7341 |
|
37,6446 |
, , .
По табл. находим: , . Учитывая, что , и , находим:
,
,
.
Так как и ,
Размещено на Allbest.ru
...Подобные документы
Построение диаграммы рассеивания (корреляционного поля). Группировка данных и построение корреляционной таблицы. Оценка числовых характеристик для негруппированных и группированных данных. Выборочное значение статистики. Параметры линейной регрессии.
контрольная работа [150,5 K], добавлен 14.12.2010Сущность и применение метода наименьших квадратов для однофакторной линейной регрессии. Нахождение коэффициента эластичности для указанной модели в заданной точке X и его экономический анализ. Прогноз убыточности на основании линейной регрессии.
контрольная работа [47,3 K], добавлен 15.06.2009Проверка выполнения предпосылок МНК. Значимость параметров уравнения регрессии с помощью t-критерия Стьюдента и F-критерия Фишера. Средняя относительная ошибка аппроксимации. Гиперболические, степенные и показательные уравнения нелинейной регрессии.
контрольная работа [253,4 K], добавлен 17.03.2011Расчет параметров уравнения линейной регрессии, экономическая интерпретация регрессии. Определение остаточной суммы квадратов. Выполнение предпосылок МНК. Расчет коэффициента детерминации, проверка значимости уравнения регрессии с помощью критерия Фишера.
контрольная работа [317,0 K], добавлен 11.05.2009Эконометрическое моделирование динамики экспорта и импорта РФ: построение регрессии, дисперсионный анализ для линейной регрессии, эластичность показательной регрессии, изучение качества линейной регрессии, колеблемость признака. Доверительные интервалы.
курсовая работа [367,5 K], добавлен 21.08.2008Парная линейная регрессия. Полный регрессионный анализ. Коэффициент корреляции и теснота линейной связи. Стандартная ошибка регрессии. Значимость уравнения регрессии. Расположение доверительных интервалов. Расчет параметров множественной регрессии.
контрольная работа [932,7 K], добавлен 09.06.2012Расчет корреляции между экономическими показателями. Построение линейной и не линейной множественной регрессии. Проверка на гетероскедастичность моделей с использованием теста Бреуша-Пагана. Корреляция между наблюдаемыми экономическими показателями.
курсовая работа [82,2 K], добавлен 23.03.2011Расчет коэффициентов корреляции Пирсона и ранговой корреляции Спирмена по регионам Российской Федерации для заданных показателей. Построение линейной и нелинейной (квадратической) модели регрессии. Проведение проверки значимости для полученных данных.
контрольная работа [464,0 K], добавлен 28.05.2012Статистика розничного и оптового товарооборота: показательная регрессия, построение регрессии. Дисперсионный анализ для линейной регрессии, изучение ее качества. Доверительные интервалы для оцененных параметров и критерий Фишера значимости регрессии.
контрольная работа [300,4 K], добавлен 21.08.2008Составление матрицы парных коэффициентов корреляции переменных. Построение линейного уравнения регрессии, характеризирующее зависимость цены от факторов. Оценка статистической значимости параметров в регрессионной модели с помощью t-критерия Стьюдента.
лабораторная работа [1,6 M], добавлен 13.04.2010Исследование типа регрессии между случайными переменными. Построение эмпирического уравнения регрессии. Расчет выборочных средних, дисперсий и среднеквадратического отклонения. Определение показателя тесноты связи как линейного коэффициента корреляции.
контрольная работа [513,5 K], добавлен 02.05.2015Экономическая интерпретация коэффициентов регрессии. Графическое представление фактических и модельных значений точки прогноза, уравнений регрессии (гиперболической, степенной, показательной). Нахождение коэффициентов детерминации и эластичности.
контрольная работа [324,1 K], добавлен 13.04.2010Оценка статистической значимости параметров регрессии. Построение экономического прогноза прибыли при прогнозном значении произведенной валовой продукции. Статистическая оценка параметров уравнения регрессии. Построение мультипликативной модели тренда.
контрольная работа [132,1 K], добавлен 10.03.2013Порядок построения линейного уравнения парной регрессии, расчет коэффициентов и оценка статической значимости параметров регрессии и корреляции. Точность прогноза. Множественная регрессия и корреляция. Системы эконометрических уравнений. Временные ряды.
контрольная работа [1,3 M], добавлен 24.09.2013Изучение и оценка коэффициентов и уравнения линейной регрессии показателей грузоперевозок по РБ за 2011-2012 гг. Проверка гипотез о значениях коэффициентов регрессии, построение доверительных интервалов, анализ статистической однородности и независимости.
курсовая работа [773,3 K], добавлен 23.10.2012Расчет параметров линейной и степенной парной регрессии. Показатели корреляции и детерминации, методика их расчета. Средняя ошибка аппроксимации. Оценка с помощью F-критерия Фишера статистической надежности результатов регрессионного моделирования.
контрольная работа [25,2 K], добавлен 20.11.2014Виды корреляции и регрессии, применяемые в статистическом анализе социально-экономических явлений и процессов. Построение корреляционной модели (уравнения регрессии). Построение корреляционной таблицы, выполнение интервальной группировки по признакам.
курсовая работа [131,7 K], добавлен 03.10.2014Составление матрицы парных коэффициентов корреляции. Построение уравнения регрессии, характеризующего зависимость цены от всех факторов. Проведение регрессионного анализа с помощью пакета SPSS. Экономическая интерпретация коэффициентов модели регрессии.
лабораторная работа [2,5 M], добавлен 27.09.2012Классификация показателей тесноты связи. Основные способы расчета показателей и определение их значимости. Линейный коэффициент корреляции для несгруппированных данных. Принятие решений о тесноте связи на основе линейного коэффициента корреляции.
презентация [146,4 K], добавлен 16.03.2014Проверка статистической гипотезы о значимости коэффициента функции регрессии. Практическое применение интерполирования. Применение процедуры линеаризации в решении нелинейной задачи регрессии. Построение квадратичной модели полулогарифмической функции.
курсовая работа [291,1 K], добавлен 23.03.2015