Анализ данных в линейной регрессионной модели

Статистическое описание и выборочные характеристики двумерного случайного вектора. Линейная регрессия, задачи линейного регрессионного анализа. Однофакторный дисперсионный анализ. Границы доверительных интервалов для параметров линейной регрессии.

Рубрика Математика
Вид курсовая работа
Язык русский
Дата добавления 28.10.2017
Размер файла 67,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Московский государственный институт электронной техники

(Технический университет)

Курсовая работа

Тема: “Анализ данных в линейной регрессионной модели”

по курсу “ Теория вероятностей и математическая статистика ”

Преподаватель:Бардушкина И.В.

Студент: группа ЭКТ-23

Белоусов А.В.

Москва 2005

Содержание

1. Теоретическая часть

1.1 Статистическое описание и выборочные характеристики двумерного случайного вектора

1.2 Линейная регрессия

1.3 Однофакторный дисперсионный анализ

2. Практическая часть

1. Теоретическая часть

линейный регрессия интервал дисперсионный

1.1 Статистическое описание и выборочные характеристики двумерного случайного вектора

Пусть ,- выборка объема из наблюдений случайного двумерного вектора. Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой системой координат. Это представление выборки называется диаграммой рассеивания.

Распределением двумерной выборки называется распределение двумерного дискретного случайного вектора, принимающего значения , с вероятностями, равными . Выборочные числовые характеристики вычисляются как соответствующие числовые характеристики двумерного случайного вектора дискретного типа.

Выборочная линейная регрессия на по выборке , определяется уравнением

Выборочные средние находятся по формулам

.

Вычислим суммы квадратов отклонений от среднего и произведений отклонений от средних:

Отсюда

Коэффициенты и называются выборочными коэффициентами регрессии. Они вычисляются по формулам

Аналогично определяется выборочная линейная регрессия на :

коэффициенты и которой находятся по формулам

Для контроля правильности расчетов используют соотношение

Прямые регрессии пересекутся в точке .

1.2 Линейная регрессия

В регрессионном анализе изучается связь между зависимой переменной и одной или несколькими независимыми переменными. Пусть переменная зависит от одной переменной . При этом предполагается, что переменная принимает фиксированные значения, а зависимая переменная имеет случайный разброс из-за ошибок измерения, влияния неучтенных факторов и т.д. Каждому значению переменной соответствует некоторое вероятностное распределение случайной величины . Предположим, что случайная величина в среднем линейно зависит от значений переменной . Это означает, что условное математическое ожидание случайной величины при заданном значении переменной имеет вид

Функция переменной, определяемая правой частью формулы, называется линейной регрессией на , а параметры и - параметрами линейной регрессии. На практике параметры линейной регрессии неизвестны и их оценки определяют по результатам наблюдений переменных и .

Пусть проведено независимых наблюдений случайной величины при значениях переменной при этом измерения величины дали следующие результаты: Так как эти значения имеют «разброс» относительно регрессии, то связь между переменными и можно записать в виде линейной регрессионной модели:

где - случайная ошибка наблюдений, причем Значение дисперсии ошибок наблюдений неизвестно, и оценка ее определяется по результатам наблюдений.

Задача линейного регрессионного анализа состоит в том, чтобы по результатам наблюдений ,

-получить наилучшие точечные и интервальные оценки неизвестных параметров и модели;

-проверить статистические гипотезы о параметрах модели;

-проверить достаточно ли хорошо модель согласуется с результатами наблюдений.

Разности между наблюдаемыми значениями переменной при ,и расчетными значениями называются остатками и обозначаются :

Качество аппроксимации результатов наблюдений , выборочной регрессии определяется величиной остаточной дисперсии, вычисляемой по формуле:

Величина , определяемая выражением

называется остаточной суммой квадратов.

В практических вычислениях остаточную сумму квадратов получают из тождества

которое записывается в виде

,

где

Величина называется суммой квадратов, обусловленной регрессией.

Полезной характеристикой линейной регрессии является коэффициент детерминации ,

вычисляемый по формуле

Коэффициент детерминации равен той доле разброса результатов наблюдений , относительно горизонтальной прямой , которая объясняется выборочной регрессией.

В случае линейной регрессии на между коэффициентом и выборочным коэффициентом корреляции имеется следующее соотношение:

.

1.3 Однофакторный дисперсионный анализ

Пусть результаты наблюдений составляют независимых выборок, полученных нормально распределенных генеральных совокупностей, которые имеют различные средние и равные дисперсии . Проверяется гипотеза о равенстве средних На практике такая задача возникает при исследовании влияния, которое оказывает изменение некоторого фактора на измеряемую величину. Например, если измерения проводятся на различных приборах, то можно исследовать влияние фактора «прибор» на результаты измерений. В данном случае нас интересует вопрос, имеют ли различные приборы одну и ту же систематическую ошибку.

Пусть обозначает -й элемент -й выборки, -выборочное среднее -й выборки, т.е.

;

- общее выборочное среднее, т.е.

где -общее число наблюдений,

Общая сумма квадратов отклонений от общего среднего может быть представлена так:

Это основное тождество дисперсионного анализа. Запишем его в виде

где -общая сумма квадратов отклонений наблюдений от общего среднего, - сумма квадратов отклонений выборочных средних от общего среднего , - сумма квадратов отклонений наблюдений от выборочных средних.

Данное тождество легко проверяется, если учесть, что

и

в силу определения и

Если верна гипотеза : , то статистики и независимы и имеют распределение с и степенями свободы. Следовательно, статистики и являются несмещенными оценками дисперсии . Значительное превышение величины над значением величины можно объяснить различием средних в группах. Отношение этих оценок имеет распределение Фишера с и степенями свободы, т.е.

Эта статистика используется для проверки гипотезы : . Гипотеза не противоречит результатам наблюдений, если выборочное значение статистики меньше квантили . В этом случае и являются несмещенными оценками параметров и . Если то гипотеза отклоняется и следует считать, что среди средних имеется хотя бы два не равных друг другу.

2. Практическая часть

Выборочная линейная регрессия на по выборке , определяется уравнением

.

Тогда

.

,

Аналогично определяется выборочная линейная регрессия на :

.

Найдем коэффициент корреляции:

Проверка:

Прямые

пересекутся в точке (4,1744; 2,765).

Вычислим остатки (см. таблицу),

где - расчетные значения.

Найдем остаточную сумму квадратов

.

Остаточная дисперсия

Сумма квадратов, обусловленная регрессией

Коэффициент детерминации

Коэффициент корреляции

Границы доверительных интервалов для параметров линейной регрессии имеют вид

Границы доверительного интервала для среднего значения , соответствующего заданному значению , определяются формулой

Доверительный интервал для дисперсии ошибок наблюдений имеет вид

,

.

Используя однофакторный дисперсионный анализ, найти и дл проверки гипотезы

по выборке (уровень значимости ).

Сумма всех элементов (компонент) выборки

Найдем

Далее

Тогда

Выборочное значение статистики

.

Найдем по таблице квантиль . Так как , то гипотеза о равенстве средних возможно верна.

Вводимые данные

ДXІ

ДYІ

Произведение величин

Остатки

Остаточная сумма квадратов

X

Y

(X-ср(y))І

(Y-ср(y))І

XY

(X+Y)І

ei

Qe

5.72

4.04

2.3889

1.6256

32.7184

16.3216

23.1088

95.2576

0.1472

0.0217

2.27

1.25

3.6267

2.2952

5.1529

1.5625

2.8375

12.3904

-0.1254

0.0157

7.03

5.27

8.1545

6.2750

49.4209

27.7729

37.0481

151.2900

0.4213

0.1775

4.37

5.06

0.0383

5.2670

19.0969

25.6036

22.1122

88.9249

2.1523

4.6323

3.67

2.00

0.2544

0.5852

13.4689

4.0000

7.3400

32.1489

-0.3969

0.1576

3.7

2.8

0.2251

0.0012

13.6900

7.8400

10.3600

42.2500

0.3812

0.1453

0.25

0.36

15.4009

5.7840

0.0625

0.1296

0.0900

0.3721

0.4586

0.2103

1.82

1.14

5.5432

2.6406

3.3124

1.2996

2.0748

8.7616

0.0930

0.0086

6.55

5.6

5.6435

8.0372

42.9025

31.3600

36.6800

147.6225

1.1016

1.2135

3.71

1.93

0.2157

0.6972

13.7641

3.7249

7.1603

31.8096

-0.4961

0.2462

5.15

4.54

0.9518

3.1506

26.5225

20.6116

23.3810

93.8961

1.0631

1.1302

3.34

0.97

0.6962

3.2220

11.1556

0.9409

3.2398

18.5761

-1.1862

1.4070

4.56

0.35

0.1487

5.8322

20.7936

0.1225

1.5960

24.1081

-2.6964

7.2704

2.88

1.17

1.6755

2.5440

8.2944

1.3689

3.3696

16.4025

-0.6505

0.4232

3.83

2.53

0.1186

0.0552

14.6689

6.4009

9.6899

40.4496

0.0163

0.0003

6.31

2.64

4.5608

0.0156

39.8161

6.9696

16.6584

80.1025

-1.6833

2.8335

3.84

3.34

0.1118

0.3306

14.7456

11.1556

12.8256

51.5524

0.8190

0.6708

1.78

1.81

5.7332

0.9120

3.1684

3.2761

3.2218

12.8881

0.7921

0.6275

4.08

3.41

0.0089

0.4160

16.6464

11.6281

13.9128

56.1001

0.7139

0.5096

4.89

4.67

0.5121

3.6290

23.9121

21.8089

22.8363

91.3936

1.3828

1.9122

4.2

0.1

0.0007

7.1022

17.6400

0.0100

0.4200

18.4900

-2.6837

7.2021

2.59

1.96

2.5103

0.6480

6.7081

3.8416

5.0764

20.7025

0.3511

0.1233

5.68

3.51

2.2668

0.5550

32.2624

12.3201

19.9368

84.4561

-0.3536

0.1250

2.86

0.76

1.7276

4.0200

8.1796

0.5776

2.1736

13.1044

-1.0459

1.0939

3.79

2.12

0.1478

0.4160

14.3641

4.4944

8.0348

34.9281

-0.3645

0.1329

4.28

4.92

0.0112

4.6440

18.3184

24.2064

21.0576

84.6400

2.0779

4.3179

5.2

1.93

1.0519

0.6972

27.0400

3.7249

10.0360

50.8369

-1.5834

2.5070

4.01

3.82

0.0270

1.1130

16.0801

14.5924

15.3182

61.3089

1.1750

1.3805

5.59

5.3

2.0039

6.4262

31.2481

28.0900

29.6270

118.5921

1.5021

2.2562

4.22

0.4

0.0021

5.5932

17.8084

0.1600

1.6880

21.3444

-2.3983

5.7517

5.62

4.16

2.0898

1.9460

31.5844

17.3056

23.3792

95.6484

0.3402

0.1157

5.7

3.55

2.3275

0.6162

32.4900

12.6025

20.2350

85.5625

-0.3282

0.1077

4.5

3.57

0.1060

0.6480

20.2500

12.7449

16.0650

65.1249

0.5674

0.3220

0.2

2.69

15.7959

0.0056

0.0400

7.2361

0.5380

8.3521

2.8250

7.9809

5.12

3.73

0.8942

0.9312

26.2144

13.9129

19.0976

78.3225

0.2750

0.0756

3.71

3.67

0.2157

0.8190

13.7641

13.4689

13.6157

54.4644

1.2439

1.5472

5.33

4.01

1.3354

1.5500

28.4089

16.0801

21.3733

87.2356

0.4018

0.1614

5.98

4.16

3.2602

1.9460

35.7604

17.3056

24.8768

102.8196

0.0775

0.0060

3.47

1.73

0.4962

1.0712

12.0409

2.9929

6.0031

27.0400

-0.5210

0.2715

5.01

5.87

0.6982

9.6410

25.1001

34.4569

29.4087

118.3744

2.4953

6.2264

4.42

2.15

0.0603

0.3782

19.5364

4.6225

9.5030

43.1649

-0.7942

0.6308

2.55

0.24

2.6387

6.3756

6.5025

0.0576

0.6120

7.7841

-1.3397

1.7948

5.25

2.87

1.1569

0.0110

27.5625

8.2369

15.0675

65.9344

-0.6798

0.4622

5.36

1.87

1.4056

0.8010

28.7296

3.4969

10.0232

52.2729

-1.7601

3.0980

4.82

0.12

0.4168

6.9960

23.2324

0.0144

0.5784

24.4036

-3.1161

9.7100

4.47

2.46

0.0874

0.0930

19.9809

6.0516

10.9962

48.0249

-0.5207

0.2711

3.82

3.07

0.1256

0.0930

14.5924

9.4249

11.7274

47.4721

0.5636

0.3176

6.99

7.76

7.9276

24.9500

48.8601

60.2176

54.2424

217.5625

2.9405

8.6466

1.51

0.71

7.0990

4.2230

2.2801

0.5041

1.0721

4.9284

-0.1108

0.0123

2.72

0.16

2.1153

6.7860

7.3984

0.0256

0.4352

8.2944

-1.5438

2.3832

?X

?Y

?ДX

?ДY

?

?

?XY

?(X+Y)І

?ei

?eiІ

208.72

138.25

116.01

154.41

987.29

536.67

661.76

2847.49

0.0000

92.6447

Размещено на Allbest.ru

...

Подобные документы

  • Статистическое описание и выборочные характеристики двумерного случайного вектора. Оценка параметров линейной регрессии, полученных по методу наименьших квадратов. Проверка гипотезы о равенстве средних нормальных совокупностей при неизвестных дисперсиях.

    контрольная работа [242,1 K], добавлен 05.11.2011

  • Знакомство с уравнениями линейной регрессии, рассмотрение распространенных способов решения. Общая характеристика метода наименьших квадратов. Особенности оценки статистической значимости парной линейной регрессии. Анализ транспонированной матрицы.

    контрольная работа [380,9 K], добавлен 05.04.2015

  • Построение уравнения регрессии. Оценка параметров линейной парной регрессии. F-критерий Фишера и t-критерий Стьюдента. Точечный и интервальный прогноз по уравнению линейной регрессии. Расчет и оценка ошибки прогноза и его доверительного интервала.

    презентация [387,8 K], добавлен 25.05.2015

  • Цели линейной модели множественной регрессии (прогноз, имитация, сценарий развития, управление). Анализ эконометрической сущности изучаемого явления на априорном этапе. Параметризация и сбор необходимой статистической информации, значимость коэффициентов.

    контрольная работа [68,7 K], добавлен 21.09.2009

  • Дисперсионный анализ по одному признаку для проверки равенства нескольких средних. Множественная линейная регрессия. Зависимость ВАШБП и ВАШСП от показателей активности в динамике. Дисперсионный анализ и линейная регрессия, артрит реактивный.

    курсовая работа [2,2 M], добавлен 08.08.2010

  • Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.

    задача [409,0 K], добавлен 17.10.2012

  • Функциональные и стохастические связи. Статистические методы моделирования связи. Статистическое моделирование связи методом корреляционного и регрессионного анализа. Проверка адекватности регрессионной модели.

    курсовая работа [214,6 K], добавлен 04.09.2007

  • Значения коэффициента регрессии (b) и сводного члена уравнения регрессии (а). Определение стандартной ошибки предсказания являющейся мерой качества зависимости величин Y и х с помощью уравнения линейной регрессии. Значимость коэффициента регрессии.

    задача [133,0 K], добавлен 21.12.2008

  • Построение линейной множественной регрессии для моделирования потребления продукта в разных географических районах. Расчет оценки дисперсии случайной составляющей. Вычисление и корректировка коэффициентов детерминации. Расчет доверительного интервала.

    контрольная работа [814,0 K], добавлен 19.12.2013

  • Понятие доверительного интервала, сущность и определение критерия согласия Пирсона. Особенности точечного оценивания неизвестных параметров, основные требования к оценкам и статистикам. Характеристика классической линейной модели регрессионного анализа.

    дипломная работа [440,4 K], добавлен 23.07.2013

  • Прямолинейные, обратные и криволинейные связи. Статистическое моделирование связи методом корреляционного и регрессионного анализа. Метод наименьших квадратов. Оценка значимости коэффициентов регрессии. Проверка адекватности модели по критерию Фишера.

    курсовая работа [232,7 K], добавлен 21.05.2015

  • Предпосылки корреляционного анализа - математико-статистического метода выявления взаимозависимости компонентов многомерной случайной величины и оценки их связи. Точечные оценки параметров двумерного распределения. Аппроксимация уравнений регрессии.

    контрольная работа [648,3 K], добавлен 03.04.2011

  • Cтатистический анализ зависимости давления. Построение диаграммы рассеивания и корреляционной таблицы. Вычисление параметров для уравнений линейной и параболической регрессии, выборочных параметров. Проверка гипотезы о нормальном распределении признака.

    курсовая работа [613,3 K], добавлен 24.10.2012

  • Определение частных производных первого и второго порядков заданной функции, эластичности спроса, основываясь на свойствах функции спроса. Выравнивание данных по прямой методом наименьших квадратов. Расчет параметров уравнения линейной парной регрессии.

    контрольная работа [99,4 K], добавлен 22.07.2009

  • Алгоритм построения ранговой оценки неизвестных параметров регрессии. Моделирование регрессионных зависимостей с погрешностями, имеющими распределения с "тяжёлыми" хвостами. Вычисление асимптотической относительной эффективности рангового метода.

    курсовая работа [1,2 M], добавлен 05.01.2015

  • Описание способов нахождения коэффициентов регрессии модели полнофакторного эксперимента. Проверка многофакторных статистических гипотез на однородность ряда дисперсий, значимость и устойчивость математических коэффициентов множественной корреляции.

    контрольная работа [1,2 M], добавлен 05.08.2010

  • Основные задачи регрессионного анализа в математической статистике. Вычисление дисперсии параметров уравнения регрессии и дисперсии прогнозирования эндогенной переменной. Установление зависимости между переменными. Применение метода наименьших квадратов.

    презентация [100,3 K], добавлен 16.12.2014

  • Сущность линейного программирования. Изучение математических методов решения экстремальных задач, которые характеризуются линейной зависимостью между переменными и линейной целевой функцией. Нахождение точек наибольшего или наименьшего значения функции.

    реферат [162,8 K], добавлен 20.05.2019

  • Точечное оценивание основных числовых характеристик, функции и плотности распределения компонент многомерного случайного вектора. Статистическая проверка характера распределения. Особенности корреляционного анализа признаков этой математической категории.

    курсовая работа [1,1 M], добавлен 01.10.2013

  • Расчет эффективности ведения многоотраслевого хозяйства, отображение связей между отраслями в таблицах балансового анализа. Построение линейной математической модели экономического процесса, приводящей к понятию собственного вектора и значения матрицы.

    реферат [271,1 K], добавлен 17.01.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.