Анализ данных в линейной регрессионной модели

Статистическое описание и выборочные характеристики двумерного случайного вектора. Предмет линейного регрессионного анализа. Особенности однофакторного дисперсионного анализа. Уравнение выборочной линейной регрессии. Выборочное значение статистики.

Рубрика Математика
Вид курсовая работа
Язык русский
Дата добавления 22.10.2017
Размер файла 337,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

11

Размещено на http://www.allbest.ru/

Министерство общего и профессионального образования Российской Федерации

Московский государственный институт электронной техники

(Технический университет)

Курсовая работа

“Анализ данных в линейной регрессионной модели”

по курсу “Теория вероятностей и математическая статистика”

Студент: группа ИМЭ-27

Дмитриев П.А.

Москва 2004

Теоретическая часть

1. Статистическое описание и выборочные характеристики двумерного случайного вектора

Пусть , - выборка объема из наблюдений случайного двумерного вектора. Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой системой координат. Это представление выборки называется диаграммой рассеивания.

Распределением двумерной выборки называется распределение двумерного дискретного случайного вектора, принимающего значения , с вероятностями, равными . Выборочные числовые характеристики вычисляются как соответствующие числовые характеристики двумерного случайного вектора дискретного типа.

Выборочная линейная регрессия на по выборке , определяется уравнением

Выборочные средние находятся по формулам

.

Вычислим суммы квадратов отклонений от среднего и произведений отклонений от средних:

Отсюда

Коэффициенты и называются выборочными коэффициентами регрессии. Они вычисляются по формулам

Аналогично определяется выборочная линейная регрессия на :

коэффициенты и которой находятся по формулам

Для контроля правильности расчетов используют соотношение

Прямые регрессии пересекутся в точке .

2. Линейная регрессия

В регрессионном анализе изучается связь между зависимой переменной и одной или несколькими независимыми переменными. Пусть переменная зависит от одной переменной . При этом предполагается, что переменная принимает фиксированные значения, а зависимая переменная имеет случайный разброс из-за ошибок измерения, влияния неучтенных факторов и т.д. Каждому значению переменной соответствует некоторое вероятностное распределение случайной величины . Предположим, что случайная величина в среднем линейно зависит от значений переменной . Это означает, что условное математическое ожидание случайной величины при заданном значении переменной имеет вид

Функция переменной, определяемая правой частью формулы, называется линейной регрессией на , а параметры и - параметрами линейной регрессии. На практике параметры линейной регрессии неизвестны и их оценки определяют по результатам наблюдений переменных и .

Пусть проведено независимых наблюдений случайной величины при значениях переменной при этом измерения величины дали следующие результаты: Так как эти значения имеют "разброс" относительно регрессии, то связь между переменными и можно записать в виде линейной регрессионной модели:

где

- случайная ошибка наблюдений, причем Значение дисперсии ошибок наблюдений неизвестно, и оценка ее определяется по результатам наблюдений.

Задача линейного регрессионного анализа состоит в том, чтобы по результатам наблюдений ,

получить наилучшие точечные и интервальные оценки неизвестных параметров и модели;

проверить статистические гипотезы о параметрах модели;

проверить достаточно ли хорошо модель согласуется с результатами наблюдений.

Разности между наблюдаемыми значениями переменной при ,и расчетными значениями называются остатками и обозначаются :

Качество аппроксимации результатов наблюдений , выборочной регрессии определяется величиной остаточной дисперсии, вычисляемой по формуле:

Величина , определяемая выражением

называется остаточной суммой квадратов.

В практических вычислениях остаточную сумму квадратов получают из тождества

которое записывается в виде

,

где

Величина называется суммой квадратов, обусловленной регрессией.

Полезной характеристикой линейной регрессии является коэффициент детерминации , вычисляемый по формуле

Коэффициент детерминации равен той доле разброса результатов наблюдений , относительно горизонтальной прямой , которая объясняется выборочной регрессией.

В случае линейной регрессии на между коэффициентом и выборочным коэффициентом корреляции имеется следующее соотношение:

.

3. Однофакторный дисперсионный анализ

Пусть результаты наблюдений составляют независимых выборок, полученных нормально распределенных генеральных совокупностей, которые имеют различные средние и равные дисперсии . Проверяется гипотеза о равенстве средних На практике такая задача возникает при исследовании влияния, которое оказывает изменение некоторого фактора на измеряемую величину. Например, если измерения проводятся на различных приборах, то можно исследовать влияние фактора "прибор" на результаты измерений. В данном случае нас интересует вопрос, имеют ли различные приборы одну и ту же систематическую ошибку.

Пусть обозначает -й элемент -й выборки, -выборочное среднее -й выборки, т.е.

;

- общее выборочное среднее, т.е.

где

-общее число наблюдений,

Общая сумма квадратов отклонений от общего среднего может быть представлена так:

Это основное тождество дисперсионного анализа. Запишем его в виде

где -общая сумма квадратов отклонений наблюдений от общего среднего, - сумма квадратов отклонений выборочных средних от общего среднего , - сумма квадратов отклонений наблюдений от выборочных средних.

Данное тождество легко проверяется, если учесть, что

и

в силу определения и

Если верна гипотеза : , то статистики и независимы и имеют распределение с и степенями свободы. Следовательно, статистики и являются несмещенными оценками дисперсии . Значительное превышение величины над значением величины можно объяснить различием средних в группах. Отношение этих оценок имеет распределение Фишера с и степенями свободы, т.е.

Эта статистика используется для проверки гипотезы : . Гипотеза не противоречит результатам наблюдений, если выборочное значение статистики меньше квантили . В этом случае и являются несмещенными оценками параметров и . Если то гипотеза отклоняется и следует считать, что среди средних имеется хотя бы два не равных друг другу.

Практическая часть

Выборочная линейная регрессия на по выборке , определяется уравнением

.

Тогда

,

Аналогично определяется выборочная линейная регрессия на :

.

Найдем коэффициент корреляции:

Проверка:

Прямые

,

пересекутся в точке (6,8826; 5,01).

Вычислим остатки (см. таблицу),

где - расчетные значения.

Найдем остаточную сумму квадратов

.

Остаточная дисперсия

Сумма квадратов, обусловленная регрессией

Коэффициент детерминации

Коэффициент корреляции

Границы доверительных интервалов для параметров линейной регрессии имеют вид

Границы доверительного интервала для среднего значения , соответствующего заданному значению , определяются формулой

Доверительный интервал для дисперсии ошибок наблюдений имеет вид

,

.

Используя однофакторный дисперсионный анализ, найти и дл проверки гипотезы

по выборке (уровень значимости ).

Сумма всех элементов (компонент) выборки

Найдем

Далее

Тогда

Выборочное значение статистики

.

Найдем по таблице квантиль . Так как , то гипотеза о равенстве средних не отклоняется.

линейная регрессионная модель дисперсионный

Размещено на Allbest.ru

...

Подобные документы

  • Статистическое описание и выборочные характеристики двумерного случайного вектора. Оценка параметров линейной регрессии, полученных по методу наименьших квадратов. Проверка гипотезы о равенстве средних нормальных совокупностей при неизвестных дисперсиях.

    контрольная работа [242,1 K], добавлен 05.11.2011

  • Знакомство с уравнениями линейной регрессии, рассмотрение распространенных способов решения. Общая характеристика метода наименьших квадратов. Особенности оценки статистической значимости парной линейной регрессии. Анализ транспонированной матрицы.

    контрольная работа [380,9 K], добавлен 05.04.2015

  • Общее понятие о дисперсионном анализе, его сущность и значение. Использование INTERNET и компьютера для проведения дисперсионного анализа, особенности работы в среде MS Excel. Примеры применения однофакторного и двухфакторного дисперсионного анализа.

    курсовая работа [820,4 K], добавлен 17.02.2013

  • Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.

    задача [409,0 K], добавлен 17.10.2012

  • Понятие доверительного интервала, сущность и определение критерия согласия Пирсона. Особенности точечного оценивания неизвестных параметров, основные требования к оценкам и статистикам. Характеристика классической линейной модели регрессионного анализа.

    дипломная работа [440,4 K], добавлен 23.07.2013

  • Функциональные и стохастические связи. Статистические методы моделирования связи. Статистическое моделирование связи методом корреляционного и регрессионного анализа. Проверка адекватности регрессионной модели.

    курсовая работа [214,6 K], добавлен 04.09.2007

  • Построение уравнения регрессии. Оценка параметров линейной парной регрессии. F-критерий Фишера и t-критерий Стьюдента. Точечный и интервальный прогноз по уравнению линейной регрессии. Расчет и оценка ошибки прогноза и его доверительного интервала.

    презентация [387,8 K], добавлен 25.05.2015

  • Изучение раздела математической статистики, посвященного методам выявления влияния отдельных факторов на результат эксперимента. Эффекты взаимодействия. Использование однофакторного дисперсионного анализа для сравнения средних значений нескольких выборок.

    презентация [110,0 K], добавлен 09.11.2014

  • Точечное оценивание основных числовых характеристик, функции и плотности распределения компонент многомерного случайного вектора. Статистическая проверка характера распределения. Особенности корреляционного анализа признаков этой математической категории.

    курсовая работа [1,1 M], добавлен 01.10.2013

  • Предмет и метод математической статистики. Распределение непрерывной случайной величины с точки зрения теории вероятности на примере логарифмически-нормального распределения. Расчет корреляции величин и нахождение линейной зависимости случайных величин.

    курсовая работа [988,5 K], добавлен 19.01.2011

  • Расчет эффективности ведения многоотраслевого хозяйства, отображение связей между отраслями в таблицах балансового анализа. Построение линейной математической модели экономического процесса, приводящей к понятию собственного вектора и значения матрицы.

    реферат [271,1 K], добавлен 17.01.2011

  • Прямолинейные, обратные и криволинейные связи. Статистическое моделирование связи методом корреляционного и регрессионного анализа. Метод наименьших квадратов. Оценка значимости коэффициентов регрессии. Проверка адекватности модели по критерию Фишера.

    курсовая работа [232,7 K], добавлен 21.05.2015

  • Теоретические основы юридической статистики, числовые характеристики. Построение гистограммы выборки. Оценка среднего значения, дисперсии и эксцесса. Выборочное уравнение регрессии по данным корреляционных таблиц. Интервальная оценка распределения.

    курсовая работа [1,1 M], добавлен 16.11.2013

  • Предмет, метод и история возникновения статистики. Построение таблиц, понятие абсолютных и относительных величин и правила действия с ними. Сущность вариации, свойства дисперсии и расчет индексов. Особенности корреляционно-регрессионного анализа.

    курс лекций [302,0 K], добавлен 14.07.2011

  • Сущность линейного программирования. Изучение математических методов решения экстремальных задач, которые характеризуются линейной зависимостью между переменными и линейной целевой функцией. Нахождение точек наибольшего или наименьшего значения функции.

    реферат [162,8 K], добавлен 20.05.2019

  • Предпосылки корреляционного анализа - математико-статистического метода выявления взаимозависимости компонентов многомерной случайной величины и оценки их связи. Точечные оценки параметров двумерного распределения. Аппроксимация уравнений регрессии.

    контрольная работа [648,3 K], добавлен 03.04.2011

  • Методика и основные этапы расчета параметров линейного уравнения парной регрессии с помощью программы Excel. Анализ качества построенной модели, с использованием коэффициента парной корреляции, коэффициента детерминации и средней ошибки аппроксимации.

    лабораторная работа [22,3 K], добавлен 15.04.2014

  • Определение типа кривой по виду уравнения, уравнение с угловым коэффициентом, в отрезках и общее уравнение. Определение медианы, уравнения средней линии в треугольнике. Вопросы по линейной алгебре. Решение системы уравнения при помощи обратной матрицы.

    контрольная работа [97,5 K], добавлен 31.10.2010

  • Описание способов нахождения коэффициентов регрессии модели полнофакторного эксперимента. Проверка многофакторных статистических гипотез на однородность ряда дисперсий, значимость и устойчивость математических коэффициентов множественной корреляции.

    контрольная работа [1,2 M], добавлен 05.08.2010

  • Сущность закона распределения и его практическое применение для решения статистических задач. Определение дисперсии случайной величины, математического ожидания и среднеквадратического отклонения. Особенности однофакторного дисперсионного анализа.

    контрольная работа [328,2 K], добавлен 07.12.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.