Корреляционный анализ зависимости изменения испарений осадков от температуры воздуха
Оценка математического ожидания, дисперсии, среднего квадратического отклонения, коэффициента корреляции случайных величин. Построение регрессионной модели и интервальная оценка. Нахождение доверительного интервала для условного математического ожидания.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 29.04.2015 |
Размер файла | 305,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
РОССИЙСКАЯ АКАДЕМИЯ НАРОДНОГО ХОЗЯЙСТВА И ГОСУДАРСТВЕННОЙ СЛУЖБЫ
ПРИ ПРЕЗИДЕНТЕ РОССИЙСКОЙ ФЕДЕРАЦИИ
НИЖЕГОРОДСКИЙ ИНСТИТУТ УПРАВЛЕНИЯ
Факультет государственного и муниципального управления
Кафедра математики и системного анализа
КУРСОВАЯ РАБОТА
ПО ДИСЦИПЛИНЕ «Теория вероятностей и математическая статистика»
на тему: «Корреляционный анализ зависимости изменения испарений осадков от температуры воздуха»
Выполнил: студент гр.Иб-321
Савельев Геннадий Николаевич
Научный руководитель:
кандидат технических наук, доцент
Маслов Владимир Николаевич
Нижний Новгород 2015
Введение
В наши дни мы все чаще сталкиваемся с обработкой больших массивов данных. Статистика стала неотъемлемой частью различных сфер деятельности, и в особенности экономики. Потребность всестороннего и эффективного анализа данных послужила толчком к развитию различных специальных методов обработки информации. Корреляционно-регрессионный анализ относятся к числу таких методов.
Основной задачей корреляционного (или регрессионного) анализа является построение статистической модели связи между различными величинами (параметрами) и получение метода косвенного оценивания одних параметров через другие, которые измеряются раньше по времени или значения которых измерить проще (дешевле).
Однако, не все факторы, влияющие на экономические процессы, являются случайными величинами, поэтому при анализе экономических явлений обычно рассматриваются связи между случайными и неслучайными величинами. Такие связи называются регрессионными, а метод математической статистики, их изучающий, называется регрессионным анализом.
К целям регрессионного анализа относятся:
1. Определение степени детерминированности вариации зависимой переменной независимыми переменными;
2. Предсказание значения зависимой переменной с помощью независимой(-ых)
3. Определение вклада отдельных независимых переменных в вариацию зависимой
Постановка задачи
При проведении исследований о выпадении осадков была выявлена зависимость, представленная в таблице, где t - температура воздуха, а у - количество испарений (в %) к количеству выпавших осадков за апрель 2014 года.
Таблица 1
Выборка из генеральной совокупности
t воздуха (градусы) |
-2 |
0 |
2 |
3 |
4 |
5 |
7 |
10 |
|
испарение (%) |
-11 |
-2 |
9 |
14 |
19 |
25 |
37 |
56 |
Увеличение испарений осадков происходит с увеличением температуры воздуха.
1. Оценить математические ожидания, дисперсии, средние квадратические отклонения и коэффициент корреляции случайных величин Х и Y. На координатную плоскость нанести точки из таблицы.
2. Используя методы корреляционного анализа построить (аналитически и графически) регрессионные модели , причем в качестве эмпирического уравнения регрессии взять линейную функцию и параболу.Для линейного случая прямым методом построить два уравнения регрессии (Y на X и X на Y),причем среднее квадратическое отклонение случайной величины найти двумя способами. Найти доверительный интервал для условного математического ожиданиям М[Y/x] с доверительной вероятностью 1-б=0,98 при предположении о нормальном условном распределении случайной величины Y.Для параболической регрессии оценить корреляционное отношение.
3. Дать интервальную оценку случайной величины Y с вероятностью попадания в интервал p=0.96, если взятое из той же генеральной совокупности значение xn+1=8, при предположении, что эмпирическое уравнение регрессии построено точно. Определить толерантный интервал.
Решение задачи
Данные в виде выборки из генеральной совокупности представлены в Таблице 2.
Таблица 2
Выборка из генеральной совокупности
xi |
-2 |
0 |
2 |
3 |
4 |
5 |
7 |
10 |
|
yi |
-11 |
-2 |
9 |
14 |
19 |
25 |
37 |
56 |
Оценивание математических ожиданий, дисперсий, средних квадратических отклонений и коэффициента корреляции случайных величин Х, Y.
1.Оценки математических ожиданий:
=3,625
= 18,375
2.Несмещённые оценки дисперсий:
= 14,552
= 455,981
3.Оценки средних квадратических отклонений (С.К.О).
= 3,814
= 21,353
4.Несмещённая оценка ковариации.
= 81,303
5.Оценка коэффициента корреляции.
= 0,9983
Полученный коэффициент корреляции, близкий по модулю к единице, говорит о наличии сильной связи между х и у.
Рис. 1 Исходные данные на координатной плоскости
I. Построение регрессионных моделей
Вычисленные показатели указывают на наличие линейной зависимости между случайными величинами. Построение регрессионной модели заключается в оценивании параметров и вида функции , распределения и параметров случайной величины , поэтому регрессионную модель записывают в виде: , где конкретная зависимость называется эмпирическим уравнением регрессии:
=5,589x-1.85 - для уравнения Y на X;
- для уравнения X на Y, где , , , и были вычислены заранее.
= 0,178y+0,355
Построим прямые по полученным уравнениям на одном графике (Рис.2)
После построения линейных регрессионных моделей в качестве эмпирического уравнения регрессии выберем параболу
8460=13395*+1559*+207*
1102=1559*+207*+29*
147=207*+29*+8*
Находим неизвестные нам параметры методом Крамера:
=0,0857; =4,9057; =-1,6274;
Уравнение параболы:
=0.0857x2+4.9057x-1.6274
Подставляем значения в уравнение и по полученным результатам строим график.(Рис.3)
Оценка среднего квадратического отклонения величины
1. Для линейной модели (l=2)
1 способ:
2=((-11-(5,589*(-2)-1,85))2+(-2-(5,589*0-1,85))2+(9-(5,589*2-1,85))2+
+(14-(5,589*3-1,85))2+(19-(5,589*4-1,85))2+(25-(5,589*5-1,85))2+
+(37-(5,589*7-1,85))2+(56-(5,589*10-1,85))2)/6=2,0778245
=1,4414
2 способ:
, где n - число исходных данных
2=(21,353)2*(1-(0,9983)2)*(8-1)/(8-2)=1,807067
=1,3414
2.Для параболической модели (l=3):
2=((-11-(0.0857*(-2)2+4.9057*(-2)-1.6274))2+(-2-(0.0857*(0)2+4.9057*(0)- 1.6274))2+(9-(0.0857*(2)2+4.9057*(2)-1.6274))2+(14-(0.0857*(3)2+4.9057*(3)-1.6274))2+(19-(0.0857*(4)2+4.9057*(4)-1.6274))2+(25-(0.0857*(5)2+4.9057*(5)-1.6274))2+(37-(0.0857*(7)2+4.9057*(7)-1.6274))2+(56-(0.0857*(10)2+4.9057*(10)-1.6274))2)/5=0,107072384
=0,327219
Оценка корреляционного отношения для параболической регрессии (l=3):
- оценка корреляционного отношения
==0,999992
Результат вычислений сравним с вычисленным ранее значением =0,9983.Так как , в качестве будем брать нелинейную функцию.
Нахождение доверительного интервала
математический ожидание дисперсия корреляция
Нахождение доверительного интервала для условного математического ожидания с доверительной вероятностью 1-б=0,98 (нормальное условное распределение случайной величины Y) для линейной регрессионной модели.
Сначала в качестве эмпирического уравнения регрессии выберем линейную функцию с 1,4414
Для вычисления доверительного интервала воспользуемся формулой:
Итак, имеем следующие данные: ; n=8; =3,625; , tб = 3 (находим это значение в таблице квантилей распределения Стьюдента)
5,589*8-1,85-3*1,4414/ *= 40,44284
5,589*8-1,85+3*1,4414/ *= 45,28116
При использовании линейной функции , где, , а также n=8, , =3,625 и , получаем следующий доверительный интервал:
При использовании параболической модели
=0.0857x2+4.9057x-1.6274, и , доверительный интервал:
Таким образом, устанавливаем, что эти доверительные интервалы накрывают истинное среднее значение изменения общего измерения испарения осадков (в %) к количеству выпавших осадков.Можно сказать, что истинное среднее значение находится в этом интервале (интервале, вычисленном по линейной модели или по параболической) с вероятностью 0,98.
Рис. 4 Доверительный интервал для условного математического ожидания на основе линейной регрессионной модели
Рис. 5 Доверительный интервал для условного математического ожидания на основе параболической модели
Определение толерантного интервала (при x9=8)
Регрессионные модели используются для косвенного оценивания значения по информации о значении , то есть x9=8 при подстановке в выражение мы оценили только среднее значение величины y с некоторым доверительным интервалом:
(линейная регрессионная модель), (параболическая регрессионная модель).
Для того, чтобы получить оценку индивидуального значения необходимо определить толерантный интервал, в который с заданной вероятностью р=0,96 и г =0,98 попадает значение :
,
где , - квантиль стандартного нормального распределения, находящийся по таблице.
Ф ()-функция стандартного нормального распределения
Ф ()=, то есть, используя таблицу «Функция стандартного нормального распределения» устанавливаем, что =1,812.
3*1,4414/*+1,812*1,4414=5,030978623
Если в качестве регрессионной модели берется линейная модель , где и , тогда толерантный интервал:
Для нахождения толерантного интервала можно также использовать параболическую регрессионную модель =0.0857x2+4.9057x-1.6274, где и . В этом случае толерантный интервал примет следующий вид:
,
3*0.327219/*+1,812*0.327219=1,204528374
Заключение
В ходе выполнения курсовой работы мною был сделан вывод о том, что изменение испарений (в %) к количеству выпавших осадков и изменение температуры воздуха тесно взаимосвязаны.
Найдены оценки математического ожидания, дисперсии, среднего квадратичного отклонения и коэффициента корреляции. Были построены эмпирические уравнения регрессии: линейное и параболическое. Результаты вычислений показали наличие сильной связи.
На последнем этапе анализа были построены доверительные интервалы с вероятностью 1-=0,98, были найдены толерантные интервалы, зависящие от двух вероятностей: 1-=0,98 и p=0,96 для значения y9 = 42,862 для линейной модели и y9 = 43,103 для параболической.
Список литературы
1. В.Н. Маслов, Теория вероятностей и математическая статистика: Учебное пособие. ВВАГС, 1999. 107 с.
2. Гмурман В.С. Теория вероятностей и математическая статистика. М.: «Высшее образование», 2008. 405 с.
Размещено на Allbest.ru
...Подобные документы
Нахождение плотности, среднеквадратического отклонения, дисперсии, ковариации и коэффициента корреляции системы случайных величин. Определение доверительного интервала для оценки математического ожидания нормального распределения с заданной надежностью.
контрольная работа [200,3 K], добавлен 16.08.2010Вычисление среднего одномерных случайных величин. Определение доверительного интервала для математического ожидания и для дисперсии. Построение эмпирической и приближенной линий регрессии Y по X. Дисперсионный анализ греко-латынского куба второго порядка.
курсовая работа [698,0 K], добавлен 08.05.2012Понятие доверительной вероятности и доверительного интервала и его границ. Закон распределения оценки. Построение доверительного интервала, соответствующего доверительной вероятности для математического ожидания. Доверительный интервал для дисперсии.
презентация [124,9 K], добавлен 01.11.2013Закон распределения суточного дохода трамвайного парка, оценка доверительного интервала для математического ожидания и дисперсии суточного дохода. Особенности определения математического ожидания рассматривающейся случайной величины при решении задач.
курсовая работа [69,5 K], добавлен 02.05.2011Адекватная линейная регрессионная модель. Правило проверки адекватности. Определение математического ожидания, коэффициента детерминации, множественного коэффициента корреляции по характеристикам случайных величин. Оценка дисперсии случайной ошибки.
контрольная работа [160,0 K], добавлен 13.08.2013Определение вероятности того, что из урны взят белый шар. Нахождение математического ожидания, среднего квадратического отклонения и дисперсии случайной величины Х, построение гистограммы распределения. Определение параметров распределения Релея.
контрольная работа [91,7 K], добавлен 15.11.2011Длина интервала группирования. Гистограмма относительных частот. Кусочно-постоянная функция. Среднеквадратичное отклонение оценки математического ожидания случайной величины. Коэффициент корреляции. Границы доверительного интервала для ожидания.
курсовая работа [622,9 K], добавлен 18.02.2009Рассмотрение способов нахождения вероятностей происхождения событий при заданных условиях, плотности распределения, математического ожидания, дисперсии, среднеквадратического отклонения и построение доверительного интервала для истинной вероятности.
контрольная работа [227,6 K], добавлен 28.04.2010Среднее арифметическое наблюдаемых значений, служащее оценкой для математического ожидания. Состоятельность оценки, следующая из теоремы Чебышева. Условия возникновения систематической ошибки, ликвидация смещения. Точечные параметры оценки величин.
презентация [62,3 K], добавлен 01.11.2013Алгоритм определения вероятности события и выполнения статистических ожиданий. Оценка возможных значений случайной величины и их вероятности. Расчет математического ожидания, дисперсии и среднего квадратического отклонения. Анализ характеристик признака.
контрольная работа [263,8 K], добавлен 13.01.2014Длина интервала группирования. Графическое описание выборки. Гистограмма относительных частот. Кусочно-постоянная функция. Границы доверительного интервала математического ожидания. Вычисление коэффициента корреляции. Эмпирическая функция распределения.
практическая работа [737,5 K], добавлен 14.02.2009Определение математической вероятности правильного набора, если на нечетных местах комбинации стоят одинаковые цифры. Использование классического определения вероятности. Расчет математического ожидания и дисперсии для очков, выпавших на игральных костях.
контрольная работа [90,2 K], добавлен 04.01.2011Определение вероятности для двух несовместных и достоверного событий. Закон распределения случайной величины; построение графика функции распределения. Нахождение математического ожидания, дисперсии, среднего квадратичного отклонения случайной величины.
контрольная работа [97,1 K], добавлен 26.02.2012Вычисление вероятностей возможных значений случайной величины по формуле Бернулли. Расчет математического ожидания, дисперсии, среднеквадратического отклонения, медианы и моды. Нахождение интегральной функции, построение многоугольника распределения.
контрольная работа [162,6 K], добавлен 28.05.2012Решение системы уравнений по методу Крамера, Гаусса и с помощью обратной матрицы. Общее число возможных элементарных исходов для заданных испытаний. Расчет математического ожидания, дисперсии и среднего квадратического отклонения, график функции.
контрольная работа [210,4 K], добавлен 23.04.2013Вычисление математического ожидания, дисперсии и коэффициента корреляции. Определение функции распределения и его плотности. Нахождение вероятности попадания в определенный интервал. Особенности построения гистограммы частот. Применение критерия Пирсона.
задача [140,0 K], добавлен 17.11.2011Формулы вычисления дисперсии суммы двух случайных величин с использованием категории математического ожидания. Характеристика понятий дисперсии. Особенности ее вычисления во взаимосвязи со средним квадратичным отклонением, определение размерности.
презентация [80,4 K], добавлен 01.11.2013Определение вероятности появления события в каждом из независимых испытаний. Случайные величины, заданные функцией распределения (интегральной функцией), нахождение дифференциальной функции (плотности вероятности), математического ожидания и дисперсии.
контрольная работа [59,7 K], добавлен 26.07.2010Первичный анализ и основные характеристики статистических данных. Точечные оценки параметров распределения. Доверительные интервалы для неизвестного математического ожидания и для среднего квадратического отклонения. Проверка статистических гипотез.
дипломная работа [850,9 K], добавлен 18.01.2016Математическое ожидание случайной величины. Свойства математического ожидания, дисперсия случайной величины, их суммы. Функция от случайных величин, ее математическое ожидание. Коэффициент корреляции, виды сходимости последовательности случайных величин.
лекция [285,3 K], добавлен 17.12.2010