Статистическая обработка данных

Рассмотрены методы описательной статистики, интервальные оценки, статистические гипотезы; Вычислены числовые характеристики выборочного распределения, произведено интервальное оценивание неизвестных параметров нормальной генеральной совокупности.

Рубрика Математика
Вид курсовая работа
Язык русский
Дата добавления 25.04.2014
Размер файла 85,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

«ИЖЕВСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

ИМЕНИ М.Т. КАЛАШНИКОВА»

ФАКУЛЬТЕТ «МАТЕМАТИКА И ЕСТЕСТВЕННЫЕ НАУКИ»

КАФЕДРА «МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

ПРОЦЕССОВ И ТЕХНОЛОГИЙ»

курсовая работа по дисциплине

«МАТЕМАТИЧЕСКАЯ СТАТИСТИКА»

тема: СТАТИСТИЧЕСКАЯ ОБРАБОТКА ДАННЫХ. Вариант XVIII

УТВЕРЖДАЮ

Зав.каф.ММПТ,

д.ф.-м.н., профессор К.В. Кетова

Руководитель работы

к.ф.-м.н., доцент В.Г. Суфиянов

Выполнил

Студент группы 6-52-8О.В. Пономарева

ИЖЕВСК 2013

Оглавление

Введение

Глава 1. Проверка статистических гипотез

Определение и виды

Общая статистическая схема статистического критерия

Характеристики качества критерия

Построение статистического критерия

Уровень значимости и мощность критерия

Заключение

Список литературы

Введение

На разных этапах статистического исследования возникает необходимость в формулировании и экспериментальной проверке некоторых предположительных утверждений (гипотез).

Во многих прикладных задачах исследователь сталкивается с наблюдениями (различными явлениями природы, результатами эксперимента) имеющими случайных характер. В таких случаях исследователю необходимо принять решения об истинном состоянии явления, однако это решение не может быть априорно правильным (возможны ошибки), так же не существует очевидного и единственно верного правила выбора этого решения.

ГЛАВА 1. Проверка статистических гипотез

Определение и виды

Статистическая гипотеза - любое предположение о виде неизвестного закона распределения или о параметрах известных распределений, которое может быть проверено по результатам наблюдений (по результатам выборки). статистика критерий определение вид

Предположим, что на основании имеющихся данных есть основания выдвинуть предположения о законе распределения или о параметре закона распределения случайной величины (или генеральной совокупности, на множестве объектов которой определена эта случайная величина). Задача проверки статистической гипотезы заключается в подтверждении или опровержении этого предположения на основании выборочных (экспериментальных) данных.

Проверка статистической гипотезы означает проверку соответствия выборочных данных выдвинутой гипотезе. Параллельно с выдвигаемой основной гипотезой , рассматривают и противоречащую ей гипотезу, которая называется конкурирующей или альтернативной и обозначается . Альтернативная гипотеза считается справедливой, если основная выдвинутая гипотеза отвергается.

Например, если проверяется гипотеза о равенстве параметра некоторому заданному значению , т.е. : = , то в качестве альтернативной можно рассмотреть следующие гипотезы: ; ; ; , где - заданное значение, .

Существуют параметрические и непараметрические гипотезы.

Параметрическая гипотеза - предположение, сформулированное относительно значений параметров функции распределения, при условии, что закон распределения генеральной совокупности известен. Например, гипотеза о том, что параметр показательного распределения равен 5 является простой параметрической гипотезой.

Непараметрическая гипотеза - предположение, не предполагающее знания закона распределения генеральной совокупности.

Также гипотезы бывают простыми и сложными.

Статистическая гипотеза называется простой, если она однозначно определяет распределение случайной величины , в противном случае гипотеза называется сложной. Например, гипотеза о том, что случайная величина распределена по нормальному закону (10,2) является простой, если же высказывается предположение, что случайная величина имеет нормальный закон (, 2), где , то это сложная гипотеза.

Статистические гипотезы подразделяются на:

Гипотеза о равенстве параметров номинальному значению генеральной совокупности, .

Гипотеза о равенстве параметров нескольких генеральных совокупностей

,

и тд.

Гипотеза согласия (о виде распределения)

1.2 Общая статистическая схема статистического критерия

Процедура обоснованного сопоставления высказанной гипотезы с имеющейся выборкой осуществляется с помощью того или иного статистического критерия и называется статистической проверкой гипотез.

Статистические критерии проверки гипотез разнообразны, но у них единая логическая схема построения, которую представим на рис. 1.2

Рисунок 1.2 - Общая схема статистического критерия

Этапы проверки статистических гипотез

Располагая выборочными данными , формулируются основная и альтернативная гипотезы;

Задается уровень значимости ;

Выбирается статистика критерия для проверки нулевой гипотезы ;

Определяется критическая область ;

Вычисляется выборочное значение статистики критерия;

Принимается решение: если , то гипотеза отклоняется в виду значимого расхождения с выборочными данными; если , то гипотеза не отклоняется, в этом случае считается, что не противоречит результатам наблюдений.

1.3 Характеристики качества критерия

Правило, по которому принимается решение принять или отвергнуть гипотезу называется критерием . Поскольку решение принимается на основании выборочных данных, необходимо найти случайную величину , которая являясь функцией выборки , имела бы известные условные законы распределения относительно проверяемой гипотезы и конкурирующей с ней гипотезы и позволяла бы судить о расхождении выборочных данных с гипотезой . Величина называется статистикой критерия .

Статистические критерии называются соответственно по тому закону распределения, которому они подчиняются, т.е. F-критерий подчиняется распределению Фишера - Снедекора, ч2-критерий подчиняется ч2 - распределению, t-критерий подчиняется распределению Стьюдента, U - критерий подчиняется нормальному распределению.

Областью принятия гипотезы (областью допустимых значений) или критической областью называется множество возможных значений статистического критерия, при которых основная гипотеза принимается. Если наблюдаемое значение статистического критерия, рассчитанное по данным выборочной совокупности, принадлежит критической области, то основная гипотеза отвергается. Если наблюдаемое значение статистического критерия принадлежит области принятия гипотезы, то основная гипотеза принимается. [2]

Значения критерия, разделяющие совокупность значений критерия на область допустимых значений (наиболее правдоподобных в отношении нулевой гипотезы ) и критическую область (область значений, менее правдоподобных в отношении нулевой гипотезы ), определяемые на заданном уровне значимости по таблицам распределения случайной величины критерия, выбранной в качестве критерия, называются критическими точками (Ккр).

В зависимости от формулировки альтернативной гипотезы, вида и распределения статистики критерия , возможны три вида расположения критической области. Например, проверяется нулевая гипотеза , а альтернативные гипотезы формулируются, как:

а) , в этом случае критическая область является правосторонней , где определяется из условия

и при известном законе распределения статистики критерия =, где - квантиль распределения уровня ;

б) , в этом случае критическая область является левосторонней , где определяется из условия

и при известном законе распределения статистики критерия =, где - квантиль распределения уровня ;

в) , в этом случае критическая область является двусторонней , где определяются соответственно из условий

и

и при известном законе распределения статистики критерия = и , где , - квантили распределения уровня . [5]

1.4 Построение критериев для проверки статистических гипотез

В статистике в настоящее время имеется большое число критериев для проверки практически любых гипотез. Притом основные принципы их построения и применения являются общими.

Обозначим значение статистики , вычисленное по выборочным данным. Критерий определяется следующим образом: гипотеза отклоняется в пользу гипотезы , если , так как попадание статистики в критическую область при гипотезе практически невозможно, а поэтому несовместимо с гипотезой . Гипотеза принимается, если , поскольку попадание статистики в эту область при гипотезе практически достоверно, а поэтому совместимо с гипотезой . Множество называется областью принятия гипотезы или доверительной областью значений статистики .

Виды статистических критериев

Статистические критерии подразделяются на следующие категории:

Критерии значимости

Проверка на значимость предполагает проверку гипотезы о численных значениях известного закона распределения: :=- нулевая гипотеза. ; ; - конкурирующая гипотеза.

Критерии согласия

Проверка на согласие подразумевает проверку предположения о том, что исследуемая случайная величина подчиняется предполагаемому закону.

Критерии согласия можно также воспринимать, как критерии значимости. Критериями согласия являются:

Критерий Пирсона

Критерий Колмогорова - Смирнова

Критерии проверки на однородность

При проверке на однородность случайные величины исследуются на факт значимости различия их законов распределения (т.е. проверки того, подчиняются ли эти величины одному и тому же закону). Используются в факторном (дисперсионном) анализе для определения наличия зависимостей.

Непараметрические критерии

Группа статистических критериев, которые не включают в расчёт параметры вероятностного распределения и основаны на оперировании частотами или рангами.

Критерий Пирсона

Критерий Колмогорова - Смирнова

Параметрические критерии

Группа статистических критериев, которые включают в расчет параметры вероятностного распределения признака (средние и дисперсии).

1. t-критерий Стьюдента

2. Критерий Фишера

Характеристики качества критерия

Наиболее важной характеристикой качества критерия является мощность.

Одновременное уменьшение ошибок 1-го и 2-го рода возможно лишь при увеличении объема выборок. Поэтому обычно при заданном уровне значимости отыскивается критерий с наибольшей мощностью.

Критическая область должна быть расположена так, чтобы при заданном уровне значимости (вероятности ошибки первого рода) вероятность ошибки второго рода была бы минимальной. В этом случае критическая область называется наилучшей критической областью (НКО).

Критерий, использующий НКО, имеет максимальную мощность. [5]

1.5 Уровень значимости и мощность критерия

Используя критерий при проверке нулевой гипотезы возможны ошибки двух родов. Ошибка первого рода состоит в том, что гипотеза отклоняется тогда, как она верна. Вероятность этой ошибки равна . А сама ошибка называется уровнем значимости. Значение уровня значимости обычно задается близким к нулю (например, 0.005; 0.01; 0.001 и т. д.), потому что, чем меньше значение уровня значимости, тем меньше вероятность совершить ошибку первого рода, состоящую в опровержении верной гипотезы . = 1 - - вероятность принятия верной основной гипотезы. Ошибка второго рода состоит в том, что гипотеза принимается тогда, как она не верна. Вероятность этой ошибки равна . Отметим, что вероятность называется мощностью критерия . - вероятность принятия верной альтернативной гипотезы.

Таблица 1.5 - Зависимость принимаемой гипотезы

от верной

Принимаемая гипотеза

Верная

гипотеза



Последствия ошибок 1-го, 2-го рода могут быть совершенно различными: в одних случаях надо минимизировать , в другом -- . Так, применительно к радиолокации говорят, что -- вероятность пропуска сигнала, -- вероятность ложной тревоги. Применительно к производству, к торговле можно сказать, что б -- риск поставщика (т.е. забраковка по выборке всей партии изделий, которые удовлетворяют стандарту), -- риск потребителя (т.е. прием по выборке всей партии изделий, не удовлетворяющей стандарту). Применительно к судебной системе, ошибка 1-го рода приводит к оправданию виновного, ошибка 2-го рода -- осуждению невиновного. [4]

Заключение

Таким образом, в результате выполнения курсовой работы

Были изучены методы описательной статистики, интервальные оценки, статистические гипотезы;

Вычислены числовые характеристики выборочного распределения, произведено интервальное оценивание неизвестных параметров нормальной генеральной совокупности, проверены статистические гипотезы, связанные с параметрами нормального распределения;

Проверены гипотезы с помощью критерия Бартлетта и критерия согласия Пирсона;

Закреплены знания, полученные на лекциях.

Список литературы

Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистик.- М.: Высшая школа, 2003. - 405 с.

Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. - М.: ФИЗМАТЛИТ, 2006. - 816 с.

Кремер Н.Ш. Теория вероятностей и математическая статистика: Учебник для вузов. - М.: ЮНИТИ-ДАНА, 2002. - 543 с.

Харин Ю.С., Степанова М.Д. Практикум на ЭВМ по математической статистике.- М.: Университетское, 1987. - 304с.

Чернова Н.И. Лекции по математической статистике.

Размещено на Allbest.ru

...

Подобные документы

  • Числовые характеристики непрерывных величин. Точечные оценки параметров распределения. Статистическая проверка гипотез. Сравнение средних известной и неизвестной точности измерений. Критерий Хи-квадрат для проверки гипотезы о виде распределения.

    курсовая работа [79,0 K], добавлен 23.01.2012

  • Классификация случайных событий. Функция распределения. Числовые характеристики дискретных случайных величин. Закон равномерного распределения вероятностей. Распределение Стьюдента. Задачи математической статистики. Оценки параметров совокупности.

    лекция [387,7 K], добавлен 12.12.2011

  • Выборки к генеральной совокупности: оценка параметра и построение доверительных интервалов. Интервальный статистический ряд. Оценивание параметров распределения. Статистическая проверка гипотез. Гипотеза о нормальном распределении случайной величины.

    контрольная работа [391,1 K], добавлен 23.06.2012

  • Статическая проверка статистических гипотез. Ошибки первого и второго рода. Числовые характеристики случайной величины, распределенной по биномиальному закону. Проверка гипотезы о биномиальном распределении генеральной совокупности по критерию Пирсона.

    курсовая работа [674,3 K], добавлен 03.05.2011

  • Оценки неизвестных параметров закона распределения случайной величины Х по данным выборки. Интервальное оценивание. Случайный интервал. Граничные точки доверительного интервала. Нижний и верхний доверительные пределы.

    реферат [30,0 K], добавлен 31.03.2003

  • Интервальный вариационный ряд. Построение гистограммы плотности относительных частот. Выдвижение гипотезы о законе распределения генеральной совокупности Х. Функция плотности рассматриваемого закона распределения "Построение ее на гистограмме".

    курсовая работа [104,4 K], добавлен 20.03.2011

  • Задачи математической статистики. Распределение случайной величины на основе опытных данных. Эмпирическая функция распределения. Статистические оценки параметров распределения. Нормальный закон распределения случайной величины, проверка гипотезы.

    курсовая работа [57,0 K], добавлен 13.10.2009

  • Статистическая обработка данных контроля времени (в часах) работы компьютерного класса в день. Полигон абсолютных частот. Построение графика эмпирической функции распределения и огибающей гистограммы. Теоретическое распределение генеральной совокупности.

    контрольная работа [379,3 K], добавлен 23.08.2015

  • Оценивание параметров закона распределения случайной величины. Точечная и интервальная оценки параметров распределения. Проверка статистической гипотезы о виде закона распределения, нахождение параметров системы. График оценки плотности вероятности.

    курсовая работа [570,4 K], добавлен 28.09.2014

  • Числовые характеристики выборки. Статистический ряд и функция распределения. Понятие и графическое представление статистической совокупности. Метод наибольшего правдоподобия для нахождения плотности распределения. Применение метода наименьших квадратов.

    контрольная работа [62,6 K], добавлен 20.02.2011

  • Числовые характеристики случайной функции: математическое ожидание, дисперсия, квадрат разности, корреляционная функция. Расчет среднего выборочного и несмещенной выборочной дисперсии, проверка гипотезы о нормальном распределении по критерию согласия.

    контрольная работа [666,1 K], добавлен 02.06.2010

  • Нормальное распределение на прямой, нормальная кривая. Влияние параметров нормального распределения на форму нормальной кривой. Вероятность отклонения в заданный интервал нормальной случайной величины. Вычисление вероятности заданного отклонения.

    курсовая работа [1,7 M], добавлен 06.12.2012

  • Цель и задачи статистического анализа. Методы получения оценок: максимального правдоподобия, моментов. Доверительный интервал. Точечная оценка параметров распределения. Генеральная и выборочная дисперсии. Интервальное оценивание математического ожидания.

    презентация [395,9 K], добавлен 19.07.2015

  • Построение полигона относительных частот, эмпирической функции распределения, кумулянты и гистограммы. Расчет точечных оценок неизвестных числовых характеристик. Проверка гипотезы о виде распределения для простого и сгруппированного ряда распределения.

    курсовая работа [216,2 K], добавлен 28.09.2011

  • Обработка и анализ статистической информации. Выборочная теория; интервальные оценки и графическое представление параметров распределения. Точечные оценки характеристик положения и мер изменчивости. Корреляционная зависимость; уравнение регрессии.

    курсовая работа [1023,9 K], добавлен 21.03.2015

  • Математические методы систематизации и использования статистических данных для научных и практических выводов. Закон распределения дискретной случайной величины. Понятие генеральной совокупности. Задачи статистических наблюдений. Выборочное распределение.

    реферат [332,8 K], добавлен 10.12.2010

  • Первичная обработка статистических данных по количеству зарегистрированных абонентских терминалов сотовой связи за 2008 год на 1000 населения в регионах России. Интервальное оценивание параметров. Гипотеза о виде распределения. Регрессионный анализ.

    курсовая работа [439,3 K], добавлен 06.10.2013

  • Пространство элементарных событий, совместные и несовместные события, поиск их вероятности. Функция распределения системы случайных величин. Числовые характеристики системы: математическое ожидание и дисперсия. Оценка закона генеральной совокупности.

    задача [73,6 K], добавлен 15.06.2012

  • Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.

    задача [409,0 K], добавлен 17.10.2012

  • Пространство элементарных событий. Понятие совместных и несовместных событий и их вероятностей. Плотность распределения вероятностей системы двух случайных величин. Числовые характеристики системы. Закон генеральной совокупности и его параметры.

    контрольная работа [98,1 K], добавлен 15.06.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.