Проверка статистических гипотез
Примеры статистических гипотез в педагогических исследованиях. Уровень значимости как вероятность ошибки первого рода при принятии решения. Характеристика методики проверки гипотезы о равенстве дисперсий двух нормальных генеральных совокупностей.
Рубрика | Математика |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 06.05.2014 |
Размер файла | 119,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
Размещено на http://www.allbest.ru
Введение
Последние годы отмечены стремительным расширением области применения теоретико-вероятностных и статистических методов. Они применяются в различных науках: физике, техники, геологии, биологии, лингвистике, медицине, социологии, управлении и т.д. Один из основных разделов статистики - теория проверки статистических гипотез. Понятие практической статистики, процедура обоснованного сопоставления высказанной гипотезы относительно природы или величины неизвестных статистических параметров анализируемого явления с имеющимися в распоряжении исследователя выборочными данными (выборкой).
Статистическая проверка гипотез проводится с помощью некоторого статистического критерия по общей логической схеме, включающей нахождение конкретного вида функции от результатов наблюдения (критической статистики), на основании которой принимается окончательное решение. Например, могут рассматриваться гипотезы об общем законе распределения исследуемой случайной величины, об однородности двух или нескольких обрабатываемых выборок, о числовых значениях параметров исследуемой генеральной совокупности и др. Результат проверки может быть либо отрицательным (данные наблюдения противоречат высказанной гипотезе), либо неотрицательным. В первом случае гипотеза ошибочна, во втором - ее нельзя считать доказанной. Для статистической проверки гипотез используются разные критерии. В частности, когда проверяется согласие между выборочным и гипотетическим распределениями, используется критерий согласия, например, критерий Пирсона «хи-квадрат», критерий Колмогорова-Смирнова и др.
Статистические критерии приводятся вместе с указанием как тех областей, где их применение вполне оправдано, так и тех областей, где применение требует осторожности. Большое внимание уделено построению критериев, в том или ином смысле наилучших.
1. Понятие статистической гипотезы, нулевой и конкурирующей гипотез
Поскольку статистика как метод исследования имеет дело с данными, в которых интересующие исследователя закономерности искажены различными случайными факторами, большинство статистических вычислений сопровождается проверкой некоторых предположений или гипотез об источнике этих данных.
Статистическая гипотеза - это предположение о свойствах случайных величин или событий, которое мы хотим проверить по имеющимся данным. Примеры статистических гипотез в педагогических исследованиях:
Гипотеза 1. Успеваемость класса стохастически (вероятностно) зависит от уровня обучаемости учащихся.
Гипотеза 2. Усвоение начального курса математики не имеет существенных различий у учащихся , начавших обучение с 6 или 7 лет.
Гипотеза 3. Проблемное обучение в первом классе эффективнее по сравнению с традиционной методикой обучения в отношении общего развития учащихся.
Нулевая гипотеза - это основное проверяемое предположение, которое обычно формулируется как отсутствие различий, отсутствие влияние фактора, отсутствие эффекта, равенство нулю значений выборочных характеристик и т.п. Примером нулевой гипотезы в педагогике является утверждение о том, что различие в результатах выполнения двумя группами учащихся одной и той же контрольной работы вызвано лишь случайными причинами.
Другое проверяемое предположение (не всегда строго противоположное или обратное первому) называется конкурирующей или альтернативной гипотезой. Так, для упомянутого выше примера гипотезы Н0 в педагогике одна из возможных альтернатив Н1 будет определена как: уровни выполнения работы в двух группах учащихся различны и это различие определяется влиянием неслучайных факторов, например, тех или других методов обучения.
Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость проверить ее. Так как проверку производят статистическими методами, то данная проверка называется статистической.
При проверке статистических гипотез возможны ошибки (ошибочные суждения) двух видов:
-- можно отвергнуть нулевую гипотезу, когда она на самом деле верна (так называемая ошибка первого рода);
-- можно принять нулевую гипотезу, когда она на самом деле не верна (так называемая ошибка второго рода).
Ошибка, состоящая в принятии нулевой гипотезы, когда она ложна, качественно отличается от ошибки, состоящей в отвержении гипотезы, когда она истинна. Эта разница очень существенна вследствие того, что различна значимость этих ошибок. Проиллюстрируем вышесказанное на следующем примере.
Пример 1. Процесс производства некоторого медицинского препарата весьма сложен. Несущественные на первый взгляд отклонения от технологии вызывают появление высокотоксичной побочной примеси. Токсичность этой примеси может оказаться столь высокой, что даже такое ее количество, которое не может быть обнаружено при обычном химическом анализе, может оказаться опасным для человека, принимающего это лекарство. В результате, прежде чем выпускать в продажу, вновь произведенную партию, ее подвергают исследованию на токсичность биологическими методами. Малые дозы лекарства вводятся некоторому количеству подопытных животных, например, мышей, и результат регистрируют. Если лекарство токсично, то все или почти все животные гибнут. В противном случае норма выживших велика.
Исследование лекарства может привести к одному из возможных способов действия: выпустить партию в продажу (а1), вернуть партию поставщику для доработки или, может быть, для уничтожения (а2).
Ошибки двух видов, связанные с действиями а1 и а2 совершенно различны, различна и важность избежания их. Сначала рассмотрим случай, когда применяется действие а1, в то время когда предпочтительнее а2. Лекарство опасно для пациента, в то время как оно признано безопасным. Ошибка этого вида может вызвать смерть пациентов, употребляющих этот препарат. Это ошибка первого рода, так как нам важнее ее избежать.
Рассмотрим случай когда предпринимается действие а2, в то время когда а1 является более предпочтительным. Это означает, что вследствие неточностей в проведении эксперимента партия нетоксичного лекарства классифицировалась как опасная. Последствия ошибки могут выражаться в финансовом убытке и в увеличении стоимости лекарства. Однако случайное отвержение совершенно безопасного лекарства, очевидно, менее нежелательно, чем, пусть даже изредка происходящие гибели пациентов. Отвержение нетоксичной партии лекарства - ошибка второго рода.
Допустимая вероятность ошибки первого рода (Ркр) может быть равна 5% или 1% (0.05 или 0.01).
Уровень значимости - это вероятность ошибки первого рода при принятии решения (вероятность ошибочного отклонения нулевой гипотезы).
Альтернативные гипотезы принимаются тогда и только тогда, когда опровергается нулевая гипотеза. Это бывает в случаях, когда различия, скажем, в средних арифметических экспериментальной и контрольной групп настолько значимы (статистически достоверны). Что риск ошибки отвергнуть нулевую гипотезу и принять альтернативную не превышает одного из трех принятых уровней значимости статистического вывода:
- первый уровень -- 5% (р=5%); где допускается риск ошибки в выводе в пяти случаях из ста теоретически возможных таких же экспериментов при строго случайном отборе испытуемых для каждого эксперимента;
- второй уровень -- 1%, т.е. соответственно допускается риск ошибиться только в одном случае из ста;
- третий уровень -- 0,1%, т.е. допускается риск ошибиться только в одном случае из тысячи.
Последний уровень значимости предъявляет очень высокие требования к обоснованию достоверности результатов эксперимента и потому редко используется. В педагогических исследованиях, не нуждающихся в очень высоком уровне достоверности, представляется разумным принять 5% уровень значимости.
Статистика критерия (Т) -- некоторая функция от исходных данных, по значению которой проверяется нулевая гипотеза. Чаще всего статистика критерия является числовой функцией, но она может быть и любой другой функцией, например, многомерной функцией.
Всякое правило, на основе которого отклоняется или принимается нулевая гипотеза, называется критерием для проверки, данной гипотезы. Статистический критерий (критерий) - это случайная величина, которая служит для проверки статистических гипотез.
Критическая область - совокупность значений критерия, при котором нулевую гипотезу отвергают. Область принятия нулевой гипотезы (область допустимых значений) - совокупность значений критерия, при котором нулевую гипотезу принимают. При справедливости нулевой гипотезы вероятность того, что статистика критерия, попадая в область принятия нулевой гипотезы, должна быть равна 1-Ркр.
2. Понятие статистического критерия. Наблюдаемое значение критерия
Статистический критерий -- строгое математическое правило, по которому принимается или отвергается та или иная статистическая гипотеза с известным уровнем значимости. Построение критерия представляет собой выбор подходящей функции от результатов наблюдений (ряда эмпирически полученных значений признака), которая служит для выявления меры расхождения между эмпирическими значениями и гипотетическими.
Пусть даны выборка из неизвестного совместного распределения , и семейство статистических гипотез . Тогда статистическим критерием называется функция, устанавливающая соответствие между наблюдаемыми величинами и возможными гипотезами:
.
Таким образом, каждой реализации выборки статистический критерий сопоставляет наиболее подходящую с точки зрения этого критерия гипотезу о распределении, породившем данную реализацию.
Виды критериев.
Статистические критерии подразделяются на следующие категории:
Критерии значимости. Проверка на значимость предполагает проверку гипотезы о численных значениях известного закона распределения: -- нулевая гипотеза. или -- конкурирующая гипотеза.
Критерии согласия. Проверка на согласие подразумевает проверку предположения о том, что исследуемая случайная величина подчиняется предполагаемому закону. Критерии согласия можно также воспринимать, как критерии значимости. Критериями согласия являются:
1. Критерий Пирсона.
2. Критерий Колмогорова
3. Критерий Андерсона-Дарлинга.
4. Критерий Крамера -- Мизеса -- Смирнова.
5. Критерий согласия Купера.
6. Z-тест.
7. Критерий Жака-Бера (англ.).
8. Критерий Шапиро-Уилка (англ.).
9. График нормальности (англ.) -- не столько критерий, сколько графическая иллюстрация: точки специально построенного графика должны лежать почти на одной прямой.
Критерии проверки на однородность. При проверке на однородность случайные величины исследуются на факт значимости различия их законов распределения (т.е. проверки того, подчиняются ли эти величины одному и тому же закону). Используются в факторном анализе для определения наличия зависимостей.
Это разделение условно, и зачастую один и тот же критерий может быть использован в разных качествах.
Непараметрические критерии.
Группа статистических критериев, которые не включают в расчёт параметры вероятностного распределения и основаны на оперировании частотами или рангами.
· Q-критерий Розенбаума.
· U-критерий Манна-Уитни.
· Критерий Уилкоксона.
· Критерий Пирсона.
· Критерий Колмогорова-Смирнова.
Параметрические критерии.
Группа статистических критериев, которые включают в расчет параметры вероятностного распределения признака (средние и дисперсии).
· t-критерий Стьюдента.
· Критерий Фишера.
· Критерий отношения правдоподобия.
· Критерий Романовского.
Основные понятия:
· Статистическая значимость критерия.
· Мощность критерия.
Простой пример.
Пусть дана независимая выборка:
,
где . Пусть есть две простые гипотезы:
Тогда можно определить следующий статистический критерий:
где - выборочное среднее.
Подчиняется распределению Стьюдента, U-критерий подчиняется нормальному распределению.
Наблюдаемым значением статистического критерия называется значение критерия, которое рассчитано по выборочной совокупности, подчиняющейся определённому закону распределения.
Множество всех возможных значений выбранного статистического критерия делится на два непересекающихся подмножества. Первое подмножество включает в себя те значения критерия, при которых основная гипотеза отвергается, а второе подмножество - те значения критерия, при которых основная гипотеза принимается.
3. Критическая область, область принятия гипотезы. Критические точки. Основной принцип проверки нулевой гипотезы. Право-, лево- и двусторонняя критические области
Критической областью называется множество возможных значений статистического критерия, при которых основная гипотеза отвергается.
Областью принятия гипотезы или областью допустимых значений называется множество возможных значений статистического критерия, при которых основная гипотеза принимается.
Если наблюдаемое значение статистического критерия, рассчитанное по данным выборочной совокупности, принадлежит критической области, то основная гипотеза отвергается. Если наблюдаемое значение статистического критерия принадлежит области принятия гипотезы, то основная гипотеза принимается.
Критическими точками или квантилями называются точки, разграничивающие критическую область и область принятия гипотезы.
Критические области могут быть как односторонними, так и двусторонними.
Процедура проверки нулевой гипотезы в общем случае включает следующие этапы:
1. задается допустимая вероятность ошибки первого рода (Ркр=0,05).
2. выбирается статистика критерия (Т).
3. ищется область допустимых значений.
4. по исходным данным вычисляется значение статистики Т.
5. если Т (статистика критерия) принадлежит области принятия нулевой гипотезы, то нулевая гипотеза принимается (корректнее говоря, делается заключение, что исходные данные не противоречат нулевой гипотезе), а в противном случае нулевая гипотеза отвергается и принимается альтернативная гипотеза. Это основной принцип проверки всех статистических гипотез.
Обычно первые три этапа выполняют профессиональные математики, а последние два - пользователи для своих частных данных.
В современных статистических пакетах на ЭВМ используются не стандартные уровни значимости, а уровни, подсчитываемые непосредственно в процессе работы с соответствующим статистическим методом. Эти уровни, обозначенные буквой P, могут иметь различное числовое выражение в интервале от 0 до 1, например, 0,7 0,23 0,012. Понятно, что в первых двух случаях полученные уровни значимости слишком велики и говорить о том, что результат значим нельзя. В последнем случае результаты значимы на уровне 12 тысячных. Это достоверный результат.
При проверке статистических гипотез с помощью статистических пакетов, программа выводит на экран вычисленное значение уровня значимости Р и подсказку о возможности принятия или неприятия нулевой гипотезы.
Если вычисленное значение Р превосходит выбранный уровень Ркр, то принимается нулевая гипотеза, а в противном случае -- альтернативная гипотеза. Чем меньше вычисленное значение Р, тем более исходные данные противоречат нулевой гипотезе.
Число степеней свободы у какого-либо параметра определяют как число опытов, по которым рассчитан данный параметр, минус количество одинаковых значений, найденных по этим опытам независимо друг от друга.
Величина Ф называется мощностью критерия и представляет собой вероятность отклонения неверной нулевой гипотезы, то есть вероятность правильного решения. Мощность критерия - вероятность попадания критерия в критическую область при условии, что справедлива альтернативная гипотеза. Чем больше Ф, тем вероятность ошибки 2-го рода меньше.
Правосторонняя критическая область. Левосторонняя и двусторонняя критические области.
При проверке статистических гипотез используют правосторонние, левосторонние и двусторонние критические области.
Правосторонняя критическая область характеризуется неравенством вида:
L>lкр,
где L - это наблюдаемое значение статистического критерия, вычисленное по данным выборки; lкр, - это положительное значение статистического критерия, определяемое по таблице распределения данного критерия.
Следовательно, для определения правосторонней критической области необходимо рассчитать положительное значение статистического критерия lкр.
Предположим, что вероятность совершения ошибки первого рода или уровень значимости равен значению а. При условии справедливости основной гипотезы Н0, вероятность того, что значение статистического критерия L будет больше значения lкр, равна заданному уровню значимости, т.е. P(L>lкр)=a.
Для каждого статистического критерия рассчитаны специальные таблицы, с помощью которых определяют критическую точку, удовлетворяющую заданному уровню значимости.
Левосторонняя критическая область характеризуется неравенством вида:
L<lкр,
где L - это наблюдаемое значение статистического критерия, вычисленное по данным выборки; lкр, -- это отрицательное значение статистического критерия, определяемое по таблице распределения данного критерия.
Следовательно, для определения левосторонней критической области необходимо найти рассчитать отрицательное значение статистического критерия lкр.
Предположим, что вероятность совершения ошибки первого рода или уровень значимости равен значению а. При условии справедливости основной гипотезы Н0, вероятность того, что значение статистического критерия L будет меньше значения lкр, равна заданному уровню значимости, т.е. P(L<lкр)=a.
Двусторонняя критическая область характеризуется двумя неравенствами вида:
L>lкр1 и L<lкр2,
где L - это наблюдаемое значение статистического критерия, вычисленное по данным выборки; lкр1 - это положительное значение статистического критерия, определяемое по таблице распределения данного критерия; lкр2 -- это отрицательное значение статистического критерия, определяемое по таблице распределения данного критерия;
lкр1> lкр2.
Предположим, что вероятность совершения ошибки первого рода или уровень значимости равен значению а. При условии справедливости основной гипотезы Н0, сумма вероятностей того, что значение статистического критерия L будет больше значения lкр1 или меньше значения lкр2, равна заданному уровню значимости, т.е. P(L>lкр1)+(L<lкр2)=a.
Выбор критической области осуществляется исходя из вида конкурирующей гипотезы Н1. При этом применяются следующие правила:
1) правосторонняя критическая область выбирается в том случае, если Н1:>;
2) левосторонняя критическая область выбирается в том случае, если Н1:‹;
3) двусторонняя критическая область выбирается в том случае, если Н1:?.
Предположим, что заданы следующие параметры:
1) статистический критерий L;
2) критическая область W, где H0 отклоняется;
3) область принятия гипотезы , где H0 не отклоняется;
4) вероятность совершить ошибку первого рода a;
5) вероятность совершить ошибку второго рода.
Тогда справедливо утверждение о том, что выражение:
,
является вероятностью того, что статистический критерий L попадёт в критическую область, если верна гипотеза H.
При построении критической области учитываются два требования:
1) вероятность того, что статистический критерий L попадёт в критическую область, если верна Н0, равна а:
Данное равенство задаёт вероятность совершения ошибки первого рода;
2) вероятность того, что статистический критерий L попадёт в критическую область (область отклонения гипотезы Н0 в пользу гипотезы Н1), если верна гипотеза Н1:
данное равенство задаёт вероятность принятия правильной гипотезы.
4. Уровень значимости. Нахождение критических точек
Критерий - это специально составленная выборочная характеристика (статистика), точное или приближенное распределение которой нам известно. Значение критерия, вычисленное по данным выборки, называется наблюдаемым значением (Кнабл). Численное значение называется уровнем значимости критерия. Критерий такого типа называется критерием значимости. После выбора определенного критерия К множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отклоняется, а другое - при которых она принимается.
Множество значений критерия, при которых нулевая гипотеза отклоняется, называется областью критических значений (W). Для критериев проверки гипотез выбираются надлежащие уровни значимости (0,01; 0,05 и др.), соответствующие событиям, которые считаются практически невозможными (с некоторым риском).
Критическая область данного критерия - это такая область, вероятность попадания в которую в случае, когда гипотеза Н0 верна, в точности равна уровню значимости.
Чтобы выбор критической области был наилучшим, необходимо чтобы вероятность попадания критерия в критическую область, когда справедлива альтернативная гипотеза Н1, была наибольшей. Эта вероятность носит название мощности критерия (М).
Под мощностью критерия понимается вероятность не совершить ошибку второго рода. Мощность критерия является важнейшей характеристикой критерия. Чем меньше мощность критерия, тем меньше вероятность совершения ошибки второго рода.
Множество значений критерия, при которых нулевую гипотезу не отклоняют (принимают), называется областью принятия гипотезы Н0 (О).
Если наблюдаемое значение критерия Кнабл принадлежит критической области, то нулевую гипотезу отклоняют; если наблюдаемое значение критерия принадлежит области принятия гипотезы, то нулевую гипотезу принимают (не отклоняют). Это основной принцип проверки гипотез.
Отыскание правосторонней критической области.
Как найти критическую область? Для определения начнем с нахождения правосторонней критической области, которая определяется неравенством К > Ккр, где Ккр > 0.
Для отыскания правосторонней критической области достаточно найти критическую точку. Следовательно, возникает новый вопрос: как ее найти?
С этой целью задаются достаточно малой вероятностью - уровнем значимости. Затем ищут критическую точку Ккр, исходя из требования, чтобы при условии справедливости нулевой гипотезы вероятность того, что критерий К примет значение, большее Ккр, была равна принятому значению уровня значимости: Р (К > Ккр) = .
Для каждого критерия имеются соответствующие таблицы, по которым и находят критическую точку, удовлетворяющую этому требованию.
Когда критическая точка уже найдена, вычисляют по данным выборок наблюденное значение критерия и, если окажется, что Кнабл > Ккр, то нулевую гипотезу отвергают; если же Кнабл < Ккр, то нет оснований, чтобы отвергнуть нулевую гипотезу.
Почему правосторонняя критическая область была определена, исходя из требования, чтобы при справедливости нулевой гипотезы выполнялось соотношение Р ( К > Ккр) = .
Поскольку вероятность события К > Ккр мала ( - малая вероятность), такое событие при справедливости нулевой гипотезы в силу принципа практической невозможности маловероятных событий в единичном испытании не должно наступить. Если все же оно произошло, т. е. наблюдаемое значение критерия оказалось больше Ккр, то это можно объяснить тем, что нулевая гипотеза ложна и, следовательно, должна быть отвергнута. Таким образом, требование Р ( К > Ккр) = определяет такие значения критерия, при которых нулевая гипотеза отвергается, а они составляют правостороннюю критическую область.
Наблюдаемое значение критерия может оказаться большим Ккр не потому, что нулевая гипотеза ложна, а по другим причинам (малый объем выборки, недостатки методики эксперимента и др.). В этом случае, отвергнув правильную нулевую гипотезу, совершают ошибку первого рода. Вероятность этой ошибки равна уровню значимости .
Отыскание левосторонней и двусторонней критических областей.
Отыскание левосторонней и двусторонней критических областей сводится (так же как и для правосторонней) к нахождению соответствующих критических точек.
Левосторонняя критическая область определяется неравенством:
К < Ккр (Ккр < 0).
Критическую точку находят, исходя из требования, чтобы при справедливости нулевой гипотезы вероятность того, что критерий имеет значение, меньшее Ккр, была равна принятому уровню значимости:
Р (К < Ккр) = .
Двусторонняя критическая область определяется неравенствами:
К< К1, К > К2.
Критические точки находят, исходя из требования, чтобы при справедливости нулевой гипотезы сумма вероятностей того, что критерий примет значение, меньшее К1 и большее К2, была равна принятому уровню значимости:
Р (К < К1) + Р (К > К2) = .
Ясно, что критические точки могут быть выбраны множеством способов. Если распределение критерия симметрично относительно нуля и имеются основания выбирать симметричные относительно нуля точки Ккр и Ккр (К > 0), то Р ( К < -Ккр) = Р ( К > Ккр).
Зная Р ( К < К1) + Р ( К > К2) = , получим Р ( К > Ккр) = .
Это соотношение и служит для отыскания критических точек двусторонней критической области. Критические точки находят по соответствующим таблицам. [4]
5. Проверка гипотезы о равенстве дисперсий двух нормальных генеральных совокупностей (критерий Фишера-Снедекора)
Рассмотрим две случайные величины Х и У, каждая из которых подчиняется нормальному закону с дисперсиями . Пусть из этих генеральных совокупностей извлечены две выборки объёмами п1 и п2 . Проверим гипотезу Н0 о том, что относительно альтернативной гипотезы Н1 , заключающейся в том, что
Однако, мы располагаем только выборочными дисперсиями
=,
=.
Задача проверки гипотезы Н0 сводится к сравнению выборочных дисперсий.
Для построения критической области с выбранной надёжностью необходимо исследовать совместный закон распределения оценок и . Таким законом распределения является распределение Фишера-Снедекора (или F- распределение).
Рассмотрим случайную величину , распределённую нормально с математическим ожиданием Х и с дисперсией . Произведём две независимые выборки объёмами п1 и п2. Для оценки используют выборочные дисперсии. Случайную величину, определяемую отношением:
,
называют величиной с распределением Фишера-Снедекора. Имеются таблицы для дифференциального закона распределения Фишера-Снедекора, которые зависят лишь от объёма выборки и уровня значимости:
,
где k1=n1-1, k2=n2-1.
Вернёмся снова к задаче проверки гипотезы о равенстве дисперсий. Сначала нужно вычислить выборочные дисперсии. Найдём отношение F=, причём в числителе поставим большую из двух оценок дисперсии. Выберем уровень значимости и из таблиц находим число F которое сравнивается с вычисленным F. Если окажется, что , то проверяема гипотеза Н0 отвергается, в противном случае делается вывод о том, что наблюдения не противоречат проверяемой гипотезе.
6. Проверка гипотезы о равенстве математических ожиданий двух генеральных нормальных совокупностей, в случае, когда дисперсии неизвестны и одинаковы(t-критерий, z-критерий)
Пусть из каждой из двух нормально распределенных генеральных совокупностей (с параметрами ) и (с параметрами ) извлечены выборки объема и соответственно. Требуется проверить нулевую гипотезу о равенстве средних значений этих генеральных совокупностей. Альтернативная гипотеза формулируется в соответствии с условиями задачи или эксперимента:
(двустороння критическая область);
(левостороння критическая область);
(правостороння критическая область).
Случай, когда дисперсии генеральных совокупностей и известны. В этом случае для проверки нулевой гипотезы используют случайную величину:
,
где - выборочные средние первой и второй выборок соответственно. Если нулевая гипотеза справедлива, то статистика имеет нормальное распределение с математическим ожиданием, равным нулю и дисперсией, равной единице (разд. 3). Критическое значение выбирается в соответствии с задаваемым уровнем значимости по таблице значений функции Лапласа (прил. 2) или стандартного нормального распределения.
Если объемы выборок достаточно велики , то случайную величину можно использовать и при неизвестных дисперсиях генеральных совокупностей, положив в выражении для , .
Эту же статистику используют и при проверке гипотезы о равенстве вероятностей «успеха». Объемы выборок должны быть достаточно велики, чтобы биномиальное распределение можно было бы приближенно считать нормальным.
Пример. Двое рабочих на одинаковых станках изготовляют одинаковые детали. Есть ли значимая разница между долями выпускаемого ими брака? Была собрана следующая информация: , , , (число деталей, изготовленных первым и вторым рабочими соответственно и число бракованных деталей у первого и второго рабочих). Положить .
Решение. Согласно условиям задачи требуется проверить нулевую гипотезу о равенстве значений вероятности «успеха» - появления бракованной детали () для первого и второго рабочего, причем, поскольку объем выборки достаточно велик, можно использовать статистику . Поскольку , то альтернативную гипотезу следует принять в виде (левосторонняя критическая область).
Итак, было обследовано деталей, изготовленных первым рабочим, из них - оказались бракованными, тогда
, .
Аналогично для второго рабочего , . Тогда экспериментальное значение статистики:
.
Для критическое значение равно , таким образом, . Следовательно, нулевая гипотеза отвергается: нельзя утверждать, что второй рабочий в среднем делает больше брака, чем первый.
Случай, когда дисперсии генеральных совокупностей и неизвестны, но известно, что . Для проверки нулевой гипотезы используется случайная величина:
,
где и - выборочные дисперсии; - исправленные выборочные дисперсии.
Если нулевая гипотеза верна, то случайная величина имеет распределение Стьюдента с числом степеней свободы (разд. 3). Критическое значение и критическая область выбираются в соответствии с альтернативной гипотезой и задаваемым уровнем значимости.
7. Проверка гипотез о законе распределения (критерий Пирсона)
Существует несколько критериев согласия для проверки законов распределения случайной величины. Это критерии Колмогорова, Смирнова, Пирсона и др. Мы остановимся лишь на критерии Пирсона - это наиболее часто употребляемый критерий для проверки закона распределения случайной величины.
Сначала нужно разбить всю область изменения случайной величины на l интервалов (бин). Затем нужно подсчитать сколько этих величин попадает в каждый бин, то есть подсчитать эмпирические частоты тк. Чтобы вычислить теоретические частоты нужно вероятность попадания в каждый бин рк умножить на объём выборки п. Таким образом, статистика:
,
является случайной величиной, подчиняющейся закону с степенями свободы. В последней формуле r - число параметров распределения, определяемы по выборке. Для нормального закона - это два параметра, для закона Пуассона - один и т.д.
Рассчитав значения и выбрав уровень значимости , по таблице -распределения определяют . Если , то гипотезу Н0 отвергают, если то гипотезу принимают.
статистический гипотеза дисперсия
Список литературы
1. Кулаичев А.П. Методы и средства анализа данных в среде Windows. Изд. 3-е, перераб. и доп. - М: ИнКо, 1999, стр. 129-131.
2. Психолого-педагогический словарь для учителей и руководителей общеобразовательных учреждений. - Ростов-н/ Д: Феникс, 1998.
3. Р 50.1.037-2002. Рекомендации по стандартизации. Прикладная статистика: Правила проверки согласия опытного распределения с теоретическим. Часть II: Непараметрические критерии. -- М.: Госстандарт РФ, 2002.
4. Статистическая проверка статистических гипотез (Учебно-практическое пособие). Авторы: Голодная Н.Ю., Шуман Г.И., редактор: Александрова Л.И.
Размещено на Allbest.ru
...Подобные документы
Ознакомление с механизмом проверки гипотезы для случая единственной выборки, двух и нескольких независимых выборок. Проверка совпадений карт, выбор фильмов разных жанров. Обоснование результатов, полученных после проверки статистических гипотез.
курсовая работа [726,2 K], добавлен 26.02.2015Статическая проверка статистических гипотез. Ошибки первого и второго рода. Числовые характеристики случайной величины, распределенной по биномиальному закону. Проверка гипотезы о биномиальном распределении генеральной совокупности по критерию Пирсона.
курсовая работа [674,3 K], добавлен 03.05.2011- Закон больших чисел. Проверка статистических гипотез (критерий согласия w2 Мизеса: простая гипотеза)
Предельные теоремы теории вероятностей. Сходимость последовательностей случайных величин и вероятностных распределений. Метод характеристических функций. Закон больших чисел. Особенности проверки статистических гипотез (критерия согласия w2 Мизеса).
курсовая работа [1,0 M], добавлен 27.01.2012 Первичный анализ и основные характеристики статистических данных. Точечные оценки параметров распределения. Доверительные интервалы для неизвестного математического ожидания и для среднего квадратического отклонения. Проверка статистических гипотез.
дипломная работа [850,9 K], добавлен 18.01.2016Описание способов нахождения коэффициентов регрессии модели полнофакторного эксперимента. Проверка многофакторных статистических гипотез на однородность ряда дисперсий, значимость и устойчивость математических коэффициентов множественной корреляции.
контрольная работа [1,2 M], добавлен 05.08.2010Основные понятия, которые касаются центральной предельной теоремы для независимых одинаково распределенных случайных величин и проверки статистических гипотез. Анализ сходимости последовательностей случайных величин и вероятностных распределений.
курсовая работа [582,0 K], добавлен 13.11.2012Статистическое описание и выборочные характеристики двумерного случайного вектора. Оценка параметров линейной регрессии, полученных по методу наименьших квадратов. Проверка гипотезы о равенстве средних нормальных совокупностей при неизвестных дисперсиях.
контрольная работа [242,1 K], добавлен 05.11.2011Вероятностная модель и аксиоматика А.Н. Колмогорова. Случайные величины и векторы, классическая предельная проблема теории вероятностей. Первичная обработка статистических данных. Точечные оценки числовых характеристик. Статистическая проверка гипотез.
методичка [433,3 K], добавлен 02.03.2010Определение вероятности, что машина с неисправной ходовой частью имеет также неисправный мотор. Методика вычисления дисперсии. Проверка статистических гипотез и дисперсионный анализ. Формирование контрольных карт, их содержание и принципы построения.
курсовая работа [686,4 K], добавлен 31.01.2015Основные этапы обработки данных натуральных наблюдений методом математической статистики. Оценка полученных результатов, их использование при принятии управленческих решений в области охраны природы и природопользования. Проверка статистических гипотез.
практическая работа [132,1 K], добавлен 24.05.2013Оценка необходимости настройки технологического процесса или ремонта и замены оборудования для обеспечения заданной точности по толщине металла. Определение количества замеров толщины стенки листа стали. Статистические особенности анализа доли брака.
курсовая работа [126,4 K], добавлен 29.10.2012Методы регистрации, описания и анализа статистических экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений. Обзор задач математической статистики. Закон распределения случайной величины. Проверка правдоподобия гипотез.
презентация [113,3 K], добавлен 01.11.2013Сходимость последовательностей случайных величин и вероятностных распределений. Метод характеристических функций. Проверка статистических гипотез и выполнение центральной предельной теоремы для заданных последовательностей независимых случайных величин.
курсовая работа [364,8 K], добавлен 13.11.2012Основные понятия математической статистики, интервальные оценки. Метод моментов и метод максимального правдоподобия. Проверка статистических гипотез о виде закона распределения при помощи критерия Пирсона. Свойства оценок, непрерывные распределения.
курсовая работа [549,1 K], добавлен 07.08.2013Понятие вариационного ряда, статистического распределения. Эмпирическая функция и основные характеристики математического ожидания выборочной дисперсии. Точечные и интервальные оценки распределений. Теория гипотез - аналог теории доверительных интервалов.
контрольная работа [172,9 K], добавлен 22.11.2013Числовые характеристики непрерывных величин. Точечные оценки параметров распределения. Статистическая проверка гипотез. Сравнение средних известной и неизвестной точности измерений. Критерий Хи-квадрат для проверки гипотезы о виде распределения.
курсовая работа [79,0 K], добавлен 23.01.2012Порядок составления гипотез и решения задач на вероятность определенных событий. Вычисление вероятности выпадения различных цифр при броске костей. Оценка вероятности правильной работы автомата. Нахождение функции распределения числа попаданий в цель.
контрольная работа [56,6 K], добавлен 27.05.2013Статистическая гипотеза о независимости логарифмической доходности за различные интервалы времени при различных объемах торгов. Сущность критерия Колмогорова. Проверка гипотез для модельных данных. Выбор альтернативной гипотезы и оценка мощности критерия.
курсовая работа [511,2 K], добавлен 03.03.2015Математическая статистика как наука о математических методах систематизации статистических данных, ее показатели. Составление интегральных статистических распределений выборочной совокупности, построение гистограмм. Вычисление точечных оценок параметров.
курсовая работа [241,3 K], добавлен 10.04.2011Функции эритроцитов в организме человека, учет изменения их количества в связи с возрастом в рамках теории вероятностей и математической статистики. Обработка исходных данных, построение диаграммы рассеивания, гистограммы признаков; проверка гипотез.
курсовая работа [1,6 M], добавлен 18.02.2012