Критерии согласия

Особенности анализа вариационных рядов распределения. Сущность наиболее распространенных критериев согласия: критерий Колмогорова, Романовского и хи-квадрат Пирсона. Передача наследственности от родительских организмов к их потомкам по законам Менделя.

Рубрика Математика
Вид реферат
Язык русский
Дата добавления 30.01.2014
Размер файла 214,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Критерии согласия

При анализе вариационных рядов распределения большое значение имеет, насколько эмпирическое распределение признака соответствует нормальному. Для этого частоты фактического распределения нужно сравнить с теоретическими, которые характерны для нормального распределения. Значит, нужно по фактическим данным вычислить теоретические частоты кривой нормального распределения, являющиеся функцией нормированных отклонений.

Иначе говоря, эмпирическую кривую распределения нужно выровнять кривой нормального распределения.

Объективная характеристика соответствия теоретических и эмпирических частот может быть получена при помощи специальных статистических показателей, которые называют критериями согласия.

Критерием согласия называют критерий, который позволяет установить, является ли расхождение эмпирического и теоретического распределений случайным или значимым, т. е. согласуются ли данные наблюдений с выдвинутой статистической гипотезой или не согласуются. Распределение генеральной совокупности, которое она имеет в силу выдвинутой гипотезы, называют теоретическим.

Возникает необходимость установить критерий (правило), которое позволяло бы судить, является ли расхождение между эмпирическим и теоретическим распределениями случайным или значимым. Если расхождение окажется случайным, то считают, что данные наблюдений (выборки) согласуются с выдвинутой гипотезой о законе распределения генеральной совокупности и, следовательно, гипотезу принимают; если же расхождение окажется значимым, то данные наблюдений не согласуются с гипотезой и ее отвергают.

Обычно эмпирические и теоретические частоты различаются в силу того, что:

· расхождение случайно и связано с ограниченным количеством наблюдений;

· расхождение неслучайно и объясняется тем, что статистическая гипотеза о том, что генеральная совокупность распределена нормально -- ошибочна.

Таким образом, критерии согласия позволяют отвергнуть или подтвердить правильность выдвинутой при выравнивании ряда гипотезы о характере распределения в эмпирическом ряду.

Эмпирические частоты получают в результате наблюдения. Теоретические частоты рассчитывают по формулам.

Для закона нормального распределения их можно найти следующим образом:

критерий согласие закон мендель

· Уѓi--сумма накопленных (кумулятивных) эмпирических частот

· h -- разность между двумя соседними вариантами

· у -- выборочное среднеквадратическое отклонение

· t-нормированное (стандартизированное) отклонение

· ц(t)-функция плотности вероятности нормального распределения (находят по таблице значений локальной функции Лапласа для соответствующего значения t)

Имеется несколько критериев согласия, наиболее распространенными из которых являются: критерий хи-квадрат (Пирсона), критерий Колмогорова, критерий Романовского.

Критерий согласия Пирсона ч2 - один из основных, который можно представить как сумму отношений квадратов расхождений между теоретическими (fТ) и эмпирическими (f) частотами к теоретическим частотам:

· k-число групп, на которые разбито эмпирическое распределение,

· fi-наблюдаемая частота признака в i-й группе,

· fT-теоретическая частота.

Для распределения ч2 составлены таблицы, где указано критическое значение критерия согласия ч2 для выбранного уровня значимости б и степеней свободы df (или н).

Уровень значимости б - вероятность ошибочного отклонения выдвинутой гипотезы, т.е. вероятность того, что будет отвергнута правильная гипотеза. Р -- статистическая достоверность принятия верной гипотезы. В статистике чаще всего пользуются тремя уровнями значимости:

б=0,10, тогда Р=0,90 (в 10 случаях из 100)

б=0,05, тогда Р=0,95 ( в 5 случаях из 100)

б=0,01, тогда Р=0,99 (в 1 случае из 100) может быть отвергнута правильная гипотеза

Число степеней свободы df определяется как число групп в ряду распределения минус число связей: df = k -z. Под числом связей понимается число показателей эмпирического ряда, использованных при вычислении теоретических частот, т.е. показателей, связывающих эмпирические и теоретические частоты. Например, при выравнивании по кривой нормального распределения имеется три связи. Поэтому при выравнивании по кривой нормального распределения число степеней свободы определяется как df =k-3. Для оценки существенности, расчетное значение сравнивается с табличным ч2табл

При полном совпадении теоретического и эмпирического распределений ч2=0, в противном случае ч2>0. Если ч2расч> ч2табл, то при заданном уровне значимости и числе степеней свободы гипотезу о несущественности (случайности) расхождений отклоняем. В случае, если ч2расч< ч2табл то гипотезу принимаем и с вероятностью Р=(1-б) можно утверждать, что расхождение между теоретическими и эмпирическими частотами случайно. Следовательно, есть основания утверждать, что эмпирическое распределение подчиняется нормальному распределению. Критерий согласия Пирсона используется, если объем совокупности достаточно велик (N>50), при этом, частота каждой группы должна быть не менее 5.

Критерий согласия Колмогорова основан на определении максимального расхождения между накопленными эмпирическими и теоретическими частотами:

где D и d - соответственно, максимальная разность между накопленными частотами и накопленными частостями эмпирического и теоретического распределений.

По таблице распределения статистики Колмогорова определяют вероятность, которая может изменяться от 0 до 1. При Р(л)=1- происходит полное совпадение частот, Р(л)=0 - полное расхождение. Если величина вероятности Р значительна по отношению к найденной величине л, то можно предположить, что расхождения между теоретическим и эмпирическим распределениями несущественны, т. е. носят случайный характер.

Основное условие использования критерия Колмогорова - достаточно большое число наблюдений.

Критерий согласия Колмогорова. Рассмотрим как критерий Колмогорова (л) применяется при проверке гипотезы о нормальном распределении генеральной совокупности. Выравнивание фактического распределения по кривой нормального распределения состоит из нескольких этапов:

1. Сравнивают фактические и теоретические частоты.

2. По фактическим данным определяют теоретические частоты кривой нормального распределения, которая является функцией нормированного отклонения.

3. Проверяют на сколько распределение признака соответствует нормальному.

Для IV колонки таблицы:

В MS Excel нормированное отклонение (t) рассчитывается с помощью функции НОРМАЛИЗАЦИЯ. Необходимо выделить диапазон свободных ячеек по количеству вариант (строк электронной таблицы). Не снимая выделения, вызвать функцию НОРМАЛИЗАЦИЯ. В появившемся диалоговом окне указать следующие ячейки, в которых размещены, соответственно, наблюдаемые значения (Xi), средняя (X) и среднеквадратическое отклонение ?. Операцию обязательно завершить одновременным нажатием клавиш Ctrl+Shift+Enter

Для V колонки таблицы:

Функцию плотности вероятности нормального распределения ц(t) находим по таблице значений локальной функции Лапласа для соответствующего значения нормированного отклонения (t)

Для VI колонки таблицы:

Критерий согласия Колмогорова (л) определяется путем деления модуля max разности между эмпирическими и теоретическими кумулятивными частотами на корень квадратный из числа наблюдений:

По специальной таблице вероятности для критерия согласия л определяем, что значению л=0,59 соответствует вероятность 0,88 (л<P) критерий статистически не значим. Это значит, что с вероятностью 0,88 можно судить, что отклонения фактических (эмпирических) частот от теоретических являются случайными. Следовательно, нулевая гипотеза принимается и есть основания утверждать, что эмпирическое распределение подчиняется нормальному распределению.

Распределение эмпирических и теоретических частот, плотности вероятности теоретического распределения

Применяя критерии согласия для проверки соответствия наблюдаемого (эмпирического) распределения теоретическому, следует различать проверку простых и сложных гипотез.

Одновыборочный критерий нормальности Колмогорова-Смирнова основан на максимуме разности между кумулятивным эмпирическим распределением выборки и предполагаемым (теоретическим) кумулятивным распределением. Если D статистика Колмогорова-Смирнова значима, то гипотеза о том, что соответствующее распределение нормально, должна быть отвергнута.

Критерии согласия основаны на использовании различных мер расстояний между анализируемым эмпирическим распределением и функцией распределения признака в генеральной совокупности.

Критерий согласия Колмогорова Критерий Смирнова Критерий омега квадрат

Перечисленные критерии были разработаны для проверки согласия с полностью известным теоретическим распределением. Расчетные формулы, таблицы распределений и критических значений широко распространены. Основная идея критериев Колмогорова, омега квадрат и аналогичных им состоит в измерении расстояния между функцией эмпирического распределения и функцией теоретического распределения. Различаются эти критерии видом расстояний в пространстве функций распределения

Законы Менделя это принципы передачи наследственных признаков от родительских организмов к их потомкам, вытекающие из экспериментов Грегора Менделя. Эти принципы послужили основой для классической генетики и впоследствии были объяснены как следствие молекулярных механизмов наследственности

Пример. В некоторых классических экспериментах с селекцией гороха Мендель наблюдал частоты различных видов семян, получаемых при скрещивании растений с круглыми желтыми семенами и растений с морщинистыми зелеными семенами. Они приводятся ниже вместе с теоретическими вероятностями, вычисленными в соответствии с теорией наследственности Менделя.

Наряду с количественными статистическими критериями для определения типа распределения по выборочным данным используются графические методы. Простейший способ - построение по имеющейся выборке гистограммы относительных частот и на том же графике и в том же масштабе, - кривой плотности нормального распределения с выборочным средним и выборочной дисперсией в качестве параметров. Значительные отклонения от нормальности (сильная асимметрия, бимодальность) легко обнаруживаются на графике.

Таким образом, критерии согласия основаны на использовании различных мер расстояния между анализируемым эмпирическим распределением и функцией распределения признака в генеральной совокупности. Критериями согласия называют статистические критерии, предназначенные для проверки согласия опытных данных и теоретической модели.

Если для конкретной выборки мы отклоняем гипотезу о нормальности, и, следовательно, не имеем права пользоваться методами, основанными на нормальности, то для получения статистических выводов можно поступать разными способами. Например, если объем выборки достаточно велик, можно предпочесть использовать параметрические критерии как приближенные. Другой путь состоит в подборе замены переменной, приводящей к нормальному распределению[9]. Третий путь - применение непараметрических критериев.

Пример. Пусть получена следующая выборка 50 значений случайной величины с неизвестным распределением: (см. Таблица 1)

Проверим гипотезу о том, что эта случайная величина имеет нормальное распределение. После разбиения области изменения выборочных значений на 5 равных интервалов получаем следующие наблюденные и гипотетические частоты:(см. Приложения Таблица 2)

Гипотетические частоты вычислялись для нормального распределения

с параметрами, оцененными по выборке - соответственно, число степеней свободы статистики критерия равно 5-1-2=2. Выборочное значение статистики равно , что не выходит за критический 5%-ный предел, равный . Следовательно, у нас нет оснований отвергнуть гипотезу о нормальности.

В действительности, выборка была получена с помощью датчика случайных чисел, равномерно распределенных на отрезке [0, 100]. Т.е. мы видим, что при данном числе наблюдений (в общем-то, конечно, небольшом для проверки гипотезы о типе распределения) критерий не обнаруживает отклонения от нормальности в направлении равномерности.

Величина статистики одновыборочного критерия Колмогорова - Смирнова равна D=0.11, что также не выходит за 5%-ный предел этого критерия в предположении, что гипотетические средние равны выборочным. Однако в случае неизвестных параметров гипотетического нормального распределения лучше пользоваться модификацией критерия Колмогорова - Смирнова, предложенной Cтефенсом (Лиллифорсом). Но в этом случае значение

т.е. нет оснований отвергнуть гипотезу и по этому критерию.

Рис. 1. Пример сравнения гистограммы и кривой нормальной плотности

Пример. Расчеты, аналогичные предыдущим, проведенные для выборки объема 150 значений случайной величины, равномерно распределенной на отрезке [0, 100], дали значение , что позволило отвергнуть гипотезу о нормальности на уровне значимости 5%. По критерию Колмогорова - Смирнова гипотеза отвергалась лишь на уровне 10%, а по критерию Лиллифорса - на уровне 1%, что показывает неправомочность применения критерия Колмогорова - Смирнова в данной ситуации.

Пример. Расчеты статистик критериев согласия для данных таблицы 1, содержащей 50 выборочных значений длины лепестка ириса разноцветного, приводят к значению статистики равному 2.1, и значению статистики , равному 0.117. В этом случае гипотеза о нормальности не отвергается ни критерием , ни критерием Колмогорова - Смирнова - Лиллифорса.

Пример. В некоторых классических экспериментах с селекцией гороха Мендель наблюдал частоты различных видов семян, получаемых при скрещивании растений с круглыми желтыми семенами и растений с морщинистыми зелеными семенами. Они приводятся ниже вместе с теоретическими вероятностями, вычисленными в соответствии с теорией наследственности Менделя. (см. Приложения Таблица 3)

В этом случае теоретическое распределение дискретно и известно полностью. Для проверки согласия экспериментальных данных теоретическому распределению используем критерий для простой гипотезы. Значение статистики, вычисленное по выборке равно

что меньше 5%-ного критического значения

Следовательно, теория наследственности Менделя не противоречит полученным экспериментальным данным.

Наряду с количественными статистическими критериями для определения типа распределения по выборочным данным используются графические методы.

Простейший способ - построение по имеющейся выборке гистограммы относительных частот и на том же графике и в том же масштабе, - кривой плотности нормального распределения с выборочным средним и выборочной дисперсией в качестве параметров.

Закон Менделя

Семена

Наблюденная численность

Ожидаемая численность

Круглые и желтые

315

Морщинистые и желтые

101

Круглые и зеленые

108

Морщинистые и зеленые

32

Всего

556

556

Значительные отклонения от нормальности (сильная асимметрия, бимодальность) легко обнаруживаются на графике.

Пример: Применим этот прием к рассмотренной выше модельной выборке объема n=50, извлеченной из равномерного распределения. На рис. 7 приведена гистограмма и кривая нормальной плотности. Можно сказать, что визуально отклонение от нормальности в пользу равномерности заметно (хотя, как мы видели, статистически значимо при таком числе наблюдений оно не подтверждается).

С точки зрения визуального обнаружения отклонений от нормальности сравнение эмпирической и гипотетической функций распределения гораздо менее наглядно, чем сравнение гистограммы с графиком плотности. Однако обычно сравнивают на сами функции распределения, а обратные нормальные преобразования от них, так называемые пробит-графики. Пробит-график от теоретической нормальной функции распределения представляет собой прямую, а пробит-график эмпирической функции распределения тем ближе к прямой, чем ближе она к нормальной. Этот прием позволяет на первом этапе анализа данных выявить их особенности, выдвинуть гипотезы о характере распределения, решить вопрос о целесообразности замены переменной. (см. Приложения Рис.1 Пример сравнения гистограммы и кривой нормальной плотности.)

Вывод

Критерии согласия основаны на использовании различных мер расстояния между анализируемым эмпирическим распределением и функцией распределения признака в генеральной совокупности. Критериями согласия называют статистические критерии, предназначенные для проверки согласия опытных данных и теоретической модели.

Существует несколько критерий согласия: критерий согласия Колмогорова и омега-квадрат, ч2 Пирсона, ч2 Фишера и другие. Состоятельность критериев Колмогорова и омега-квадрат означает, что любое отличие распределения выборки от теоретического будет с их помощью обнаружено, если наблюдения будут продолжаться достаточно долго. Практическую значимость свойства состоятельности не велика, так как трудно рассчитывать на получение большого числа наблюдений в неизменных условиях, а теоретическое представление о законе распределения, которому должна подчиняться выборка, всегда приближённое. Поэтому точность статистических проверок не должна превышать точность выбранной модели.

Список использованной литературы:

1. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере /Под ред. В. Э. Фигурнова. - 3-е изд., перераб. и доп. - М.:ИНФРА - М. 2003. - 544 с., ил.

2. Электронный учебник по дисциплине "Математическая статистика"В. В. Шеломовский, Мурманский федеральный государственный педагогический университет. http://www.exponenta.ru/educat/systemat/shelomovsky/lab/lab14.asp

3. Тюрин Ю.Н. Исследования по непараметрической статистике (непараметрические методы и линейная модель): Автореф. дисс. … д-ра физ.-мат. наук. - М., 1985. - 33 с. - (МГУ).

4. Лемешко Б.Ю., Постовалов С.Н. О зависимости предельных распределений статистик Пирсона и отношения правдоподобия от способа группирования данных // Заводская лаборатория. 1998. - Т. 64. - № 5. - С.56-63.

Размещено на Allbest.ru

...

Подобные документы

  • Суть понятия "критерии согласия". Критерии согласия Колмогорова и омега-квадрат в случае простой гипотезы. Критерии согласия Пирсона для простой гипотезы, Фишера для сложной гипотезы. Теоретическое обоснование и практическое применение критерия согласия.

    курсовая работа [3,6 M], добавлен 18.11.2010

  • Критерий согласия – критерий проверки гипотезы о предполагаемом законе распределения генеральной совокупности. Критерий Колмогорова-Смирнова и его практическое применение. Критические значения статистик Стефенса. Критерии Пирсона и Смирнова-Крамера.

    курсовая работа [629,9 K], добавлен 26.08.2012

  • Основные понятия математической статистики, интервальные оценки. Метод моментов и метод максимального правдоподобия. Проверка статистических гипотез о виде закона распределения при помощи критерия Пирсона. Свойства оценок, непрерывные распределения.

    курсовая работа [549,1 K], добавлен 07.08.2013

  • Способы получения псевдослучайных чисел. Общая характеристика генератора псевдослучайных чисел фон Неймана. Сущность равномерного закона распределения. Понятие о критериях согласия. Анализ критериев Пирсона и Колмогорова.

    курсовая работа [176,9 K], добавлен 28.04.2010

  • Случайная выборка объема как совокупность независимых случайных величин. Математическая модель в одинаковых условиях независимых измерений. Определение длины интервала по формуле Стерджесса. Плотность относительных частот, критерий согласия Пирсона.

    контрольная работа [90,4 K], добавлен 17.10.2009

  • Закон и свойства нормального распределения случайной величины. На основе критерия согласия Пирсона построение гистограммы, статистической функции и теоретической кривой и определение согласованности теоретического и статистического распределения.

    курсовая работа [894,5 K], добавлен 30.10.2013

  • Доверительное оценивание параметров законов распределения (дисперсия, математическое ожидание), классический регрессионный анализ. Проверка гипотез, методики расчета доверительных интервалов и критериев согласия для различных числовых характеристик.

    курсовая работа [302,9 K], добавлен 25.07.2013

  • Критерии выбросов в случае нормального распределения, их асимптотические свойства и эмпирическая мощность. Исследование распределения статистик по критериям Колмогорова и Смирнова. Реализация критериев определения выбросов в статистическом пакете R.

    курсовая работа [521,9 K], добавлен 10.01.2016

  • Понятие доверительного интервала, сущность и определение критерия согласия Пирсона. Особенности точечного оценивания неизвестных параметров, основные требования к оценкам и статистикам. Характеристика классической линейной модели регрессионного анализа.

    дипломная работа [440,4 K], добавлен 23.07.2013

  • Использование вероятностной модели для описания неопределенностей. Распределение Пирсона, Стьюдента и Фишера при статистической обработке данных. Использование "Хи-квадрата" при оценивании дисперсии, проверке гипотез согласия качественных переменных.

    контрольная работа [794,7 K], добавлен 02.02.2011

  • Числовые характеристики непрерывных величин. Точечные оценки параметров распределения. Статистическая проверка гипотез. Сравнение средних известной и неизвестной точности измерений. Критерий Хи-квадрат для проверки гипотезы о виде распределения.

    курсовая работа [79,0 K], добавлен 23.01.2012

  • Предельные теоремы теории вероятностей. Сходимость последовательностей случайных величин и вероятностных распределений. Метод характеристических функций. Закон больших чисел. Особенности проверки статистических гипотез (критерия согласия w2 Мизеса).

    курсовая работа [1,0 M], добавлен 27.01.2012

  • Проведение проверки гипотезы о нормальности закона распределения вероятности результатов измерения случайной величины по критерию согласия Пирсона. Определение ошибок в массивах данных: расчет периферийных значений, проверка серии на равнорассеянность.

    контрольная работа [1,8 M], добавлен 28.11.2011

  • Проверка выполнимости теоремы Бернулли на примере вероятности прохождения тока по цепи. Моделирование дискретной случайной величины, имеющей закон распределения Пуассона. Подтверждение гипотезы данного закона распределения с помощью критерия Колмогорова.

    курсовая работа [134,2 K], добавлен 31.05.2010

  • Критерий Пирсона, формулировка альтернативной гипотезы о распределении случайной величины. Нахождение теоретических частот и критического значения. Отбрасывание аномальных результатов измерений при помощи распределения. Односторонний критерий Фишера.

    лекция [290,6 K], добавлен 30.07.2013

  • Расчет доверительных интервалов и критериев согласия для различных числовых характеристик, а также восстановление сигнала из смеси – сигнал + шум, используя метод наименьших квадратов. Разработка универсальной программы для извлечения сигнала из смеси.

    курсовая работа [395,2 K], добавлен 06.08.2013

  • Числовые характеристики случайной функции: математическое ожидание, дисперсия, квадрат разности, корреляционная функция. Расчет среднего выборочного и несмещенной выборочной дисперсии, проверка гипотезы о нормальном распределении по критерию согласия.

    контрольная работа [666,1 K], добавлен 02.06.2010

  • Сущность понятия "грубая погрешность", её главные источники. Проявление промахов на дифференциальном законе распределения вероятности. Критерий "трех сигм": общая теория, область применения. Характеристика сущности критерия Романовского, Шарлье и Диксона.

    презентация [131,0 K], добавлен 13.08.2013

  • Построение и графическое изображение вариационных рядов. Дискретный вариационный ряд распределения урожайности зерновых, сельскохозяйственных предприятий по качеству почв. Показатели центра распределения. Показатели формы и колеблемости признака.

    лабораторная работа [208,0 K], добавлен 15.05.2014

  • Одномерная выборка, ее представление и числовые характеристики. Проведение исследования нормального, равномерного и экспоненциального распределения. Проверка гипотез по критерию Пирсона и Колмогорова-Смирнова. Особенность изучения двухмерных выборок.

    курсовая работа [1,2 M], добавлен 22.11.2021

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.