Статистические критерии и гипотезы

Статистическая гипотеза как предположение о параметре генеральной совокупности. Пример формулировки гипотез. Статистический критерий как правило, обеспечивающее надежное поведение. Принятие истинной и отклонение ложной гипотезы с высокой вероятностью.

Рубрика Экономика и экономическая теория
Вид контрольная работа
Язык русский
Дата добавления 28.10.2013
Размер файла 26,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

1. Статистические гипотезы

статистическая истинная ложная гипотеза

Полученные в экспериментах выборочные данные всегда ограничены и носят в значительной мере случайный характер. Именно поэтому для анализа таких данных и используется математическая статистика, позволяющая обобщать закономерности, полученные на выборке, и распространять их на всю генеральную совокупность.

Полученные в результате эксперимента на какой-либо выборке данные служат основанием для суждения о генеральной совокупности. Однако в силу действия случайных вероятностных причин оценка параметров генеральной совокупности, сделанная на основании экспериментальных (выборочных) данных всегда будет сопровождаться погрешностью, и подобного рода оценка должны рассматриваться как предположительные, а не как окончательные утверждения. Подобные предположения о свойствах и параметрах генеральной совокупности получили название статистических гипотез. Как указывает Суходольский Г.В. «Под статистической гипотезой обычно принимают формальное предположение о том, что сходство или различие некоторых параметрических или функциональных характеристик случайно или, наоборот, неслучайно».

Гипотеза - это предположение о параметре генеральной совокупности.

Сущность проверки статистической гипотезы заключается в том, чтобы установить, согласуются ли экспериментальные данные и выдвинутая гипотеза, допустимо ли отнести расхождение между гипотезой и результатом статистического анализа экспериментальных данных за счет случайных причин?

Каждая проверка гипотез предполагает наличие основной(нулевой) и альтернативной гипотез.

Принято считать, что нулевая гипотеза H0 - это гипотеза о сходстве, а альтернативная H1-гипотеза о различии. Т.о. принятие нулевой гипотезы H0 свидетельствует об отсутствии различий, а гипотеза H1 o наличии различий. Альтернативная гипотеза - это то, что мы хотим доказать, поэтому иногда ее называют экспериментальной гипотезой.

Пример.

Если выборки извлечены из нормально распределенных генеральных совокупностей, причем одна выборка имеет параметры и, а другая и, то нулевая гипотеза исходит из предположения о том и , т.е. разность двух средних и разность двух стандартных отклонений . (Отсюда и название гипотезы нулевая).

Принятие альтернативной гипотеза H1 свидетельствует о наличии различий и исходит из предположения, что и .

Например, психолог провел выборочное тестирование показателей интеллекта у подростков из полных и неполных семей. В результате обработки экспериментальных данных установлено, что у подростков из не полных семей показатели интеллекта в среднем ниже, чем у их ровесников из полных семей. Может ли психолог на основе полученных данных сделать вывод о том, что неполная семья ведет к снижению интеллекта у подростков? Принимаемый в таких случаях вывод носит название статистического решения. Подчеркнем, что такое решение вероятоно.

При проверки гипотезы экспериментальные данные могут противоречить гипотезе H0 тогда это гипотеза откланяется. В противном случае, .т.е. если экспериментальные данные согласуются с гипотезой H0 она не откланяется. Часто в таких случаях говорят, что гипотеза H0 принимается. Отсюда видно, что статистическая проверка гипотез, основанная на экспериментальных данных, неизбежно связана с риском (вероятностью) принять ложное решение. При этом возможны ошибки двух родов. Ошибка первого рода произойдет, когда будет принято решение отклонить гипотезу H0, хотя в действительности она будет верной. Ошибка второго рода произойдет, когда будет принято решение не отклонять гипотезу H0, хотя в действительности она будет не верной. Вышесказанное представим в таблице.

Результаты проверки гипотезы H0

Возможные состояние проверяемой гипотезы

Верна гипотеза H0

Верна гипотеза H1

Гипотеза H0 отклоняется

Ошибка первого рода

Правильное решение

Гипотеза H0 не отклоняется

Правильное решение

Ошибка второго рода

Не исключено, что психолог, может ошибиться в своем статистическом решении, как видим в таблице, эти ошибки могут быть только двух родов. Поскольку исключить ошибки при принятии статистических гипотез не возможно, то необходимо минимизировать возможные последствия, .т.е. принятие неверной статистической гипотезы. В большинстве случаев единственный путь минимизации ошибок заключается в увеличении объема выборки.

Еще пример формулировки гипотез.

Некто изобрел мяч для гольфа и утверждает, что он полетит дальше обычных мячей более чем на 20 метров. То гипотезы можно сформулировать так:

2. Статистические критерии

Одним из наиболее часто встречающихся статистических задач с которыми сталкивается психолог является задача сравнения результатов обследования какого-либо психологического признака в разных условиях (например, до и после определенного воздействия) или обследования контрольной и экспериментальной групп. Помимо этого возникает необходимость оценить характер изменения того или иного психологического признака в одной или нескольких группах в разные периоды времени или выявить динамику изменения этого показателя под влиянием экспериментальных воздействий.

Для решения подобных задач используется достаточно большой набор статистических критериев.

Статистический критерий - это решающее правило, обеспечивающее надежное поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой вероятностью (Суходольский Г.В., 1972, с. 291).

Эти критерии позволяют оценить степень статистической достоверности различий между разнообразными показателями измеренными согласно плану психологического исследования.

Когда мы говорим, что достоверность различий определялась по критерию ч2, то имеем в виду, что использовали метод ч2 - для расчета определенного числа.

Когда мы говорим, далее, что ч2=12,676, то имеем в виду определенное число, рассчитанное по методу ч2. Это число обозначается как эмпирическое значение критерия.

По соотношению эмпирического и критического значений критерия мы можем судить о том, подтверждается ли или опровергается нулевая гипотеза. Например, если ч2эмп> ч2кр, H0 отвергается.

В большинстве случаев для того, чтобы мы признали различия значимыми, необходимо, чтобы эмпирическое значение критерия превышало критическое, хотя есть критерии (например, критерий Манна-Уитни или критерий знаков), в которых мы должны придерживаться противоположного правила.

Эти правила оговариваются в описании каждого из представленных в руководстве критериев.

Существует достаточно большое количество критериев различий.

В некоторых случаях расчетная формула критерия включает в себя количество наблюдений в исследуемой выборке, обозначаемое как n. В этом случае эмпирическое значение критерия одновременно является тестом для проверки статистических гипотез. По специальной таблице мы определяем, какому уровню статистической значимости различий соответствует данная эмпирическая величина. Примером такого критерия является критерий ц*, вычисляемый на основе углового преобразования Фишера.

В большинстве случаев, однако, одно и то же эмпирическое значение критерия может оказаться значимым или незначимым в зависимости от количества наблюдений в исследуемой выборке (n) или от так называемого количества степеней свободы, которое обозначается как v или как df.

Число степеней свободы v равно числу классов вариационного ряда минус число условий, при которых он был сформирован (Ивантер Э.В., Коросов А.В., 1992, с. 56). К числу таких условий относятся объем выборки (n), средние и дисперсии.

Если мы расклассифицировали наблюдения по классам какой-либо номинативной шкалы и подсчитали количество наблюдений в каждой ячейке классификации, то мы получаем так называемый частотный вариационный ряд. Единственное условие, которое соблюдается при его формировании - объем выборки п. Допустим, у нас 3 класса: "Умеет работать на компьютере - умеет выполнять лишь определенные операции - не умеет работать на компьютере". Выборка состоит из 50 человек. Если в первый класс отнесены 20 испытуемых, во второй - тоже 20, то в третьем классе должны оказаться все остальные 10 испытуемых. Мы ограничены одним условием - объемом выборки. Поэтому даже если мы потеряли данные о том, сколько человек не умеют работать на компьютере, мы можем определить это, зная, что в первом и втором классах - по 20 испытуемых. Мы не свободны в определении количества испытуемых в третьем разряде, "свобода" простирается только на первые две ячейки классификации:

v= c-l = 3-1 = 2

Степени свободы - это количество значений, которые могут свободно варьироваться, при условии, что известна информация вроде выборочного среднего.

Аналогичным образом, если бы у нас была классификация из 10 разрядов, то мы были бы свободны только в 9 из них, если бы у нас было 100 классов - то в 99 из них и т. д.

Способы более сложного подсчета числа степеней свободы при двухмерных классификациях приведены в разделах, посвященных критерию ч2 и дисперсионному анализу.

И те, и другие критерии имеют свои преимущества и недостатки. На основании нескольких руководств можно составить таблицу, позволяющую оценить возможности и ограничения тех и других..

Возможности и ограничения параметрических и непараметрических критериев

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

1. Позволяют прямо оценить различи* в средних, полученных в двух выборках (t - критерий Стьюдента).

Позволяют оценить лишь средние тенденции, например, ответить на вопрос, чаще ли в выборке А встречаются более высокие, а в выборке Б - более низкие значения признака (критерии Q, U, ц* и др.).

2. Позволяют прямо оценить различия в дисперсиях (критерий Фишера).

Позволяют оценить лишь различия в диапазонах вариативности признака (критерий ц*).

3. Позволяют выявить тенденции изме-нения признака при переходе от условия к условию (дисперсионный однофакторный анализ), но лишь при условии нормального распределения признака.

Позволяют выявить тенденции изменения признака при переходе от условия к условию при любом распределении признака (критерии тенденций L и S).

4. Позволяют оценить взаимодействие двух и более факторов в их влиянии на изменения признака (двухфакторный дисперсионный анализ).

Эта возможность отсутствует.

5. Экспериментальные данные должны отвечать двум, а иногда трем, условиям: а) значения признака измерены по интервальной шкале; б) распределение признака является нормальным; в) в дисперсионном анализе должно соблюдаться требование равенства дисперсий в ячейках комплекса.

Экспериментальные данные могут не отвечать ни одному из этих условий: а) значения признака могут быть представлены в любой шкале, начиная от шкалы наименований; б) распределение признака может быть любым и совпадение его с каким-либо теоретическим законом распределения необязательно и не нуждается в проверке; в) требование равенства дисперсий отсутствует.

6. Математические расчеты довольно сложны.

Математические расчеты по большей части просты и занимают мало времени (за исключением критериев ч2 и л).

7. Если условия, перечисленные в п.5, выполняются, параметрические критерии оказываются несколько более мощными, чем непараметрические.

Если условия, перечисленные в п.5, не выполняются, непараметрические критерии оказываются более мощными, чем параметрические, так как они менее чувствительны к "засорениям'.

Из Табл. 1 мы видим, что параметрические критерии могут оказаться несколько более мощными, чем непараметрические, но только в том случае, если признак измерен по интервальной шкале и нормально распределен. С интервальной шкалой есть определенные проблемы (см. раздел "Шкалы измерения"). Лишь с некоторой натяжкой мы можем считать данные, представленные не в стандартизованных оценках, как интервальные. Кроме того, проверка распределения "на нормальность" требует достаточно сложных расчетов, результат которых заранее неизвестен (см. параграф 7.2). Может оказаться, что распределение признака отличается от нормального, и нам так или иначе все равно придется обратиться к непараметрическим критериям.

Непараметрические критерии лишены всех этих ограничений и нетребуют таких длительных и сложных расчетов. По сравнению с параметрическими критериями они ограничены лишь в одном - с их помощью невозможно оценить взаимодействие двух или более условий или факторов, влияющих на изменение признака. Эту задачу может решить только дисперсионный двухфакторный анализ.

3. Уровни статистической значимости

Уровень значимости - это вероятность того, что мы сочли различия существенными, а они на самом деле случайны.

Уровнем p-значимости называется самый маленький уровень значимости, при котором будет отвергнута основная гипотеза при допущении, что основная гипотеза является истиной.

Когда мы указываем, что различия достоверны на 5%-ом уровне значимости, или при р<0,05, то мы имеем виду, что вероятность того, что они все-таки недостоверны, составляет 0,05. (Обозначают )

Когда мы указываем, что различия достоверны на 1%-ом уровне значимости, или при р<0,01, то мы имеем в виду, что вероятность того, что они все-таки недостоверны, составляет 0,01.

Если перевести все это на более формализованный язык, то уровень значимости - это вероятность отклонения нулевой гипотезы, в то время как она верна т.е. вероятность ошибки 1-го рода и называется уровнем значимости б

Исторически сложилось так, что в прикладных науках в том числе в психологии принято считать низшим уровнем статистической значимости 5%-ый уровень (р<0,05): достаточным - 1%-ый уровень (р<0,01) и высшим 0,1%-ый уровень (р<0,001), поэтому в статистических таблицах критических значений которые приводятся в приложениях обычно приводятся значения критериев, соответствующих уровням статистической значимости р<0,05 и р<0,01, иногда - р<0,001.

Величины 0,01 0,05 и 0,001- это так называемые стандартные уровни статистической значимости. При статистическом анализе психолог должен в зависимости от задач и гипотез исследования должен выбрать необходимый уровень значимости.

0,05 это означает 5 ошибок в выборке из 100 элементов или одна ошибка из 20 элементов. Считается, что ни 6 ни 7 ни большее количество раз из 100 мы ошибиться не можем. Цента таких ошибок будет слишком велика.

На основании полученных экспериментальных данных психолог подсчитывает по выбранному им статистическому методу эмпирическое значение . Затем эмпирическое значение сравнивается с двумя критическими величинами, которые соответствуют уровням значимости в 5% и 1% для выбранного статистического метода и которые обозначаются как .

Величины этого находятся, для данного статистического метода, по таблицам приведенном в приложении в любом учебнике по статистике. Эти величины всегда различны и для удобства их можно называть и . Найденные по таблицам величины критических значений и удобно представлять в след. Записи

Теперь нам необходимо сравнить наше эмпирическое значение с двумя найденными по таблице критическими значениями. Лучше всего это сделать, расположить все три числа на так называемой «оси значимости» (По сути дела это обычная школьная ось абсцисс ОХ ДСК). Однако особенность этой ост в том, что на ней выделено 3 участка зоны. Левая зона наз. Зоной незначимости, правая - зоной значимости, а промежуточная - зоной неопределенности. Границами все трех зон являются для и .

В этом случае принимается альтернативная гипотеза H1 - о наличии различий, а гипотеза H0 отклоняется.

В этом случае перед психологом стоит дилемма. Так в зависимости от важности решаемой задачи он может считать полученную статистическую оценку достоверной на уровне 5% и принять тем самым гипотезу H1 отклонив H0 либо - недостоверной на уровне 1% принять тем самым гипотезу H0. Подчеркнем однако, что это именно тот случай, когда психолог может допустить ошибки 1-го или 2-го рода. Как говорилось ранее, в этих случаях, лучше увеличить объем выборки.

Правило отклонения H0 и принятия H1

1. Если эмпирическое значение критерия меньше критического значения, соответствующего р<0,05, то гипотеза об отсутсвии различий H0 принимается.

2. Если эмпирическое значение критерия равняется критическому значению, соответствующему р<0,05 или превышает его, то H0 отклоняется, но мы еще не можем определенно принять H1.

3. Если эмпирическое значение критерия равняется критическому значению, соответствующему р<0,01 или превышает его, то H0 отклоняется и принимается H1.

Исключения: критерий знаков G, критерий Т Вилкоксона и критерий U Манна-Уитни. Для них устанавливаются обратные соотношения.

4. Мощность критериев

Мощность критерия - это его способность выявлять различия, если они есть. Иными словами, это его способность отклонить нулевую гипотезу об отсутствии различий, если она неверна.

Ошибка, состоящая в том, что мы приняли нулевую гипотезу, в то время как она неверна, называется ошибкой II рода. Обозначается .

Мощность критерия определяется эмпирическим путем. Одни и те же задачи могут быть решены с помощью разных критериев, при этом обнаруживается, что некоторые критерии позволяют выявить различия там, где другие оказываются неспособными это сделать, или выявляют более высокий уровень значимости различий. Возникает вопрос: а зачем же тогда использовать менее мощные критерии? Дело в том, что основанием для выбора критерия может быть не только мощность, но и другие его характеристики, а именно:

а) простота;

б) более широкий диапазон использования (например, по отношению к данным, определенным по номинативной шкале, или по отношению к большим n);

в) применимость по отношению к неравным по объему выборкам;

г) большая информативность результатов.

5. Список используемой литературы:

1. Бережная Е.В., Математические методы моделирования экономических систем: учебное пособие, 2е изд., М.: Финансы и статистика, 2005, 148с.

2. Гатаулин А.М., Гаврилов Г.В., Сорокина Т. M. и др. Математическое моделирование экономических процессов. - М., Агропромиздат, 1990.

3. Гладилин А.В., Эконометрика: учебное пособие.- М.:КНОРУС, 2006.- 68 с.

4. Гладилин А.В., Эконометрика: учебное пособие., М.:КНОРУС, 2006, 60с

5. Дмитровский В.В.: Эконометрика: учебник, М.: Новый учебник, 2004, 27с.

6. Дрейнер Н., Смит Г.: Прикладной регрессионный анализ/Пер. с англ., М.:Статистика , 1973, 140с.

7. Езекил М.: Методы анализа корреляций и регрессий, М.:Статистика, 1966.-393с

8. Елисеева И.И., Эконометрика: учебник для вузов., 2-е изд., М.: Финансы и статистика, 2005 - 81с

9. Елисеева И.И., Эконометрика: учебник для вузов., М.: Финансы и статистика, 2002 - 36с.

10. Елисеева И.И., Эконометрика: учебник для вузов., М.: Финансы и статистика, 2002 - 42с.

Размещено на Allbest.ru

...

Подобные документы

  • Общее понятие про гипотезы, их классификация. Выбор и основные принципы расчета критериев для проверки статистических гипотез. Проверка гипотезы о законе распределения генеральной совокупности с использованием функции Лапласа, критерия Фишера-Снедекора.

    курсовая работа [2,6 M], добавлен 01.04.2011

  • Статистическая гипотеза как любое предположение о свойствах и характеристиках исследуемых генеральных совокупностей. Общая характеристика наиболее важных статистических гипотез: однородности, согласия, независимости. Знакомство со значениями статистики.

    презентация [70,0 K], добавлен 16.03.2014

  • Статистические гипотезы и методы их проверки. Закон распределения случайной величины. Математические ожидания экспоненциально распределенных выборок. Области отклонения гипотезы. Плотность нормального распределения. Плотность распределения Стьюдента.

    контрольная работа [850,5 K], добавлен 30.03.2011

  • Проверка гипотезы о равенстве дисперсий двух генеральных совокупностей. Критерий Фишера-Снедекора. Сравнение выборочной средней с гипотетической генеральной средней нормально распределенной совокупности. Построение теоретического закона распределения.

    курсовая работа [96,2 K], добавлен 17.11.2014

  • Изучение свойств расположения статистических групп и понятие статистической совокупности. Определение состава показателей для измерения структуры совокупности, обобщающие индексы сравнения. Статистическая проверка гипотез и эмпирическое распределение.

    лекция [290,8 K], добавлен 27.04.2013

  • Порядок проведения проверки статистических гипотез. Проверка однородности результатов эксперимента в целях исключения грубых ошибок. Расчет теоретических частот для нормального распределения. Уравнение линейной регрессии и метод наименьших квадратов.

    курсовая работа [349,5 K], добавлен 09.01.2011

  • Проведение статистического наблюдения за деятельностью предприятий. Стоимость основных производственных фондов. Статистический анализ генеральной совокупности. Описательные статистики выборочной совокупности. Распределение единиц выборочной совокупности.

    практическая работа [66,9 K], добавлен 31.01.2012

  • Понятие и основные виды выборочного наблюдения. Ошибки выборочного статистического наблюдения. Определение генеральной совокупности, проблема соотношения выборки и совокупности. Точечная и интервальная оценка параметров генеральной совокупности.

    контрольная работа [32,6 K], добавлен 02.12.2015

  • Абсолютные и относительные статистические показатели, методы прогнозирования. Закон распределения вероятностей дискретной случайной величины. Оценки параметров генеральной совокупности. Статистическое исследование социально-экономического потенциала.

    шпаргалка [1,8 M], добавлен 16.05.2012

  • Оценка некоторого набора условий и характеристик жизни человека. Критерии качества жизни. Уровень материальной обеспеченности, жилищные условия, экологическая ситуация. Статистическая информация по Кемеровской области. Образование и здравоохранение.

    курсовая работа [909,1 K], добавлен 04.02.2014

  • Понятие статистической совокупности и ее структура. Понятие генеральной и выборочной совокупности. Обеспечение репрезентативности выборочной совокупности. Вероятность наступления в выборочной совокупности какого-либо события. Закон больших чисел.

    презентация [76,5 K], добавлен 19.05.2012

  • Сущность понятия "статистическая сводка". Основные типы группировок: типологические, структурные и аналитические. Расчет обобщающего сегмента. Предельная ошибка выборки. Спрос на предлагаемый товар в генеральной совокупности. Жизненный цикл товара.

    контрольная работа [103,8 K], добавлен 08.03.2011

  • Основы статистического контроля качества продукции. Типовые расчеты по курсу теории вероятностей: построение закона распределения и расчет основных характеристик непрерывной случайной величины. Интервальное оценивание параметров генеральной совокупности.

    контрольная работа [1,2 M], добавлен 21.01.2016

  • Среднее арифметическое выборки, дисперсия, среднеквадратическое отклонение. Отбраковка по критерию Шовене. Правило "трех сигм". Оценка значимости различия средних значений двух выборок. Парный, множественные регрессионные анализы. Полный факторный анализ.

    курсовая работа [267,9 K], добавлен 05.12.2012

  • Изучение динамики средней затратоемкости продукции на примере предприятий Вологодской области. Априорный анализ показателей себестоимости продукции. Проверка гипотезы о нормальном распределении. Исследование связи между себестоимостью, выручкой, прибылью.

    курсовая работа [1,4 M], добавлен 14.03.2016

  • Экономический анализ степени риска в бизнесе. Понятие и сущность неопределенности, ее источники и виды. Рассмотрение оценки параметров хиквадрат-теста. Статистические гипотезы. Статистика Колмогорова-Смирнова. Тест Колмогорова-Смирнова для двух выборок.

    реферат [204,3 K], добавлен 30.11.2013

  • Статистика в медицине как один из инструментов анализа экспериментальных данных и клинических наблюдений. Понятие количественных (числовых) данных. Выборки численных переменных. Виды критериев для независимых выборок, особенности их использования.

    презентация [750,1 K], добавлен 16.10.2016

  • Расчет плана по реализации продукции. Динамика численности населения. Плановое задание по росту производительности труда за год. Основные статистические показатели зарплаты и основных фондов (моду и медиану, дисперсию, коэффициент вариации, отклонение).

    контрольная работа [95,4 K], добавлен 21.11.2010

  • Простая сводка данных по показателю "Внешняя торговля по субъектам РФ". Вариационный анализ статистической совокупности. Выборочное наблюдение и генеральная совокупность на основе выборочной. Анализ рядов динамики и корреляционный анализ показателей.

    курсовая работа [1,6 M], добавлен 26.02.2012

  • Виды несплошного статистического наблюдения, их использование для формирования объема и состава генеральной совокупности. Определение заработной платы как средней гармонической взвешенной. Исчисление индекса производительности труда стоимостным методом.

    контрольная работа [35,2 K], добавлен 09.10.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.