Статистическое оценивание и проверка гипотез
Теоретические распределения, используемые в статистических выводах. Принципы построения доверительных интервалов. Выборочные распределения, интервальное оценивание и свойства оценок. Метод максимального правдоподобия. Проверка статистических гипотез.
Рубрика | Экономика и экономическая теория |
Вид | реферат |
Язык | русский |
Дата добавления | 26.08.2015 |
Размер файла | 209,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Реферат
Статистическое оценивание и проверка гипотез
Введение
Сбор и последующий анализ этих данных направлен на проверку определенных предположений относительно возможных механизмов изучаемых процессов или явлений, выдвигаемых исследователем при постановке задачи. Несмотря на то, что число объектов или процессов в каждом конкретном исследовании, как правило, сравнительно невелико, мы бы хотели, чтобы получаемые в результате анализа статистики достаточно хорошо описывали все реально существующее или мыслимое множество объектов или процессов, представляющее интерес в данном исследовании. Для этого делаются некоторые предположения о том, как вычисленные на основе экспериментальных данных показатели соотносятся с параметрами тех распределений, которые могли бы быть получены, если бы в нашем распоряжении оказалось все множество интересующих нас объектов. Это и составляет, в общих чертах, основную задачу статистического оценивания. Решение этой задачи представляет собой главную часть любого анализа экспериментальных данных и тесно связано с использованием ряда теоретических распределений некоторых специальных переменных, с рассмотрения которых мы и начнем.
1. Теоретические распределения, используемые в статистических выводах
статистический интервал оценивание выборочный
Распределением, играющим, пожалуй, основную роль в теории статистического оценивания, является нормальное распределение. Его свойства были подробно рассмотрены в предыдущем разделе, поэтому здесь мы приведем только формулу для плотности этого распределения
(1)
и отметим следующее. Широкое использование в статистических выводах нормального распределения имеет под собой как определенное эмпирическое, так и теоретическое обоснование. Во-первых, многочисленные примеры построения гистограмм и аппроксимация их непрерывными кривыми для экспериментальных данных самой различной природы показывают, что во многих случаях нормальное распределение действительно является довольно точным представлением таких данных. Во-вторых, доказано, что благодаря усреднению некоторого числа отдельных значений, которые сами по себе имеют произвольное распределение, получаемое распределение в среднем оказывается близким к нормальному. И, наконец, нормальное распределение имеет ряд определенных математических достоинств, позволяющих существенно облегчить доказательства некоторых основополагающих моментов теории статистического вывода.
Следует четко представлять, что нормальное распределение - это чисто математический инструмент, и совсем необязательно, чтобы реальные экспериментальные данные точно описывались этим распределением, хотя во многих случаях, допуская небольшую ошибку, это распределение может быть принято в качестве модели для реальных данных.
Наряду с одномерным, важную роль в статистике особенно в теории корреляции играет двумерное нормальное распределение:
(2)
представляет собой колоколообразную поверхность в трехмерном пространстве (рис. 1) и обладает рядом характерных особенностей. Во первых, если взять только значения x без учета значений y, которым они соответствуют, то распределение этих x является нормальным. То же справедливо и для значений y. Во-вторых, если зафиксировать какое-то значение x, то все соответствующие ему значения y имеют также нормальное распределение (аналогично для y). И, наконец, средние значения y(x) для каждого отдельного значения x(y) ложатся на прямую.
Дальнейшим обобщением нормального распределения является n-мерное нормальное распределение, широко используемое в многомерном статистическом анализе.
Распределение хи-квадрат. Другим играющим важную роль в статистических выводах распределением является распределение (хи-квадрат), введенное в статистическую практику К.Пирсоном.
Представим себе очень большую совокупность нормально распределенных значений с нулевым средним и единичным стандартным отклонением. Обозначим через квадрат стандартизованной величины, выбранной из этой совокупности. Таких величин можно получить очень большое количество, для них построить гистограмму и аппроксимировать ее непрерывной кривой. Если теперь выбрать масштаб ординат этой кривой так, чтобы площадь под ней была равна единице, то получим кривую распределения хи-квадрат с одной степенью свободы. Одна степень свободы указывает, что для получения использовались квадраты одной величины.
Начнем теперь выбирать из исходной совокупности по два значения, возведем их в квадрат и сложим. Получим величину . Если эту процедуру повторить многократно, а затем сделать все как и для , то получим другую кривую распределения, а именно ( хи-квадрат с двумя степенями свободы). Аналогичным образом можно получать кривые распределения хи-квадрат для сумм произвольного числа квадратов стандартизованных величин, взятых из совокупности с нормальным распределением. Известно аналитическое выражение для кривой распределения , однако ввиду сложности приводить мы его не будем.
Все семейство распределений хи-квадрат характеризуется следующими свойствами:
1. Среднее значение распределения хи-квадрат с n степенями свободы равно n.
2. Мода находится в точке n-2 для n.
3. Дисперсия равна 2n.
4. Асимметрия равна .
5. Для больших n стремится к нормальному распределению со средним n и стандартным отклонением .
6. Если имеет распределение хи-квадрат с степенями свободы и если имеет распределение хи-квадрат с степенями свободы и не зависит от , то имеет также распределение хи-квадрат с степенями свободы.
В Приложении приведена таблица со значениями для разного числа степеней свободы, соответствующими определенным долям площади под кривой распределения. Например, что означает число 11,07 для =0,05 и n=5? Это число показывает, что сумма квадратов пяти значений z, случайно выбранных из нормального распределения, только в пяти случаях из ста будет превышать 11,07. В остальных 95 случаях она будет меньше. Другими словами, вероятность получить значение между 0 и 11,07 равна 0,95.
F-распределение. Распределение Фишера (F-распределение) возникает в результате следующих действий. Пусть имеется переменная и независимая от нее переменная . Случайная величина, называемая F-отношением, получается так:
(3)
Можно вычислить множество F-отношений. Построив для них гистограмму и аппроксимировав ее непрерывной кривой, получим распределение F c и степенями свободы. Графики кривых этого распределения для разных чисел степеней свободы приведены на рис. 3. По тем же причинам, что и для распределения хи-квадрат, мы не приводим аналитического выражения для F-распределения, а упомянем о некоторых его особенностях. Это распределение характеризуется унимодальностью, положительной асимметрией, имеет медиану Md и среднее равное для .
В Приложении приведена таблица F-распределения, в которой каждой паре степеней свободы соответствуют два числа. Эти числа равны граничным значениям, слева от которых лежит соответственно 95 и 99 % от общей площади под кривой F-распределения. Распределение Стьюдента. Если в нашем распоряжении есть нормированное нормальное распределение и распределение , то как показал Стьюдент (псевдоним крупного английского статистика В.Госсета), величина
(4)
имеет распределение (t-распределение), обладающее рядом важных свойств.
Как и для F-распределений, существует целое семейство t-распределений. Все эти распределения симметричны, унимодальны и имеют нулевое среднее и дисперсию, равную n/(n-2). По мере роста n распределение начинает быстро приближаться к нормальному. Для различных значений n по аналитическому выражению для t-распределения вычислены величины, приведенные в соответствующей таблице Приложения. Например, числа 2,365 и 3,499 для числа степеней свободы, равного 7, означают, что только в пяти и соответственно одном случае из ста вычисленное значение по абсолютной величине превысит эти числа. Или, другими словами, что в диапазоне 2,365 и 3,499 заключено соответственно 95% и 99% площади под кривой t-распределения.
Распределение Стьюдента играет в теоретической и прикладной статистике почти такую же важную роль, как и нормальное распределение.
2. Выборочные распределения и свойства оценок
Мы уже упоминали о том, что после проведения экспериментов в распоряжении исследователя оказывается определенное ограниченное количество измерений, характеризующих объект исследования по интересующему его признаку. Результатом же анализа должен быть вывод, относящийся ко всем объектам данного вида. Множество объектов, конечное или бесконечное, относительно которого делаются статистические выводы, носит название генеральной совокупности. Этот термин приобретает смысл в сочетании с понятием о выборке, т.е. части этого множества. Естественно, что бесконечно большие генеральные совокупности - это умозрительные абстракции, существование которых постулируется при теоретических построениях. Реально же мы имеем дело с конечными генеральными совокупностями, размеры которых, правда, могут колебаться в очень широких пределах.
Например, вся генеральная совокупность уссурийских тигров насчитывает около двухсот особей, в то время как число таких видов деревьев как березы или осины измеряется миллионами. В статистических выводах важен не сам по себе объем генеральной совокупности, а та доля от него, которую составляет выборка. Во всех случаях, когда объем выборки меньше сотой части всей генеральной совокупности, последнюю по отношению к выборке можно считать практически бесконечной и использовать математический аппарат, основанный на таком представлении.
Ряд показателей, методы вычислений которых уже были рассмотрены, такие, как среднее, дисперсия и т.д., характеризуют выборку и носят название статистик. Такие же показатели, но характеризующие всю генеральную совокупность в целом, носят название параметров. Таким образом, можно считать, что статистики служат оценками для параметров. Чтобы отличать статистики от параметров, принято последние обозначать греческими буквами: - среднее, - дисперсия, - коэффициент корреляции и т.д.
Пусть теперь мы извлекаем из генеральной совокупности большое число выборок, для каждой из которых вычисляется некоторая статистика, например, среднее. Если для множества полученных средних (их будет столько, сколько было извлечено выборок) построить гистограмму, а затем аппроксимировать ее непрерывной кривой, выбрав масштаб так, чтобы площадь под кривой равнялась единице, то получим приближенное выборочное распределение среднего. Естественно, что такие выборочные распределения могут быть построены для любых интересующих нас статистик.
Предположим, что в очень большой генеральной совокупности признаки (x), принимающие численные значения от единицы до десяти, встречаются одинаково часто.
Пусть теперь из всей совокупности объектов с этими признаками извлекаются 100 выборок по два объекта в каждой. Если теперь для средних этих выборок () построить распределение, то оно будет иметь вид, как на рис. 6. Возникает вопрос, случайно ли, что это распределение более или менее симметрично и имеет такой вид, что если его аппроксимировать непрерывной кривой, то эта кривая будет приближаться к колоколообразной? Оказывается, нет. Была доказана специальная теорема (см. главу38), которая утверждает, что если из бесконечной генеральной совокупности с произвольным распределением и параметрами и извлекаются случайные выборки объема n, где n достаточно велико, то выборочное среднее будет иметь распределение, приближающееся к нормальному с параметрами и /n ( - дисперсия генеральной совокупности).
Попытаемся нестрого доказать эту теорему. Предположим, что из генеральной совокупности извлекается большое число выборок объемом n. Все выборочные значения x имеют номера от 1 до n, причем эти номера указывают только, в каком порядке извлекались объекты в каждой выборке. Если считать, что среднее и дисперсия генеральной совокупности равны и , то , взяв только первые или только вторые и т.д. значения из каждой выборки, получим совокупности со средним и дисперсией . Таким образом, случайные переменные имеют одинаковые средние и дисперсии.
Отсюда следует, что выборочное среднее равно . Среднее выборочного распределения должно быть равно ожидаемому значению (математическому ожиданию). Имеем
(5)
Выше было указано, что ожидаемые значения для всех x независимо от их порядковых номеров одинаковы и равны .
Следовательно,
Таким образом, ожидаемое значение генерального среднего в выборочном распределении средних равно , т.е. среднему совокупности, из которой извлекаются выборки.
Теперь попробуем доказать, что дисперсия распределения выборочных средних равна /n. Пусть мы извлекаем из генеральной совокупности выборки объема два. Для каждой выборки . Объекты и во всех выборках извлекаются независимо, и, следовательно, ряды и , полученные по всем выборкам не коррелированы между собой. Как указывалось выше, совокупности и имеют дисперсии . Найдем теперь дисперсию выборочных средних для данного случая:
(6)
В предыдущей главе было показано, что
.
Так как в нашем случае x и y, т.е. и некоррелированы, то приведенное соотношение приобретает вид
Если теперь учесть, что , а также свойство дисперсии, состоящее в том, что умножение переменной на константу приводит к умножению дисперсии на квадрат этой константы, то получим
(7)
То, что дисперсия средних для выборок объемом два равна половине дисперсии генеральной совокупности, не случайно. По индукции можно доказать, что
(8)
Величина в правой части (8) носит название дисперсии ошибки среднего, а положительное значение корня квадратного из нее называется стандартной ошибкой среднего, т.е. .
То, как для некоторого распределения генеральной совокупности выглядит распределение средних, когда объемы выборок равнялись 100, из которого видно, что кривая подходит очень близко к оси абсцисс на расстояниях, равных трем стандартным ошибкам относительно среднего.
Другой пример выборочного распределения - распределение коэффициентов корреляции, полученных из двумерной нормальной генеральной совокупности с .
Теоретически было показано, что распределение выборочных коэффициентов корреляции в этом случае стремится к нормальному распределению с нулевым средним и стандартной ошибкой Имея в достаточно большом масштабе (или используя аналитическое выражение для нормального распределения), можно видеть, что в пяти случаях из ста в выборках объемом, например, в 80 объектов из генеральной совокупности с некоррелированными признаками вычисленные коэффициенты корреляции могут быть по абсолютной величине больше 0,22.
Теперь мы переходим к рассмотрению вопроса, о котором уже упоминалось в главе 41, когда речь шла об описательных статистиках. Разговор пойдет о свойствах оценок. Итак, как подчеркивалось ранее, описательные статистики используются как оценки параметров. Однако возникает вопрос, какую из статистик предпочесть в качестве оценки параметра, если есть выбор, либо насколько хорошо оценивает тот или иной параметр некоторая новая статистика. Существенный вклад в решение проблемы формализации свойств оценок принадлежит английскому статистику Р.Фишеру, о котором мы уже неоднократно упоминали и будем еще упоминать, так как практически во всех разделах математической статистики им были поставлены и решены ключевые проблемы.
Рассмотрим три свойства оценок: несмещенность, состоятельность и эффективность.
Оценка называется несмещенной, если среднее выборочного распределения оценки равно величине оцениваемого параметра. Из рассмотренных нами описательных статистик несмещенной оценкой является среднее, причем несмещенность сохраняется при любом распределении генеральной совокупности. В случае симметричных распределений несмещенной оценкой среднего генеральной совокупности является также медиана.
Именно желание получить несмещенную оценку дисперсии генеральной совокупности приводит к тому, что в формуле для расчета выборочной дисперсии в знаменателе стоит n-1, а не n. Покажем это. Обозначим среднее выборочного распределения дисперсии через , тогда можно записать, что
(9)
где - среднее генеральной совокупности, а - выборочная оценка этого среднего. Далее
Так как ожидаемое значение квадратов отклонений измеряемой случайной величины от среднего генеральной совокупности равно дисперсии этой совокупности , а ожидаемое значение суммы квадратов отклонений выборочного среднего от есть не что иное, как дисперсия выборочных средних, то с учетом 8 последнее соотношение может быть переписано в следующем виде:
(10)
Таким образом, видно, что ожидаемое значение оценки не равно в точности параметру генеральной совокупности. Если же ввести выборочную оценку
(11)
то, как несложно видеть, ее ожидаемое значение точно равно дисперсии генеральной совокупности, и, значит, является несмещенной оценкой.
Конечно, если n достаточно велико, например, больше 50, то для практических целей непринципиально, делим ли мы в формуле для дисперсий на n или на (n-1).Однако для небольших n использование смещенной оценки дисперсии приводит к существенным отличиям, поэтому нужно пользоваться только формулой 11.
Несмотря на то , что выборочная дисперсия является несмещенной оценкой, корень квадратный от нее - стандартное отклонение s - является смещенной оценкой. Правда, смещение его очень незначительно (например для n=6 оно составляет около 5%), и поэтому в практических расчетах поправку не вносят.
Второе свойство оценок - состоятельность, свойство, обладание которым даже для смещенных оценок приводит при постоянном увеличении объема выборки тому, что вычисляемая оценка приближается к оцениваемому параметру.
Формально, если мы имеем оценку параметра , то вероятность
Это свойство соответствует здравому смыслу, и все используемые в практике статистики являются состоятельными.
Еще одно свойство оценок - их эффективность.
Понятие эффективности приобретает смысл только при сравнении этого свойства у двух или нескольких оценок и характеризует точность оценки параметра. Чем, в свою очередь, определяется точность? Если из генеральной совокупности извлекается несколько выборок и для каждой из них вычисляется, например, среднее, то все они будут иметь разброс относительно среднего генеральной совокупности. Разброс этот можно охарактеризовать дисперсией, которая в данном случае будет равна
Пусть наша гипотетическая генеральная совокупность имеет нормальное распределение, тогда в качестве оценки ее среднего можно использовать и медиану, которая в этом случае также будет несмещенной оценкой. Однако если взять множество выборок, для каждой из них найти медиану, а затем вычислить дисперсию распределения выборочных медиан, то окажется (и это строго доказывается, что эта дисперсия равна
Как видно, точность приближения среднего генеральной совокупности медианой меньше, чем при использовании среднего арифметического.
Таким образом, эффективность двух оценок может быть определена через отношение дисперсий этих оценок. В случае среднего и медианы это отношение составляет 63,7%, т.е. для получения одинаковой точности в оценке среднего генеральной совокупности с помощью медианы нужно взять, например, выборки объемом в 100 и 64 значения соответственно. Следовательно, более эффективная оценка (в данном случае среднее арифметическое) позволяет ограничиваться при заданной точности меньшим числом наблюдений.
Теперь, рассмотрев понятие относительной эффективности, вернемся к одной из оценок, технику вычисления которой мы уже рассматривали в главе 1. Речь идет о вычислении среднего совокупности, состоящей из нескольких выборок. Там мы показали, что
Эта формула справедлива, если предположить, что дисперсии всех выборок одинаковы. Если же дисперсии неодинаковы, то оценкой с минимальной дисперсией, т.е. более эффективной оценкой будет
(12)
где - "вес", равный
3. Методы получения точечных оценок
Существует много методов оценивания параметров, три наиболее широко используемые из которых мы рассмотрим. Фактически один из них - метод наименьших квадратов - мы уже использовали в предыдущей главе при оценке коэффициентов в уравнениях регрессии. Два других метода - метод максимального правдоподобия, разработанный Р.Фишером, и метод моментов, предложенный К.Пирсоном.
Метод максимального правдоподобия. Суть этого метода состоит в следующем. Пусть имеются независимые случайные величины , каждая из которых имеет плотность распределения , если мы имеем дело с непрерывными случайными величинами, либо =, если случайные величины распределены дискретно. Предполагается, что функция известна с точностью до неизвестного параметра , который и необходимо оценить по выборкам .
Рассмотрим функцию
(13)
Эта функция представляет собой случайную величину и называется функцией правдоподобия. Она получается в результате подстановки в качестве аргументов совместного распределения этих величин.
Суть метода максимального правдоподобия состоит в том, чтобы найти такое значение параметра , которое обращает в максимум для данных значений .
Так как точка максимума функции совпадает с точкой максимума функции , то бывает удобней искать требуемое значение , решая уравнение правдоподобия в виде
. (14)
При довольно общих условиях оценки максимального правдоподобия обладают желательными свойствами состоятельности, асимптотической эффективности и нормальности, хотя и не всегда бывают несмещенными.
Рассмотрим несколько примеров. Пусть производятся независимые испытания по схеме Бернулли, в каждом из которых мы имеем «успех» с одной и той же неизвестной вероятностью . Чему в этом случае равна максимально правдоподобная оценка параметра , если в результате испытаний получено «успехов» и «неудач»?
Так как в данном случае мы имеем дело с биномиальным распределением, то функция правдоподобия имеет вид
=
Логарифмируя это выражение, получим
.
Чтобы найти точку максимума этой функции , необходимо в соответствии с (14) продифференцировать ее и приравнять производную нулю:
Решением полученного уравнения является
т.е. частота «успехов», когда число испытаний неограниченно растет, является асимптотически эффективной оценкой .
Найдем максимально правдоподобные оценки параметров для плотности нормального распределения. Имеем
и
(15)
Прежде чем вычислить оценки максимального правдоподобия для , заметим, что обращение в максимум по параметру эквивалентно обращению в минимум суммы квадратов . Но это именно то условие, которое использовалось при оценке коэффициентов уравнений регрессии по методу наименьших квадратов. Таким образом, метод наименьших квадратов, являясь одним из способов оценки неизвестных параметров, представляет собой частный случай метода максимального правдоподобия, когда результаты экспериментов или наблюдений распределены нормально.
Продифференцируем (15) сначала по :
.
Приравняв правую часть нулю, получим уравнение относительно:
решая которое, найдем его корень, представляющий наиболее правдоподобную оценку
.
Следовательно для нормального распределения максимально правдоподобной оценкой для параметра является среднее арифметическое.
Продифференцируем (15) по :
.
Так как в данном случае оценка параметра нам известна, то приравняв правую часть этого уравнения к нулю и решив его относительно , получим
.
Таким образом, максимально правдоподобная оценка параметра в нормальном распределении представляет собой смещенную оценку выборочной дисперсии.
Метод моментов. Этот метод представляет собой исторически один из первых методов точечной оценки параметров распределений случайных величин. При исследовании с помощью этого метода плотности распределения вероятности, содержащей параметров , вычисляются первые моментов случайной переменной :
- для дискретного распределения и
- для непрерывного распределения,
которые затем приравниваются выборочным моментам, вычисленным из экспериментальных данных, и, таким образом, получают оценки неизвестных параметров. В отличие от метода максимального правдоподобия метод моментов не всегда приводит к эффективным оценкам, хотя и обеспечивает их состоятельность.
Приведенные выше формулы описывают начальные моменты. В частности, первый начальный момент равен среднему. Кроме них существуют и центральные моменты, определяемые, например, для непрерывного распределения как
где - математическое ожидание величины .
В качестве примеров применения метода моментов можно воспользоваться ранее полученными результатами для биномиального и нормального распределения (параграф 37.3), где фактически показано, что первые начальные моменты для биномиального и нормального распределений равны соответственно , а второй центральный момент для нормального распределения - .
Если теперь приравнять эти моменты величины X соответствующим выборочным моментам, получим для оценок следующие выражения:
;
;
Полезно знать соотношения между начальными и центральными моментами первых порядков:
Через центральные моменты могут быть выражены асимметрия () и эксцесс () распределений вероятностей случайных величин:
4. Интервальное оценивание
Различные статистики, получаемые в результате вычислений, представляют собой точечные оценки соответствующих параметров. В предыдущем параграфе указывалось, что если из генеральной совокупности извлечь некоторое количество выборок и для каждой из них найти интересующую нас статистику, то вычисленные значения будут представлять собой случайные величины, имеющие некоторый разброс вокруг оцениваемого параметра. Как правили, в результате эксперимента в распоряжении исследователя имеется одна выборка, поэтому значительный интерес представляет получение интервальной оценки, т.е. интервала, внутри которого, как можно предположить, лежит истинное значение параметра.
Для примера интервального оценивания рассмотрим как оценку . Нам известно, что если выборки извлекаются из генеральной совокупности с параметрами и , то распределение выборочных будет иметь среднее, равное , и дисперсию /n и будет приближаться к нормальному. Для такого распределения 68% наблюдений лежит в пределах одного стандартного отклонения, относительно , т.е. в пределах (стандартное отклонение выборочного распределения - не что иное, как стандартная ошибка среднего). Соответственно в пределах и лежит около 95% и 99% всех возможных значений выборочных средних. (Коэффициенты 2 и 3 взяты для упрощения. На самом деле они равны 1,96 и 2,58). Отсюда следует вывод, что если, например, 95% значений расположено внутри интервала относительно , то , где , вычислено по одной выборке из генеральной совокупности с параметрами и , дает интервал, который заключает в своих границах.
Сделанный вывод допускает и следующую формулировку: вероятность P того, что расстояние от до , измеренное в единицах стандартной ошибки, больше или меньше равна , т.е.
(16)
Поясним этот вывод. Как мы уже говорили, для выборок достаточно большого объема распределение приближается к нормальному. Следовательно, используя соответствующую таблицу площадей под кривой стандартного нормального распределения, можно определить значения , между которыми заключена интересующая нас часть площади. Оставшуюся часть площади обозначим через . В силу того, что кривая распределения симметрична, слева от -z и справа от z будет находиться по части площади стандартного нормального распределения.
Табличные значения z даны в единицах стандартного отклонения, которое для стандартизованного нормального распределения равно единице. Следовательно, чтобы найти интересующую нас часть площади 1- под кривой нормального распределения с произвольными параметрами, необходимо табличные значения умножить на величину стандартного отклонения, которое в нашем случае равна . Величина носит название доверительной вероятности, а сам доверительный интервал, т.е. интервал, внутрь которого с заданной доверительной вероятностью попадает истинное значение параметра, задается выражением
(17)
Рассмотрим пример. Пусть n=144, =49, а доверительная вероятность произвольно выбрана равной 0,91, т.е. P=1- = 0,91. Отсюда = 0,09. Из табл. П.1 Приложения видно, что доля =0,045 (или 4,5%) площади под единичной нормальной кривой лежит слева от значения z=1,7. Следовательно, Пусть среднее этой выборки равно 18,2. Тогда доверительный интервал для равен
В данном примере предполагалось, что дисперсия генеральной совокупности известна, однако на практике этого почти никогда не бывает. Поэтому вместо обычно используют, вычисленную по выборке, и вместо таблиц стандартного нормального распределения пользуются таблицами распределения Стьюдента. Более подробно об этом пойдет речь в следующей главе.
Рассмотренные принципы построения доверительных интервалов справедливы, естественно, не только для средних, но и для всех других статистик, для которых показано, что распределение их выборочных значений приближается к нормальному.
Требование нормальности является принципиальным, так как только при его выполнении имеет смысл приведенная выше процедура построения доверительных интервалов. Как правило, для большинства рассмотренных нами статистик это требование выполняется, но не для всех. В частности, нормальность выборочных коэффициентов корреляции имеет место только для случая, когда в генеральной двумерной генеральной совокупности, из которой извлекаются выборки с последующим вычислением . Для других значений распределение выборочных коэффициентов корреляции имеет большую асимметрию и не может быть аппроксимировано кривой нормального распределения.
Тем не менее интервальное оценивание возможно и в этом случае, но при использовании не самих выборочных коэффициентов корреляции, а некоторых преобразованных величин. Р.Фишером было показано, что величина
(18)
где r - выборочный коэффициент корреляции, имеет нормальное распределение со средним равным и стандартным отклонением (здесь и в дальнейшем для простоты индекс "xy" у коэффициента корреляции опущен).
Рассмотрим пример построения доверительного интервала для r с использованием z-преобразования Фишера.
Пусть число пар значений, по которым вычислялся r, равно 12, а само полученное значение равно 0,79. Необходимо построить доверительный интервал для r, который с доверительной вероятностью P=0,95 накрывал бы истинное значение параметра .
Преобразуем r в и из табл. П4.6 Приложения для r=0,79 имеем z=1,07. Преобразованная величина , как уже было сказано выше, имеет нормальное распределение со стандартным отклонением . Так как , то доверительный интервал для будет равен
Теперь, вновь используя таблицу z-преобразования, можно прейти к значениям r. Доверительные пределы для коэффициента корреляции будут приближенно равны (0,396; 0,938).
В заключение этого параграфа приведем формулы для стандартных ошибок некоторых статистик и те условия, при выполнении которых распределения выборочных значений этих статистик приближаются к нормальным, и, следовательно, для них можно строить доверительные интервалы по описанным выше правилам.
1. Медиана (Md) -
Здесь n - число значений в выборке, - стандартное отклонение генеральной совокупности. Формула справедлива, если генеральная совокупность симметрична, а .
2. Стандартное отклонение -
Распределение выборочных стандартных отклонений близко к нормальному, когда и исходная генеральная совокупность нормальна.
3. Коэффициент вариации (cv) -
.
Вторым сомножителем в этом выражении можно ввиду его малости пренебречь, тогда . Ограничения те же, что и для стандартного отклонения.
4. Коэффициенты регрессии (a и b) -
,
где - стандартное отклонение зависимой переменной y, которая должна иметь обязательно нормальное распределение с параметром для всех значений независимой переменной x.
5. Пусть генеральная совокупность состоит из объектов исследования двух видов, где объекты понимаются в обобщенном смысле. Это может быть популяция, в самом деле состоящая из особей обоих полов, либо признак, принимающий одно из двух возможных значений, и т.д. Другими словами, пусть мы имеем дело с дихотомической случайной переменной, в которой доля объектов вида A представляет собой величину , где и n - соответственно число объектов вида A и общее число объектов. Для такого случая показано, что стандартная ошибка доли p для выборки равна
,
где в данном случае через обозначена доля объектов одного из двух видов в генеральной совокупности.
5. Проверка статистических гипотез
Этот параграф требует к себе особого внимания. Только хорошо разобравшись в его содержании, исследователь сможет осознано, а не механически использовать многочисленные критерии для проверки статистических гипотез, критически оценивать использование этих критериев в работах других ученых, а также получит необходимый минимум сведений, позволяющий ему продолжить изучение вопросов, связанных с проверкой статистических гипотез, по более продвинутым в математическом плане курсам.
Итак, после проведения эксперимента в распоряжении исследователя оказывается некоторое множество значений измеренных показателей, и возникает вопрос, какие выводы о свойствах генеральной совокупности можно сделать по этим выборочным наблюдениям. Первым шагом в решении поставленной задачи может быть вычисление различных статистик и построение для них доверительных интервалов по методике, обсуждавшейся в предыдущих параграфах. Вторым обязательным шагом является проверка выдвигаемых статистических гипотез.
Нужно четко представлять себе разницу между гипотезой в обычном понимании и гипотезой статистической.
Статистическая гипотеза - это любое предположение относительно распределения наблюдаемых случайных величин, в то время как в других областях знаний гипотеза - предположительное суждение о закономерной, причинной связи явлений.
Мы не будем здесь более подробно касаться интересных и важных методологических вопросов, с которыми можно познакомиться в рекомендуемой литературе, а перейдем к фактическому изложению подходов к проверке статистических гипотез.
Пусть, например, при изучении взаимосвязи между двумя переменными получена выборка из двумерной генеральной совокупности и рассчитан коэффициент корреляции. Будем считать, что эта выборка достаточно представительна (репрезентативна), т.е. хорошо отражает свойства всей генеральной совокупности. Имея в своем распоряжении выборочный коэффициент корреляции r, исследователь выдвигает статистическую гипотезу о том, что коэффициент корреляции генеральной совокупности равен какому-то значению, например, нулю. Формально это записывается так: H: =0. (Здесь и в дальнейшем буквой H обозначается статистическая гипотеза.) Процедура, которая будет использоваться для принятия решения об истинности или ложности сформулированной статистической гипотезы, называется проверкой гипотезы. Итак, если вычисленное значение 0 , значит ли это, что H ошибочна?
Мы уже знаем, что выборочные значения различных статистик, в том числе и коэффициента корреляции, представляют собой случайные величины, имеющие порой довольно большой разброс, поэтому даже в том случае, когда =0, вычисленные по выборке значения могут существенно отличаться от нуля. Следовательно (и это зависит от объема выборки), утверждать с уверенностью по полученному значению r , равен или неравен нулю, исследователь не может. Эти соображения составляют один из основных принципов, лежащих в основе проверки статистических гипотез: при проверке любой статистической гипотезы решение никогда не принимается с абсолютной уверенностью, всегда существует риск принятия неправильного решения. Именно в контроле и оценке этого риска состоит сущность проверки статистических гипотез.
Мы уже говорили о том, что если выборочные значения представляют собой случайные величины, то возможно получение любого значения в нашем случае для коэффициента корреляции в диапазоне 1. Однако некоторые значения более, а другие менее вероятны. В частности, выборочное распределение коэффициентов корреляции для выборок объемом 100 (рис. 13) показывает, что, если в генеральной совокупности = 0.1, получение выборочных значений, например, =0.4 или =-0.2, весьма маловероятно, хотя полностью их исключить нельзя.
Какой вывод можно из этого сделать? Пусть, например, получено выборочное значение =0.5. С одной стороны, такое значение должно способствовать отклонению гипотезы H: =0 ввиду ничтожной вероятности его появления, если истинное значение коэффициента корреляции в самом деле равно 0,1. Эта вероятность конечно же очень мала, но все-таки не равна нулю. С другой стороны, истинное значение в генеральной совокупности на самом деле нам неизвестно. А если, например =0.3 ? В этом случае появление выборочного значения =0.5 не такое уж маловероятное событие. А какое-то решение принимать надо. И здесь мы сталкиваемся с еще некоторыми понятиями, составляющими основу теории проверки статистических гипотез. Речь идет о так называемых ошибках первого и второго рода.
Вернемся к нашему примеру. Если в самом деле = 0 и выдвинута гипотеза H: = 0 , но получив значение r = 0.5 , мы ее отвергаем (а сделать это можно, поскольку и такое значение, хотя и очень редко, может появиться), возникает ошибка первого рода.
Пусть выдвинута та же гипотеза H: = 0 , в то время как истинное значение в генеральной совокупности равно, например, -0.3, и мы, получив значение r = 0.12, примем ее, появляется ошибка второго рода .
Таким образом, при проверке статистических гипотез существует четыре возможности:
1. H верна, и она принимается.
2. H верна, но она отвергается (ошибка первого рода).
3. H неверна, и она отвергается.
4. H неверна, но она принимается (ошибка второго рода).
Ошибки первого и второго рода существенно различаются между собой по значимости, и это оказывает большое влияние на всю процедуру проверки статистических гипотез.
Здесь необходимо еще раз подчеркнуть, что никакая гипотеза не может быть окончательно принята или отвергнута. Поэтому используемые в дальнейшем довольно категорические утверждения “принять” и “отвергнуть” являются просто условными сокращениями выражений вида “опытные данные не противоречат выдвинутой гипотезе” и “опытные данные противоречат выдвинутой гипотезе”.
Прежде чем перейти к дальнейшему изложению, сформулируем основные этапы проверки статистических гипотез.
1. Формулируется проверяемая гипотеза, например, H: = 0. В силу исторической традиции проверяемая гипотеза носит название нуль-гипотезы.
2. Делаются некоторые предположения относительно выборочного распределения статистики, с помощью которой планируется оценивать параметр, входящий в гипотезу.
3. Принимается степень риска отвергнуть выдвинутую гипотезу, если она верна. Этот риск называется уровнем значимости проверки гипотезы и выражается как вероятность. Из определения уровня значимости следует, что его величина определяет уровень ошибки первого рода. Уровень значимости определяет также критические области, т.е. области, попадание в которые выборочного значения статистики, оценивающей параметр, приводит к отвержению сформулированной гипотезы. Критические области и область принятия гипотезы для H : = 0 и = 0.05.
4. Извлекается выборка, рассчитывается значение интересующей нас статистики, определяется в какую область, критическую или допустимую, она попала, и на основании этого принимается решение о относительно истинности H . Решение принимается с использованием критерия для проверки статистической гипотезы, который представляет собой правили для определения ложности или истинности в выдвинутой гипотезы.
Уровнем значимости, а значит, и вероятностью ошибки первого рода можно управлять. В самом деле, в принципе мы можем установить любую приемлемую для нас степень риска для неправильного вывода на основе выборочных данных об ошибочности выдвинутой гипотезы. Поэтому на первый взгляд кажется целесообразным выбирать уровень значимости как можно меньшим, так как в этом случае вероятность отвергнуть правильную гипотезу будет минимальной. Однако сформулировав проверяемую гипотезу, мы не знаем, верна ли она. Поэтому уменьшение вероятности ошибки первого рода автоматически будет приводить к увеличению вероятности ошибки второго рода. Поясним это на примере.
Обозначим нуль-гипотезу о том, что = 0, через , а альтернативную ей гипотезу - . Предположим, что на самом деле истинное значение =0.20 и извлекается выборка объемом n=200. Кривые представляют собой распределения выборочных коэффициентов корреляции для генеральных совокупностей с = 0 и = 0.20. Если выбрать уровень значимости = 0.05, то в случае истинности появление выборочных значений, больших 0.14 или меньших -0.14, возможно только в пяти случаях из ста, и для таких значений гипотеза будет отвергаться. Все же остальные значения r, попадающие в интервал (-0.14; 0.14), будут приводить к принятию . Но что будет, если на самом деле =0.20? Тогда нуль-гипотезу следовало бы отклонить в пользу альтернативной гипотезы , и это будет делаться для значений r > 0.14 (область со штриховкой).
. Площадь этой заштрихованной области численно равна вероятности отвергнуть неправильную гипотезу, а сама эта вероятность носит название мощности выбранного критерия, в данном случае критерия =0.20.
С другой стороны, если мы приняли , в то время как справедлива , такие значения, как r=0.1, будут свидетельствовать в пользу этой неправильной гипотезы, т.е. будет совершаться ошибка второго рода. Из рисунка видно, что площадь под кривой 2, соответствующая выборочным значениям r < 0.14 и перекрывающаяся с областью принятия гипотезы довольно значительна (в данном случае она равна 18%).
Поэтому и вероятность принять неправильную гипотезу о том, что =0, численно равная этой площади, тоже велика. При этом мы видим, что если уровень значимости выбрать еще меньше, то вероятность ошибки второго рода еще больше возрастает, а мощность критерия - уменьшается.
Таким образом, становится ясно, что уровень значимости и мощность критерия связаны между собой, причем связь эта нелинейная. Поэтому произвольно по нашему усмотрению изменять уровень значимости нельзя, так как неоправданное уменьшение ошибки первого рода может привести к существенной потере мощности критерия для проверки статистической гипотезы.
Наиболее часто в статистической практике используются уровни значимости =0.05 и =0.01, потому что они обеспечивают разумный компромисс между ошибками первого и второго рода. Но абсолютизировать эти уровни значимости нельзя. Вообще приемлемый уровень значимости выбирать необходимо сообразуясь с условиями решаемой исследовательской задачи.
Рассмотрим два примера. Пусть испытывается вновь созданный лекарственный препарат, действие которого направлено на поддержание некоторого существенного для жизни показателя в определенных пределах. Испытывая этот препарат, можно, например, выдвинуть гипотезу, что он в самом деле удерживает среднее значение показателя в нужных пределах. И если был выбран уровень значимости =0 .05, то в случае справедливости выдвинутой гипотезы она будет отвергаться в одном случае из двадцати. Но если гипотеза неверна, то при таком уровне ошибки первого рода ошибка второго рода будет достаточно высока, а это значит, что мы можем принять неправильную гипотезу во многих случаях, когда препарат не выполняет своих функций. Естественно, что это недопустимо, когда речь идет о здоровье или жизни людей. Поэтому в этих случаях нужно выбирать уровень значимости по крайней мере =0.10 или даже еще больше, чтобы свести риск принятия неправильной гипотезы к минимальному значению.
Правда, при этом мы значительно чаще будем отвергать правильную гипотезу, и возможно, что для ее окончательной проверки понадобится провести значительно больше экспериментов. Это будет, конечно, связано с дополнительными затратами сил и средств, но в случаях, аналогичных вышеприведенному, эти соображения всегда должны отодвигаться на второй план.
С другой стороны, может встретится прямо противоположная ситуация, когда уровень значимости нужно выбирать меньше даже, чем 0.01. Это может потребоваться в тех случаях, когда проверяются статистические гипотезы о некоторых параметрах, выборочные статистики для которых получаются при проведении экспериментов, направленных на поиск новых эффектов, предсказываемых теорией, или связанных с использованием уникального оборудования. В этих случаях экспериментатору очень важно не упустить эффект, если он есть. Поэтому он может предусмотреть, чтобы выдвигаемая им и, как он считает, правильная гипотеза отвергалась не более чем в одном случае из тысячи. При этом экспериментатор должен отдавать себе полный отчет в том, что существенно возрастает ошибка второго рода, т.е. вероятность принять выдвигаемую гипотезу, даже если она неверна, со всеми вытекающими отсюда последствиями.
В заключение заметим, что, варьируя уровень значимости и число наблюдений n, можно в каждом конкретном случае выбрать разумный компромисс между и мощностью критерия , помня при этом, что мощность критерия для проверки статистической гипотезы возрастает с увеличением n и .
Размещено на Allbest.ur
...Подобные документы
Общее понятие про гипотезы, их классификация. Выбор и основные принципы расчета критериев для проверки статистических гипотез. Проверка гипотезы о законе распределения генеральной совокупности с использованием функции Лапласа, критерия Фишера-Снедекора.
курсовая работа [2,6 M], добавлен 01.04.2011Порядок проведения проверки статистических гипотез. Проверка однородности результатов эксперимента в целях исключения грубых ошибок. Расчет теоретических частот для нормального распределения. Уравнение линейной регрессии и метод наименьших квадратов.
курсовая работа [349,5 K], добавлен 09.01.2011Анализ этапов проверки статистических гипотез. Сравнение центров распределений. Концепция объектно-ориентированного программирования. Проверка неразличимости дисперсий с помощью критерия Кохрена. Определение границ существования математического ожидания.
курсовая работа [793,5 K], добавлен 16.05.2013Способы сбора и группировки статистических сведений, полученных в результате наблюдений или экспериментов. Методы анализа статистических данных в зависимости от целей исследования. Проверка статистических гипотез, оценка неизвестной вероятности события.
курсовая работа [172,8 K], добавлен 15.11.2009Нахождение доверительных интервалов с помощью функции Лапласа и критериев распределения Стьюдента: сравнение средних выборок; корреляция случайных величин. Метод наименьших квадратов: построение модели; расчет доверительных интервалов для коэффициентов.
презентация [109,2 K], добавлен 30.07.2013Графическое представление данных. Определение основных статистических характеристик исходных данных. Применение центральной предельной теоремы. Построение доверительных интервалов. Репрезентативность выборки и ее проверка. Цепные и базисные индексы.
отчет по практике [2,3 M], добавлен 25.09.2015Проверка гипотезы о равенстве дисперсий двух генеральных совокупностей. Критерий Фишера-Снедекора. Сравнение выборочной средней с гипотетической генеральной средней нормально распределенной совокупности. Построение теоретического закона распределения.
курсовая работа [96,2 K], добавлен 17.11.2014Получение выборки объема n-нормального распределения случайной величины. Нахождение числовых характеристик выборки. Группировка данных и вариационный ряд. Гистограмма частот. Эмпирическая функция распределения. Статистическое оценивание параметров.
лабораторная работа [496,0 K], добавлен 31.03.2013Изучение и оценка коэффициентов и уравнения линейной регрессии показателей грузоперевозок по РБ за 2011-2012 гг. Проверка гипотез о значениях коэффициентов регрессии, построение доверительных интервалов, анализ статистической однородности и независимости.
курсовая работа [773,3 K], добавлен 23.10.2012Группировка организаций по степени износа основных фондов в виде интервалов. Расчет среднего значения, модального и медианного значения ряда. Форма распределения на основе показателей асимметрии и эксцесса. Определение степени однородности распределения.
контрольная работа [341,6 K], добавлен 07.12.2016Комбинаторный метод вычисления вероятностей. Понятие случайных величин. Характеристики положения и рассеивания. Закон больших чисел. Центральная предельная теорема. Статистическое оценивание характеристик распределения генеральной совокупности по выборке.
учебное пособие [554,6 K], добавлен 15.06.2015Понятие статистических рядов распределения и их виды: атрибутивные и вариационные. Графическое изображение статистических данных: расчет показателей вариации, моды и медианы. Анализ группы предприятий по признакам Товарооборот и Средние товарные запасы.
курсовая работа [498,5 K], добавлен 09.01.2011Основы статистического контроля качества продукции. Типовые расчеты по курсу теории вероятностей: построение закона распределения и расчет основных характеристик непрерывной случайной величины. Интервальное оценивание параметров генеральной совокупности.
контрольная работа [1,2 M], добавлен 21.01.2016Изучение свойств расположения статистических групп и понятие статистической совокупности. Определение состава показателей для измерения структуры совокупности, обобщающие индексы сравнения. Статистическая проверка гипотез и эмпирическое распределение.
лекция [290,8 K], добавлен 27.04.2013Понятие и виды статистической группировки, производимой с целью установления статистических связей и закономерностей, выявления структуры изучаемой совокупности. Построение интервального ряда распределения предприятий по признаку "торговая площадь".
дипломная работа [1,6 M], добавлен 14.02.2016Основные принципы работы в MathCAD. Типовые статистические функции. Функции вычисления плотности распределения вероятности. Функции и квантили распределения. Функции создания векторов с различными законами распределения. Функции для линейной регрессии.
курсовая работа [684,3 K], добавлен 19.05.2011Статистическое наблюдение. Понятие и содержание статистической сводки. Группировка – основа статистической сводки. Статистические ряды распределения. Осуществление конкретной аналитической группировки. Табличное представление статистических данных.
курсовая работа [172,8 K], добавлен 22.12.2010Проверка гипотез о равенстве систематических погрешностей. Минимизация издержек исследований. Определение максимального значения выходной величины исследуемого процесса. Определение наиболее оптимального выбора стратегии проведения исследований.
курсовая работа [736,3 K], добавлен 31.01.2015Оформление результатов сводки и группировки материалов статистического наблюдения в виде рядов распределения (атрибутивных и вариационных). Расчет средних величин и показателей вариации, моды и меридианы. Графическое изображение статистических данных.
контрольная работа [226,8 K], добавлен 31.07.2011Сбор и регистрация исходных статистических данных. Расчет числовых характеристик экспериментальных данных. Проверка согласия опытного распределения с теоретическим нормальным. Построение и анализ контрольных карт средних арифметических и размахов.
курсовая работа [244,9 K], добавлен 04.04.2014