Применение метода Монте-Карло при изучении свойств статистических критериев однородности двух независимых выборок
Результаты изучения свойств критериев однородности двух независимых выборок в случаях функций нормального распределения и распределения Вейбулла-Гнеденко с одинаковыми и различными значениями параметров. Проверка равенства математических ожиданий.
Рубрика | Экономико-математическое моделирование |
Вид | статья |
Язык | русский |
Дата добавления | 26.01.2020 |
Размер файла | 53,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Применение метода Монте-Карло при изучении свойств статистических критериев однородности двух независимых выборок
Орлов Александр Иванович д.э.н., д.т.н., к.ф.-м.н., профессор Московский государственный технический университет им. Н.Э. Баумана
Аннотация
К инструментальным методам экономики относится метод Монте-Карло (метод статистических испытаний). Он широко используется при разработке, изучении и применении математических методов исследования в эконометрике, прикладной статистике, организационно-экономическом моделировании, при разработке и принятии управленческих решений, является основой имитационного моделирования. Разработанная нами новая парадигма математических методов исследования опирается на применение метода Монте-Карло. В математической статистике для многих метолов анализа данных получены предельные теоремы об асимптотическом поведении рассматриваемых величин при безграничном росте объемов выборок. Следующий шаг - изучение свойств этих величин при конечных объемах выборок. Для такого изучения применяют метод Монте-Карло.
В настоящей статье этот метод применяем для изучения свойств статистических критериев проверки однородности двух независимых выборок. Рассмотрены наиболее используемые при анализе реальных данных критерии - Крамера-Уэлча, совпадающий при равенстве объемов выборок с критерием Стьюдента; Лорда, Вилкоксона (Манна-Уитни), Вольфовица, Ван-дер-Вардена, Смирнова, типа омега-квадрат (Лемана-Розенблатта). Метод Монте-Карло позволяет оценить скорости сходимости распределений статистик критериев к пределам, сравнить свойства критериев при конечных объемах выборок. Для применения метода Монте-Карло необходимо выбрать функции распределения элементов двух выборок. Для этого использованы нормальные распределения и распределения Вейбулла-Гнеденко.
Получена рекомендация: для проверки гипотезы совпадения функций распределения двух выборок целесообразно использовать критерий Лемана-Розенблатта типа омега-квадрат. Если есть основания предполагать, что распределения отличаются в основном сдвигом, то можно использовать также критерии Вилкоксона и Ван-дер-Вардена. Однако даже в этом случае критерий типа омега-квадрат может оказаться более мощным. В общем случае, кроме критерия Лемана-Розенблатта, допустимо применение критерия Смирнова, хотя для этого критерия реальный уровень значимости может значительно отличаться от номинального. Оценены частоты расхождений статистических выводов по разным критериям
Ключевые слова: инструментальные методы экономики, эконометрика, прикладная статистика, метод статистических испытаний, метод Монте-Карло, датчики псевдослучайных чисел, критерии проверки статистических гипотез, однородность двух независимых выборок, критерий Крамера-Уэлча, критерий Лорда, критерий Вилкоксона, критерий Ван-Дер-Вардена, критерий Смирнова, критерий Лемана-Розенблатта
Abstract
The instrumental methods of economics include the Monte Carlo method (statistical simulations method). It is widely used in the development, study and application of mathematical research methods in econometrics, applied statistics, organizational and economic modeling, in the development and making management decisions, in the basis of simulation modeling. The new paradigm of mathematical research methods developed by us is based on the use of the Monte Carlo method. In mathematical statistics, limit theorems on the asymptotic behavior of the considered random values were obtained for many methods of data analysis with an unlimited increase in sample volumes.
The next step is to study the properties of these random values for finite sample sizes. For such a study, the Monte-Carlo method is used. In this article, we use this method to study the properties of statistical criteria for testing the homogeneity of two independent samples. We considered the most used in the analysis of real data criteria - Cramer-Welch, which coincides with the equality of the sample sizes with Student's criterion; Lord, Wilcoxon (Mann-Whitney), Wolfowitz, Van der Waerden, Smirnov, type omega-square (Lehmann-Rosenblatt). The Monte Carlo method allows us to estimate the rates of convergence of distributions of criteria statistics to the limits, to compare the properties of the criteria for finite sample sizes. To use the Monte Carlo method, it is necessary to select the distribution functions of the elements of the two samples. For this purpose, normal and Weibull - Gnedenko distributions are used.
The recommendation was received: to test the hypothesis of coincidence of distribution functions of two samples, it is advisable to use the Lehmann-Rosenblatt (type omega-square) test. If there is reason to assume that the distributions differ mainly by the shift, then the Wilcoxon test and Van der Waerden criteria can also be used. However, even in this case, the omega-square type test may be more powerful. In the general case, besides the Lehmann-Rosenblatt criterion, the use of the Smirnov criterion is permissible, although for this criterion the real level of significance may differ from the nominal level of significance. We sstudied the frequency of discrepancies of statistical findings on different criteria
Keywords: instrumental methods of economics, econometrics, applied statistics, statistical simulations method, monte-carlo method, pseudo-random number generators, criteria for testing statistical hypotheses, homogeneity of two independent samples, Cramer-Welch test, Lord test,Wilcoxon test, Van Der Waerden test, Smirnov test, Lehmann-Rosenblatt test
1. Новая парадигма математических методов исследования
Среди математических и инструментальных методов экономики важное место занимают метод статистических испытаний (Монте-Карло). Он широко используется при разработке, изучении и применении математических методов исследования в эконометрике, прикладной статистике, организационно-экономическом моделировании, при разработке и принятии управленческих решений.
В развитии математических методов исследования выделяем два важных периода [1]. Первый - начало ХХ в., когда были разработаны базовые положения современной математической статистики, сформулированы основные идеи таких ее разделов, как описание данных, оценивание параметров, проверка статистических гипотез. Эти идеи легли в основу учебников, используемых и в настоящее время. Наряду с рациональными приемами анализа данных продолжают пропагандироваться устаревшие воззрения, например, основанные на использовании параметрических семейств распределений вероятностей, в то время как установлено, что практически все распределения реальных данных ненормальны и не описываются с помощью иных семейств распределений вероятностей.
Второй период - с 1980-х годов по настоящее время. Усилиями сотен исследователей разработана новая парадигма прикладной статистики [2]. Фактически речь идет о новой парадигме математических методов исследования [3]. В соответствии с новой парадигмой заложены основы математики XXI в. - системной нечеткой интервальной математики [4]. На первое место вышла статистика нечисловых данных. Так, за десять лет (2006 - 2015) ей посвящены 27,6% всех публикаций раздела "Математические методы исследования" журнала "Заводская лаборатория. Диагностика материалов", т.е. 63,0% статей по прикладной статистике [5].
Новая парадигма математических методов исследования опирается на эффективное применение информационно-коммуникационных технологий как при расчете характеристик методов анализа данных, так и при имитационном моделировании. Датчики псевдослучайных чисел лежат в основе многих современных технологий анализа данных. Эти эффективные инструменты исследователя внутренне противоречивы - в них с помощью детерминированных алгоритмов получаем последовательность чисел, обладающих многими свойствами случайных величин. Поэтому свойства таких инструментов требуют тщательного изучения.
2. Метод статистических испытаний - инструмент исследователя
Для решения конкретных прикладных задач исследователи постоянно разрабатывают новые методы обработки статистических данных - результатов измерений (наблюдений, испытаний, анализов, опытов) и экспертных оценок. Свойства каждого вновь предлагаемого метода необходимо изучить. Какие интеллектуальные инструменты можно применить для такого изучения?
Мощным инструментом исследователей в области математической статистики являются предельные теоремы теории вероятностей - закон больших чисел, центральная предельная теорема и т.п. Некоторые ориентированные на математику специалисты призывают ими и ограничиться. Однако для практического использования статистических методов предельных теорем недостаточно. Необходимо найти границу - выяснить, начиная с какого объема выборки можно пользоваться результатами, полученными с помощью предельных теорем. И выяснить, как принимать решения, если объем имеющихся данных меньше этой границы.
С середины ХХ в. исследователю доступна универсальная "отмычка" - метод статистических испытаний (метод Монте-Карло), другими словами, имитационное моделирование. Он основан на использовании последовательности псевдослучайных чисел, свойства которых напоминают свойства рассматриваемых в теории вероятностей случайных величин. Основная идея состоит в последовательном выполнении следующих этапов: (1) разработке вероятностно-статистической модели реального явления или процесса; (2) планировании статистического испытания, в котором случайные величины заменяются псевдослучайными, полученными с помощью того или иного датчика псевдослучайных чисел; (3) проведении большого числа испытаний (тысяч или миллионов); (4) анализе полученных результатов расчетов.
С каждым этапом связаны соответствующие проблемы адекватности имитационного моделирования. Так, для предельных теорем обычно справедлив тот или иной принцип инвариантности, т.е. в пределе исчезает зависимость от конкретного вида распределения. Однако при изучении скорости сходимости выбор этого конкретного вида весьма важен, поскольку от него зависит итоговый результат статистического моделирования - один для нормального распределения, другой - для логистического, третий - для распределения Коши...
Датчики псевдослучайных чисел лишь имитируют случайность. Алгоритмы получения псевдослучайных чисел имеют достаточно короткое описание, в то время как по определению А.Н. Колмогорова 60-х годов (в рамках теории информации) описание случайной последовательности должно расти пропорционально длине этой последовательности [6]. Кроме этой глобальной причины методологической несостоятельности датчиков псевдослучайных чисел есть и частные недостатки. Например, у некоторых популярных до настоящего времени датчиков три последовательных значения связаны линейной зависимостью.
Значения, рассчитанные с помощью метода Монте-Карло, имеют погрешности, определяемые конечностью числа испытаний. При оценивании вероятности события погрешность достигает величины , где N - число испытаний. Значит, для оценивания вероятности с точностью 10-6 необходимо 1012 / 4 испытаний. На практике провести такое количество испытаний невозможно.
3. Дискуссия о современном состоянии и перспективах развития статистического моделирования
Проблемы теории и практики статистических испытаний (Монте-Карло) заслуживают тщательного обсуждения. В 2016 г. журнал "Заводская лаборатория. Диагностика материалов" начал дискуссию о современном состоянии и перспективах развития статистического моделирования, т.е. теории и практики применения метода статистических испытаний (Монте-Карло), различных вариантов имитационного моделирования. Предыдущая дискуссия о свойствах таких датчиков была проведена в журнале "Заводская лаборатория. Диагностика материалов" в 1985 - 1993 гг.
"Затравкой" дискуссии послужили статьи [7] и [8]. В первой из них рассмотрены задачи повышения эффективности вычислений методом Монте-Карло. Отмечено, что ключевую роль в их решении играют вопросы выбора объема статистических испытаний (количества моделируемых случайных чисел), а также качества соответствующих датчиков случайных чисел. Обсуждены проблемы реализации алгоритмов методов Монте-Карло, обусловленные требованиями повышения скорости сходимости асимптотических решений к истинным решениям.
В статье [8] констатируется, что цель прикладной математической статистики - разработка методов анализа данных, предназначенных для решения конкретных прикладных задач. С течением времени подходы к разработке таких методов менялись. Сто лет назад принимали, что распределения данных имеют определенный вид, например, являются нормальными, и исходя из этого предположения развивали статистическую теорию. На следующем этапе на первое место в теоретических исследованиях выдвинулись предельные теоремы. Под «малой выборкой» понимают такую выборку, для которой нельзя применять выводы, основанные на предельных теоремах. В каждой конкретной статистической задаче возникает необходимость разделить конечные объемы выборки на два класса: для одного можно применять предельные теоремы, а для другого делать этого нельзя из-за риска получения неверных выводов. Для выбора границы часто используют метод Монте-Карло (статистических испытаний). Более сложные проблемы возникают при изучении влияния на свойства статистических процедур анализа данных тех или иных отклонений от исходных предположений. Такое влияние также часто изучают, используя метод Монте-Карло. Основная и пока не решенная в общем виде проблема при изучении устойчивости выводов при наличии отклонений от параметрических семейств распределений состоит в том, какие распределения использовать для моделирования. Сформулированы и другие нерешенные проблемы.
Подборка из трех статей опубликована в мартовском номере 2017 г. О.И. Кутузов и Т.М. Татарникова [9] рассмотрели две задачи, обусловленные особенностями применения имитационного моделирования при исследовании сложных технических систем. Одна из них связана с реализацией подхода к повышению эффективности метода Монте-Карло при моделировании редких событий: сочетание расслоенной выборки с равновзвешенным моделированием позволяет значительно ускорить алгоритмический анализ моделей стохастических систем методом имитации. Решение другой задачи выявило проблему, связанную с неадекватностью использования одного и того же датчика псевдослучайных чисел при сопоставлении выборочных значений очередей, полученных на имитационных моделях фрактальной и классической систем массового обслуживания.
И.З. Аронов и О.В. Максимова [10] представили результаты статистического моделирования, характеризующие зависимость времени достижения консенсуса от числа членов технических комитетов по стандартизации (ТК) и их авторитарности. Использована математическая модель обеспечения консенсуса в работе ТК, основанная на модели, предложенной Де Гроотом. Проведен анализ основных проблем достижения консенсуса при разработке консенсусных стандартов в условиях предложенной модели. Показано, что увеличение числа экспертов ТК и их авторитарности негативно влияет на время достижения консенсуса и способствует разобщенности группы.
В комментарии [11] к этой статье проанализировано соотношение консенсуса и истины. Работа технических комитетов по стандартизации - одна из форм экспертных процедур, поэтому ее целесообразно рассматривать в рамках теории и практики экспертных оценок. Тогда проблема консенсуса - это проблема согласованности мнений членов комиссии экспертов. Однако цель работы экспертной комиссии - не достижение согласованности экспертов (консенсуса), а получение (в качестве коллективного мнения) выводов, отражающих реальность, обычно нацеленных на выработку обоснованных управленческих решений, короче говоря, на получение истины. Наблюдаем объективное противоречие между стремлением к выявлению истины и желанием обеспечить консенсус.
Итоги первого этапа дискуссии подведены в [12]. Продолжают публиковаться статьи, посвященные применению метода статистических испытаний (Монте-Карло) для решения различных задач. Так, М.С. Жуков применяет его для изучения свойств алгоритмов нахождения медианы Кемени как итогового мнения комиссии экспертов [13], а И.В. Гадолина и Н.Г. Лисаченко - при разработке метода построения доверительных интервалов для процентилей случайной выборки прочности композитов [14]. Столь интересно начатая дискуссия заслуживает продолжения и расширения круга обсуждаемых проблем.
4. Статистические критерии проверки однородности двух независимых выборок
Обсудим применение метода статистических испытаний для изучения свойств статистических критериев проверки однородности двух независимых выборок.
Исходные данные - две выборки x1, x2,...,xm и y1, y2,...,yn (т. е. наборы из m и п действительных чисел), требуется проверить их однородность.
В общепринятой модели x1, x2, ..., xm - независимые одинаково распределенные случайные величины с функцией распределения F(x), а y1, y2, ..., yn- также независимые одинаково распределенные случайные величины, но с, вообще говоря, другой функцией распределения G(x).
Разделяют однородность характеристик (равенство математических ожиданий, или медиан, или дисперсий и т.п.) и однородность (совпадение) функций распределения (абсолютную однородность). Во втором случае речь идет о проверке нулевой гипотезы:
H0 : F(x)=G(x) при всех х.
Отсутствие однородности означает, что верна альтернативная гипотеза, согласно которой
H1 : F(x0)G(x0) хотя бы при одном значении аргумента x0.
Если гипотеза H0 принята, то выборки можно объединить в одну, если нет - то нельзя.
Рассмотрим следующие статистические критерии, предназначенные для проверки однородности двух независимых выборок.
(1) Критерий Крамера-Уэлча T, совпадающий при равенстве объемов выборок (m = n) с критерием Стьюдента t [15].
(2) Критерий Лорда, или модифицированный t-критерий [16, табл.3.10, с.42] со статистикой
.
(3) Критерий Вилкоксона (Манна-Уитни) ([16, табл.6.8, с.94]. [17]), основанный на статистике U - сумме рангов элементов первой выборки в общем вариационном ряду.
(4) Критерий Вольфовица (серий) V, основанный на количестве серий в общем (объединенном) вариационном ряду (серия - часть последовательности, состоящая из элементов одной выборки) и разобранный в [16, табл.6.7].
(5) Критерий Ван-дер-Вардена [16, табл.6.9], основанный на статистике
,
где - ранг i-го элемента первой выборки в общем вариационном ряду, - функция, обратная к функции стандартного нормального распределения .
(6) Критерий Смирнова [16, 18], основанный на статистике
,
где - эмпирическая функция распределения, построенная по первой выборке, а - эмпирическая функция распределения, построенная по второй выборке.
(7) Критерий типа омега-квадрат [16, 18], предложенный Леманом [19] изученный впервые Розенблаттом [20], а потому называемый критерием Лемана-Розенблатта. Этот критерий основан на статистике
,
где - эмпирическая функция распределения, построенная по объединенной выборке.
За пределами перечня остались многие критерии - хи-квадрат [21], Сэвиджа [22], знаков [23], основанные на последовательных рангах [24] и другие.
5. Постановка задачи изучения статистических критериев методом статистических испытаний
С помощью вычислительных экспериментов по изучению свойств критериев однородности двух выборок можно выяснить, при каких объемах выборок можно пользоваться предельными распределениями. Ясно, что ответ определяется заданной исследователем точностью (максимально возможным отклонением допредельного распределения от предельного на заданном отрезке или на всей прямой). Можно сравнивать критерии по мощности при тех или иных конкретных альтернативах (например, альтернативах сдвига или масштаба). Представляет интерес анализ "корреляции" критериев на основе изучения доли совпадающих решений по результатам проверки статистических гипотез с помощью этих критериев (эта задача допускает несколько вариантов постановок - можно сравнивать критерии при фиксированном уровне значимости, например, 0,05, можно использовать несколько уровней значимости, можно установить связь между достигаемыми уровнями значимости, ...).
Поскольку статистики ранговых критериев принимают лишь конечное число значений, то их распределения дискретны. Поэтому они "проскакивают" обычно используемые в таблицах [16, 23] номинальные уровни значимости - 0,01; 0,05; 0,1 и др. Особенно существенным это обстоятельство оказывается для статистик, принимающих небольшое число значений, таких, как статистика Смирнова: реальный уровень значимости статистического критерия может быть в несколько раз меньше номинального - например, равняться 0,02 вместо 0,05 [21, 25]. Сравнение непараметрических критериев затрудняется тем, что по указанной причине невозможно обеспечить совпадение их уровней значимости. Казалось бы, можно использовать рандомизированные критерии. Однако использование таких критериев не соответствует большинству практических задач, в которых проверяется однородность двух конкретных выборок, в то время как рандомизированные критерии нацелены на обработку большого числа однотипных выборок фиксированных объемов.
Таким образом, многообразие перспективных вычислительных экспериментов обширно. Для обеспечения изучения свойств различных критериев проверки гипотез однородности нами совместно с Ю.Э. Камнем и Я.Э. Камнем разработан программный продукт, состоящий из четырех блоков: генерации равномерно распределенных на [0; 1] псевдослучайных чисел; вычисления на их основе псевдослучайных чисел с заданными законами распределения; блока расчета значений статистик критериев и блока сервисных и управляющих программ.
При моделировании использовался датчик равномерно распределенных на множестве псевдослучайных чисел [26], построенный на основе рекуррентной формулы
(1)
Тестирование [27] этого датчика с помощью критерия Колмогорова для выборок объема 5000 на уровне значимости 2,5% показало согласие с равномерным распределением. Поскольку далее гипотеза однородности проверяется при уровне значимости 0,05, то погрешность метода Монте-Карло оценивается как
.
Как отмечал акад. АН СССР Ю.В. Прохоров (1929 - 2013) на "неформальном обсуждении" проблем статистического моделирования, проведенном в рамках Первого Всемирного конгресса Общества математической статистики и теории вероятностей им. Бернулли [28], применения метода Монте-Карло можно разделить на два класса. В первом из них, появившемся исторически раньше, качество датчика определяется соответствием распределения даваемых датчиком псевдослучайных чисел заданному распределению, например, равномерному.
Выполнения этого условия достаточно, например, для вычисления многомерных интегралов. Именно этот класс применений обычно имеется в виду в литературе по методу Монте-Карло [29, 30]. Для применений из второго класса существенно обеспечить независимость псевдослучайных чисел, точнее, достаточное для успешного применения датчика приближение к независимости. Как показано в работах И.Г. Журбенко с соавторами [31 - 33], датчики типа (1) принципиально не могут обеспечить независимость. Однако из расчетов Г.В. Рыдановой [34] следует, что последовательности из не более чем 24 псевдослучайных чисел, используемые для одного статистического испытания, есть основания рассматривать как модели последовательностей независимых случайных величин.
Коротко говоря, наша позиция по поводу метода Монте-Карло такова. Мы активно используем этот метод в научных исследованиях. В частности, для изучения скорости сходимости распределений статистик - в предельной теории помех, создаваемых электровозами [35], в теории люсианов [36], при изучении свойств критериев однородности [25]. Но одновременно отдаем себе отчет в недостатках этого инструмента и предостерегаем от его бездумного употребления [37].
Для постановки вычислительного эксперимента необходимо задать две функции распределения F(x) и G(x) - функции распределения элементов двух выборок. Обоснованных теорией или практикой рекомендаций по выбору F(x) и G(x) в настоящее время нет. Поэтому для поискового исследования будем использовать привычные нормальные распределения и распределения Вейбулла-Гнеденко.
Функция распределения Вейбулла-Гнеденко имеет вид
где a - параметр сдвига, b - параметр масштаба, c - параметр формы.
Нормально распределенные псевдослучайные числа находились методом обратной функции [38, с. 440, ф-ла (12.10)]. Распределение Вейбулла-Гнеденко моделировалось по [39, с.93].
6. Вычислительные эксперименты
Приведем некоторые результаты изучения свойств критериев однородности двух независимых выборок в двух случаях:
F(x) и G(x) - функции нормального распределения;
F(x) и G(x) - функции распределения Вейбулла-Гнеденко
- как с одинаковыми, так и с различными значениями параметров.
В первом случае первая выборка бралась из стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1, а вторая - из нормального распределения с математическим ожиданием m2 и дисперсией , где значения m2 и приведены в табл.1.
Во втором случае параметр масштаба b функции распределения Вейбулла-Гнеденко во всех выборках принят равным 1. Первая выборка бралась (при всех экспериментах, кроме четырех) при a = 0 и c = 1, т.е. из экспоненциального распределения с функцией распределения
Таблица 1. Проверка равенства математических ожиданий для выборок из нормальных распределений по критерию Крамера-Уэлча
Номер вычислительного эксперимента |
Объем выборок m = n |
Параметры второй выборки |
Частота принятия нулевой гипотезы H0 |
Вероятность принятия H0 (исходя из распределения Стьюдента) |
Вероятность принятия H0 (исходя из нормального распределения) |
||
m2 |
у2 |
||||||
1 |
6 |
0 |
1 |
0,969 |
0,974 |
0,950 |
|
2 |
7 |
0 |
1 |
0,954 |
0,971 |
0,950 |
|
3 |
8 |
0 |
1 |
0,956 |
0,968 |
0,950 |
|
4 |
10 |
0 |
1 |
0,958 |
0,961 |
0,950 |
|
5 |
6 |
1 |
1 |
0,596 |
0,691 |
0,592 |
|
6 |
6 |
1,5 |
1 |
0,366 |
0,356 |
0,262 |
|
7 |
8 |
2 |
1 |
0,048 |
0,032 |
0,021 |
|
8 |
12 |
3 |
1 |
0 |
0 |
0 |
|
9 |
6 |
0 |
1,5 |
0,948 |
0,974 |
0.950 |
|
10 |
8 |
0 |
2 |
0,938 |
0,968 |
0,950 |
|
11 |
6 |
0 |
3 |
0,930 |
0,974 |
0,950 |
|
12 |
10 |
0 |
3 |
0,934 |
0,961 |
0,950 |
Вторая выборка бралась из распределений Вейбулла-Гнеденко с параметрами a, b = 1, c, приведенными в табл.2 (там же оговорены исключения).
Таблица 2. Проверка равенства математических ожиданий для выборок из распределений Вейбулла-Гнеденко по критерию Крамера-Уэлча
Номер вычислительного эксперимента |
Объем выборок m = n |
Параметры второй выборки |
Частота принятия нулевой гипотезы H0 |
Вероятность принятия H0 (исходя из распределения Стьюдента) |
Вероятность принятия H0 (исходя из нормального распределения) |
||
a |
c |
||||||
1 |
6 |
0 |
1 |
0,956 |
0,974 |
0,950 |
|
2 |
10 |
0 |
1 |
0,954 |
0,961 |
0,950 |
|
3 |
6 |
0,5 |
1 |
0,828 |
0,912 |
0,861 |
|
4 |
8 |
0,5 |
1 |
0,772 |
0,874 |
0,829 |
|
5 |
10 |
0,5 |
1 |
0,750 |
0,837 |
0,800 |
|
6 |
6 |
1 |
1 |
0,750 |
0,689 |
0,592 |
|
7 |
8 |
1 |
1 |
0,450 |
0,558 |
0,484 |
|
8 |
10 |
1 |
1 |
0,348 |
0,446 |
0,313 |
|
9 |
6 |
0 |
1,5 |
0,950 |
0,971 |
0,946 |
|
10 |
8 |
0 |
1,5 |
0,950 |
0,963 |
0,946 |
|
11 |
10 |
0 |
1,5 |
0,956 |
0,958 |
0,942 |
|
12 |
6 |
0 |
2 |
0,940 |
0,949 |
0,943 |
|
13 |
8 |
0 |
2 |
0,944 |
0,954 |
0,938 |
|
14 |
10 |
0 |
2 |
0,928 |
0,949 |
0,935 |
|
15 |
12 |
0 |
2 |
0,944 |
0,950 |
0,935 |
|
16 |
8 |
0 |
3 |
0,930 |
0,961 |
0,942 |
|
17 |
12 |
0 |
3 |
0,942 |
0,949 |
0,935 |
|
18 |
6 |
0 |
5 |
0,904 |
0,971 |
0,945 |
|
19 |
8 |
0 |
5 |
0,910 |
0,963 |
0,944 |
|
20 |
10 |
0 |
5 |
0,920 |
0,958 |
0,943 |
|
21 |
12 |
0 |
5 |
0,940 |
0,955 |
0,941 |
|
22 |
8 |
0 |
1 |
0,928 |
0,968 |
0,950 |
|
23* |
6 |
0 |
3 |
0,946 |
0,974 |
0,950 |
|
24* |
10 |
0 |
3 |
0,928 |
0,961 |
0,950 |
|
25* |
6 |
0,5 |
3 |
0,292 |
0,553 |
0,447 |
|
26* |
10 |
0,5 |
3 |
0,094 |
0,273 |
0,228 |
|
27 |
6 |
0,5 |
3 |
0,690 |
0,905 |
0,850 |
|
28 |
10 |
0,5 |
3 |
0,676 |
0,826 |
0,781 |
* В экспериментах 23 - 26 первая выборка взята из распределения Вейбулла-Гнеденко с параметрами a = 0, b = 1, c = 3.
Выбор распределений для экспериментов определяется наряду с желанием сравнить свойства статистик на выборках из нормального семейства распределений, для которых статистики Стьюдента и Крамера-Уэлча имеют определенные оптимальные свойства, так и желанием рассмотреть класс распределений, существенно отличающихся от нормальных, в частности, несимметричностью. Экспоненциальное распределение часто используют при изучении показателей надежности [40], поэтому оно и было включено в эксперименты.
Из семи перечисленных в п.4 критериев однородности критерий Вольфовица (серий), как установлено, имеет малую мощность. Поэтому его исключение из дальнейших рассмотрений не приводит к отрицательным последствиям.
В табл.3 приведены результаты экспериментов для выборок из нормальных распределений. Табл. 3 соответствует табл. 1 - при совпадающих номерах речь идет об одних и тех же экспериментах. В табл. 4 для облегчения анализа свойств критериев приведены относительные мощности критериев по отношению к критерию Крамера-Уэлча (совпадающего с критерием Стьюдента в рассматриваемых экспериментах). В табл. 4 стоят отношения двух случайных величин - оценки мощности рассматриваемого критерия, полученной по 5000 испытаниям, к оценке мощности критерия Крамера-Уэлча.
В табл. 5 приведены результаты экспериментов для выборок из распределений Вейбулла-Гнеденко. Табл. 5 соответствует табл. 2 - при совпадающих номерах речь идет об одних и тех же экспериментах.
Таблица 3. Частоты принятия гипотезы однородности для выборок из нормальных распределений
№ |
Объем выборок m = n |
Параметры второй выборки |
Частоты принятия нулевой гипотезы H0 для критериев |
|||||||
1 |
2 |
3 |
5 |
6 |
7 |
|||||
m2 |
у2 |
t |
L |
U |
X |
S |
щ2 |
|||
1 |
6 |
0 |
1 |
0,969 |
0,970 |
0,976 |
0,976 |
0,982 |
0,976 |
|
2 |
7 |
0 |
1 |
0,954 |
0,968 |
0,986 |
0,964 |
1,00 |
0,956 |
|
3 |
8 |
0 |
1 |
0,956 |
0,958 |
0,50 |
0,954 |
0,994 |
0,944 |
|
4 |
10 |
0 |
1 |
0,958 |
0,960 |
0,974 |
0,972 |
0,998 |
0,958 |
|
5 |
6 |
1,0 |
1 |
0,596 |
0,624 |
0,680 |
0,698 |
0,754 |
0,690 |
|
6 |
6 |
1,5 |
1 |
0,366 |
0,390 |
0,464 |
0,474 |
0,616 |
0,496 |
|
7 |
8 |
2,0 |
1 |
0,048 |
0,054 |
0,064 |
0,078 |
0,480 |
0,084 |
|
8 |
12 |
3,0 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
|
9 |
6 |
0 |
1,5 |
0,948 |
0,952 |
0,974 |
0,976 |
0,980 |
0,972 |
|
10 |
8 |
0 |
2,0 |
0,938 |
0,940 |
0,930 |
0,950 |
0,998 |
0,904 |
|
11 |
6 |
0 |
3,0 |
0,930 |
0,924 |
0,950 |
0,956 |
0,934 |
0,920 |
|
12 |
10 |
0 |
3,0 |
0,934 |
0,902 |
0,930 |
0,946 |
0,988 |
0,846 |
Таблица 4. Мощность критериев относительно критерия Крамера-Уэлча (для экспериментов №№ 5-12 в табл. 1 и 3)
№ эксперимента |
Относительная мощность критериев |
|||||
2 |
3 |
5 |
6 |
7 |
||
L |
U |
X |
S |
щ2 |
||
5 |
0,931 |
0,792 |
0,748 |
0,609 |
0,767 |
|
6 |
0,727 |
0,739 |
0,783 |
0,000 |
0,957 |
|
7 |
0,993 |
0,983 |
0,968 |
0,546 |
0,962 |
|
8 |
1,000 |
1,000 |
1,000 |
1,000 |
1,000 |
|
9 |
0,923 |
0,500 |
0,460 |
0,385 |
0,538 |
|
10 |
0,806 |
1.129 |
0,806 |
0,030 |
1,548 |
|
11 |
1,086 |
0,714 |
0,629 |
0,943 |
1.140 |
|
12 |
1,485 |
1,061 |
0,818 |
0,182 |
2,323 |
Таблица 5. Частоты принятия гипотезы однородности для выборок из распределений Вейбулла-Гнеденко
№ |
Частоты принятия нулевой гипотезы H0 для критериев |
||||||
1 |
2 |
3 |
5 |
6 |
7 |
||
t |
L |
U |
X |
S |
щ2 |
||
1 |
0,956 |
0,942 |
0,964 |
0,968 |
0,964 |
0,960 |
|
2 |
0,966 |
0,940 |
0,956 |
0,962 |
0,998 |
0,952 |
|
3 |
0,828 |
0,818 |
0,840 |
0,858 |
0,878 |
0,840 |
|
4 |
0,772 |
0,764 |
0,720 |
0,746 |
0,974 |
0,698 |
|
5 |
0,750 |
0,724 |
0,678 |
0,668 |
0,962 |
0,634 |
|
6 |
0,528 |
0,514 |
0,534 |
0,586 |
0,552 |
0,482 |
|
7 |
0,450 |
0,432 |
0,354 |
0,392 |
0,756 |
0,336 |
|
8 |
0,348 |
0,344 |
0,268 |
0,272 |
0,662 |
0,206 |
|
9 |
0,950 |
0,934 |
0,958 |
0,958 |
0,974 |
0,958 |
|
10 |
0,950 |
0,936 |
0,946 |
0,954 |
1,000 |
0,950 |
|
11 |
0,956 |
0,934 |
0,954 |
0,956 |
1,000 |
0,946 |
|
12 |
0,940 |
0,934 |
0,962 |
0,970 |
0,960 |
0,952 |
|
13 |
0,944 |
0,922 |
0,930 |
0,972 |
0,984 |
0,958 |
|
14 |
0,928 |
0,900 |
0,930 |
0,932 |
0,990 |
0,894 |
|
15 |
0,944 |
0,918 |
0,938 |
0,944 |
0,932 |
0,898 |
|
16 |
0,930 |
0,906 |
0,906 |
0,924 |
0,986 |
0,884 |
|
17 |
0,942 |
0,908 |
0,910 |
0,930 |
0,816 |
0,786 |
|
18 |
0,904 |
0,886 |
0,934 |
0,946 |
0,876 |
0,866 |
|
19 |
0,910 |
0,872 |
0,866 |
0,896 |
0,972 |
0,790 |
|
20 |
0,920 |
0,872 |
0,874 |
0,920 |
0,968 |
0,714 |
|
21 |
0,940 |
0,886 |
0,862 |
0,908 |
0,662 |
0,606 |
|
22 |
0,928 |
0,908 |
0,944 |
0,952 |
0,998 |
0,944 |
|
23 |
0,946 |
0,948 |
0,964 |
0,966 |
0,978 |
0,970 |
|
24 |
0,928 |
0,934 |
0,948 |
0,944 |
0,998 |
0,936 |
|
25 |
0,292 |
0,312 |
0,392 |
0,408 |
0,578 |
0,430 |
|
26 |
0,094 |
0,100 |
0,142 |
0,132 |
0,654 |
0,144 |
При анализе табл. 3 и 5 необходимо иметь в виду отличие реальных уровней значимости от номинальных (см. [25]). Особенно это касается критерия Смирнова. Различие между собой реальных уровней значимости у свободных от распределения статистик делает трудным сравнение между собой критериев по мощности - такое сравнение желательно проводить при одном и том же уровне значимости, но это невозможно.
Как и должно быть согласно теории математической статистики [41], для выборок из нормального распределения наиболее мощным оказался критерий Крамера-Уэлча (Стьюдента). Близким к нему по мощности оказались критерий Лорда и критерий типа омега-квадрат. Отметим: критерий Лорда использует размахи, а потому неустойчив к засорениям на "хвостах"; следовательно, возможность его использования при анализе реальных данных в каждом конкретном случае требует специального обоснования. Критерии Вилкоксона и Ван-дер-Вардена также имеют высокую мощность, особенно в экспериментах №№ 6,8. Малая мощность критерия Смирнова объясняется, видимо, отличием от .
Другая картина наблюдается при изменении дисперсии. Критерии Крамера-Уэлча и Лорда слабо реагируют на нее. Еще меньше реагируют линейные ранговые статистики U и X. Критерий Вилкоксона не может, даже асимптотически, различить нормальные совокупности с одинаковыми математическими ожиданиями, но разными дисперсиями [17]. Обращает на себя внимание высокая мощность критерия омега-квадрат (см. табл.4, эксперименты №№ 10 - 12).
Для выборок из распределений Вейбулла-Гнеденко картина несколько иная. Если распределения отличаются только сдвигом (эксперименты №№ 3 - 8), то наибольшую мощность имеет критерий омега-квадрат, затем идут критерии Вилкоксона и Ван-дер-Вардена, после них - критерии Стьюдента и Лорда, наименьшая мощность у критерия Смирнова. Если же изменяется также и параметр формы (см., например, эксперимент № 21), то наибольшая мощность также у критерия омега-квадрат, следующим является критерий Смирнова (с учетом отличия от ). Заметно также существенное возрастание мощности с ростом объемов выборок и увеличением различия параметров.
На основе анализа таблиц 3 - 5 можно сформулировать, с понятными оговорками, следующие практические рекомендации.
А. Для проверки гипотезы абсолютной однородности (гипотезы совпадения функций распределения двух выборок) целесообразно использовать критерий Лемана - Розенблатта типа омега-квадрат [18] - во всех случаях.
Б. Если есть основания предполагать, что распределения отличаются в основном сдвигом, то целесообразно использовать линейные ранговые критерии Вилкоксона и Ван-дер-Вардена. Однако даже в этом случае критерий омега-квадрат может оказаться более мощным.
В. Из рассмотренных критериев для проверки гипотезы однородности в общем случае, кроме критерия , можно использовать критерий Смирнова - с учетом отличия реального уровня значимости от номинального.
7. Частота совпадений статистических выводов по разным критериям
По итогам обработки данных с помощью определенного критерия однородности принимают одно из двух решений: "гипотеза однородности отклоняется" или "гипотеза однородности не отклоняется". Решения по разным критериям могут не совпадать. Насколько часты расхождения?
Были изучены доли (в %) расхождений решений по критериям L, U,X, S, с решениями по критерию Крамера-Уэлча. Для описания полученных результатов введены "зоны". Пусть tn - критическое значение для критерия Крамера-Уэлча, соответствующее уровню значимости = 0,05 и объему выборок m = n. Используется абсолютное значение статистики критерия Крамера-Уэлча. Введено 8 зон: 1 - [0; tn/4), 2 - [tn/4; tn/2), 3 - [tn/2; 3tn/4), 4 - [3tn/4; tn), 5 - [tn; 5tn/4), 6 - [5tn/4; 3tn/2), 7 - [3tn/2; 7tn/4), 8 - [7tn/4; ).
В качестве примера проведенных исследований приведем в табл. 6 данные по вычислительному эксперименту № 19 для выборок из распределений Вейбулла - Гнеденко (см. табл. 2). В строке "T (частота попадания в зону)" приведено асимптотическое распределение статистики Крамера - Уэлча (сгруппированное по зонам). В каждой строке, соответствующей определенному критерию, для каждой зоны указана доля совпадений решений по этому критерию с решением по критерию Крамера - Уэлча.
Таблица 6. Доли совпадений решений по критериям L, U, X, S, с решениями по критерию Крамера-Уэлча T (эксперимент № 19)
Критерии |
Доля принятия H0 по T |
Зоны |
||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|||
T (частота попадания в зону) |
0,910 |
0,362 |
0,274 |
0,194 |
0,080 |
0,042 |
0,022 |
0,008 |
0,018 |
|
L |
0,872 |
1 |
1 |
0,979 |
0,575 |
1 |
1 |
1 |
1 |
|
U |
0,866 |
0,956 |
0,978 |
0,897 |
0,775 |
0,562 |
0,937 |
1 |
1 |
|
X |
0,896 |
0,978 |
0,978 |
0,928 |
0,900 |
0,500 |
0,875 |
1 |
1 |
|
S |
0,972 |
1 |
0,985 |
0,990 |
1 |
0,125 |
0,125 |
0,750 |
0,555 |
|
щ2 |
0,790 |
0,889 |
0,927 |
0,835 |
0,600 |
0,875 |
1 |
1 |
1 |
В качестве второго примера в табл. 7, построенной аналогично табл. 6, приведена сводка для экспериментов №№ 1-21 с выборками из распределений Вейбулла-Гнеденко. Табл.8 содержит информацию о расхождениях (в %) решений по критериям L, U,X, S, с решениями по критерию Крамера-Уэлча.
Таблица 7. Сводка для выборок из распределений Вейбулла-Гнеденко (эксперименты №№ 1-21). Проценты расхождений c решениями по критерию Крамера-Уэлча.
Критерии |
Зоны |
||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
||
L |
0 |
0 |
0,9 |
24,4 |
6,6 |
0 |
0 |
0 |
|
U |
1,1 |
2,2 |
5,8 |
22,5 |
30,7 |
3,0 |
0,4 |
0 |
|
X |
0,5 |
1,3 |
3,5 |
17,7 |
34,6 |
6,2 |
1,2 |
0,3 |
|
S |
3,3 |
3,4 |
4,4 |
10,4 |
77,8 |
60,3 |
46,0 |
17,0 |
|
щ2 |
6,5 |
6,6 |
11,8 |
29,5 |
30,7 |
2,5 |
0 |
0 |
Таблица 8. Расхождения (в %) решений по критериям L, U,X, S, с решениями по критерию Крамера-Уэлча.
По критерию Крамера-Уэлча |
По другим критериям |
|||||
L |
U |
X |
S |
щ2 |
||
Принято 84,6%, из них отвергнуто |
3,2 |
5,1 |
3,5 |
4,5 |
10,5 |
|
Отвергнуто 15,4%, из них принято |
2,7 |
13,1 |
15,8 |
56,5 |
12,9 |
|
Проверено 100%, из них расхождений |
3,1 |
6,3 |
5,4 |
12,4 |
10,9 |
|
По сравнению с критерием Крамера - Уэлча, % |
- 2,3 |
- 2,3 |
- 0,5 |
+ 4,9 |
- 6,9 |
Из полученных результатов можно сделать ряд выводов.
Наибольший процент расхождений приходится на зоны № 4 (от 10.4% до 29,5% по табл. 7) и № 5 (от 6,6% до 77,8%), что естественно, т.к. при переходе от зоны 4 к зоне № 5 и происходит изменение решения по критерию Крамера-Уэлча. Обратим внимание, что расхождения имеются и в зоне №1 - для 6,5% экспериментов, попавших в эту зону, критерий Лемана - Розенблатта отвергает нулевую гипотезу (т.е. во всех этих случаях гипотеза однородности неверна). Вместе с тем нет ни одного случая, когда бы этот критерий принял гипотезу для экспериментов из зон 7, 8. Другими словами, если критерий Крамера - Уэлча отклоняет нулевую гипотезу с T > 3,0, то критерий также отклоняет гипотезу однородности.
Наибольшее расхождение с критерием Крамера - Уэлча наблюдается у критерия Смирнова, в основном за счет принятия гипотезы в случае, когда T - критерий ее отверг. Это во многом объясняется существенным различием и для критерия Смирнова. Почти такое же суммарное число расхождений у критерия Лем...
Подобные документы
Выборочные исследования предпочтений потребителей специалистами маркетологами. Построение выборочной функции спроса. Маркетинговые опросы потребителей. Выбор и организация метода опроса. Обработка данных. Проверка однородности двух биномиальных выборок.
реферат [179,8 K], добавлен 08.01.2009Связь стохастических процессов и дифференциальных уравнений. Алгоритм Бюффона для определения числа Пи. Геометрический алгоритм Монте-Карло интегрирования. Применение метода Монте-Карло в логистике. Алгоритм Метрополиса, квантовый метод Монте-Карло.
курсовая работа [258,0 K], добавлен 26.12.2013Анализ структуры взаимосвязей признаков по данным трехмерной таблицы сопряженности с помощью логлинейных моделей. Непараметрические методы проверки гипотез об однородности распределения двух совокупностей. Модели двухфакторного дисперсионного анализа.
отчет по практике [388,6 K], добавлен 01.10.2013Формулы вычисления критерия Пирсона, среднего квадратического отклонения и значений функций Лапласа. Определение свойств распределения хи-квадрата. Критерий согласия Колмогорова-Смирнова. Построение графика распределения частот в заданном массиве.
контрольная работа [172,2 K], добавлен 27.02.2011Определение площади фигуры аналитическим методом (с помощью вычисления определенного интеграла) и методом статистических испытаний Монте-Карло. Построение графиков для наглядной демонстрации результатов эксперимента. Вычисление доверительного интервала.
лабораторная работа [211,9 K], добавлен 15.10.2013Случайная выборка из генеральной совокупности. Сущность метода Монте-Карло. Определение адекватности принятой эконометрической модели. Линейная регрессионная модель вида. Система нормальных уравнений в матричной форме. Параметры регрессионной модели.
контрольная работа [323,5 K], добавлен 08.12.2010Проверка гипотезы о нормальности распределения дневных логарифмических доходностей, рассчитанных по котировкам акций. Принятие в расчет достаточного объема выборок данных. Расчет характеристик временных рядов. Оценка статистического критерия Фроцини.
курсовая работа [307,0 K], добавлен 29.08.2015Изучение особенностей метода статистического моделирования, известного в литературе под названием метода Монте-Карло, который дает возможность конструировать алгоритмы для ряда важных задач. Решение задачи линейного программирования графическим методом.
контрольная работа [1,2 M], добавлен 17.12.2014Применение дискриминантного анализа. Дискриминантные функции и их геометрическая интерпретация. Расчет коэффициентов дискриминантной функции. Классификация при наличии двух обучающих выборок. Взаимосвязь между дискриминантными переменными и функциями.
реферат [4,6 M], добавлен 08.05.2009Оценка параметров шестимерного нормального закона распределения с помощью векторов средних арифметических и среднеквадратического отклонений и матрицы парных коэффициентов корреляции (по программе Statistica). Методика определения Z-преобразования Фишера.
контрольная работа [33,6 K], добавлен 13.09.2010Теоретические основы первичной обработки статистической информации. Особенности определения минимального числа объектов наблюдения при оценке показателей надежности. Анализ вероятностной бумаги законов нормального распределения и распределения Вейбулла.
курсовая работа [163,5 K], добавлен 22.03.2010Разработка алгоритма и программы на одном из алгоритмических языков для построения эмпирической плотности распределения случайных величин. Осуществление проверки гипотезы об идентичности двух плотностей распределения, используя критерий Пирсонга.
лабораторная работа [227,8 K], добавлен 19.02.2014Формирование иерархии при решении проблемы "выбор фрезы". Третий этап окончательного определения. Глобальные приоритеты выбора. Полный факторный эксперимент. Определение однородности дисперсий. Расчетные значения критериев. Неполная квадратичная модель.
курсовая работа [1,6 M], добавлен 12.09.2014Понятие имитационного моделирования, применение его в экономике. Этапы процесса построения математической модели сложной системы, критерии ее адекватности. Дискретно-событийное моделирование. Метод Монте-Карло - разновидность имитационного моделирования.
контрольная работа [26,7 K], добавлен 23.12.2013Использование статистических характеристик для анализа ряда распределения. Частотные характеристики ряда распределения. Показатели дифференциации, абсолютные характеристики вариации. Расчет дисперсии способом моментов. Теоретические кривые распределения.
курсовая работа [151,4 K], добавлен 11.09.2010Оценка социально-экономического развития Финляндии. Установление степени однородности и закономерности распределения рядов данных в среде MS Excel с помощью инструментов "Описательная статистика" и "Скользящее среднее". Расчет коэффициента корреляции.
курсовая работа [176,8 K], добавлен 29.11.2014Построение и изучение математической модели случайного стационарного эргодического процесса с вероятностными характеристиками: ожидание и дисперсия. Построение графиков динамики изменения эмпирических данных и гистограмм распределения для всех выборок.
курсовая работа [217,2 K], добавлен 18.03.2012Методи генерування послідовності рівномірно розподілених випадкових чисел. Перевірка якості псевдовипадкових чисел. Використання методу Монте-Карло в імітаційному моделюванні. Обчислення інтегралу методом Монте-Карло. Переваги програмного методу.
методичка [2,8 M], добавлен 29.01.2010Особенности метода проверки гипотезы о законе распределения по критерию согласия хи-квадрат Пирсона. Свойства базовой псевдослучайной последовательности. Методы оценки закона распределения и вероятностных характеристик случайной последовательности.
лабораторная работа [234,7 K], добавлен 28.02.2010Характеристика метода Монте-Карло. Его преимущество и недостатки, области применения. Решение задач по оптимизации использования ресурсов, управлению запасами и системе массового обслуживания с помощью средств аналитического и имитационного моделирования.
контрольная работа [1,4 M], добавлен 22.11.2013