Пуассоновская модель
Анализ математических моделей случайных явлений, изучаемых в теории вероятностей и математической статистике. Определение смешанных моментов и кумулянт для многомерных случайных величин. Изучение методов распределения пуассоновски остановленных сумм.
Рубрика | Математика |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 21.06.2016 |
Размер файла | 285,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Оглавление
Аннотация
1. Основные понятия и теоретические сведения
2. Определение и вероятностные свойства
3. Историческая справка
4. Моменты
5. Асимптотические результаты и приближения
6. Моделирование
7. Статистические выводы
8. Характеризации
9. Распределение пуассоновски остановленных сумм
Заключение
Литература
Аннотация
Случайные величины играют огромную роль во всех современных областях знания и практической деятельности человека. Они измеряются и анализируются в терминах их вероятностных и статистических свойств, главным выразителем которых является функция распределения. Хотя число потенциально возможных моделей распределения чрезвычайно велико, практически относительно небольшое их число занимает особое положение - либо потому, что они обладают хорошими математическими свойствами, либо потому, что достаточно адекватно описывают соответствующую область действительности, либо в силу обеих этих причин. Замечательным фактом при этом является то, что существует несколько распределений большой общности, встречающихся в самых разнообразных задачах теории вероятностей и математической статистики и значение которых для приложений трудно переоценить. К числу таковых относится и распределение Пуассона, которому посвящена настоящая работа. Следует отметить, что за последние десятилетия в этой области получено большое число новых результатов, существенно дополняющих и развивающих в самых различных направлениях классические достижения, поэтому их систематизация и единообразное изложение представляется актуальным и полезным для их практического использования.
В работе с единых позиций и с использованием единых терминологии и символики детально излагаются известные к настоящему времени вероятностные и статистические свойства распределения Пуассона, и ее целью является удовлетворение потребности в быстром получении соответствующей информации, которая обычно разбросана по многочисленным и часто трудно доступным источникам.
При выполнении работы использовались как оригинальные публикации, так и различная монографическая и учебная литературу по теории вероятностей и математической статистике.
Annotation (in english)
Random variables play a huge role in all areas of modern knowledge and practical activity. They are measured and analyzed in terms of their probability and statistical properties, the chief exponent of which is the distribution function. Although the number of potential models for the distribution is extremely large, almost a relatively small number of them occupies a special position - either because they have good mathematical properties, either because adequately describe the relevant area of reality, either because both of these reasons. A remarkable fact in this case is that there are some very general distributions occurring in a wide variety of problems in the theory of probability and mathematical statistics and value for applications which can hardly be overestimated. Among those concerns and the Poisson distribution, which is devoted to this work. It should be noted that over the last decade in this area received a large number of new results, significantly complement and develop in different directions to achieve the classic, so their classification and uniform presentation seems relevant and useful for their practical use.
In working with unified positions and using uniform terminology and symbols details the currently known probabilistic and statistical properties of the Poisson distribution, and its aim is to meet the demands of rapid delivery of relevant information that is usually scattered across numerous and often difficult to available sources. When the work was used as the original publications, and various monographs and educational literature on the theory of probability and mathematical statistics.
1. Основные понятия и теоретические сведения
Вероятностно-статистические модели. Математические модели случайных явлений, изучаемых в теории вероятностей и математической статистике, основываются на понятии вероятностного пространства , где - непустое множество, называемое пространством элементарных событий (множество всех возможных исходов изучаемого случайного явления), -алгебра его подмножеств и вероятностная мера на ней. Случайная же величина - это функция, отображающая пространство элементарных событий в множество действительных чисел (её можно понимать как некоторую числовую характеристику эксперимента (опыта) со случайным исходом). Случайную величину мы будем обозначать символом Х = Х (это может быть число или вектор некоторой размерности), а её реализацию - соответствующей строчной буквой х (используются также и другие символы: , и т.д.). Совокупность всех возможных реализаций случайной величины обозначается ={х} и называется её областью значений. В данном пособии мы ограничиваемся рассмотрением случайных величин лишь дискретного типа, когда состоит из конечного или счётного числа точек (без точек накопления); в этом случае распределение случайной величины Х, обозначаемое символом (Х) (-law (закон)), задаётся вероятностями отдельных её реализаций
Функцию мы будем называть (для краткости) плотностью; в дальнейшем для неё используются и другие обозначения, связанные со спецификой конкретных распределений и традиционно используемые в математической литературе. математический кумулянта пуассоновский
Частным случаем дискретных распределений являются решётчатые распределения и, в частности, распределения, сосредоточенные на множестве целых чисел или его подмножествах.
Если плотность из каких-то соображений задана, то говорят, что задана вероятностная модель эксперимента. В вероятностных задачах плотность наблюдаемой (изучаемой) случайной величины полностью известна, в статистических же - она известна лишь с той или иной степенью неопределённости. Часто при этом предполагается, что плотность задана с точностью до значений тех или иных параметров, от которых зависит функция , - в таких случаях говорят о параметрических статистических моделях. В теории вероятностей наиболее часто встречающиеся распределения (модели) имеют общепринятое наименование и обозначение - этот «язык» переносится и на соответствующие статистические модели. Вместе с тем в статистике используется и специфическая терминология: наблюдаемая в эксперименте случайная величина Х называется выборкой (синоним термина статистические данные), а множество её возможных реализаций ={х} - выборочным пространством.
На практике часто встречаются ситуации, когда эксперимент состоит в проведении серии повторных независимых наблюдений над некоторой случайной величиной . Если проводится n наблюдений, то выборка Х = (Х1,…,Хn) представляет собой n независимых копий величины , т. е. является n-мерным случайным вектором с независимыми и одинаково распределёнными компонентами. В этом случае плотность выборки Х=(Х1,…,Хn) имеет вид , т. е. полностью определяется плотностью наблюдаемой случайной величиной , и говорят, что Х=(Х1,…, Хn) есть случайная выборка объёма n из распределения (). Случайная выборка является математической моделью независимых измерений, проводимых в одинаковых условиях, и именно такие модели чаще всего применяются на практике и будут в основном рассматриваться в последующем. В общем случае параметрическая статистическая модель случайной выборки задаётся классом допустимых плотностей наблюдаемой случайной величиной (индекс случайной величины у плотности обычно опускается, если это не приводит к недоразумениям), т. е. плотность задаётся с точностью до значений некоторого параметра с областью возможных значений . Говорят, что в этом случае известен тип распределения наблюдаемой случайной величины, а неизвестен только параметр, от которого зависит распределение. Параметр может быть как скалярным, так и векторным, область (множество) его допустимых значений называется параметрическим множеством модели.
Для удобства дальнейшего изложения напомним также определения моментов случайных величин и основные соотношения между моментами различных видов.
Если для случайной величиной существует абсолютный момент порядка , то существуют и все обычные моменты , а также центральные моменты , при ; при этом первый момент называется математическим ожиданием или средним значением случайной величины , а второй центральный момент - её дисперсией. Обычные и центральные моменты связаны соотношениями
где , - биномиальный коэффициент, для которого используется также обозначение
Факториальные и биномиальные моменты определяются соответственно равенствами
где .
Имеют место следующие соотношения:
где и есть числа Стирлинга первого и второго рода соответственно, определяемые как коэффициенты разложений
.
Пусть - целочисленная неотрицательная случайная величина и
есть её производящая и характеристическая функции. Введём также производящие функции моментов:
Тогда имеют место соотношения
.
Используются также семиинварианты, или кумулянты, представляющие собой коэффициенты разложения в ряд Тейлора логарифма характеристической функции:
,
в частности, .
Важную роль играют также следующие моментные характеристики случайной величины : коэффициенты вариации , асимметрии , эксцесса и среднее отклонение .
Одной из важных характеристик распределения (случайной величины) является интенсивность отказов (failure rate)
.
Для многомерных случайных величин определяются также смешанные моменты и кумулянты. В частности, смешанный центральный момент второго порядка двух случайных величин и называется их ковариацией: , а величина - коэффициентом корреляции.
Оценивание. В статистических задачах рассматриваются различные функции от выборки Х=(Х1,…,Хn), сами являющиеся случайными величинами (т. е. для которых при всех t определены вероятности (функция распределения) ). Если при этом функция не зависит от неизвестного параметра модели, то её принято называть статистикой. В статистических задачах речь идёт либо об оценивании по наблюдениям Х=(Х1,…,Хn) той или иной характеристики наблюдаемой случайной величиной , которая в параметрической модели всегда является некоторой функцией от неизвестного параметра (такие функции называются параметрическими), либо о проверке тех или иных статистических гипотез о законе распределения (о параметре - в случае параметрической модели).
Если для оценивания параметрической функции используется некоторая статистика , то она называется оценкой (для ). Обычно в качестве меры точности оценки используют среднеквадратическую ошибку , и среди всех возможных оценок ищут такую, для которой среднеквадратическая ошибка минимальна. При этом часто ограничиваются лишь несмещёнными оценками, т. е. такими оценками, для которых выполняется условие несмещённости:
.
Функция , для которой это уравнение имеет решение, называется оцениваемой. Для несмещённой оценки среднеквадратическая ошибка совпадает с её дисперсией, следовательно, оптимальной оценкой является оценка с минимальной дисперсией, для неё используется обозначение . Оптимальная оценка (в заданной модели и для заданной параметрической функции ) существует не всегда, но в тех случаях, когда она существует, она единственна.
Обязательным для любого правила оценивания является свойство состоятельности, означающее сходимость по вероятности оценки к оцениваемой характеристике при неограниченном возрастании объёма выборки n.
Для удобства дальнейшего изложения напомним кратко некоторые дополнительные факты из теории статистического вывода.
1. Если в параметрической модели наблюдается случайная выборка Х=(Х1,…,Хn), то функцией правдоподобия данных называется . Если при этом плотность при всех х и , дважды дифференцируема по , и существует второй момент
называемый функцией информации, то модель называется регулярной (большинство рассматриваемых ниже моделей являются таковыми).
Для регулярной модели любая несмещённая оценка дифференцируемой функции удовлетворяет неравенству Рао-Крамера
.
Оценка , для которой эта нижняя граница достигается, называется эффективной (она и является оптимальной оценкой ).
2. Пусть модель обладает полной достаточной статистикой , т. е. имеет место факторизация
где множитель может зависеть от а от зависит лишь через а множитель от параметра не зависит, и при этом уравнение
имеет единственное решение . Тогда всякая функция от является оптимальной оценкой своего среднего - этот факт во многих случаях даёт эффективный способ отыскания оптимальных оценок.
3. Одним из наиболее универсальных методов оценивания неизвестных параметров распределений является метод максимального правдоподобия. По этому методу оценкой максимального правдоподобия (далее кратко - ОМП) по выборке Х=(Х1,…,Хn) является такая точка параметрического множества , в которой функция правдоподобия достигает максимума.
Для произвольной параметрической функции её ОМП находится по правилу .
Для регулярных моделей оценки максимального правдоподобия обладают свойствами состоятельности, асимптотической нормальности и асимптотической эффективности. Это даёт возможность строить приближённые доверительные интервалы как для самого параметра : такой интервал (при больших значениях объёма выборки n и доверительном уровне ) имеет вид
,
так и для любой непрерывно дифференцируемой параметрической функции : соответствующий доверительный интервал имеет вид
,
где и - стандартная нормальная функция распределения.
4. При байесовском подходе предполагается, что параметр - это случайная величина с некоторым (априорным) распределением (), а о качестве оценки судят обычно по величине квадратичной функции риска
:
статистика , минимизирующая байесовский риск , называется байесовской оценкой, а минимизирующая максимальный риск - минимаксной оценкой. В ряде случаев при отыскании таких оценок можно руководствоваться следующим принципом: находится такое априорное распределение (), для которого соответствующая байесовская оценка имеет постоянный риск: (его называют наименее благоприятным априорным распределением), тогда является также и минимаксной оценкой.
При построении байесовских оценок важную роль играют сопряжённые априорные распределения, т.е. такие, для которых апостериорное распределение () принадлежит тому же семейству, что и априорное распределение (), - обычно наименее благоприятное априорное распределение находится в этом семействе.
Проверка статистических гипотез. Напомним кратко общую схему постановки задач и принципов их решения в теории проверки статистических гипотез. В случае параметрической модели статистические гипотезы формулируются в терминах параметра , и в общем случае основная (нулевая) гипотеза имеет вид утверждения : при задании соответствующего подмножества , альтернатива же в этом случае имеет вид . При заданном уровне значимости (вероятности ошибочно отвергнуть гипотезу , когда она верна, или, что то же, вероятности ошибки первого рода) соответствующий тест имеет вид
отвергается ,
где критическое множество выбирается так, чтобы вероятность указанного события при гипотезе не превосходила :
.
Такой тест кратко называют критерием и его качество оценивают величиной его мощности
среди всех критериев с уровнем значимости наилучшим считается такой, для которого мощность максимальна. Если такой критерий существует (тогда он обозначается символом ), то он называется оптимальным или равномерно наиболее мощным (сокращённо - р.н.м.).
2. Определение и вероятностные свойства
1. Случайная величина (с.в.) X имеет распределение Пуассона с параметром (0), что кратко обозначается так: L(X) =, если её плотность имеет вид:
Эта модель обычно описывает схему редких событий: при некоторых предположениях о характере процесса появления случайных событий число событий, происшедших за фиксированный промежуток времени или в фиксированной области пространства, часто подчиняется пуассоновскому распределению. Помимо этого, распределение Пуассона даёт хорошую аппроксимацию (при соответствующих условиях) для ряда других дискретных распределений, в частности, для биномиального, отрицательного биномиального, гипергеометрического и Маркова-Пойа распределений.
Функция распределения может быть выражена через неполную гамма-функцию:
,
а также
;
отсюда видно, что - убывающая ( - возрастающая) функция от для любого .
Имеют место неравенства
, если
, если ,
а также (Bohman, 1963)
,
.
Пуассоновские вероятности удовлетворят рекуррентному соотношению
= ,
и многочисленным другим соотношениям, например,
,
,
,
,
.
Распределение Пуассона обладает свойством воспроизводимости по параметру : если с. в. независимы и
L(X j) =
L.
2. Если L(X) =, то производящая и характеристическая функции с. в. X имеют вид соответственно
,
а факториальные моменты равны
Обычные моменты, следовательно, имеют вид
и они удовлетворяют рекуррентному соотношению
.
В частности, первые четыре момента есть
Для центральных моментов имеет место аналогичное рекуррентное соотношение
следовательно,
и т.д.
Общая же формула имеет вид (N. Privault, 2011)
где - число разбиений множества объёма на подмножеств объёмов, по крайней мере 2; эти числа связаны с числами Стирлинга второго рода (числом разбиений множества объёма на непустых подмножеств) соотношением
,
а также
Коэффициенты вариации и асимметрии в данном случае равны , а коэффициент эксцесса равен .
Что касается кумулянтов , то в данном случае
для всех .
Распределение Пуассона однозначно определяется своими моментами, при этом
,
его мода равна (квадратные скобки означают целую часть), если - не целое, в противном же случае имеются две моды: и , а медиана лежит между и .
Среднее отклонение с. в. X есть
и при
Для обратных факториальных моментов справедливо представление
.
Интенсивность отказов (failure rate) для распределения Пуассона является возрастающей функцией , а его энтропия равна
.
3. Распределение безгранично делимо: для любого целого
,
где также является пуассоновской характеристической функцией с параметром .
4. Связь с другими распределениями. 1) Пусть с. в. и независимы и L(X j) =. Тогда условное распределение есть
L.
2) Пусть с. в. имеет распределение хи-квадрат с степенями свободы ( - целое), плотность которого есть . Тогда
.
5. Симметризация. Пусть обозначают независимые случайные величины, имеющие одно и то же распределение Пуассона . Тогда их сумма имеет распределение . Распределение же их разности называется симметризованным пуассоновским распределением и обозначается символом Это распределение симметрично, имеет среднее 0, дисперсию и оно является предельным (при условии ) для симметризованного биномиального распределения . Соответствующие вероятности имеют вид
,
где - модифицированная функция Бесселя порядка (она определяется этим соотношением), а характеристическая функция этого распределения есть
.
Справедливо также представление ( - целое)
,
где с. в. имеет нецентральное распределение хи-квадрат с степенями свободы и параметром нецентральности , задаваемое плотностью
Более того, если - независимые случайные величины, имеющие пуассоновские распределения с соответствующими параметрами, то для распределения их разности имеет место аналогичное представление:
,
где теперь с. в. имеет параметр нецентральности .
Соответствующие же вероятности имеют теперь вид
,
и это распределение называют также распределеним - Бесселя.
6. Обобщённое (сложное) распределение Пуассона. Так называется распределение суммы
случайного числа одинаково распределённых целочисленных неотрицательных случайных величин. При этом с. в. независимы в совокупности и распределено по закону Пуассона с параметром .
Соответствующая производящая функция равна
где - производящая функция . При этом
Такое распределение возникает как предельное в следующей схеме серий. Пусть - независимые в каждой серии случайные величины, имеющие распределения
Обозначим
.
Тогда, если при
то предельным распределением суммы является сложное пуассоновское распределение с параметром и функцией .
Если суммируются бернуллиевские величины с параметром , то сумма имеет, очевидно, распределение Пуассона с параметром .
Обобщённым распределением Пуассона называют также распределение целочисленной неотрицательной с. в. , когда
,
при получаем обычное распределение .
7. Рандомизация параметра. Пусть параметр является случайной величиной, имеющей некоторую функцию распределения . Тогда составное распределение Пуассона (его также называют смесью пуассоновских распределений) имеет плотность
Производящая функция и факториальные моменты этого распределения равны
8. Усечённое распределение. Если в пуассоновском распределении значение 0 запрещено, то говорят, что наблюдаемая с. в. имеет усечённое в нуле (или положительное) пуассоновское распределение:
.
Замечание. В общем случае можно рассматривать лево-усечённое распределение (запрещены первые значения ), право-усечённое распределение (запрещены значения, большие некоторого уровня ) и двусторонне-усечённое распределение. Например, для последнего случая
Среднее и дисперсия положительного пуассоновского распределения есть
(аппроксимация справедлива для достаточно больших значений (Tiku, 1964)).
Сумма независимых одинаково распределённых положительных пуассоновских величин имеет производящую функцию
,
а соответствующие вероятности имеют вид
где есть числа Стирлинга второго рода.
Среднее и дисперсия этого распределения, называемого распределением Стирлинга второго рода, имеют вид:
и .
9. Ортогональные многочлены. Систему многочленов, ортогональных относительно распределения Пуассона L(X) =, образуют многочлены Пуассона-Шарлье (В.И. Хохлов, 2001)
:
- символ Кронекера.
3. Историческая справка
Пуассон в своей книге (Poisson, 1837, Secs. 73, pp. 189-190 and Secs. 81, pp. 205 207) опубликовал вывод распределения, в дальнейшем, получившего его имя. Распределение выводится, как предел последовательности биномиальных распределений
при N, стремящемся к бесконечности, р стремящемся к нулю. Произведение Np остается конечным и равным и. Нетрудно установить непосредственным подсчетом, что
Где означает суммирование по любому (конечному или бесконечному) подмножеству неотрицательных целых чисел 0, 1, 2, ... .
Этот результат был приведен ранее де Муавром в книге (de Mensura, 1711, p. 219). Борткевич в своей работе (Bortkiewicz, 1898) рассматривал ситуации, в которых может возникнуть распределение Пуассона. С точки зрения подхода самого Пуассона, это ситуации, в которых, в дополнение к требованиям независимости испытаний и неизменности вероятности успеха от испытания к испытанию, число испытаний должно быть велико, в то время как вероятность успеха мала. Хотя Борткевич назвал это условие законом малых чисел, нет необходимости, чтобы величина и = Np была «мала». Важно лишь, чтобы N было велико, а р мало. В своей книге Борткевич изучал, в частности, количество смертей от удара копытом лошади за год в прусском армейском корпусе. Это -как раз такая ситуация, когда вероятность смерти по указанной причине мала, а число солдат, подверженных риску (в любом из корпусов), велико. Правда, остается неясным, выполнены ли условия независимости и постоянства вероятности. Однако данные, собранные Борткевичем, вполне удовлетворительно описывались пуассоновским распределением и широко цитировались, как пример применимости данного распределения. Эти данные детально обсуждаются в работе (Quine and Seneta, 1987). Борткевич, также, получил хорошее согласование с пуассоновским распределением для данных о несчастных случаях со смертельным исходом и самоубийств, включая данные о числе самоубийств в год среди прусских мальчиков в возрасте до десяти лет (а также и для девочек).
Борткевич рассчитал таблицы значений вероятностей пуассоновского распределения, а также получил многие свойства данного распределения, такие как: разностные и дифференциальные уравнения для вероятностей, вывел ряд таких моментов, как предел моментов биномиального распределения.
В работе (Thiele, 1889) приводится совершенно иной вывод. Показано, что для распределения с семиинвариантами «наблюдаемые значения равны 0, а, 2а, 3а ..., и относительная частота значения ra равна автор считает, что такое распределение, «возможно, предпочтительнее биномиального, как представитель некоторого класса асимметричных законов ошибок».
Шарлье в своей статье (Charter, 1905а) рассматривал биномиальную выборочную схему с производящей функцией и таким образом показал, что вероятности успеха , не обязаны быть постоянными для того, чтобы получилось распределение Пуассона.
В статье (Charlier, 1905b) Шарлье получил это же распределение, решив систему дифференциально-разностных уравнений
где вероятности являются функциями времени. В работах (Bateman, 1910) и (MrKendrick, 1914), также рассматривается эта модель (процесс чистого размножения с постоянной интенсивностью рождения).
Стьюдент (это псевдоним В. С. Госсета) в своей статье (Student, 1907) использовал распределение Пуассона для того, чтобы представить в первом приближении число частиц, попадающих в некоторую малую область А, когда большое число таких областей разбросано случайным образом по поверхности, которая велика по сравнению с А.
Пуассоновское распределение может также возникать для событий, происходящих «случайно и независимо» по времени. Если предположить, что будущая продолжительность жизни некоторого элемента не зависит от его текущего возраста, то его общая продолжительность жизни может рассматриваться как случайная величина Т с плотностью распределения
т.е. имеет показательное распределение. Математическое ожидание Т равно . Теперь представим себе ситуацию, в которой каждый элемент по окончании срока службы может быть заменен другим, с таким же распределением продолжительности жизни. Тогда распределение числа выходов из строя (полных продолжительностей жизни) X в интервале длины t задается следующим образом
где обозначают последовательные продолжительности жизни и .
Из соотношения между распределениями и пуассоновским, вытекает, что
т.е. получен тот же вид, что в изначальном равенстве, но с заменой и на . Следовательно, случайная величина X имеет распределение Пуассона с параметром .
Тем же самым методом приходят к использованию пуассоновского распределения для того, чтобы описывать изменение числа частиц («лучей»), испускаемых радиоактивным источником за периоды излучения. В статье (Rutherford and Geiger, 1910) приведены некоторые численные данные, хорошо согласующиеся с законом Пуассона; смотри также работу (Rutherford et al 1930).
Унификация существовавшей в то время теории была произведена Борткевичем в статье (Bortkiewicz, 1915), который опирался на распределение промежутков между осуществлениями событий; смотри монографию (Haighl, 1967). Пуассоновское распределение может быть охарактеризовано также распределением числа событий на фиксированном интервале времени процесса восстановления с показательными промежутками между восстановлениями
В книге (Levy, 1937b, pp. 173-174) инициирован аксиоматический подход. Пуассоновское распределение - это считающее распределение для пуассоновского процесса. А сам пуассоновский процесс определяется как случайный точечный процесс, удовлетворяющий следующим условиям: каково бы ни было число точек в интервале , вероятность того, что точка попадет в интервал , равна , а вероятность иметь более одной точки равна ; см. например, монографию (Feller, 1968, р. 447).
В paбoтe (Paren, 1962. р. 118) применяется более строгий подход. Показано что пуассоновский процесс X(t) удовлетворяет следующим пяти аксиомам:
Аксиома 0: X(0)=0
Аксиома 1: Приращения процесса X(t) независимы, т.е. для любых , таких, что случайные величины независимы.
Аксиома 2: Для любого t > 0 справедливо 0 < P[X(t) > 0] < 1.
Аксиома 3: Для любого t > 0
Аксиома 4: Приращения процесса X(t) стационарны, т.е. для точек
(при h>0), случайные величины и распределены одинаково.
Существуют различные доказательства того, что из аксиом 0-4 следует существование постоянной и, для которой
Модификация этих аксиом приводит к более общему случайному процессу, например, заменив соотношение в аксиоме 4 на
Получим неоднородный процесс, см. работу (Parzen, 1962, p. 125). В монографии о пуассоновских распределениях (Haight, 1967) обсуждаются другие аксиоматические подходы, в частности подход Фиша и Урбаника (см. работу (Fish and Urbanik, 1956)), которые дали достаточное условие для того, чтобы процесс, удовлетворяющий аксиомам 0-2, был пуассоновским. Хэйт также описал несколько специальных вероятностных моделей, среди которых модель из статьи (Hurwitz and Кас, 1944). Работа (Johnson and Kotz, 1977) посвящена урновым моделям, связанным с пуассоновским распределением.
Поскольку равенство
выполняется тогда и только тогда, когда случайная величина X имеет экспоненциальное распределение, (см. работы (Feller, 1957, ch. 17) и (Parzen, 1962)), из показательности промежутков между пуассоновскими событиями вытекает что, удивительным образом, промежуток времени между произвольным моментом времени и следующим за ним пуассоновским событием распределен так же, как промежуток между двумя соседними пуассоновскими событиями.
Пуассоновское распределение - это следствие максимального беспорядка возникающего в теории информации, см. статью (Renyi, 1964). Пуассоновское расположение точек, полученное в результате тщательного перемешивания других точек, изучалось в работе (Maruyama, 1955) и (Watanabe. 1956) в справочнике (Haight, 1967) имеются также и другие ссылки.
В статье (Kreweras, 1979) описаны два необычных способа получении пуассоновского распределения с параметром . Рассмотрим все n! перестановок чисел 1, 2…n, и пусть u(n,x) - это число тех перестановок, в которых имеется x пар целых чисел, стоящих в естественном порядке. Например, при п = 5 перестановке 12543 соответствует число x=1, перестановке 12534 - х = 2, а для перестановки 12345 получается х = 4.
Тогда
Таким образом, распределение числа пар целых чисел, расположенных в естественном порядке (что было названо регулярностью перестановки), стремится к пуассоновскому распределению с параметром .
Другой способ возникновения распределения связан с рассмотрением разбиения первых 2п целых чисел на пары. Общее число возможных разбиений равно
доля тех, которые содержат ровно х пар, состоящих из последовательных целых чисел, также стремится к при .
Пуассоновское распределение является предельным для биномиального распределения и многих других распределений. В частности, оно является предельным для отрицательно биномиального распределения; поскольку
Осознание этого факта помогло бы смягчить дискуссию, инициированную в работе (Whittaker, 1914) по поводу относительной ценности пуассоновской и отрицательно биномиальной моделей.
В статье (Widdra, 1972) пуассоновское распределение получается как предел (при ) распределения числа успехов в n частично зависимых испытаниях. Оказывается, что если -- индикаторные случайные величины, и при где но в остальном случайные величины и независимы, а вероятность успеха постоянна, т. е. для всех g, h, то распределение случайной величины
стремится к пуассоновскому при , причем .
Важные результаты из статьи (Chen, 1975) о сходимости к пуассоновскому распределению для числа успехов в п зависимых испытаниях с использованием только первых двух моментов были передоказаны в работах (Arratia, Goldstein and Gordon, 1989, I990). Простое доказательство о пуассоновской аппроксимации распределений типа степенного ряда, опирающееся только на непрерывность производящих функций, можно найти в работе (Perez - Abreu, 1991).
В статье (Settling, 1977) с использованием пуассоновских аппроксимаций были получены границы надежности для систем типа k из п.
В последние годы использование пуассоновского распределения заметно участилось. Наряду с биномиальным распределением, пуассоновское часто служит стандартом, от которого измеряется отклонение, даже тогда, когда само пуассоновское распределение не дает адекватного представления действительности.
Справочник (Haight, 1967) о пуассоновских распределениях содержит много интересной информации о пуассоновском и связанных с ним распределениях.
4. Моменты
Простота пуассоновской производящей функции приводит к простым выражениям для производящей функции семиинвариантов, производящей функции факториальных моментов и производящей функции факториальных семиинвариантов.
Производящая функция семиинвариантов равна , поэтому для всех
Производная функция факториальных моментов равна , откуда для всех .
Производящая функция факториальных семиинвариантов равна , следовательно,
для всех .
Из соотношения между факториальными моментами и обычными получаем:
где - это разность, в нуле, a S(r,j)- число Стирлинга второго рода.
Производящая функция моментов имеет вид
а производящая функция центральных моментов --
из последней формулы следуют рекуррентные соотношения для моментов относительно среднего:
(Riordan, 1937). Кроме того, в монографии (Kendall, 1943) показано, что
Следовательно
О пуассоновской случайной величине с параметром иногда говорят, что она имеет пуассоновское распределение со средним .
Моментные отношения и задаются следующим образом:
Заметим, что пуассоновское распределение обладает следующими свойствами
Коэффициент вариации равен . Индекс рассеивания (дисперсии) равен ; этим часто пользуются в экологии, как эталоном, относительно которого измеряется степень концентрации распределения около среднего: избыточное рассеяние при и избыточная концентрированность при .
Среднее отклонение пуассоновского распределения имеет вид
(где [*] означает целую часть); этот факт был установлен в работе (Ramasubban, 1958), где имеется также выражение для средней разности. В статье (Crow, 1958) также рассматривается среднее отклонение и показано, что r-й обратный факториальный момент (по возрастанию) равен
Для пуассоновского распределения
где означает целую часть. При росте отношение осциллирует; оно стремится к .
В справочнике (Haight, 1967) приводится целый ряд формул, относящихся к неполным моментам.
5. Асимптотические результаты и приближения
1. Нормальное приближение. Если , то нормированная с. в. имеет асимптотически нормальное распределение с параметрами 0 и 1, т. е. равномерно по
Справедлив также локальный вариант нормальной сходимости:
,
при этом последнее соотношение выполняется равномерно по .
Имеются различные уточнения этих классических утверждений. Так, применение разложения Эджеворта даёт следующий результат (Matsunawa, 1986):
где и .
Известна также весьма точная аппроксимация (Peiser and Pratt, 1968):
, ,
где .
Локальные вероятности для больших значений могут быть аппроксимированы с использованием формулы Стирлинга для , один из соответствующих результатов имеет вид (Kemp, 1989):
.
Для обобщённого пуассоновского распределения, порождаемого производящей функцией , соответствующее утверждение имеет следующий вид.
Пусть и ряд имеет радиус сходимости . Пусть, далее,
и .
Тогда, если целое при так, что , то
и нормированная с.в. имеет в пределе стандартное нормальное распределение.
2. Большие уклонения. В зонах больших уклонений, где , справедливы представления
где - числа Бернулли, определяемые разложением
(при нечётных все , первые значения этих чисел таковы: ).
Пусть, далее, так, что при некоторых выполняется условие
. (*)
Тогда для «правого хвоста» имеет место соотношение (А.Н. Тимашев, 2011)
Где ,
а также
.
Для «левого хвоста» , при замене условия (*) на симметричное условие , выполняются соотношения
.
3. Добавления для обобщённого распределения Пуассона. Пусть для этого распределения выполняются указанные выше в п.1 условия.
а) Если - многочлен степени и , то при фиксированном и
,
где - единственный положительный корень уравнения
;
при этом
.
б) Если и так, что
Где ,
то ,
где - единственный корень уравнения
.
Если выше заменить на , то также
а если , то и
.
в) Пусть тогда при и фиксированном
.
4. При имеют место асимптотические соотношения:
5. Пусть Тогда
.
6. Пусть , тогда
.
7. Асимптотическое поведение квантилей (В.Ф. Колчин, 1969). 1) Если , и выбрано так, что и , то
.
2) Если , и выбрано так, что и , то
и ,
где - корень уравнения в интервале .
3) Если , и
,
,
где - отрицательная функция на отрезке , задаваемая уравнением
;
при этом
4) Если , и выбрано так, что и , то и
.
5) Если , и выбрано так, что и , то
и ,
где - корень уравнения в интервале .
6) Если , и
,
,
где - положительная функция, заданная в интервале тем же уравнением, что и в п. 3); при этом
6. Моделирование
Пусть - последовательность независимых и равномерно распределённых на отрезке случайных величин и
.
Тогда величина распределена по закону .
Таким образом, выборку Х=(Х1,…, Хn) из распределения можно смоделировать по формулам
.
7. Статистические выводы
1. Модель и её характеристики. Пусть Х=(Х1,…, Хn) есть случайная выборка объёма n из распределения L () =.
Для этой модели функция информации имеет вид
,
а полная достаточная статистика есть
при этом
L () =.
2. Оценивание. а) Оптимальной несмещённой оценкой для сходящегося при всех степенного ряда
является статистика
.
В частности, для функций
оптимальные оценки имеют вид соответственно
.
б) Эффективная оценка (она же является и оценкой максимального правдоподобия ) существует для функции : она имеет вид
и её дисперсия равна .
в) Преобразование параметра, стабилизирующее дисперсию, имеет вид : асимптотическая дисперсия ОМП не зависит от параметра и равна .
г) Оценивание для усечённого распределения. Пусть в пуассоновском распределении значение 0 запрещено, т. е. наблюдаемая с. в. имеет усечённое в нуле (или положительное) пуассоновское распределение:
.
Оптимальная оценка для параметра этого распределения по соответствующей выборке Х=(Х1,…, Хn) имеет вид (Tate and Goen, 1958)
,
Где ,
и для больших справедлива аппроксимация
.
Оценка же максимального правдоподобия находится из уравнения
и имеет вид (Irwin, 1959)
.
При больших значениях объёма выборки
.
Простая оценка, основанная на выборочных моментах
имеет вид (David and Johnson, 1952)
,
и для её дисперсии справедлива аппроксимация
.
Асимптотическая эффективность этой оценки (относительно ОМП) достигает минимума около 70% между и , и она возрастает до 100% при возрастании .
3. Доверительное оценивание. Доверительный интервал для параметра в модели , по соответствующей выборке Х=(Х1,…, Хn) и при доверительном уровне определяется условиями
при этом где есть -квантиль распределения хи-квадрат с степенями свободы .
Если велико, то приближённый -доверительный интервал для имеет вид
.
Асимптотический -доверительный интервал для произвольной непрерывно дифференцируемой функции имеет вид
а для функции - вид
().
4. Байесовское оценивание. Пусть параметр случаен и его априорное распределение есть гамма-распределение (оно сопряжено к распределению Пуассона).
Тогда байесовская оценка для по выборке Х=(Х1,…,Хn), которая минимизирует среднеквадратическую ошибку , существует и имеет вид
и её риск равен
.
В рассматриваемом случае апостериорное распределение параметра имеет вид
L() =.
При цене одного наблюдения оптимальный объём выборки, минимизирующий общие потери , есть
.
5. Проверка гипотез. а) Критерий Неймана-Пирсона. Чтобы построить критерий в задаче с простыми гипотезами (), где, для определённости, , определим целое число (- заданный уровень значимости) из условия
. (*)
Если здесь имеет место знак равенства , то критерий Неймана-Пирсона задаётся критической областью
и его мощность есть
Если же , то можно использовать критерии
(с уровнем значимости )
либо
(с уровнем значимости ).
Эти же критерии являются оптимальными и в задаче () со сложными односторонними гипотезами.
Для больших выборок асимптотический вариант критерия Неймана-Пирсона принимает вид
и его мощность при «близкой» альтернативе вида
удовлетворяет предельному (при ) соотношению
.
б) Задача . В этой задаче с двусторонней альтернативой асимптотический вариант критерия отношения правдоподобия при уровне значимости имеет вид
и его мощность при альтернативах вида
удовлетворяет предельному (при ) соотношению
.
в) Гипотеза однородности (1). Пусть - выборочные средние для независимых выборок объёмов соответственно из распределений . Для проверки гипотезы однородности в случае больших выборок можно использовать следующий асимптотический вариант критерия отношения правдоподобия (при уровне значимости )
,
где .
г) Гипотеза однородности (2). Пусть наблюдаемые случайные величины независимы и L() =. В этой ситуации требуется проверить гипотезу однородности .
Пусть и - выборочные среднее и дисперсия исходных данных, тогда статистика
при гипотезе имеет асимптотически (при ) стандартное нормальное распределение, поэтому в этих условиях можно использовать критерий (при уровне значимости )
.
8. Характеризации
Много исследований было посвящено характеризации пуассоновского распределения. Обзор работ, вышедших до 1974, имеется в статье (Kotz, 1974).
Райков в работе (Raikov, 1938) показал, что если , - независимые случайные величины, а их сумма имеет пуассоновское распределение, то каждая из величин и должна иметь распределение Пуассона. (Аналогичное свойство справедливо для суммы любого числа независимых пуассоновских случайных величин.)
Одно фундаментальное свойство пуассоновского распределения описано в статье Морена (Moran, 1952). Если и независимые неотрицательные целочисленные случайные величины, такие что условное распределение при заданной сумме биномиальное с одним и тем же параметром р для любых значений , и если существует по крайней мере одно целое i такое, что , , то обе случайные величины и пуассоновские. В работе (Chartterji, 1963) показано, что если и независимые неотрицательные целочисленные случайные величины и если
, =0, 1, …, x
то верны следующие утверждения:
1) не зависит от х и равно постоянной p для всех значений x,
2) каждая из величин и имеет пуассоновское распределение, причем отношение параметров равно р/(1 - р).
Эта характеризация была обобщена Большевым в статье (Bol'shew, 1965) на случай п величин . Условие состоит в том, что условное распределение при заданной сумме полиномиальное, см. также работу (Volodin, 1965). Большев предположил, что это свойство может применяться для порождения нескольких пуассоновских распределений с использованием только одной первоначальной суммарной пуассоновской величины (с большим средним), которая расщепляется на целочисленные слагаемые с помощью полиномиального распределения с заданными вероятностями исходов. В статье (Braun and Bromberg, 1984) эта идея получила дальнейшее развитие. В работе (Patil and Seshadri, 1964) показано, что характеризация Морана - это частный случай более общей характеризации для пары независимых случайных величин , и с заданным условным распределением при фиксированной сумме . Дальнейшее обобщение характеризации Морана было дано в работах (Janardan and Rao, 1982) и (Alzaid, Rao and Shanbhag, 1986). Комментарии о предложенном распространении на усеченные случайные величины можно найти в работе (Panaretos, 1983b).
Лукач в статье (Lucacs, 1956) показал, что если - это случайная выборка из некоторого распределения, то это распределение является пуассоновским с параметром тогда и только тогда, когда статистика имеет пуассоновское распределение с параметром .
Предположим, что - случайная выборка, и пусть r и s - два положительных целых числа. Предположим также, что у распределения существует (r + s)-й момент, а функция распределения равна нулю при x < 0 и больше нуля при . Лукач показал, что в такой ситуации распределение пуассоновское тогда и только тогда, когда k-статистика вида имеет постоянную регрессию на , т. е. в том и только в том случае, когда .
В статье (Rao and Rubin, 1964) получена следующая характеризация пуассоновского распределения. Если X - дискретная случайная величина, принимающая только неотрицательные целые значения, и условное распределение Y при условии X = х биномиальное с параметрами х, р (p не зависит от х), то распределение X пуассоновское тогда и только тогда, когда
.
Рао в работе (Rao, 1965) дал следующее физическое обоснование модели, описанной выше:
* X представляет «естественно» возникающую случайную величину, которая реализуется таким образом, что некоторые значения случайной величины X могут быть искажены.
* Y представляет собой остающуюся реально наблюдаемую искаженную величину X после такого «деструктивного процесса».
Иначе говоря предположим, что первоначальное наблюдение распределено по закону Пуассона с параметром , а вероятность того, что первоначальное наблюдение n превращается в r из-за деструктивного процесса, равна
, .
Если Y обозначает результирующую случайную величину, то не повреждено] = повреждено] = .
Таким образом, условие характеризует пуассоновское распределение.
Характеризация Рао - Рубина привлекла большое внимание. Например, в статье [Srivastava and Srivastava, 1970] показано, что если первоначальные наблюдения имени пуассоновское распределение и если условие выполнено, то деструктивный процесс биномиальный.
Пусть X - дискретная случайная величина с носителем 0, 1,...; предположим также, что если наблюдается X = n, то проводится п бернуллиевских испытаний с вероятностью успеха р. Пусть Y и Z соответственно получившиеся числа успехов и неудач. В работе [Srivastava, 1971] показано, что случайная величина X имеет пуассоновское распределение тогда и только тогда, когда Y и Z независимы.
Альтернативное, более простое доказательство теоремы Рао-Рубина было дано Вангом в статье (Wang, 1970). Ванг также выдвинул идею биномиального смещения, т.е. построение составного распределения (смещение) X с помощью биномиальною распределения
,
Аналогично определяется понятие биномиального разложения. Ванг показал, что пуассоновское распределение это единственное распределение, инвариантное относительно биномиального смещения или разложения.
Характеризация Рао и Рубина была обобщена на пару независимых пуассоновских величин (а также на совокупность нескольких пуассоновских величин) в работе (Таlwalker, 1970). Независимо это же обобщение было предложено в статье (Sriwastava and Srivastava, 1970) в следующем виде.
Пусть -- невырожденный дискретный случайный вектор такой, что , принимают неотрицательные целые значения. Пусть, далее независимо с вероятностями
и
наблюдения величин , сводятся соответственно к , в результате деструктивного процесса. Пусть обозначает случайный вектор, где и принимают значения 0, 1, 2… пусть это вектор с компонентами , . Соотношение = повреждено] = повреждено, не повреждено] = не повреждено, повреждено] = не повреждено]
выполнено тогда и только тогда, когда вектор X имеет двумерное пуассоновское распределение с производящей функцией .
Элементарное (и элегантное) доказательство было дано в статье (Shanbhag, 1974); см. также работы (Aczel, 1972) и (van der Vaart, 1972). В статье (Aczel, 1975) эта проблема изучена при более слабых условиях. Заметим, что более простое доказательство Ванга (см. работу (Wang, 1970)) характеризации Рао - Рубина справедливо и в многомерном случае.
Характеризация тройки распределений биномиального, пуассоновского и отрицательно биномиального - с помощью обобщенного условия Рао - Рубина изучалась в работах (Talwalker, 1975, 1980) и (Rao et al., 1980). Обобщенное условие Рао - Рубина имеет вид вероятность выживания ] = не повреждено, вероятность выживания ], где Y - это результирующая случайная величина с носителем 0, 1, ...
В статье (Krishnaji, 1974) получен следующий результат: если и
,
то тогда и только тогда, когда случайная величина Y имеет распределение Пуассона со средним .
Другой вариант теоремы Рао--Рубина был доказан в статье [Shanbhag and Clark, 1972].
Пусть случайная величина X имеет распределение типа степенного ряда
, х = 0, 1,…,
предположим также, что условное распределение Y при условии X = п имеет вид , r = 0, 1,…, n, со средним и дисперсией , где не зависит от . Тогда
и
в том и только том случае, когда пуассоновское и . (Заметим, что если g(r;n) биномиальное, то соответственно среднее и дисперсия равны и )
Дальнейшие результаты, связанные с характеризацией Рао-Рубина, были получены в работах (Shanbhag, 1974), (Shanbhag and Rajamannar 1974), (Saristava and Singh, 1975), (Shanbhag and Panaretos, 1979), (Gupta. 1981) и (Kourouklis, 1986).
Согласно статье (Korwar, 1975), если X и Y неотрицательные целочисленные случайные величины такие, что для любого x
, y = 0, 1, …,x
где p некоторая, не зависящая от x постоянная такая, что 0 < p < 1, то функция X имеет распределение Пуассона в том и только том случае, когда
...Подобные документы
Двумерная функция распределения вероятностей случайных величин. Понятие условной функции распределения и плотности распределения вероятностей. Корреляция двух случайных величин. Система произвольного числа величин, условная плотность распределения.
реферат [325,3 K], добавлен 23.01.2011Основные понятия, действия над случайными событиями. Классическое определение, свойства вероятностей. Правила вычисления вероятностей случайных событий. Построение законов распределения вероятностей случайных величин, вычисление числовых характеристик.
задача [82,0 K], добавлен 12.02.2011Биография и творческий путь Гнеденко - советского математика, специалиста по математической статистике. Выявление его вклада в развитие теории вероятностей. Описание статистических методов управления качеством. Суммирование независимых случайных величин.
курсовая работа [27,5 K], добавлен 10.01.2015Классификация случайных событий. Функция распределения. Числовые характеристики дискретных случайных величин. Закон равномерного распределения вероятностей. Распределение Стьюдента. Задачи математической статистики. Оценки параметров совокупности.
лекция [387,7 K], добавлен 12.12.2011Классическое, статистическое и геометрическое определения вероятности. Дискретные случайные величины и законы их распределения. Числовые характеристики системы случайных величин. Законы равномерного и нормального распределения систем случайных величин.
дипломная работа [797,0 K], добавлен 25.02.2011Описание случайных ошибок методами теории вероятностей. Непрерывные случайные величины. Числовые характеристики случайных величин. Нормальный закон распределения. Понятие функции случайной величины. Центральная предельная теорема. Закон больших чисел.
реферат [146,5 K], добавлен 19.08.2015Возможные варианты расчета вероятности событий. Выборочное пространство и события, их взаимосвязь. Общее правило сложения вероятностей. Законы распределения дискретных случайных величин, их математическое ожидание. Свойства биномиального распределения.
презентация [1,4 M], добавлен 19.07.2015Статистическое, аксиоматическое и классическое определение вероятности. Дискретные случайные величины. Предельные теоремы Лапласа и Пуассона. Функция распределения вероятностей для многомерных случайных величин. Формула Байеса. Точечная оценка дисперсии.
шпаргалка [328,7 K], добавлен 04.05.2015Алгебраический расчет плотности случайных величин, математических ожиданий, дисперсии и коэффициента корреляции. Распределение вероятностей одномерной случайной величины. Составление выборочных уравнений прямой регрессии, основанное на исходных данных.
задача [143,4 K], добавлен 31.01.2011Основные понятия, которые касаются центральной предельной теоремы для независимых одинаково распределенных случайных величин и проверки статистических гипотез. Анализ сходимости последовательностей случайных величин и вероятностных распределений.
курсовая работа [582,0 K], добавлен 13.11.2012Случайный процесс в теории вероятностей. Математическое ожидание и дисперсия. Многомерные законы распределения. Вероятностные характеристики "входной" и "выходной" функций. Сечение случайной функции. Совокупность случайных величин, зависящих от параметра.
курсовая работа [1,8 M], добавлен 23.12.2012Понятия теории вероятностей и математической статистики, применение их на практике. Определение случайной величины. Виды и примеры случайных величин. Закон распределения дискретной случайной величины. Законы распределения непрерывной случайной величины.
реферат [174,7 K], добавлен 25.10.2015Пространство элементарных событий, математическое ожидание. Функции распределения и плотности распределения составляющих системы случайных величин. Числовые характеристики системы. Условия нормировки плотности системы случайных непрерывных величин.
практическая работа [103,1 K], добавлен 15.06.2012Сходимость последовательностей случайных величин. Центральная предельная теорема для независимых одинаково распределенных случайных величин. Основные задачи математической статистики, их характеристика. Проверка гипотез по критерию однородности Смирнова.
курсовая работа [1,6 M], добавлен 13.11.2012Сущность и предмет теории вероятностей, отражающей закономерности, присущие случайным явлениям массового характера. Изучение ею закономерностей массовых однородных случайных явлений. Описание наиболее популярных в теории вероятностей экспериментов.
презентация [474,2 K], добавлен 17.08.2015События и случайные величины. Функция распределения и ее характерные свойства. Сущность и определение основных числовых характеристик случайных величин: математическое ожидание, дисперсия, моменты. Критерии и факторы, влияющие на их формирование.
контрольная работа [118,5 K], добавлен 30.01.2015Изучение закономерностей массовых случайных явлений. Степень взаимосвязи теории вероятностей и статистики. Невозможные, возможные и достоверные события. Статистическое, классическое, геометрическое, аксиоматическое определение вероятности. Формула Бейеса.
реферат [114,7 K], добавлен 08.05.2011Пространства элементарных событий. Совместные и несовместные события. Функция распределения системы случайных величин. Функции распределения и плотности распределения отдельных составляющих системы случайных величин. Условные плотности распределения.
задача [45,4 K], добавлен 15.06.2012Предмет и метод математической статистики. Распределение непрерывной случайной величины с точки зрения теории вероятности на примере логарифмически-нормального распределения. Расчет корреляции величин и нахождение линейной зависимости случайных величин.
курсовая работа [988,5 K], добавлен 19.01.2011Вероятность совместного выполнения двух неравенств в системе двух случайных величин. Свойства функции распределения. Определение плотности вероятности системы через производную от соответствующей функции распределения. Условия закона распределения.
презентация [57,9 K], добавлен 01.11.2013