Математическая статистика
Свойства функции распределения случайного вектора. Числовые характеристики системы двух величин. Ковариация, коэффициент корреляции и его свойства. Основные задачи математической статистики. Генеральная совокупность, статистическое распределение выборки.
Рубрика | Математика |
Вид | шпаргалка |
Язык | русский |
Дата добавления | 20.02.2018 |
Размер файла | 364,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http: //www. allbest. ru/
План
1. Случайный вектор. Свойства функции распределения случайного вектора
2. Дискретный и непрерывный случайный вектор. Свойства плотности распределения случайного вектора
3. Числовые характеристики системы двух случайных величин. Ковариация, коэффициент корреляции и его свойства. Асимметрия и эксцесс
4. Задачи математической статистики. Генеральная совокупность, выборка.
5. Эмпирическая функция распределения
6. Статистическое распределение выборки. Варианты. Полигон и гистограмма
7. Точечные оценки неизвестных параметров. Несмещённые, состоятельные и эффективные оценки
8. Методы моментов и максимального правдоподобия
9. Интервальные оценки неизвестных параметров. Доверительные интервалы для математического ожидания и дисперсии
10. Функция двух случайных аргументов. Формула свертки
математический статистика вектор корреляция
1. Случайный вектор. Свойства функции распределения случайного вектора
Определение. Упорядоченная пара случайных величин(X, Y), определенных на одном и том же пространстве элементарных событий ?, называется системой случайных величин, двумерным случайным вектором или двумерной случайной величиной.
Систему случайных величин можно рассматривать как случайную точку на координатной плоскости, либо как случайный вектор (см. рис. 7.1, 7.2). Для обычной случайной величины X случайным событием являлось любое множество элементарных событий, удовлетворяющих условию X B, где B - борелевское множество на прямой. Подмножество B R2 числовой плоскости называется борелевским, если оно может быть получено из открытых или замкнутых множеств вR2 с помощью конечного или счетного числа теоретико-множественных операций. Борелевскими множествами являются: точки, прямые, открытые и замкнутые многоугольники, полуплоскости, круги и т.д.
Так же как и в одномерном случае, ситуация упрощается с помощью рассмотрения функции распределения.
Определение. Функцией распределения двумерной случайной величины (X, Y) называется вероятность совместного выполнения двух событий
X< x и Y< y
FX,Y(x,y) =P(X <x,Y <y). (7.1)
Геометрической интерпретацией (7.1) может служить рис. 7.3, на котором значением функции распределения может служить вероятность попадания случайной величины (X,Y) в бесконечный квадрант Q(x,y) с вершиной в точке (x,y), лежащий левее и ниже ее.
Случайные векторы (, ) и (,)одинаково распределены, когда их функции распределения совпадают.
Для одинаково распределенных случайных векторов (, ) и (,) вероятность попадания точек (, ) и (,) в какое-либо борелевское множество B R2 одна и та же:
P{(, )B}= P{(,)B} .
Свойства функции распределения.
1.FX,Y(x, y) не убывает по обоим аргументам, т.е.
при при .
2.FX,Y(x, y) непрерывна слева по обоим аргументам, т.е.
3.
4.
5.
6. 1
2. Дискретный и непрерывный случайный вектор. Свойства плотности распределения случайного вектора
Случайный вектор называется дискретным, если все его компоненты--дискретные случайные величины. Вектор называется непрерывным, если существует неотрицательная функция
Св-ва плотности распред случ велич
1)
2)
3) -
4) множество из пространства
Если каждое возможное значение случайной величины Х соответствует 1 возможному значению случайной величины У, то У называется функцией случайного аргумента Х.
3. Числовые характеристики системы двух случайных величин. Ковариация, коэффициент корреляции и его свойства. Асимметрия и эксцесс
Для описания системы двух случайных величин кроме математических ожиданий и дисперсий используют и другие характеристики. К их числу относятся ковариация и коэффициент коррекции.
v Ковариацией между случайными величинами Х и Y называется число
, где
Для непрерывных случайных величин X и Y используют формулу
Покажем, что если случайные величины Х и Y независимы, то. Пусть Х и Y - непрерывные случайные величины
v Коэффициентом корреляции между случайными величинами Х и Y называется число
.
Свойства корреляции.
Свойство 1: Абсолютная величина коэффициента корреляции не превосходит единицы, т.е..
Свойство 2: Для того чтобы необходимо и достаточно, чтобы случайные величины Х и Y были связанны линейной зависимостью. Т.е.
с вероятностью 1.
Свойство 3: Если случайные величины независимы, то они некоррелированы, т.е. r=0.
Пусть Х и Y--независимы, тогда по свойству математического ожидания
ь Две случайные величины Х и Y называют коррелированными, если их коэффициент корреляции отличен от нуля.
ь Случайные величины Х и Y называют некоррелированными если их коэффициент корреляции равен 0.
Замечание. Из коррелированности двух случайных величин следует их зависимость, но из зависимости еще не вытекает коррелированность. Из независимости двух случайных величин следует их некоррелированность, но из некоррелированности еще нельзя заключить о независимости этих величин.
Коэффициент корреляции характеризует тенденцию случайных величин к линейной зависимости. Чем больше по абсолютной величине коэффициент корреляции, тем больше тенденция к линейной зависимости.
· Коэффициентом асимметрии случайной величины Х называется число
Знак коэффициента асимметрии указывает на правостороннюю или левостороннюю асимметрию.
· Эксцессом случайной величины Х называется число.
Характеризует сглаженность кривой распределения по отношению к кривой нормального распределения.
4. Задачи математической статистики. Генеральная совокупность, выборка
1. Указать способы сбора и группировки статистических сведений, полученных в результате наблюдений или специально поставленных экспериментов.
2. Разработать методы анализа статистических данных в зависимости от целей исследований. Сюда относятся:
· Оценка неизвестной вероятности события; оценка неизвестной функции распределения; оценка параметров распределения, вид которых известен; оценка зависимости случайно величины от одной или нескольких случайных величин и т.д.;
· Проверка статистических гипотез о виде неизвестного распределения или о величине параметров распределения, вид которых известен;
· Установление статистических зависимостей между случайными событиями, случайными величинами или случайными процессами;
· Управление случайными процессами;
· Планирование эксперимента.
Математическая статистика разрабатывает способы определения числа необходимых испытаний до начала исследований, в ходе исследования и решая другие задачи.
Математическая статистика - наука о способах получения, сокращения, хранения и обработки информации.
Выборочной совокупностью (выборкой) называется совокупность случайно отобранных объектов.
Генеральной совокупностью называется совокупность объектов, из которых производится выборка.
Объемом совокупности (выборочной или генеральной) называется число объектов этой совокупности.
Для того, чтобы по данным выборки можно было достаточно судить об интересующем признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно его представляли, т.е. выборка должна правильно представлять пропорции генеральной совокупности. Коротко: выборка должна быть репрезентативной (представительной).
Предположим, что можно производить измерения случайно величины Допустим, что в n - экспериментах результаты измерений случайной величины - некоторые числа.
Предположим, что выполняются следующие две предпосылки:
1. Эксперименты проверятся в одинаковых условиях;
2. Эксперименты проводятся независимо друг от друга.
Говорят, что результаты n - экспериментов образуют конкретную выборку объема n из генеральной совокупности случайной величины , если предпосылки 1 и 2. Величину называют теоретической случайной величиной.
Пусть требуется произвести измерение случайных величин .
Если производить измерения сериями, то результаты можно записать следующим образом:
- 1 серия
- 2 серия
……………..
- n-я серия
Тогда случайные величины - абстрактные результаты измерения (т.е. результат эксперимента до того, как и провели). Из 1 предпосылки следует , что - одинаково распределенные случайные величины, имеющие один и тот же закон распределения, совпадающий с законом распределения теоретической случайной величины .
Из 2 предпосылки следует, что - независимые случайные величины.
Говорят, что случайные величины образуют абстрактную выборку объема n, если они, за независимые случайные величины.
Функция распределения случайной величины называется теоретической функцией распределения или функцией распределения генеральной совокупности.
Как абстрактную, так и конкретную выборки будем обозначать одними и теми же буквами и называть выборкой.
Повторной называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность.
Бесповоротной называют выборку, при которой отображенный объект в генеральную совокупность не возвращается.
Простым случайным называется такой отбор, при котором объекты извлекают по одному из всей генеральной совокупности.
5. Эмпирическая функция распределения
Пусть получено статистическое распределение выборки и каждому варианту из этой выборки поставлена в соответствие его частость.
Определение. Эмпирической функцией (функцией распределения выборки) называется функция , определяющая для каждого значения частость события ,
,
- где - объем выборки, - число наблюдений, меньших .
При увеличении объема выборки частость события приближается к вероятности этого события. Эмпирическая функция является оценкой интегральной функции в теории вероятностей.
Функция обладает теми же свойствами, что и функция :
1. ;
2. -неубывающая функция;
3. , .
Рассмотрим выборку как генеральную совокупность дискретного типа со значениями , которые принимает с равными вероятностями
По определению начальные моменты и центральные моменты такой генеральной совокупности равны, соответственно,
Эти числовые характеристики называются выборочными характеристиками.
Выборочную характеристику
называют выборочным начальным моментом k -го порядка.
Выборочная характеристика
называется выборочным центральным моментом k -го порядка.
6. Статистическое распределение выборки. Варианты. Полигон и гистограмма
Генеральной совокупностью называют полный набор всех возможных N значений дискретной случайной величины Х. Практически сложно получить полную информацию о случайной величине. Поэтому случайным образом отбирают объекты, которые называются выборкой, при этом число - n называется объёмом выборки. Выборку делают либо из ранее полученных результатов, либо планируют эксперимент. По результатам выборки строят простой статистический ряд в виде таблицы, состоящей из двух строк, в первой - порядковый номер измерения, во второй - его результат xi. Затем производят группировку данных. Вначале xi располагают в порядке возрастания, интервал наблюдаемых значений случайной величины разбивают на последовательные непересекающиеся частичные интервалы, далее подсчитывают количество значений xi, попавших в каждый интервал, т.е. ni. Таким образом, получается группированный статистический ряд или статистическое распределение выборки.
Статистическим распределением выборки или статистическим рядом называют перечень вариант и соответствующих им частот или относительных частот.
Значения xi называют вариантами. Последовательность вариант, записанных в возрастающем порядке (вся строка xi) называется вариационным рядом. Число наблюдений ni называют частотами, i - номер варианты.
Учитывая, что
n- это объем выборки, можно найти относительную частоту pi=ni/n, наблюдаемого значения xi - варианты, k - количество вариант.
Табличные данные могут быть представлены графически в виде полигона или гистограммы. Если выборка задана в виде отдельных точек, а не интервалов, тогда строят полигон частот.
Полигоном частот называют ломаную, отрезки которой соединяют точки с координатами ; полигоном частостей - с координатами, где
,.
Полигон служит для изображения дискретного статистического ряда.
Полигон частостей является аналогом многоугольника распределения дискретной случайной величины в теории вероятностей.
Гистограммой частот (частостей) называют ступенчатую фигуру, состоящую из прямоугольников, основания которых расположены на оси и длины их равны длинам частичных интервалов , а высоты равны отношению: - для гистограммы частот; - для гистограммы частостей.
Гистограмма является графическим изображением интервального ряда.
Площадь гистограммы частот равна , а гистограммы частостей равна 1.
Можно построить полигон для интервального ряда, если его преобразовать в дискретный ряд. В этом случае интервалы заменяют их серединными значениями и ставят в соответствие интервальные частоты (частости). Полигон получим, соединив отрезками середины верхних оснований прямоугольников гистограммы.
7. Точечные оценки неизвестных параметров. Несмещённые, состоятельные и эффективные оценки
Пусть изучается некоторый количественный признак генеральной совокупности. Допустим, что из теоретических соображений удалось установить, какое именно распределение имеет наблюдаемый признак. Естественно возникает задача оценки параметров, которыми определяется это распределение. В нашем распоряжении имеются лишь данные выборки, например значения признака . Их рассматриваем как значения независимых СВ . Найти оценку неизвестного параметра теоретического распределения - значит найти функцию от наблюдаемых случайных величин, которая дает приближенное значение оцениваемого параметра. Итак, статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин. Чтобы оценки давали хорошие приближения параметров распределения, они должны удовлетворять определенным требованиям - быть несмещенными, эффективными, состоятельными.
Оценку параметра назовем точечной, если она выражается одним числом. Любая точечная оценка, вычисленная на основании опытных данных, является их функцией и поэтому сама должна представлять собой случайную величину с распределением, зависящим от распределения исходной случайной величины, от самого оцениваемого параметра и от числа опытов n. 1. Оценка называется состоятельной, если при увеличении числа наблюдений она приближается (сходится по вероятности) к значению оцениваемого параметра.
2. Оценка называется несмещенной, если ее математическое ожидание равно оцениваемому параметру.
3. Оценка называется эффективной, если ее дисперсия меньше дисперсии любой другой оценки данного параметра.
8. Методы моментов и максимального правдоподобия
Пусть - выборка из генеральной совокупности с функцией распределения зависящей от m-неизвестных параметров
, т.е. .
Необходимо найти оценки этих неизвестных параметров.
Метод моментов состоит в том, что выборочные (эмпирические) моменты принимаются за оценки соответствующих теоритических (генеральных) моментов и неизвестные параметры принимаются как функции от этих моментов.
Начальные моменты
1) теоретические (генеральные)
Где / - вероятность того, что P(X=)
P(,) - плотность распределения случайной величины X.
2) Выборочные (эмпирические)
Центральные моменты
1) теоритические (генеральные)
2) Выборочные (эмпирические)
Таким образом для получения оценок неизвестных параметров необходимо решить одну из следующих систем уравнений:
Или
Метод максимального правдоподобия
Пусть - выборка из генеральной совокупности имеющей плотность распределения P(,) зависящую от m-неизвестных параметров .
Оценки этих параметров находятся из условия, что функция правдоподобия должна принимать наибольшее значение. Под функцией правдоподобия (L) понимается совместная плоскость распределения случайной величины
Т.е. ,
получается, что
Для уменьшения количества вычислений находят логарифмическую функцию правдоподобия
И решаем задачу
Для этого составляется система
Откуда находят оценки неизвестных параметров , обращающих логарифмическую функцию правдоподобия, а следовательно и функцию правдоподобия в максимум.
При этом методе получаются состоятельные, но возможно смещенные оценки.
9. Интервальные оценки неизвестных параметров. Доверительные интервалы для математического ожидания и дисперсии
Пусть имеется выборка объема n из генеральной совокупности функция распределения которой зависит от неизвестного параметра .
Интервальная оценка неизвестных параметров основана на построении некоторого интервала, внутри которого с определенной вероятностью находится неизвестное значение параметра.
Для построения интервальных оценок применяют метод доверительных интервалов.
Опр. Случайные величины
и
являются функциями от выборочных значений наз. Соответственно нижним и верхним двусторонними доверительными пределами для неизвестного параметра с надежностью (коэффициент доверия), доверительной вероятностью (0,5<<1) или с уровнем значимости
(, 0<<0,5)
если для доверительного интервала вероятность
.
При этом интервал называется двусторонним доверительным интервалом для параметра .
Доверительным интервалом для параметра X (при вероятности г) называется интервал вида
,
такой что
,
а значения вычисляются некоторым образом по выборке .
Обычно в прикладных задачах доверительную вероятность берут равной г = 0,9; 0,95; 0,99.
Рассмотрим некоторую выборку объема n, сделанную из генеральной совокупности, распределенной предположительно по нормальному закону распределения Покажем, по каким формулам находятся доверительные интервалы для параметров распределения - математического ожидания и дисперсии (среднего квадратического отклонения).
Доверительный интервал для математического ожидания
Случай 1. Дисперсия распределения известна и равна . Тогда доверительный интервал для параметра a имеет вид:
,
где - выборочное среднее, вычисленное по выборке, параметр t определяется из таблицы распределения Лапласа по соотношению
Случай 2. Дисперсия распределения неизвестна, по выборке вычислена точечная оценка дисперсии . Тогда доверительный интервал для параметра a имеет вид:
,
где - выборочное среднее, вычисленное по выборке, параметр t определяется из таблицы распределения Стьюдента
Доверительный интервал для дисперсии
Считаем, что вообще говоря, математическое ожидание неизвестно, а известна только точечная несмещенная оценка дисперсии . Тогда доверительный интервал имеет вид:
, где ,
где - квантили распределения , определяемые из таблиц.
10. Функция двух случайных аргументов. Формула свертки
Если каждой паре возможных значений случайных величин X и Y по определенному правилу соответствует одно возможное значение случайной величины Z , то Z называют функцией двух случайных аргументов X , Y и записывают
.
Для случайной величины
функция распределения G(z) вычисляется по формуле
(72)
где D(z) область на плоскости (x,y) , для которой
Плотность распределения g(z) случайной величины Z находится дифференцированием функции распределения G(z) , т.е
. g(z) = G(z) .
Для практики большое значение имеет задача определения закона распределения суммы двух случайных величин, т.е. случайной величины
Z=X+Y .
Если X и Y дискретные независимые величины, то случайная величина Z также является дискретной.
В частности, если Z представляет сумму двух независимых случайных величин, обе распределенных по закону Пуассона с параметрами и соответственно, то Z также распределена по закону Пуассона с параметром
.
Если X и Y непрерывные независимые величины и заданы своими плотностями распределения и соответственно, то плотность аспределения g(z) суммы
Z=X+Y
может быть найдена с помощью равенства
(73)
либо с помощью равносильного равенства
(74)
Формулы (72), (73) называют формулами композиции (свертки) двух распределений.
Размещено на Allbest.ru
...Подобные документы
Функция распределения вероятностей двух случайных величин. Функция и плотность распределения вероятностей случайного вектора. Многомерное нормальное распределение. Коэффициент корреляции. Распределение вероятностей функции одной случайной величины.
реферат [241,8 K], добавлен 03.12.2007Числовые характеристики выборки. Статистический ряд и функция распределения. Понятие и графическое представление статистической совокупности. Метод наибольшего правдоподобия для нахождения плотности распределения. Применение метода наименьших квадратов.
контрольная работа [62,6 K], добавлен 20.02.2011Предмет и метод математической статистики. Распределение непрерывной случайной величины с точки зрения теории вероятности на примере логарифмически-нормального распределения. Расчет корреляции величин и нахождение линейной зависимости случайных величин.
курсовая работа [988,5 K], добавлен 19.01.2011Классификация случайных событий. Функция распределения. Числовые характеристики дискретных случайных величин. Закон равномерного распределения вероятностей. Распределение Стьюдента. Задачи математической статистики. Оценки параметров совокупности.
лекция [387,7 K], добавлен 12.12.2011Пространство элементарных событий. Совместные и несовместные события. Плотность распределения вероятностей системы двух случайных величин. Эмпирическая функция распределения. Числовые характеристики случайной функции. Условие независимости двух событий.
контрольная работа [30,0 K], добавлен 15.06.2012Пространство элементарных событий, математическое ожидание. Функции распределения и плотности распределения составляющих системы случайных величин. Числовые характеристики системы. Условия нормировки плотности системы случайных непрерывных величин.
практическая работа [103,1 K], добавлен 15.06.2012Предмет, методы и понятия математической статистики, ее взаимосвязь с теорией вероятности. Основные понятия выборочного метода. Характеристика эмпирической функции распределения. Понятие гистограммы, принцип ее построения. Выборочное распределение.
учебное пособие [279,6 K], добавлен 24.04.2009Математическое ожидание дискретной случайной величины, его свойства и определение. Дисперсия и формула для ее вычисления. Среднее квадратическое отклонение. Ковариация и коэффициент корреляции. Коррелированные и некоррелированные случайные величины.
курсовая работа [133,7 K], добавлен 05.06.2011Пространство элементарных событий. Понятие совместных и несовместных событий и их вероятностей. Плотность распределения вероятностей системы двух случайных величин. Числовые характеристики системы. Закон генеральной совокупности и его параметры.
контрольная работа [98,1 K], добавлен 15.06.2012Вероятность совместного выполнения двух неравенств в системе двух случайных величин. Свойства функции распределения. Определение плотности вероятности системы через производную от соответствующей функции распределения. Условия закона распределения.
презентация [57,9 K], добавлен 01.11.2013Оценки параметров распределения, наиболее важные распределения, применяемые в математической статистике: нормальное распределение, распределения Пирсона, Стьюдента, Фишера. Факторное пространство, формулирование цели эксперимента и выбор откликов.
реферат [105,5 K], добавлен 01.01.2011Понятие математической статистики как науки о математических методах систематизации и использования статистических данных для научных и практических выводов. Точечные оценки параметров статистических распределений. Анализ вычисления средних величин.
курсовая работа [215,1 K], добавлен 13.12.2014Вероятность и ее общее определение. Теоремы сложения и умножения вероятностей. Дискретные случайные величины и их числовые характеристики. Закон больших чисел. Статистическое распределение выборки. Элементы корреляционного и регрессионного анализа.
курс лекций [759,3 K], добавлен 13.06.2015Теория вероятности, понятие вероятности события и её классификация. Понятие комбинаторики и её основные правила. Теоремы умножения вероятностей. Понятие и виды случайных величин. Задачи математической статистики. Расчёт коэффициента корреляции.
шпаргалка [945,2 K], добавлен 18.06.2012Точечное оценивание основных числовых характеристик, функции и плотности распределения компонент многомерного случайного вектора. Статистическая проверка характера распределения. Особенности корреляционного анализа признаков этой математической категории.
курсовая работа [1,1 M], добавлен 01.10.2013Классическое, статистическое и геометрическое определения вероятности. Дискретные случайные величины и законы их распределения. Числовые характеристики системы случайных величин. Законы равномерного и нормального распределения систем случайных величин.
дипломная работа [797,0 K], добавлен 25.02.2011Дискретные системы двух случайных величин. Композиция законов распределения, входящих в систему. Определение вероятности попадания случайной величины в интервал; числовые характеристики функции; математическое ожидание и дисперсия случайной величины.
контрольная работа [705,1 K], добавлен 22.11.2013Рассмотрение в теории вероятностей связи между средним арифметическим и математическим ожиданием. Основные формулы математического ожидания дискретного распределения, целочисленной величины, абсолютно непрерывного распределения и случайного вектора.
презентация [55,9 K], добавлен 01.11.2013Функция распределения непрерывной случайной величины. Математическое ожидание непрерывной случайной величины, плотность распределения вероятностей системы. Ковариация. Коэффициент корреляции.
лабораторная работа [52,3 K], добавлен 19.08.2002Таблица значений выборки дискретных случайных величин в упорядоченном виде. Таблица интервального статистического ряда относительных частот. Задание эмпирической функции распределений и построение ее графика. Полигон и распределение случайной величины.
практическая работа [109,3 K], добавлен 26.07.2012