Элементы математической статистики

Выборка, основные задачи математической статистики. Различные эмпирические функции распределения. Выборочные характеристики случайной величины. Примеры параметрических семейств распределений. Оценивание неизвестных параметров. Методы получения оценок.

Рубрика Математика
Вид контрольная работа
Язык русский
Дата добавления 19.03.2015
Размер файла 1,3 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://allbest.ru

Элементы математической статистики

1.Выборка, основные задачи математической статистики

математический статистика распределение функция

Рассмотрим случайный эксперимент, связанный со случайной величиной , принимающей значения в 1. Проведя п независимых повторений эксперимента, мы получим последовательность из п значений случайной величины , которые обозначим через X1, X2,..., Xn.

Пусть F(x)-- функция распределения случайной величины . Совокупность X1, X2,..., Xn -- называется выборкой объема п из генеральной совокупности с функцией распределения F(x). Выборку объема п можно рассматривать как n-мерный случайный вектор X = (X1, X2,..., Xn), где X1, X2,..., Xn -- независимые случайные величины, имеющие одну и ту же функцию распределения F(x). В задачах математической статистики F(x) принято называть теоретической функцией распределения.

Основной задачей математической статистики является получение по выборке X1, X2,..., Xn такой информации, которая позволяет более или менее точно судить о неизвестном распределении F(x).

Пример. Продолжительность горения («время жизни») электрической лампочки является ее качественной характеристикой. Пусть случайная величина -- это «время жизни», она имеет показательное распределение с плотностью распределения

Пусть у нас имеется некоторая партия лампочек. Предположим, что в результате п наблюдений мы получили следующие значения (выраженные в часах): X1, X2,..., Xn, т.е. получили выборку объема n, извлеченную из всей партии. Теперь, опираясь только на эти данные, мы должны оценить, скажем, параметр . В связи с этим возникают следующие виды задач, которые связаны с этим экспериментом.

1. Как по выборке X1, X2,..., Xn получить точную оценку параметра ? Такая задача называется задачей «построения точечных оценок».

2. Указать в какой интервал может попасть значение этого параметра с достаточно высокой вероятностью. Такая задача называется задачей «построения доверительных интервалов».

3. Можно ли считать всю рассматриваемую партию лампочек бракованной или нет? Поставленный вопрос решается, например, следующим образом.

Рассмотрим два предположения (гипотезы) :

где число Т либо зададим, либо определим по выборке. Далее, с помощью некоторой процедуры (критерия) проверяем выполнение H1, и H2. Если для данных X1, X2,..., Xn гипотеза H1 выполняется, то всю рассматриваемую партию лампочек считаем годной, если же выполняется H2, то партию лампочек считаем негодной.

Такая задача называется задачей «проверки статистических гипотез».

2. Эмпирическая функция распределения

Пусть X1, X2,..., Xn -- выборка объема п из генеральной совокупности с функцией распределения F(x). Если расположить выборочные данные в порядке неубывания, то полученный ряд называется вариационным рядом: X(1), X(2),..., X(n)

Пример 1. Если выборка объема 4 следующая: 4, -2, 3, 1, то вариационный ряд выглядит так: -2, 1, 3, 4.

Определение 1. Эмпирической называется функция распределения F(x) дискретной случайной величины , у которой таблица распределения имеет следующий вид:

Как показано в 2.2.1 функция распределения дискретной случайной величины

имеет следующий вид:

Отсюда

Другими словами Fn (x) = v/n, где v--число тех выборочных значений Xi, которые меньше х.

Как видно из графика, функция Fn (x) ступенчатая и имеет разрывы в точках X(i) и величина скачка равна 1/n, если совпадающих друг с другом значений Xi, нет. Если же k значений X(i) совпадают, то величина скачка в этой точке равна k/n.

Представляет интерес предельное поведение Fn (x) при п .

Теорема 1. Пусть X1, X2,..., Xn -- выборка объема п из генеральной совокупности функцией распределения F(x). Тогда при п со для любого х 1 справедливо

Fn (x) P F(x),

или, другими словами, для любого > 0,

Доказательство. Пусть

такие дискретные случайные величины, что Р(i == 0) = q и P(i = 1) = р, i = 1. 2..... п. Легко видеть, что

Тогда по закону больших чисел (см. 2.7.2) для эмпирической функции распределения Fn (x) = 1/n ni=1 i при п получим

Fn (x) P F(x),

Прежде чем сформулировать еще одну теорему, приведем следующее определение.

Определение 2. Последовательность случайных величин 1, 2, …, n, … сходится к с вероятностью 1 {единица) {или почти наверное), если выполняется следующее равенство

Теперь сформулируем (без доказательства, его можно найти в [2]) следующую теорему.

Теорема 2 (Гливенко - Кантелли). В условиях предыдущей теоремы справедливо

Эти результаты показывают, что при больших п эмпирическая функция распределения дает хорошее приближение для теоретической функции распределения F(x).

Выборки объема п из генеральной совокупности с непрерывным распределением F(x) на практике часто подвергаются группировке. В этом случае указываются не выборочные значения, а число выборочных значений, попавших в интервалы некоторого определенного разбиения генеральной совокупности (разбиения множества возможных значений случайной величины, имеющей функцию распределения F(x) ). Как правило, интервалы берутся одинаковой длины, скажем h. Если обозначить через ni число выборочных значений, попавших в i - интервал, то этот интервал принимается за основание прямоугольника высоты ni/nh. Получающаяся при этом фигура называется гистограммой выборки. Площадь каждого прямоугольника гистограммы равна частоте ni/n соответствующей группы. При больших п эта площадь будет приблизительно равна вероятности попасть в соответствующий интервал, т.е. будет приблизительно равна интегралу от плотности распределения р(t), вычисленному по данному интервалу. Таким образом, верхняя часть контура гистограммы дает хорошее приближение для плотности распределения.

Пример 2. Испытывалась чувствительность 1-го канала п = 40 телевизоров. Данные испытаний указаны в следующей таблице, где в первой строке даны интервалы чувствительности в микровольтах, во второй - число телевизоров, чувствительность которых оказалась данном интервале:

Здесь длина интервала h = 50. Построим гистограмму.

3. Выборочные характеристики случайной величины

Пусть X1, X2,..., Xn -- выборка объема п из генеральной совокупности с функцией распределения F(x).

Определение 1. Выборочным начальным моментом порядка k (случайной величины с функцией распределения F(x) ) называется величина

Выборочным центральным моментом порядка k называется число

Замечание 1. a1 = 1/n ni=1 Xi -- называется выборочным средним и обозначается через , т2 = 1/n ni=1 (Xi - a1)2 -- называется выборочной дисперсией и обозначается через s2, a s называется выборочным стандартным отклонением.

В заключение этого пункта приведем теорему, которая легко получается из закона больших чисел (проверьте самостоятельно!).

Теорема 2. Справедливы следующие утверждения:

ak р Еk при п;

mk р Е( - E) k при п.

Замечание 2. Из теоремы 2 следует, что при больших п выборочные моменты могут служить приближением для неизвестных теоретических моментов.

Пример 1. Измерительным прибором, практически не имеющим систематической ошибки, было сделано пять независимых измерений некоторой величины. Результаты измерений даны в следующей таблице:

Вычислим выборочные характеристики:

(2807 - 2809)2 + (2763 - 2809)2 +

(2858 - 2809)2 = 1206,8

В силу предыдущего замечания, значения могут служить ориентировочными значениями измеряемой величины и ошибки измерения. Однако малый объем выборки (n = 5) не позволяет рассчитывать на достоверность этих результатов.

Рассмотрим другие выборочные характеристики.

Разность называется размахом вариации и обозначается через R.

Медиана (Ме) - это то значение выборки, которое находится в середине вариационного ряда. Если вариационный ряд дискретный, то в случае, когда n - нечетное число, медиана - это то значение выборки, которое находится ровно в середине вариационного ряда. Если n - четное число, то медиана определяется как среднее арифметическое двух выборочных значений, которые находятся в середине вариационного ряда.

Если вариационный ряд интервальный, то в этом случае определяется медианный интервал, который находится в середине. С помощью линейной интерполяции находится медиана. Здесь мы опустим процедуру нахождения. Приближенно значение медианы в этом случае можно определить следующим образом. Пусть все выборочные значения попадают в промежуток от (a,b). Составим таблицу

(a,a1)

(a1,a2)

(am-1,b)

н1

н2

нm

где н - количество выборочных значений X, попадающих в интервал. Вычислим

Медиана - это то значение выборки, для которого

,

где n - объем выборки.

Если в выборке разброс крайних значений существенен, то в качестве выборочной характеристики среднего лучше использовать медиану (а не )

Мода (Мо) - это то значение выборки, которое имеет наибольшую частоту (т.е. это часто встречающееся значение выборки). Если вариационный ряд дискретный, т.е. имеет следующий вид

X(1)

X(2)

X(n)

н1

н2

нn

то мода - это то значение X, которому соответствует наибольшее значение н.

Если вариационный ряд интервальный, то здесь определяется интервал, которому соответствует наибольшее н, а затем с помощью линейной интерполяции находится мода. Процедуру нахождения также опустим.

Коэффициент вариации (CV). Это безразмерная величина, которая указывает величину вариации (среднеквадратического отклонения) на единицу среднего значения, т.е.

Коэффициент асимметрии (). Эта характеристика определяется так

,

Коэффициент асимметрии для нормального распределения равен нулю.

положительная асимметрия или правая

отрицательная асимметрия или левая.

Коэффициент эксцесса (Е).

Эта характеристика определяется так

Коэффициент эксцесса для нормального распределения равен нулю.

Замечание. Введенные, нами основные понятия математической статистики естественно распространяются на многомерный случай. Например, предположим, что мы имеем выборку п пар значений двумерной случайной величины .

Если приписать каждому из этих значений вероятность 1/n, то получим распределение выборки. Выборочные характеристики для этого распределения вычисляются по общим правилам для двумерных распределений (см. 2.4.2 и 2.6).

Задачи

1. Дано распределение признака X (случайной величины X), полученное по n наблюдениям. В данной задаче X - число сделок на фондовой бирже за квартал; n=400 (инвесторов).

Xi

0

1

2

3

4

5

6

7

8

9

10

ni

146

97

73

34

23

10

6

3

4

2

2

Необходимо1: 1) построить гистограмму и эмпирическую функцию распределения X; 2) найти: а) среднюю арифметическую ; б) медиану Me и моду M0; в) дисперсию s2, среднеквадратическое отклонение s и коэффициент вариации CV; г) начальные и центральные моменты k-го порядка (k=1,2,3,4); д) коэффициенты асимметрии и эксцесса E. (1При наличии открытых интервалов значений X типа «менее X1» или «свыше Xn» для проведения расчётов их условно заменяют интервалами той же ширины k, т.е. (X1-k,X1) или (Xn,Xn+k)).

2. Дано распределение признака X (случайной величины X), полученное по n наблюдениям. В данной задаче X - месячный доход жителя региона (в руб.); n=1000 (жителей).

Xi

Менее 500

500-1000

1000-1500

1500-2000

2000-2500

Свыше 2500

ni

58

96

239

328

147

132

Необходимо1: 1) построить гистограмму и эмпирическую функцию распределения X; 2) найти: а) среднюю арифметическую ; б) медиану Me и моду M0; в) дисперсию s2, среднеквадратическое отклонение s и коэффициент вариации CV; г) начальные и центральные моменты k-го порядка (k=1,2,3,4); д) коэффициенты асимметрии и эксцесса E. (1При наличии открытых интервалов значений X типа «менее X1» или «свыше Xn» для проведения расчётов их условно заменяют интервалами той же ширины k, т.е. (X1-k,X1) или (Xn,Xn+k)).

Примеры параметрических семейств распределений

Пусть X1, X2, ..., Xn,--выборка объема п из генеральной совокупности с функцией распределения F(x). Предположим, что распределение генеральной совокупности зависит от параметров. Чаще всего, в задачах математической статистики параметры распределений неизвестны и могут принимать те или иные значения. В связи с этим вводится некоторое множество -- множество возможных значений данного параметра . Понятно, что может быть множеством любой природы, но чаще всего 1 или 2. Поэтому выражение «дана выборка X1, X2, ..., Xn, объема п из генеральной совокупности с функцией распределения F(x)» часто заменяется на следующее «дана выборка X1, X2, ..., Xn, из семейства {p (t), }», где для фиксированного функция p (t) определяется однозначно:

Теперь перечислим некоторые важные семейства параметрических распределений, которые часто встречаются в задачах математической статистики. На известных нам из Главы 1 распределениях подробно останавливаться не будем.

1. Нормальное распределение с параметрами а, 2. (Функцию нормального распределения будем обозначать через ).

2. Гамма распределение с параметрами и , , > 0 (Г,)

Плотность распределения имеет следующий вид:

гамма функция, которая обладает свойствами: Г(1) = 1, Г (+1) = - Г().

Приведем (без вычисления) некоторые числовые характеристики данного распределения:

3. Показательное распределение с параметром , > 0 (Г,1).

Это частный случай гамма распределения, когда = 1.

4. Равномерное распределение с параметрами а и b (Ua,b).

5. Биномиальное распределение с параметрами п и рnp).

Отметим, что при п = 1 получаем распределение Бернулли (В1p).

6. Распределение Пуассона с параметром , > 0 (П).

7. Распределение хи - квадрат (Н).

Это тоже частный случай гамма распределения, когда = n/2, = 1/2. Иногда его обозначают через 2n. Можно показать, что (см. [2]) случайная величина

21 + 22 + … + 2n

имеет распределение Н, где i, i = 1,...,n независимые случайные величины, имеющие распределение Ф0,1 (стандартное нормальное распределение, которого в предыдущих главах мы обозначали через Ф). Здесь n называют числом степеней свободы распределения Н. График плотности распределения выглядит так

Отметим, то распределение приближенно совпадает с нормальным распределением при n>?. Приведем (без вычисления) некоторые числовые характеристики данного распределения Eз = n; Dз = 2n;

Распределение Стьюдента (G).

Это распределение следующей случайной величины t:

где i, i = 0, 1,...,n -- независимые случайные величины, имеющие распределение Ф0,1. Здесь n также называют числом степеней свободы.

Следует отметить, что при п распределение Стьюдента приближенно совпадает с нормальным распределением. График плотности распределения Стьюдента выглядит так (по сравнению с графиком плотности стандартного нормального закона)

Приведем (без вычисления) некоторые числовые характеристики данного распределения Et = 0, Dt = n/(n-2).

Распределение Фишера-Снедекора

Рассмотрим две независимые случайные величины , имеющие хи-квадрат распределения с числом степеней свободы , соответственно. Распределением Фишера-Снедекора с числом степеней свободы называется распределение следующей случайной величины (дробь Фишера)

.

4.Оценивание неизвестных параметров

Оценка. Определение

Пусть X1, X2, .... Xn выборка, объема п из семейства {р(t), }.

Определение. Оценкой * неизвестного параметра называется всякая функция * = *(X1,..., Xn) от выборки, которая предназначена для использования вместо неизвестного параметра в качестве его приближения.

Например, функция * = *(X1,.... Xn) = 1/n ni=1 Xi является оценкой. Отметим, что любая функция от выборки называется в общем случае статистикой, и оценка - это та статистика, которая не зависит от параметра.

Свойства оценок

Если рассматривается выборка X1, X2, …, Xn из семейства распределений {р(t), }, то в обозначениях числовых характеристик оценки * (как случайной величины) будет указан индекс , например, Е*-- означает математическое ожидание оценки * = *( X1, ..., Xn) по распределению {р(t)}, зависящему от неизвестного параметра .

Заметим, что произвольная оценка * не может считаться «хорошей» для оценивания параметра до тех пор, пока не установлены некоторые свойства, связывающие * и . Рассмотрим эти свойства.

Несмещенность.

Определение 1. Оценка * неизвестного параметра называется несмещенной, если Е* = при всех .

Если это не так, то h() = Е* -- называется смещением оценки *.

Пример. Пусть X1, X2, …, Xn выборка из распределения U0,b, где b--неизвестный параметр. В этом случае, плотность распределения имеет вид:

Рассмотрим следующие оценки

Вычислим математические ожидания этих оценок.

Сначала для оценки b*1

Далее,

отсюда следует, что Еb b*1 b, что означает -- оценка b*1 является смещенной.

Вычислим теперь Еb X*2.

Плотность распределения оценки b*2 имеет вид:

Отсюда получаем, что

что позволяет нам заключить, что b*2 смещенная оценка.

И наконец, проверим оценку b*3 на несмещенность.

так как Еb X1 = b/2, следовательно, b*3-- несмещенная оценка.

Асимптотическая несмещенность.

Определение 2. Оценка * неизвестного параметра называется асимптотически несмещенной, если Е* при всех .

Оценка из предыдущего примера b*1 не является асимптотически несмещенной, а оценки b*2 и b*3 являются асимптотически несмещенными.

Состоятельность

Определение 3. Оценка * неизвестного параметра называется состоятельной, если

* при п .

Проверим состоятельность вышеприведенных оценок.

по закону больших чисел, отсюда следует, что

т.е. b*1 не является состоятельной.

Теперь,

так как 1 -- /b < 1. Следовательно, оценка b*2-- состоятельная оценка. Далее, поскольку

по закону больших чисел, поэтому b*3-- состоятельная оценка.

Асимптотическая нормальность

Определение 4. Оценка, * неизвестного параметра называется асимптотически нормальной с коэффициентом 2 , если имеет место

Отметим, что b*1 и b*2 -- не являются асимптотически нормальными (доказательство приводить не будем). Рассмотрим оценку b*3..

По центральной предельной теореме,

поскольку

Итак, мы получили, что b*3 -- асимптотически нормальная оценка с коэффициентом .

Задачи

1. Имеются следующие результаты выборок, извлечённых из нормально распределённой генеральной совокупности:

n = 9; ?Xi = 36; ?( Xi -)2 = 288; n = 16; ?Xi = 64; ?( Xi -)2 = 180;

n = 25; ?Xi = 500; ? = 11400.

Что является лучшей оценкой средней арифметической, дисперсии, среднеквадратического отклонения и среднеквадратического отклонения выборочных данных? Найти несмещённую оценку дисперсии случайной величины X на основании данного распределения выборки:

Xi

1

5

6

8

ni

6

4

7

3

5. Методы получения оценок

Метод моментов

Метод моментов был предложен известным английским статистиком К.Пирсоном и отличается простотой получения оценок. Суть этого метода заключается в приравнивании друг другу теоретических и выборочных моментов. Пусть X1, X2, …, Xn выборка объема п из семейства распределений {р(t), }. Пусть = (1, 2,..., k)--неизвестный параметр, и предположим, что существуют первые k моментов у случайной величины с распределением р(t): i = Еi, i = 1,2,...k. С помощью выборки X1, X2, …, Xn, мы можем вычислить первые k выборочных моментов: ai = 1/nnj=1 , i = 1,2,..., k. Составим систему уравнений, приравнивая соответствующие теоретические и выборочные моменты:

Решение этой системы * = (*1,..., *k) и будет оценкой, полученной по методу моментов.

Отметим, что можно составить и систему уравнений, приравнивая соответствующие теоретические и выборочные центральные моменты:

и решив эту систему, получим оценку * = (*1,..., *k) по методу моментов.

Пример. Пусть X1, X2, …, Xn выборка из показательного распределения Г,1 с плотностью распределения

Известно, что EX1 = 1/.

Так как а1 = EX1 -- момент порядка 1, то = 1/ а1. По определению, оценкой *1 неизвестного параметра по методу моментов будет следующая оценка:

По закону больших чисел

Сравнив моменты второго порядка

2 = Е2 = 2/2 и a2 = 1/nni=1 X2i получим:

Отсюда

По методу моментов можно найти еще одну оценку *3 :

отсюда = 1/ и по методу моментов получаем оценку

где s - выборочное стандартное отклонение.

Метод максимального правдоподобия

Пусть X1, X2, …, Xn выборка объема п из семейства распределений {р(t), }

Определение 1. Статистика

называется функцией правдоподобия, a Ln() = ln f() -- логарифмической функцией правдоподобия.

Замечание. Напомним еще раз смысл обозначения р(Xi) на примерах.

1). Пусть Xi Г,1, тогда

2). Пусть Xi B1p, тогда

Определение 2. Оценка * неизвестного параметра называется оценкой максимального правдоподобия, если

f(*) = max f (*), или Ln(*) = max Ln().

Алгоритм получения такой оценки следующий: если f(), и соответственно Ln(), гладкая функция (т.е. непрерывно дифференцируемая в окрестности каждой точки), тогда оценка максимального правдоподобия ищется как решение уравнения (системы уравнений, если параметр многомерный):

поскольку

Пример 1. Пусть Х1, Х2,..., Хn

выборка из распределения Бернулли В1p, = p -- неизвестный параметр. Напомним, что

и --число успехов (число единиц в выборке).

Функция правдоподобия имеет вид:

а логарифмическая функция правдоподобия

Тогда

и получаем уравнение

Решение этого уравнения и есть оценка максимального правдоподобия

Пример 2. Пусть Х1, Х2,..., Хn выборка из нормального распределения , где = (a, 2) -- неизвестный параметр. Напомним, что

где ехр(у) = еy. Функция правдоподобия имеет следующий вид:

Здесь удобно воспользоваться логарифмической функцией правдоподобия:

Теперь составим систему уравнений правдоподобия:

Отсюда получаем

Решив эту систему, получаем оценки максимального правдоподобия для параметров а и 2:

Теперь рассмотрим пример отыскания оценки максимального правдоподобия в случае, когда f() не является гладкой функцией.

Пример 3. Х1, Х2,..., Хn выборка из равномерного распределения Uo,b, = b --неизвестный параметр. Напомним, что

Функция правдоподобия имеет следующий вид:

Очевидно, что эта функция не является гладкой. Мы должны найти такое значение b*, которое удовлетворяет равенству f(b*) = maxb f(b). Преобразуем функцию f(b). Легко убедиться в том, что Xi [0, b] для любого i эквивалентно b [max1 i n Xi, ), поскольку b max1 i n Xi. Напомним, что max1 i n Xi = X(n) - последний член вариационного ряда.

С учетом вышесказанного получаем

Построим график этой функции:

Из графика видно, что maxb f(b) достигается в точке b* = X(n) .

Задачи

1. Для определения средней заработной платы работников определённой отрасли было обследовано 100 человек. Результаты представлены в следующей таблице (данные условные):

Зарплата в долларах

Число человек

Зарплата в долларах

Число человек

190-192

1

200-202

19

192-194

5

202-204

11

194-196

9

204-206

4

196-198

22

206-208

1

198-200

28

Построить гистограмму и график эмпирической функции распределения, найти оценки математического ожидания и дисперсии зарплаты наугад взятого работника.

2. При условии равномерного распределения случайной величины X

произведена выборка

Xi

2

3

4

5

6

ni

4

6

5

12

8

Найти оценку параметров a и b.

3. Случайная величина подчиняется нормальному закону распределения с плотностью

Произведена выборка

Xi

3

5

7

9

11

13

15

ni

6

9

16

25

20

16

8

Найти оценку параметра а и несмещённую оценку параметра у.

Стеклянные однородные изделия отправлены для реализации из Москвы в Новосибирск в 1000 контейнерах. После поступления товара было выявлено количество разбитых изделий в каждом контейнере. Результаты представлены в таблице:

Xi

0

1

2

3

4

ni

785

163

32

16

4

Считая, что число разбитых изделий описывается законом Пуассона, найти точечную оценку параметра л.

7. Сравнение оценок. Неравенство Рао - Крамера

С помощью различных методов мы получаем множество оценок и нам нужно определить лучшие из них. Для сравнения оценок рассмотрим два подхода.

Среднеквадратический подход

Пусть X1, X2,…, Xn выборка объема п из семейства распределений {p(t), 1} и *1, *2 -- две оценки неизвестного параметра .

Определение 1. Оценка *1 лучше, чем *2, если выполняется

Отметим, что если в определении 1 знак < заменить на , >, , то получим понятия: «*1 не хуже», «хуже», «не лучше», чем *2, соответственно.

Если h() = E*-- смещение оценки *, то

Так как для несмещенных оценок *1 и *2 смещение h() = 0, то в определении 1 величины E(*i-- )2 заменяются на D*i, i = 1, 2. Тем самым, сравнение несмещенных оценок сводится к сравнению дисперсии этих оценок.

Определение 2. В классе несмещенных оценок неизвестного параметра оценка * с минимальной дисперсией называется эффективной оценкой.

Асимптотический подход

Пусть *1 и *2 две асимптотически нормальные оценки, т.е.

или

Определение 1. Оценка *1 лучше, чем *2, если 21 < 22.

Естественно асимптотический подход менее предпочтителен, поскольку может быть применен в случае выборки большого объема и только в классе асимптотически нормальных оценок.

Пример. Пусть X1, X2,…, Xn выборка из показательного распределения Г,1, = -- неизвестный параметр. В 3.4.1 мы получили две оценки

Без доказательства заметим, что эти оценки асимптотически нормальны с коэффициентами 21 = 2 и 22 = 5/4 2.Сравнив 21 и 22 мы видим, что оценка *1 лучше, чем *2.

Определение 2. В классе асимптотически нормальных оценок параметра оценка * с минимальным коэффициентом 2 называется асимптотически эффективной оценкой.

Неравенство Рао - Крамера

Попытаемся указать нижнюю границу дисперсии D* оценки *. Этот вопрос решается с помощью неравенства Рао - Крамера.

Пусть X1, X2,…, Xn выборка из семейства распределений {p(t), 1}. Рассмотрим функцию L(t, ) = ln p (t) и найдем ее производную по :

Предположим, что выполнено некоторое условие регулярности (R):

а) в случае распределения непрерывного типа функции p(t) непрерывно дифференцируемы по для почти всех t, а интегралы

существуют и непрерывны по ;

б) в случае распределения дискретного типа существуют частные производные p(t) / , а ряды

сходятся абсолютно и равномерно в 1,

где p(i)--вероятности принятия значений i, дискретной случайной величины.

I()--называется информационным количеством Фишера. Без доказательства (его можно найти в [4]) сформулируем следующую теорему.

Теорема (неравенство Рао - Крамера). Пусть выполнено условие (R). Тогда для оценки * неизвестного параметра справедливо следующее неравенство

Следствия теоремы.

При выполнении условий теоремы справедливо неравенство

если же * -- несмещенная оценка, то справедливо неравенство

2. Если выполнено условие (R) и в неравенстве Рао-Крамера достигается равенство, то * -- эффективная оценка в классе оценок со смещением h(), т.е.

Размещено на Allbest.ru

...

Подобные документы

  • Понятия теории вероятностей и математической статистики, применение их на практике. Определение случайной величины. Виды и примеры случайных величин. Закон распределения дискретной случайной величины. Законы распределения непрерывной случайной величины.

    реферат [174,7 K], добавлен 25.10.2015

  • Классификация случайных событий. Функция распределения. Числовые характеристики дискретных случайных величин. Закон равномерного распределения вероятностей. Распределение Стьюдента. Задачи математической статистики. Оценки параметров совокупности.

    лекция [387,7 K], добавлен 12.12.2011

  • Задачи математической статистики. Распределение случайной величины на основе опытных данных. Эмпирическая функция распределения. Статистические оценки параметров распределения. Нормальный закон распределения случайной величины, проверка гипотезы.

    курсовая работа [57,0 K], добавлен 13.10.2009

  • Построение полигона относительных частот, эмпирической функции распределения, кумулянты и гистограммы. Расчет точечных оценок неизвестных числовых характеристик. Проверка гипотезы о виде распределения для простого и сгруппированного ряда распределения.

    курсовая работа [216,2 K], добавлен 28.09.2011

  • Оценки неизвестных параметров закона распределения случайной величины Х по данным выборки. Интервальное оценивание. Случайный интервал. Граничные точки доверительного интервала. Нижний и верхний доверительные пределы.

    реферат [30,0 K], добавлен 31.03.2003

  • Понятие математической статистики как науки о математических методах систематизации и использования статистических данных для научных и практических выводов. Точечные оценки параметров статистических распределений. Анализ вычисления средних величин.

    курсовая работа [215,1 K], добавлен 13.12.2014

  • Математические методы систематизации и использования статистических данных для научных и практических выводов. Закон распределения дискретной случайной величины. Понятие генеральной совокупности. Задачи статистических наблюдений. Выборочное распределение.

    реферат [332,8 K], добавлен 10.12.2010

  • Оценки параметров распределения, наиболее важные распределения, применяемые в математической статистике: нормальное распределение, распределения Пирсона, Стьюдента, Фишера. Факторное пространство, формулирование цели эксперимента и выбор откликов.

    реферат [105,5 K], добавлен 01.01.2011

  • Числовые характеристики выборки. Статистический ряд и функция распределения. Понятие и графическое представление статистической совокупности. Метод наибольшего правдоподобия для нахождения плотности распределения. Применение метода наименьших квадратов.

    контрольная работа [62,6 K], добавлен 20.02.2011

  • Классическая формула для вероятности события, отношение благоприятного числа исходов опыта к общему числу всех равновозможных несовместных исходов. Понятие непрерывной и дискретной случайной величины, их числовые характеристики и законы распределения.

    презентация [5,5 M], добавлен 19.07.2015

  • Методы регистрации, описания и анализа статистических экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений. Обзор задач математической статистики. Закон распределения случайной величины. Проверка правдоподобия гипотез.

    презентация [113,3 K], добавлен 01.11.2013

  • Задачи на элементы теории вероятности и математической статистики. Решение систем линейных уравнений методом Крамера; методом Гаусса. Закон распределения дискретной случайной величены. Построение выпуклого многоугольника, заданного системой неравенств.

    контрольная работа [96,1 K], добавлен 12.09.2008

  • Теория вероятности, понятие вероятности события и её классификация. Понятие комбинаторики и её основные правила. Теоремы умножения вероятностей. Понятие и виды случайных величин. Задачи математической статистики. Расчёт коэффициента корреляции.

    шпаргалка [945,2 K], добавлен 18.06.2012

  • Нормальное распределение на прямой, нормальная кривая. Влияние параметров нормального распределения на форму нормальной кривой. Вероятность отклонения в заданный интервал нормальной случайной величины. Вычисление вероятности заданного отклонения.

    курсовая работа [1,7 M], добавлен 06.12.2012

  • Предмет и метод математической статистики. Распределение непрерывной случайной величины с точки зрения теории вероятности на примере логарифмически-нормального распределения. Расчет корреляции величин и нахождение линейной зависимости случайных величин.

    курсовая работа [988,5 K], добавлен 19.01.2011

  • Что такое абсолютные и относительные величины. Применение абсолютной и относительной величины в статистике. Прикладные варианты использования методов математической статистики в различных случаях решения задач. Опыт построения статистических таблиц.

    контрольная работа [39,6 K], добавлен 12.12.2009

  • Основные этапы обработки данных натуральных наблюдений методом математической статистики. Оценка полученных результатов, их использование при принятии управленческих решений в области охраны природы и природопользования. Проверка статистических гипотез.

    практическая работа [132,1 K], добавлен 24.05.2013

  • Цель и задачи статистического анализа. Методы получения оценок: максимального правдоподобия, моментов. Доверительный интервал. Точечная оценка параметров распределения. Генеральная и выборочная дисперсии. Интервальное оценивание математического ожидания.

    презентация [395,9 K], добавлен 19.07.2015

  • Основные понятия математической статистики, интервальные оценки. Метод моментов и метод максимального правдоподобия. Проверка статистических гипотез о виде закона распределения при помощи критерия Пирсона. Свойства оценок, непрерывные распределения.

    курсовая работа [549,1 K], добавлен 07.08.2013

  • Обработка результатов информации по транспортным и технологическим машинам методом математической статистики. Определение интегральной функции нормального распределения, функции закона Вейбула. Определение величины сдвига к началу распределения параметра.

    контрольная работа [488,5 K], добавлен 05.03.2017

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.