Основы математической статистики

Понятие генеральной и выборочной совокупностей. Эмпирические аналоги функции распределения и плотности распределения, их свойства. Построение гистограммы. Теорема Чебышева. Лемма Бернулли. Точечные оценки параметров генеральной совокупности, их свойства.

Рубрика Математика
Вид шпаргалка
Язык русский
Дата добавления 14.06.2013
Размер файла 350,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

1. Понятие генеральной и выборочной совокупностей. Эмпирические аналоги функции распределения и плотности распределения, их свойства. Построение гистограммы

совокупность генеральный чебышев бернулли

Мат. статистикой называется наука, занимающаяся методами обработки эмпирических данных, полученных в результате наблюдений.

Основу мат. статистики составляет теоретико-вероятностные модели.

Задачи мат. статистики:

1. Определение методов сбора и отличия статистических данных

2. Выбор способа анализа данных

Генеральная совокупность - это совокупность, которая принадлежит исследованию.

Сущ-ет 2 основных способа изучения сов-тей:

· Выборочное обследование

· Сплошное обследование.

При сплошном обследовании, обследуется каждый предмет совокупности.

Достоинства: максимально полная информация.

Недостатки: дорого; есть обследование, которое связано с разрушением объекта, метод не приемлем.

Выборочное обследование - из генерал. сов-ти отбирается некоторая её часть (т.н. «выборка»), она обследуется и результаты распространяются на всю генеральную сов-ть.

Количество объектов в совокупности - выборочной или генеральной называется объемом совокупности.

Для того чтобы использовать результаты выборки, она должна быть репрезентативной.

Понятие теоретического и эмпирического закона распределения:

Пусть имеется величина X, которая имеет функцию распределения F(x).

Пусть имеется некоторая выборка объема - n.

Используя эту выборку, можно построить функцию распределения, которую будем называть эмпирической (выборочной) функцией распределения.

Если случайная величина Х дискретна, то необходимо составить таблицу:

X

- частота появления величины в выборке.

Для этой таблицы можно построить ф-ю распред-я. Которая будет называться эмпирической функцией распределения.

Если Х - непрерывная случайная величина, то выборочные значения упорядочиваются по возрастанию, т.е. создается т.н. вариационный ряд.

Определяют размах выборки

и интервал делится на некоторое число интервалов k. Подсчитывается число наблюдений попавших в каждый интервал и вычисляется

; m - число испытаний.

Для непрерывной случайной величины плотность вычисляется:

При переходе к интервальному ряду все значения случайной величины попавшие в 1 интервал, заменяются 1 значением, равным середине этого интервала.

Выборочные характеристики, которые используются в качестве приближенных значений характеристик генеральной совокупности, называют статистическими оценками.

Если оценка представляет функцию, она называется функциональной оценкой (гистограмма статистическая оценка плотности распределения).

Выборочная функция распределения - статистическая оценка теоретической функции распределения.

Оценки могут быть найдены для параметров распределения, таких как математическое ожидание, дисперсия и т.д.

2. Теорема Чебышева. Лемма Бернулли

Предпосылками для решения основной задачи мат. статистики - изучение генеральной совокупности, которая представлена выборкой, создает то обстоятельство, что при увеличении объема выборки ее характеристика приближается к соответствующим характеристикам генеральной совокупности.

Это утверждение является следствием закона больших чисел.

В простейшем варианте этот закон выражается теоремой Чебышева.

Пусть дана совокупность независимых одинаково распределенных случайных величин.

Будем считать, что

- ограничены

Тогда для любого

Замечание 1. Величина - среднее арифметическое значение величин

- отклонение среднего значения Х от величины a.

Теорема утверждает, что при увеличении объема выборки n будет отличаться от истинного значения a на величину E, как угодно малую с вероятностью 1.

В этом случаи принято говорить, что сходятся к a по вероятности .

Доказательство:

1. Лемма Чебышева.

Пусть - неотрицательная случайная величина, имеющая плотность распределения f(x) и конечное

Тогда для любого имеется место неравенство:

Доказательство:

Рассмотрим

2. Рассмотрим в качестве случайной величины величину

Тогда используя лемму можно записать, что для любого

Перейдем к противоположному событию:

и т.д.

Из теоремы Чебышева следует теорема Бернулли.

Пусть дана серия n независимых испытаний, в которых событие А происходит с вероятностью

Пусть m-число появлений события А в этой серии. Следовательно - частота появления события А.

Тогда вероятность отклонения частоты появления события А стремится к 1.

3. Точечные оценки параметров генеральной совокупности, их свойства: состоятельность, несмещенность, эффективность

Пусть имеется выборка независимых наблюдений случайной величины х:

Используя эту выборку, можно получить какое-то приближенное значение параметра распределения случайной величины х.

Например: в качестве оценки математического ожидания случайной величины х удобно использовать выборочную среднюю величину

Такая выборочная характеристика, которая используются в качестве приближенного значения неизвестной характеристики, называется точечной статистической оценкой.

Замечание: число, которое на численной осн. представлено точкой.

Будем рассматривать не как конкретное числ. значение, а как случайная величина, имеющие такое же распределение, как случайная величина х, т.е. как статистич. копии величины х.

В этом случае числ. характеристика (оценка) будет тоже случайной величиной со своим законом распределения, не обязательно совпадающим со знаком распределения случайной величины х.

Любая функция наблюдаемых значений называется статистикой.

Приближенные значения, которые используются для оценки, в этом случае будут статистическими оценками.

Пусть имеется выборка и пусть - некоторый параметр, который надо оценить.

На основании выборки построим статистическую оценку

Будем рассматривать статистику , как случайную величину со своей функцией распределения.

Тогда зная функцию распределения, можно найти оценку параметра , как числовую характеристику этой функции распределения.

Например: математическое ожидание.

Распределение как случайные величины позволяет сформулировать свойства, которая должна удовлетворить статистическая оценка:

1. Несмещенность.

Оценка называется несмещенной оценкой параметра , если при фиксированном объеме выборки n -

Несмещенность оценки означает, что при вычислении оценки не происходит систематической ошибки.

Если из генеральной совокупности образовать все выборки объема n и по ним вычислить оценку , а затем эту оценку усреднить, то она совпадет с истинным значением параметра .

2. Состоятельность.

Оценка называется состоятельной, если она по вероятности сходится к истинному значению

Оценки, которые используются на практике, обязательно должны быть состоятельными.

На практике состоятельность оценки будет означать, что с увеличением объема выборки n точность оценивания улучшается.

3. Эффективность.

Оценка называется эффективной оценкой, если она обладает минимальной дисперсией среди всех оценок . n

4. Точечная оценка математического ожидания, ее свойства

Пусть имеется случайная величина х и выборка независимых наблюдений

В качестве оценки мат ожидания введем среднее арифметическое

Свойства:

1. Несмещенность.

M(x) = a => оценка мат ожидания является несмещенной.

2. Состоятельность.

Оценка является состоятельной

3. Эффективность.

Оценка мат ожидания зависит от вида распределения

Можно показать, что если , то эта оценка будет эффективной.

5. Точечная оценка дисперсии случайной величины. Поправка на смещение оценки дисперсии

Рассм. в кач-ве оценки => величину: . Эта оценка является состоятельной. D*n D(x)

Покажем, что оценка явл. смещенной:

M(D*n(x))=M()==

==

==

==

===

==

(т.к. ; )

=> Оценка D*n(х) явл. смещенной.

Замечание: Если n>?, то D*n(х) > => эта оценка явл. асимптотически несмещенной.

Чтобы получить несмещ. оценку, рассмотрим: . ( - поправка на смещение) =>

M()=M()==

Оценка == - несмещенная оценка. Оценкаявл. состоятельной.

6. Понятие о доверительном оценивании. Точность и надежность оценки параметра. Доверительный интервал для оценки мат. ож-я нормально распределенной случайной вел-ны с известным значением

Если имеется выборка объема n x1, х2,…, хn и по этой выборке нужно оценить некоторый параметр и, то можно получить точечную оценку параметра и*n.

Если будет дана другая выборка, то знач-е точеч. оценки будет, вообще говоря, другим. Поэтому имеет смысл рассм. иn как случ. вел-ну, зависящую от наблюдений и оцениваемого параметра и.

Др. словами, и*n будет статистикой, т.е. ф-цией наблюдаемых значений x1, х2,…, хn.

Получая различ. значения оценок, нас будет интересовать вопрос точности оценивания параметра.

Рассм. и*n как случ. вел-ну. Предположим, что мы знаем закон ее распределения, например, плотность.

и - такие, что , где .

Получаем .

Полученное нерав-во обращают и разрешают относительно и.

. В результате преобразований получаем интервал - доверительный интервал для оценки параметра и, г - уровень надежности. Ширина интервала b2-b1 характеризует точность оценивания.

Дана случ. вел-на . Значение у считается известным.

Получена выборка объема n независ. случ. наблюдений x1, х2,…, хn.

Требуется построить по заданному уровню надежности г доверит. инт-л для оценки мат. ож-я.

Рассм. точечную оценку мат. ож-я: . Введем в рассмотрение оценки . Статистич. корни тоже распределены нормально и оценка как лин. ф-ция нормально распред. случ. вел-н также будет иметь нормал. распр-е.

Статистика Z явл. лин. ф-цией нормал. распределения.

Распред-е статистики Z будет точно известно, если мы найдем M(Z), D(Z).

M(Z)== =0 (т. к. =0).

M(Z)=0

D(Z)= ====1

D(Z)=1 =>

Пусть задано г. Определим таким образом, чтобы вероятность .

=> .

;

=> - по таблицам ф-ции Лапласа. Тогда будет справедливо нер-во

; ;

.

Это нер-во означает, что интервал включает в себя (накрывает) истинное знач-е мат. ож-я а с вер-тью г. Этот инт-л по определению будет наз-ся доверительным интервалом для оценки мат. ож-я нормал. распред. случ. вел-ны с известным знач-ем у с надежностью г.

Замеч-е.

д= - точность.

1. .

2. Предположим, что n фиксир-но, а г возрастает. => возрастает. При увелич-ии надеж-ти ^ => вел-на д увелич-ся => точность прогноза уменьш-ся. Точность прогноза и надеж-ть - взаимно обратные параметры.

7. Доверительный интервал для оценки мат. ож-я нормально распределенной случайной вел-ны с неизвестным значением

Пусть (а, неизвестны). Имеется выборка объема n независ наблюдений x1, х2,…, хn. Задан уровень надежности г=1.

Требуется построить доверит. интервал для оценки мат. ож-я с заданным уровнем надеж-ти г.

Пусть - точеч. оценка мат. ож-я, - несмещ. оценка дисперсии.

Проводя рассуждения, аналогич. предыдущему случаю, получим

,

где - величина, определяемая по табл. распред-я Стьюдента с n-1 степенью свободы.

Из этой формулы =>, что доверит. интервал с заданным уровнем надеж-ти г будет иметь вид

Размещено на Allbest.ru

...

Подобные документы

  • Интервальный вариационный ряд. Построение гистограммы плотности относительных частот. Выдвижение гипотезы о законе распределения генеральной совокупности Х. Функция плотности рассматриваемого закона распределения "Построение ее на гистограмме".

    курсовая работа [104,4 K], добавлен 20.03.2011

  • Статистическая обработка данных контроля времени (в часах) работы компьютерного класса в день. Полигон абсолютных частот. Построение графика эмпирической функции распределения и огибающей гистограммы. Теоретическое распределение генеральной совокупности.

    контрольная работа [379,3 K], добавлен 23.08.2015

  • Уравнения с разделяющими переменными. Частное решение линейного дифференциального уравнения. Оценка вероятностей с помощью неравенства Чебышева. Нахождение плотности нормального распределения. Построение гистограммы и выборочной функции распределения.

    контрольная работа [387,4 K], добавлен 09.12.2011

  • Понятие генеральной совокупности, математического ожидания и дисперсии. Обеспечение случайности и репрезентативности выборки в статистическом планировании. Дискретный и интервальный вариационный ряд, точечные оценки параметров распределения признака.

    реферат [259,1 K], добавлен 13.06.2011

  • Построение полигона относительных частот, эмпирической функции распределения, кумулянты и гистограммы. Расчет точечных оценок неизвестных числовых характеристик. Проверка гипотезы о виде распределения для простого и сгруппированного ряда распределения.

    курсовая работа [216,2 K], добавлен 28.09.2011

  • Классификация случайных событий. Функция распределения. Числовые характеристики дискретных случайных величин. Закон равномерного распределения вероятностей. Распределение Стьюдента. Задачи математической статистики. Оценки параметров совокупности.

    лекция [387,7 K], добавлен 12.12.2011

  • Математические методы систематизации и использования статистических данных для научных и практических выводов. Закон распределения дискретной случайной величины. Понятие генеральной совокупности. Задачи статистических наблюдений. Выборочное распределение.

    реферат [332,8 K], добавлен 10.12.2010

  • Числовые характеристики выборки. Статистический ряд и функция распределения. Понятие и графическое представление статистической совокупности. Метод наибольшего правдоподобия для нахождения плотности распределения. Применение метода наименьших квадратов.

    контрольная работа [62,6 K], добавлен 20.02.2011

  • Оценки параметров распределения, наиболее важные распределения, применяемые в математической статистике: нормальное распределение, распределения Пирсона, Стьюдента, Фишера. Факторное пространство, формулирование цели эксперимента и выбор откликов.

    реферат [105,5 K], добавлен 01.01.2011

  • Определение числовых характеристик производной случайной функции. Расчет корреляционной функции и дисперсии спектральной плотности. Группировка заданной выборки, построение выборочной функции распределения и гистограммы, доверительного интервала.

    контрольная работа [681,0 K], добавлен 02.06.2010

  • Проверка выполнимости теоремы Бернулли на примере вероятности прохождения тока по цепи. Моделирование дискретной случайной величины, имеющей закон распределения Пуассона. Подтверждение гипотезы данного закона распределения с помощью критерия Колмогорова.

    курсовая работа [134,2 K], добавлен 31.05.2010

  • Обработка и анализ статистической информации. Выборочная теория; интервальные оценки и графическое представление параметров распределения. Точечные оценки характеристик положения и мер изменчивости. Корреляционная зависимость; уравнение регрессии.

    курсовая работа [1023,9 K], добавлен 21.03.2015

  • Выборки к генеральной совокупности: оценка параметра и построение доверительных интервалов. Интервальный статистический ряд. Оценивание параметров распределения. Статистическая проверка гипотез. Гипотеза о нормальном распределении случайной величины.

    контрольная работа [391,1 K], добавлен 23.06.2012

  • Закон и свойства нормального распределения случайной величины. На основе критерия согласия Пирсона построение гистограммы, статистической функции и теоретической кривой и определение согласованности теоретического и статистического распределения.

    курсовая работа [894,5 K], добавлен 30.10.2013

  • Оценивание параметров закона распределения случайной величины. Точечная и интервальная оценки параметров распределения. Проверка статистической гипотезы о виде закона распределения, нахождение параметров системы. График оценки плотности вероятности.

    курсовая работа [570,4 K], добавлен 28.09.2014

  • Понятие математической статистики как науки о математических методах систематизации и использования статистических данных для научных и практических выводов. Точечные оценки параметров статистических распределений. Анализ вычисления средних величин.

    курсовая работа [215,1 K], добавлен 13.12.2014

  • Определение вероятности наступления события по формуле Бернулли. Построение эмпирической функции распределения и гистограммы для случайной величины. Вычисление коэффициента корреляции, получение уравнения регрессии. Пример решения задачи симплекс-методом.

    контрольная работа [547,6 K], добавлен 02.02.2012

  • Основные понятия математической статистики, интервальные оценки. Метод моментов и метод максимального правдоподобия. Проверка статистических гипотез о виде закона распределения при помощи критерия Пирсона. Свойства оценок, непрерывные распределения.

    курсовая работа [549,1 K], добавлен 07.08.2013

  • Математическая статистика как наука о математических методах систематизации статистических данных, ее показатели. Составление интегральных статистических распределений выборочной совокупности, построение гистограмм. Вычисление точечных оценок параметров.

    курсовая работа [241,3 K], добавлен 10.04.2011

  • Использование формулы Бернулли для нахождения вероятности происхождения события. Построение графика дискретной случайной величины. Математическое ожидание и свойства интегральной функции распределения. Функция распределения непрерывной случайной величины.

    контрольная работа [87,2 K], добавлен 29.01.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.