Первичная обработка данных

Генеральная и выборочная совокупность. Выборочные характеристики и точечные оценки. Основная задача математической статистики. Статистический ряд для дискретной случайной величины. Полигон относительных частот. Эмпирическая функция распределения.

Рубрика Математика
Вид учебное пособие
Язык русский
Дата добавления 11.11.2013
Размер файла 2,9 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Министерство транспорта Российской Федерации

Федеральное агентство железнодорожного транспорта

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

«Дальневосточный государственный университет путей сообщения»

Кафедра «Высшая математика»

Теория вероятностей и математическая статистика

М.А. Городилова,

Г.А. Ушакова

Хабаровск

Контрольная работа

Математическая статистика

Первичная обработка данных

Учебное издание

Городилова Марианна Альбертовна

Ушакова Галина Александровна

Теория вероятностей и математическая статистика

Учебное пособие

Редактор Т.М. Яковенко

Технический редактор Н.В. Мильштейн

Корректор Г.Ф. Иванова

План г. Поз. 3.23.

ИД № 05247 от 2.07.2001 г. ПЛД № 79-19 от 19.01.2000 г.

Формат 60841/16. Бумага тип. № 2. Гарнитура "Arial". Печать плоская.

Издательство ДВГУПС

680021, г. Хабаровск, ул. Серышева, 47.

Оглавление

математический статистика дискретный эмпирический

1. Генеральная и выборочная совокупность

2. Выборочные характеристики и точечные оценки

3. Примеры решения задач

4. Варианты заданий

Библиографический список

1. Генеральная и выборочная совокупность

Генеральной совокупностью называется множество объектов произвольной природы, обладающих признаками, доступными для наблюдения и количественного измерения.

Объекты, входящие в генеральную совокупность, называются её элементами, а их общее число - её объёмом.

Предположим, из генеральной совокупности случайным образом извлекаем элементы, значения некоторого признака для них записываем как . Эти значения называются наблюдениями, их набор - выборкой. Количество наблюдений каждого из признаков обозначим и назовём частотами. Число наблюдений называем объёмом выборки: .

Основная задача математической статистики - сделать научно обоснованные выводы о распределении одной или более неизвестных случайных величин или их взаимосвязи между собой.

Выборочным методом называется метод решения этой задачи посредством анализа выборки, полученной в результате многократных наблюдений.

Для того чтобы характеристики случайной величины, полученные выборочным методом, были объективны, необходимо, чтобы выборка была репрезентативной, т. е. достаточно хорошо представляла исследуемую величину. В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если её осуществлять случайно, т. е. все объекты генеральной совокупности имеют одинаковую вероятность попасть в выборку [1].

Выборка называется повторной, если отобранный объект перед выбором следующего возвращается в генеральную совокупность. Выборка называется бесповторной, если отобранный объект в генеральную совокупность не возвращается. На практике обычно имеют дело с бесповторными выборками.

Всякая случайная величина имеет определённую функцию распределения и другие числовые характеристики, которые называются теоретическими, в отличие от выборочных, которые определяются по наблюдениям.

Ряд наблюдений, упорядоченных по возрастанию, называется вариационным рядом. Его члены обозначаются и называются вариантами.

Наименьшее и наибольшее значения вариант обозначаются и , их называются крайними членами вариационного ряда. Число называется размахом выборки.

В случае наблюдений дискретной случайной величины одно и то же значение можно встретить несколько раз. Такие значения случайной величины записывают с указанием числа раз его появления в наблюдениях, это и есть частота данного значения.

Вариационный ряд в общем виде можно записать как

В случае непрерывной случайной величины на практике часто применяют группировку.

Отрезок наблюдаемых значений называют интервалом наблюдений.

Интервал наблюдений разбивают на частичных интервалов одинаковой длины .

Рекомендуемое число интервалов вычисляют по формуле Стерджеса [3] .

Длину частичных интервалов вычисляют как .

Затем подсчитывают числа попаданий наблюдений в эти интервалы, которые принимают за частоты . Малочисленные частоты, значения которых меньше 5 (), следует объединить, в этом случае надо объединить и соответствующие интервалы.

В качестве новых значений вариант берут середины интервалов .

Примечание. Группировка связана с потерей части полезной информации, заключённой в выборке. Однако она имеет и свои преимущества. Оценим величину экономии, например, выполнено 1000 наблюдений некоторого признака. Рекомендуемое число интервалов:

.

Отсюда видно, что требуется обработать числа вместо 1000.

Группировку можно применять и в случае дискретной случайной величины, если шаг, с которым меняются её значения, слишком мал.

Число называется относительной частотой.

Набор вариант (или частичных интервалов) и их относительных частот называется статистическим рядом.

Статистический ряд для дискретной случайной величины

Варианта

Частота

Относительная частота

Статистический ряд для непрерывной случайной величины

Интервалы

Середина интервала

Частота

Относительная частота

Графически статистические ряды можно представить в виде полигона, гистограммы или графика накопленных частот.

Полигон частот - это ломаная линия, отрезки которой соединяют точки , , …, .

Полигон относительных частот - это ломаная линия, отрезки которой соединяют точки , , …, .

Примечание. Полигоны обычно служат для изображения выборки в случае дискретных случайных величин.

Накопленные частоты будем обозначать , где . Очевидно, что эти величины получены суммированием частот, т. е. , что эти величины не убывают.

Накопленные относительные частоты обозначим , где . Очевидно, что эти величины также не убывают.

Упражнение 1. Постройте полигоны частот и относительных частот, найдите накопленные относительные частоты, запишите эмпирическую функцию распределения по данному вариационному ряду:

2

3

5

6

10

15

5

20

Решение

Найдём объём выборки и дополним таблицу относительными и накопленными относительными частотами.

Варианты

Частота

Относительная частота

Накопленная относительная частота

2

10

0,2

0,2

3

15

0,3

0,5

5

5

0,1

0,6

6

20

0,4

1

Объём выборки:

50

Запишем эмпирическую функцию распределения, используя накопленные относительные частоты:

Гистограммой частот называется ступенчатая фигура, состоящая из прямоугольников, основанием которых служат частичные интервалы длиною , а высоты равны .

Величина называется плотностью частоты.

Гистограммой относительных частот называется ступенчатая фигура, состоящая из прямоугольников, основанием которых служат частичные интервалы длиною , а высоты равны .

Величина называется плотностью относительной частоты.

Примечание. Гистограмма обычно служит для изображения выборки в случае непрерывных случайных величин. Очевидно, площадь гистограммы относительных частот равна единице. Поэтому гистограмму относительных частот можно рассматривать как график эмпирической (выборочной) плотности распределения, в этом и заключается практическая польза гистограммы относительных частот.

Графиком накопленных частот называется ступенчатая фигура, состоящая из прямоугольников, основанием которых служат частичные интервалы длиною , а высоты равны накопленным относительным частотам. Заметим, что график накопленных относительных частот имеет вид ступенчатой «лестницы» (от 0 до 1).

Примечание. График накопленных относительных частот и эмпирическая функция распределения на практике используются для приближения теоретической функции распределения [3].

Упражнение 2. Постройте гистограммы частот и относительных частот, график накопленных относительных частот, запишите эмпирическую функцию распределения по данному распределению выборки:

Частичный интервал

[2,7)

[7,12)

[12,17)

[17,22)

[22,27)

Число наблюдений, попавших в интервал,

5

10

25

6

4

Решение

Найдём объём выборки (50), длину интервала (5), построим таблицу, где вычислены относительные и накопленные относительные частоты, плотности частот и относительных частот, которые потребуются при построении соответствующих гистограмм.

Частичный интервал

Частота

Относительная частота

Накопленная относительная частота

Плотность частоты

Плотность относительной частоты

[2; 7)

5

0,1

0,1

1

0,02

[7; 12)

10

0,2

0,3

2

0,04

[12; 17)

25

0,5

0,8

5

0,1

[17; 22)

6

0,12

0,92

1,2

0,024

[22; 27)

4

0,08

1

0,8

0,016

Объём выборки: 50

Площадь гистограммы частот: 50

Длина

интервала:

5

Используя накопленные относительные частоты, запишем эмпирическую функцию распределения:

2. Выборочные характеристики и точечные оценки

Выборочными характеристиками называются функции от наблюдений, приближённо оценивающие соответствующие числовые характеристики случайной величины.

Оценки параметров генеральной совокупности делятся на два класса: точечные и интервальные.

Точечные оценки выражаются одним числом (точкой на числовой оси), находятся такие оценки по данным выборки и используются в дальнейшем вместо оцениваемого параметра. Точечная оценка, как функция от выборки, является случайной величиной и меняется от выборки к выборке при повторном эксперименте.

Интервальные оценки определяются двумя числами - концами интервала, который накрывает оцениваемый параметр.

В отличие от точечных оценок, которые не дают представления о том, как далеко от них может находиться оцениваемый параметр, интервальные оценки позволяют установить точность и надёжность оценок.

Если объём выборки , то при построении доверительного интервала для математического ожидания можно пользоваться нормальным законом распределения. В случае неизвестной дисперсии для определения ширины интервала используют несмещённую оценку дисперсии и соответствующее выборочное среднее квадратическое отклонение [2] .

К точечным оценкам предъявляют требования, которым они должны удовлетворять, чтобы хоть в каком-то смысле быть «доброкачественными». Это несмещённость, эффективность и состоятельность [1].

В качестве точечных оценок математического ожидания, дисперсии и среднего квадратического отклонения используют выборочные характеристики соответственно выборочное среднее, выборочная дисперсия и выборочное среднее квадратическое отклонение:

выборочное среднее:

;

выборочная смещённая (неисправленная) дисперсия:

, или

;

выборочная несмещённая (исправленная) дисперсия:

, или ;

смещённое выборочное среднее квадратическое отклонение:

;

несмещённое выборочное среднее квадратическое отклонение:

.

Примечание. Выборочное среднее есть несмещённая, эффективная и состоятельная точечная оценка математического ожидания, в то время как, выборочная дисперсия является смещённой точечной оценкой дисперсии. В этом случае вводят исправленную (несмещённую) точечную оценку дисперсии [3].

В качестве других используемых на практике выборочных характеристик можно назвать выборочную моду и выборочную медиану [3].

Для наблюдений дискретной случайной величины:

выборочная мода равна значению варианты с наибольшей частотой ;

выборочная медиана равна значению варианты, стоящей в середине вариационного ряда, если число наблюдаемых вариант есть нечётное число;

если число наблюдаемых вариант есть чётное число, тогда выборочная медиана равна полусумме двух соседних значений вариант, стоящих в середине вариационного ряда.

Медиана есть серединный элемент.

В том случае, когда наблюдения проводятся для непрерывной случайной величины, то мода и медиана определяются по следующим правилам.

Что касается моды , то сначала определяется модальный интервал, т. е. интервал с наибольшей частотой (или относительной частотой). Затем мода вычисляется по формуле

, (1)

здесь начало модального интервала, имеющего максимальную частоту , частота модального интервала, длина модального интервала, и частоты интервалов соответственно предшествующего и последующего за модальным интервалом.

Медианой называют такое число , когда 50% вариант выборки меньше или равна этого значения, а 50% больше или равна его, т. е. .

Медиану определяем по следующему алгоритму:

1) найдите медианный интервал . Это такой интервал, для которого накопленная частота , в этом случае медиана ;

2) вычислите медиану по одной из формул:

, (2)

или

, (3)

здесь начало медианного интервала, ширина медианного интервала, объём выборки, накопленная частота интервала, предшествующего медианному интервалу, частота медианного интервала, накопленная относительная частота медианного интервала, накопленная относительная частота интервала, предшествующего медианному интервалу.

Упражнение 3. Найдите выборочное среднее, смещённую и несмещённую выборочные дисперсии, смещённое и несмещённое выборочные средние квадратические отклонения, моду и медиану по данному распределению выборки:

2

3

5

6

10

15

5

20

Решение

В упражнении рассматривается дискретная случайная величина. Вычисления выполним в MS Excel.

Варианта

Частота

Относительная частота

Накопленная частота

Произведение варианты на частоту

Произведение квадрата варианты на частоту

2

10

0,2

0,2

20

40

3

15

0,3

0,5

45

135

5

5

0,1

0,6

25

125

6

20

0,4

1

120

720

Объём выборки:

50

210

1020

Выборочное среднее:

4,2

20,4

Смещённая выборочная дисперсия:

2,76

Несмещённая выборочная дисперсия:

2,82

Смещённое выборочное среднее квадратическое отклонение:

1,66

Несмещённое выборочное среднее квадратическое отклонение:

1,68

Мода М0 = 3, наибольшая частота равна 15.

Медиана Ме = (3+5)/2 = 4 среднее арифметическое двух серединных элементов.

Примечание. В данном примере чётное количество вариант, а именно 4, это 2, 3, 5, и 6. Поэтому медиану определяем как среднее значение дух серединных элементов:

Несмещённая выборочная дисперсия вычисляется по формуле:

Упражнение 4. Найдите выборочное среднее, выборочную дисперсию (смещённую и несмещённую), выборочное среднее квадратическое отклонение (смещённое и несмещённое) по данному распределению выборки:

Частичный интервал

[2,7)

[7,12)

[12,17)

[17,22)

[22,27)

Число наблюдений, попавших в интервал,

5

10

25

6

4

Решение

В данном упражнении наблюдения выполнены для непрерывной случайной величины. Здесь обязательно надо найти середины исследуемых интервалов. Именно таким образом поставленную задачу сведём к исследованию дискретной случайной величины. Вычисления выполним в MS Excel.

Частичный интервал

Частота

Относитель-ная частота

Накоплен-ная относитель-ная частота

Начало интервала

Конец интервала

Середина интервала

Произведение середины интервала на частоту

[2; 7)

5

0,1

0,1

2

7

4,5

22,50

[7; 12)

10

0,2

0,3

7

12

9,5

95,00

[12; 17)

25

0,5

0,8

12

17

14,5

362,50

[17; 22)

6

0,12

0,92

17

22

19,5

117,00

[22; 27)

4

0,08

1

22

27

24,5

98,00

Объём выборки:

50

695,00

Длина интервала:

5

Выборочное среднее:

13,90

Мода М0:

14,21

Медиана Ме:

17,00

Примечание. В данном примере максимальная частота , [12; 17) модальный интервал, моду вычисляем по формуле (1):

Интервал [7; 12) является медианным интервалом, поскольку накопленная относительная частота равна 0.3, а это значение меньше, чем 0.5, т. е. Медиану можно вычислить по одной из формул (2) или (3):

Найдём

выборочную дисперсию (смещённую и несмещённую оценки);

выборочное среднее квадратическое отклонение (смещённую и несмещённую оценки), для чего выполним дополнительные вычисления.

3. Примеры решения задач

Задача 1

Анализируется выборка из 100 малых предприятий региона. Цель обследования измерение коэффициента соотношения заёмных и собственных средств на каждом предприятии. Результаты представлены в виде табл. 1.

Таблица 1. Коэффициенты соотношений заёмных и собственных средств на предприятиях

5.56

5.45

5.48

5.45

5.39

5.37

5.46

5.59

5.61

5.31

5.46

5.61

5.11

5.41

5.31

5.57

5.33

5.11

5.54

5.43

5.34

5.53

5.46

5.41

5.48

5.39

5.11

5.42

5.48

5.49

5.36

5.40

5.45

5.49

5.68

5.51

5.50

5.68

5.21

5.38

5.58

5.47

5.46

5.19

5.60

5.63

5.48

5.27

5.22

5.37

5.33

5.49

5.50

5.54

5.40

5.58

5.42

5.29

5.05

5.79

5.79

5.65

5.70

5.71

5.85

5.44

5.47

5.48

5.47

5.55

5.67

5.71

5.73

5.05

5.35

5.72

5.49

5.61

5.57

5.69

5.54

5.39

5.32

5.21

5.73

5.59

5.38

5.25

5.26

5.81

5.27

5.64

5.20

5.23

5.33

5.37

5.24

5.55

5.60

5.51

Используя полученные данные, выполните следующие задания:

Задание 1. Постройте статистический ряд.

Задание 2. Вычислите относительные частоты, накопленные относительные частоты, плотности относительных частот.

Задание 3. Представьте графически статистический ряд в виде полигона или гистограммы.

Задание 4. Постройте график накопленных относительных частот.

Задание 5. Запишите эмпирическую функцию распределения.

Задание 6. Вычислите точечные оценки параметров закона распределения:

выборочное среднее;

выборочную дисперсию (смещённую, т. е. неисправленную, и несмещённую, т. е. исправленную);

выборочное среднее квадратическое отклонение (смещённое и несмещённое);

выборочную моду;

выборочную медиану.

Задание 7. Полагая, что данная генеральная совокупность подчиняется нормальному закону, найдите доверительный интервал для неизвестного математического ожидания при условии, что дисперсия неизвестна, если доверительная вероятность задаётся формулой

,

где последняя цифра шифра зачётной книжки.

Решение

Задание 1. Постройте статистический ряд.

Шаг 1. Внесём данные выборки в MS Excel, упорядочим их по возрастанию, найдём наименьшее и наибольшее значения вариант . Это и соответственно. Вычислим размах выборки и число интервалов, на которые разбивается диапазон [; ], по формуле Стерджеса:

,

. Определим длину интервала

.

Шаг 2. Построим статистический ряд (табл. 2).

Таблица 2

Интервал

[5.0;5.1)

[5.1;5.2)

[5.2;5.3)

[5.3;5.4)

[5.4;5.5)

[5.5;5.6)

[5.6;5.7)

[5.7;5.8)

[5.8;5.9)

Частота

2

4

11

17

27

17

12

8

2

Примечание. При построении интервалов начальное значение первого интервала, как правило, надо вычислять по формуле, конечное значение последнего интервала должно удовлетворять условию

.

В данном примере частоты первого и последнего интервалов меньше пяти (2 и 2 соответственно). Поэтому объединим первый интервал со вторым, а последний интервал с предпоследним. Соответственно изменятся и частоты объединённых интервалов (табл. 3).

Таблица 3

Интервал

[5.0;5.2)

[5.2;5.3)

[5.3;5.4)

[5.4;5.5)

[5.5;5.6)

[5.6;5.7)

[5.7;5.9)

Частота

6

11

17

27

17

12

10

Задание 2. Вычислите относительные частоты, накопленные относительные частоты, плотности относительных частот.

Построим группированный ряд наблюдений, найдём середины интервалов, вычислим относительные и накопленные относительные частоты, а также плотности относительных частот (табл. 4). Обратите внимание, что длина первого и последнего интервалов равна 0,2.

Таблица 4

Номер интервала

Интервал

Середина интервала

Частота

Относительная частота

Накопленная относительная частота

1

[5.0; 5.2)

5.1

6

0.06

0.06

0.3

2

[5.2; 5.3)

5.25

11

0.11

0.17

1.1

3

[5.3; 5.4)

5.35

17

0.17

0.34

1.7

4

[5.4; 5.5)

5.45

27

0.27

0.61

2.7

5

[5.5; 5.6)

5.55

17

0.17

0.78

1.7

6

[5.6; 5.7)

5.65

12

0.12

0.90

1.2

7

[5.7; 5.9)

5.8

10

0.10

1.00

0.5

Задание 3. Представьте графически статистический ряд в виде полигона или гистограммы.

Поскольку исследуем статистический ряд для непрерывной случайной величины, выполним построение гистограммы относительных частот (рис. 1). В роли значения функции, описанной в легенде, выступает плотность относительной частоты.

Рис. 1. Гистограмма относительных частот

Задание 4. Постройте график накопленных относительных частот.

Используем вычисленные накопленные частоты, полученные на предыдущем шаге, и построим график накопленных относительных частот (рис. 2).

Рис. 2. График накопленных относительных частот

Задание 5. Запишите эмпирическую функцию распределения.

Эмпирическую функцию распределения записываем, используя вычисленные накопленные относительные частоты:

Задание 6. Вычислите точечные оценки параметров закона распределения:

выборочное среднее;

выборочную дисперсию (смещённую и несмещённую;

выборочное среднее квадратическое отклонение (смещённое и несмещённое);

выборочную моду;

выборочную медиану.

Примечание. Выполняя данное задание, используйте формулы:

выборочное среднее

выборочная смещённая (неисправленная) дисперсия

выборочная несмещённая (исправленная) дисперсия:

;

смещённое выборочное среднее квадратическое отклонение:

;

несмещённое выборочное среднее квадратическое отклонение:

Мода и медиана :

или .

Для решения этой задачи выполним дополнительные вычисления, используя MS Excel.

Задание 7. Полагая, что данная генеральная совокупность подчиняется нормальному закону, найдите доверительный интервал для неизвестного математического ожидания при условии, что дисперсия неизвестна, если доверительная вероятность задаётся формулой

,

где последняя цифра шифра зачётной книжки.

Положим , тогда доверительная вероятность задана как .

Используем ранее полученные выборочное среднее и исправленное среднее квадратическое отклонение .

По условию . По таблице значений функции Лапласа (прил. 2) находим значение аргумента . Объём выборки . Тогда . Таким образом, интервал покрывает неизвестный параметр такой, как математическое ожидание , с надёжностью .

Примечание. Если в таблице значений функции Лапласа нет точного значения , то следует взять среднее арифметическое двух ближайших соседних значений, одно меньшее , другое большее .

Задача 2

Выполнены экологические статистические исследования за определённый промежуток времени, например, несанкционированный подъезд машин к закрытой территории мусорных отходов. Получили выборку, данные которой приведены в табл. 5.

Таблица 5. Несанкционированный подъезд машин

2

4

2

4

3

3

3

2

0

6

1

2

3

2

2

4

3

3

5

1

0

2

4

3

2

2

3

3

1

3

3

3

1

1

2

3

1

4

3

1

7

4

3

4

2

3

2

3

3

1

4

3

1

4

5

3

4

2

4

5

3

6

4

1

3

2

4

1

3

1

0

0

4

6

4

7

4

1

3

По приведённым данным выполните следующие задания:

Задание 1. Постройте статистический ряд.

Задание 2. Вычислите относительные частоты и накопленные относительные частоты.

Задание 3. Представьте графически статистический ряд в виде полигона или гистограммы.

Задание 4. Постройте график накопленных относительных частот.

Задание 5. Запишите эмпирическую функцию распределения.

Задание 6. Вычислите точечные оценки параметров закона распределения:

выборочное среднее;

выборочную дисперсию (смещённую и несмещённую, или, как её ещё называют, исправленную);

выборочное среднее квадратическое отклонение (смещённое и несмещённое);

выборочные моду и медиану.

Задание 7. Положим, изучаемая генеральная совокупность подчиняется нормальному закону распределения. Найдите доверительный интервал для неизвестного математического ожидания при условии, что дисперсия неизвестна и доверительная вероятность задаётся формулой

,

где последняя цифра шифра зачётной книжки.

Решение

Задание 1. Постройте статистический ряд.

Внесём данные выборки в MS Excel, упорядочим их по возрастанию, найдём наименьшее и наибольшее значения вариант Объём выборки . Вычислим размах выборки . Размах довольно мал, поэтому составим вариационный ряд по значениям, вычислим частоты.

0

1

2

3

4

5

6

7

4

13

14

24

16

3

3

2

Задание 2. Вычислите относительные частоты и накопленные относительные частоты.

Организуем новую таблицу, вычисления проведём в MS Excel, округляя до двух знаков после десятичной точки. Заметим, что накопленные относительные частоты используем при выполнении задания 4 при записи эмпирической функции распределения. В таблице отметим наибольшую частоту (24) и накопленную относительную частоту , которые будут участвовать при нахождении моды и медианы.

Варианта

Частота

Относительная частота

Накопленная относительная частота

0

4

0,05

0,05

1

13

0,16

0,22

2

14

0,18

0,39

3

24

0,30

0,70

4

16

0,20

0,90

5

3

0,04

0,94

6

3

0,04

0,97

7

2

0,03

1,00

Объём выборки:

79

Задание 3. Представьте графически статистический ряд в виде полигона или гистограммы.

Поскольку исследуем статистический ряд для дискретной случайной величины, то построим полигон относительных частот (рис. 3).

Рис. 3. Полигон относительных частот

Задание 4. Постройте график накопленных относительных частот.

Искомый график представлен на рис. 4

Рис. 4. График накопленных относительных частот

Задание 5. Запишите эмпирическую функцию распределения.

Запишем эмпирическую функцию распределения, используя данные накопленных относительных частот:

Задание 6. Вычислите точечные оценки параметров закона распределения:

выборочное среднее;

выборочную дисперсию (смещённую и несмещённую);

выборочное среднее квадратическое отклонение (смещённое и несмещённое);

выборочные моду и медиану.

Организуем новую таблицу, вычисления выполним в MS Excel.

Варианта

Частота

0

4

0

0

1

13

13

13

2

14

28

56

3

24

72

216

4

16

64

256

5

3

15

75

6

3

18

108

7

2

14

98

Объём выборки:

79

224

822

Выборочное среднее:

2,84

10,41

Смещённая выборочная дисперсия:

2,37

Несмещённая выборочная дисперсия:

2,40

Выборочное среднее квадратическое отклонение (смещённое):

1,54

Выборочное среднее квадратическое отклонение (несмещённое):

1,55

Мода (наибольшая частота 24):

3

Медиана (элемент, стоящий на 40-м месте,

т. е. серединный элемент):

3

Задание 7. Положим, изучаемая генеральная совокупность подчиняется нормальному закону распределения. Найдите доверительный интервал для неизвестного математического ожидания при условии, что дисперсия неизвестна и доверительная вероятность задаётся формулой

,

где последняя цифра шифра зачётной книжки.

Предположим , тогда доверительная вероятность вычисляется как . Из таблицы, приведённой выше, выборочное среднее и исправленное среднее квадратическое отклонение .

По условию . По таблице значений функции Лапласа (прил. 2) находим значение аргумента . Объём выборки .

Вычислим : .

Таким образом, доверительный интервал, покрывающий неизвестное математическое ожидание с надёжностью , есть .

4. Варианты заданий

В задачах по данным своего варианта выполните следующие задания:

Задание 1. Постройте статистический ряд.

Задание 2. Вычислите относительные частоты и накопленные относительные частоты.

Задание 3. Представьте графически статистический ряд в виде полигона или гистограммы.

Задание 4. Постройте график накопленных относительных частот.

Задание 5. Запишите эмпирическую функцию распределения.

Задание 6. Вычислите точечные оценки параметров закона распределения:

выборочное среднее;

выборочную дисперсию (смещённую и несмещённую);

выборочное среднее квадратическое отклонение (смещённое и несмещённое);

выборочную моду;

выборочную медиану.

Задание 7. Положим, изучаемая генеральная совокупность подчиняется нормальному закону распределения. Найдите доверительный интервал для неизвестного математического ожидания при условии, что дисперсия неизвестна и доверительная вероятность задаётся формулой

,

где последняя цифра шифра зачётной книжки.

Вариант 0

В автопарке проводилось исследование продолжительности автомобильных рейсов (сутки). Результаты дорожной ведомости приведены в табл. 0.

Таблица 0

4

2

7

10

4

3

6

2

8

10

2

8

5

6

3

4

8

6

5

1

5

7

4

3

4

7

3

5

9

2

3

5

10

4

3

8

5

9

4

4

4

7

4

2

1

8

10

3

4

6

1

3

6

2

4

7

5

5

0

2

3

7

7

9

10

2

5

8

3

6

8

10

2

4

9

3

6

6

2

7

9

3

5

2

1

6

3

5

7

2

10

5

7

3

6

3

2

7

1

9

Вариант 1

В течение квартала на фондовой бирже выполнен сбор данных по количеству сделок для 100 инвесторов. Результаты представлены в виде табл. 1.

Таблица 1

10

7

3

9

2

6

5

0

4

8

1

2

5

13

2

14

7

9

17

11

4

16

Здесь количество сделок, число инвесторов.

Вариант 2

Для изучения распределения заработной платы работников некоторой отрасли за определённый промежуток времени обследовано 100 человек. Результаты представлены в табл. 2.

Таблица 2

2.0

3.2

5.2

4.8

3.8

2.8

4.9

3.2

3.9

1.8

3.7

3.2

4.5

2.5

2.3

3.4

1.1

5.7

3.3

2.7

2.5

1.4

2.1

3.9

2.2

1.2

4.2

5.4

2.3

4.1

3.8

3.2

6.1

2.1

3.8

2.5

1.7

2.9

5.9

7.1

3.9

4.2

5.8

1.8

4.2

6.1

5.1

3.3

4.2

3.6

3.0

2.3

1.5

3.3

3.7

2.4

1.6

2.7

4.2

5.9

4.7

5.4

3.2

2.7

1.8

2.5

3.7

4.8

5.8

6.6

2.8

5.4

3.2

1.6

4.7

3.3

4.9

5.3

5.1

3.2

1.2

2.4

6.2

7.4

7.7

6.9

7.1

8.2

6.3

5.3

2.2

5.7

4.3

5.1

4.9

2.3

1.4

7.7

6.1

5.1

Вариант 3

Проведено исследование посещаемости интернет-сайта. Несколько часов подряд регистрируется число посетителей, посетивших сайт в течение данного часа. Результаты исследования приведены в табл. 3.

Таблица 3

2

11

14

3

6

12

4

38

4

2

52

27

2

32

7

10

9

8

1

6

0

13

11

27

45

20

40

57

Здесь число посетителей, время (ч).

Вариант 4

В течение трёх месяцев проводились измерения барометрического давления воздуха (мм. рт. ст.). Результаты приведены в табл. 4.

Таблица 4

745

746

747

748

749

750

751

752

753

754

2

3

7

10

11

6

8

10

6

5

755

756

757

758

759

760

761

762

763

764

8

9

8

12

13

11

8

6

4

3

Вариант 5

Проведено исследование продолжительности работы лампочек (ч/10). Результаты исследования приведены в таб. 5.

Таблица 5

51

56

69

31

56

49

51

53

74

51

63

48

53

51

64

50

59

84

55

82

55

72

70

54

51

77

98

62

73

55

87

79

52

45

69

70

99

87

65

47

45

30

60

69

58

66

88

92

94

68

Вариант 6

На некотором участке дороги проведены измерения скорости автомобилей, км/ч. Результаты измерения даны в табл. 6.

Таблица 6

41

41

29

25

41

43

42

34

41

30

23

48

50

36

35

46

28

46

50

41

55

27

43

53

48

47

34

35

29

42

30

35

38

41

36

38

45

59

44

43

60

56

46

30

50

44

58

30

54

29

57

47

70

63

42

35

48

44

63

30

Вариант 7

У пятидесяти новорождённых измеряли массу тела с точностью до 10 г. Результаты измерений приведены в таблице 7.

Таблица 7

3,70

3,85

3,70

3,78

3,60

4,45

4,20

3,87

3,30

3,76

3,75

4,03

3,75

4,18

3,80

4,75

3,25

4,10

3,55

3,35

3,38

3,30

4,15

3,95

3,50

3,88

3,71

3,15

4,15

3,80

4,22

3,75

3,58

3,55

4,08

4,03

3,24

4,05

3,56

3,05

3,58

3,98

3,88

3,78

4,05

3,40

3,80

3,06

4,38

4,20

Вариант 8

Получены данные коэффициента интеллекта семидесяти взрослых людей. Результаты измерений приведены в таблице 8.

Таблица 8

141

115

123

124


Подобные документы

  • Задачи математической статистики. Распределение случайной величины на основе опытных данных. Эмпирическая функция распределения. Статистические оценки параметров распределения. Нормальный закон распределения случайной величины, проверка гипотезы.

    курсовая работа [57,0 K], добавлен 13.10.2009

  • Генеральная совокупность подлежащих изучению объектов или возможных результатов наблюдений, производимых в одинаковых условиях над одним объектом. Описание наблюдаемых значений случайной величины Х. Характеристика статистической функции распределения.

    курсовая работа [216,5 K], добавлен 03.05.2011

  • Понятия теории вероятностей и математической статистики, применение их на практике. Определение случайной величины. Виды и примеры случайных величин. Закон распределения дискретной случайной величины. Законы распределения непрерывной случайной величины.

    реферат [174,7 K], добавлен 25.10.2015

  • Особенности функции распределения как самой универсальной характеристики случайной величины. Описание ее свойств, их представление с помощью геометрической интерпретации. Закономерности вычисления вероятности распределения дискретной случайной величины.

    презентация [69,1 K], добавлен 01.11.2013

  • Математические методы систематизации и использования статистических данных для научных и практических выводов. Закон распределения дискретной случайной величины. Понятие генеральной совокупности. Задачи статистических наблюдений. Выборочное распределение.

    реферат [332,8 K], добавлен 10.12.2010

  • Случайные величины. Функция и плотность распределения вероятностей дискретной случайной величины. Сингулярные случайные величины. Математическое ожидание случайной величины. Неравенство Чебышева. Моменты, кумулянты и характеристическая функция.

    реферат [244,6 K], добавлен 03.12.2007

  • Понятие вариационного ряда, статистического распределения. Эмпирическая функция и основные характеристики математического ожидания выборочной дисперсии. Точечные и интервальные оценки распределений. Теория гипотез - аналог теории доверительных интервалов.

    контрольная работа [172,9 K], добавлен 22.11.2013

  • Вероятность совместного появления двух белых шаров. Расчет числа исходов, благоприятствующих интересующему событию. Функция распределения случайной величины. Построение полигона частот, расчет относительных частот и эмпирической функции распределения.

    задача [38,9 K], добавлен 14.11.2010

  • Построение полигона относительных частот, эмпирической функции распределения, кумулянты и гистограммы. Расчет точечных оценок неизвестных числовых характеристик. Проверка гипотезы о виде распределения для простого и сгруппированного ряда распределения.

    курсовая работа [216,2 K], добавлен 28.09.2011

  • Использование формулы Бернулли для нахождения вероятности происхождения события. Построение графика дискретной случайной величины. Математическое ожидание и свойства интегральной функции распределения. Функция распределения непрерывной случайной величины.

    контрольная работа [87,2 K], добавлен 29.01.2014

  • Обработка и анализ статистической информации. Выборочная теория; интервальные оценки и графическое представление параметров распределения. Точечные оценки характеристик положения и мер изменчивости. Корреляционная зависимость; уравнение регрессии.

    курсовая работа [1023,9 K], добавлен 21.03.2015

  • Классическая формула для вероятности события, отношение благоприятного числа исходов опыта к общему числу всех равновозможных несовместных исходов. Понятие непрерывной и дискретной случайной величины, их числовые характеристики и законы распределения.

    презентация [5,5 M], добавлен 19.07.2015

  • Вероятность попадания случайной величины Х в заданный интервал. Построение графика функции распределения случайной величины. Определение вероятности того, что наудачу взятое изделие отвечает стандарту. Закон распределения дискретной случайной величины.

    контрольная работа [104,7 K], добавлен 24.01.2013

  • Функция распределения непрерывной случайной величины. Математическое ожидание непрерывной случайной величины, плотность распределения вероятностей системы. Ковариация. Коэффициент корреляции.

    лабораторная работа [52,3 K], добавлен 19.08.2002

  • Числовые характеристики случайной функции: математическое ожидание, дисперсия, квадрат разности, корреляционная функция. Расчет среднего выборочного и несмещенной выборочной дисперсии, проверка гипотезы о нормальном распределении по критерию согласия.

    контрольная работа [666,1 K], добавлен 02.06.2010

  • Методы регистрации, описания и анализа статистических экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений. Обзор задач математической статистики. Закон распределения случайной величины. Проверка правдоподобия гипотез.

    презентация [113,3 K], добавлен 01.11.2013

  • Классификация случайных событий. Функция распределения. Числовые характеристики дискретных случайных величин. Закон равномерного распределения вероятностей. Распределение Стьюдента. Задачи математической статистики. Оценки параметров совокупности.

    лекция [387,7 K], добавлен 12.12.2011

  • Таблица значений выборки дискретных случайных величин в упорядоченном виде. Таблица интервального статистического ряда относительных частот. Задание эмпирической функции распределений и построение ее графика. Полигон и распределение случайной величины.

    практическая работа [109,3 K], добавлен 26.07.2012

  • Распределение дискретной случайной величины по геометрическому закону распределения, проверка теоремы Бернулли на примере моделирования электрической схемы. Математическое моделирование в среде Turbo Pascal. Теоретический расчёт вероятности работы цепи.

    контрольная работа [109,2 K], добавлен 31.05.2010

  • Длина интервала группирования. Графическое описание выборки. Гистограмма относительных частот. Кусочно-постоянная функция. Границы доверительного интервала математического ожидания. Вычисление коэффициента корреляции. Эмпирическая функция распределения.

    практическая работа [737,5 K], добавлен 14.02.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.