Этапы статистического анализа

Определение средней по сгруппированным данным. Использование метода определения средней арифметической взвешенной. Расчет моды в интервальных рядах распределения с равными интервалами. Определение медианы, дисперсии и среднего квадратического отклонения.

Рубрика Математика
Вид контрольная работа
Язык русский
Дата добавления 18.06.2023
Размер файла 178,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

РАСЧЁТНО-ГРАФИЧЕСКОЕ ЗАДАНИЕ

по дисциплине «Теория вероятностей и математическая статистика»

Цель работы: освоить основные этапы статистического анализа, научиться собирать и анализировать статистические данные.

Возраст

До 20

20 - 30

30 - 40

40 - 50

50 - 60

60 и более

Итого

% обращавшихся за кредитом

8

25

52

7

5

3

100

Решение:

Данный интервальный вариационный ряд содержит открытые интервалы, которые предварительно необходимо закрыть. Для этого из величины верхней границы первого интервала надо вычесть величину второго интервала. Получим нижнюю границу первого интервала.

20 - 10 = 10.

Первый интервал: 10 - 20.

а) Определение средней по сгруппированным данным производится по формуле средней арифметической взвешенной:

Чтобы применить эту формулу, необходимо варианты признака выразить одним числом (дискретным). За такое дискретное число принимается средняя арифметическая простая из верхнего и нижнего значения каждого интервала.

Так, например, дискретная величина х для первого интервала будет равна: (10 - 20) / 2 = 15.

Построим таблицу рассчётных данных:

х

f

хf

15

8

120

148

2738

-50653

937080,5

25

25

625

212,5

1806,25

-15353,1

130501,6

35

52

1820

78

117

175,5

263,3

45

7

315

80,5

925,75

10646,1

122430,4

55

5

275

107,5

2311,25

49691,9

1068375,3

65

3

195

94,5

2976,75

93767,6

2953680,2

Итого

100

3350

721

10875

88275

5212331,3

Дальнейший расчёт производится обычным методом определения средней арифметической взвешенной.

Определим моду.

Мода - это величина признака наиболее часто встречающегося в совокупности.

В интервальных рядах распределения с равными интервалами мода определяется по формуле:

где

хМо - начальное значение интервала, содержащего моду;

iМо - величина модального интервала,

fМо - частота модального интервала,

fМо-1 - частота интервала, предшествующего модальному,

fМо - 1 - частота интервала, следующего за модальным.

Мода содержится в интервале от 30 до 40, так как у этого интервала наибоьшая частота при x = 35 (f = 52). Следовательно, мода равна 35.

Моду легко отыскать по таблице, и ещё легче на полигоне частот - это абсцисса самой высокой точки:

Медиана.

Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности.

Это значение xi = 35. Таким образом, медиана равна 35.

Медиана служит хорошей характеристикой при ассиметричном распределении данных, т.к. даже при наличии "выбросов" данных, медиана более устойчива к воздействию отклоняющихся данных.

В симметричных рядах распределения значение моды и медианы совпадают со средней величиной (xср=Me=Mo), а в умеренно асимметричных они соотносятся таким образом: 3(xср-Me) ? xср-Mo

Найдём среднее квадратическое отклонение:

средняя взвешенная интервальный квадратический

Дисперсия будет равна:

у2 = 108,75=10,428

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>30%,но v<70%, то вариация умеренная.

Показатель асимметрии

где м3 - центральный момент третьего порядка, рассчитываемый по формуле:

м3 = 88 275 / 100 = 882,75

Положительная величина указывает на наличие правосторонней асимметрии

Оценка существенности показателя асимметрии дается с помощью средней квадратической ошибки коэффициента асимметрии:

Далее рассчитаем показатель эксцесса (Еk). Наиболее точно он определяется по формуле с использованием центрального момента четвёртого порядка:

м4 = 52 123 312 500 / 100 = 521 233 125

у4 = 118 265 625

Ek = 521 233 125 / 118 265 625 - 3 = 4,41 - 3 = 1,41

Так как Ek > 0 распределение является островершинным.

Проверка гипотез о виде распределения.

1. Проверим гипотезу о том, что Х распределено по нормальному закону с помощью критерия согласия Пирсона.

где f*i - теоретические частоты:

Вычислим теоретические частоты, учитывая, что:

N = 100, h=10 (ширина интервала), у = 10.428, xср = 34

i

xi

ui

цi

fi*

1

15

-1.774

0,0818

7.844

2

25

-0.8151

0,285

27.329

3

35

0.1438

0,3939

37.772

4

45

1.1028

0,2155

20.665

5

55

2.0617

0,0468

4.488

6

65

3.0206

0,004

0.384

Сравним эмпирические и теоретические частоты. Составим расчетную таблицу, из которой найдем наблюдаемое значение критерия:

i

fi

f*i

fi-fi*

(fi-fi*)2

(fi-fi*)2/fi*

1

8

7.844

-0.156

0.02433

0.0031

2

25

27.3294

2.3294

5.4261

0.199

3

52

37.7721

-14.2279

202.4326

5.359

4

7

20.6649

13.6649

186.7286

9.036

5

5

4.4878

-0.5122

0.2624

0.0585

6

3

0.3836

-2.6164

6.8457

17.847

?

100

100

32.503

Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл, тем сильнее довод против основной гипотезы.

Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp; - ?).

Её границу Kkp = ч2(k-r-1;б) находим по таблицам распределения ч2 и заданным значениям у, k = 6, r=2 (параметры xcp и у оценены по выборке).

Kkp(0.05;3) = 7.81473; Kнабл = 32.5

Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл > Kkp, поэтому есть основания отвергать основную гипотезу. Данные выборки распределены не по нормальному закону. Другими словами, эмпирические и теоретические частоты различаются значимо.

Проверим гипотезу о том, что Х распределено по закону Пуассона.

где pi -- вероятность попадания в i-й интервал случайной величины, распределенной по гипотетическому закону.

а) Находим по заданному эмпирическому распределению выборочную среднюю (xВ = 33.5).

б) Принимаем в качестве оценки параметра л распределения Пуассона выборочную среднюю xср = 33.5. Следовательно, предполагаемый закон Пуассона имеет вид:

в) Найдем по формуле Пуассона вероятности Pi, появления ровно i событий в n испытаниях. Находим теоретические частоты по формуле npi

i = 0: p0 = 0, np0 = 0

i = 1: p1 = 0, np1 = 0

i = 2: p2 = 0, np2 = 0

i = 3: p3 = 0, np3 = 0

i = 4: p4 = 0, np4 = 0

i = 5: p5 = 0, np5 = 0

в) Вычисляем слагаемые статистики Пирсона по формуле (5 столбец таблицы):

i

ni

pi

Ожидаемая частота npi

Слагаемые статистики Пирсона Ki

0

8

0

0

2.2648795879183E - 14

1

25

0

0

66023775300745

2

52

0

0

17053448445350

3

7

0

0

27674389740.06

4

5

0

0

1685920779.16

5

3

0

0

90586782.671

100

3.0959463343523E - 14

Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл, тем сильнее довод против основной гипотезы.

Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp; - ?).

Её границу Kkp = ч2(k-r-1;б) находим по таблицам распределения г2 и заданным значениям s, k (число интервалов), r=1 (параметр л).

Kkp(0.1;4) = 7.77944; Kнабл = 3.0959463343523E - 14

Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл > Kkp, поэтому есть основания отвергать основную гипотезу. Данные выборки распределены не по закону Пуассона.

Гистограмма

Вывод

Среднее значение примерно равно моде и медиане, что свидетельствует о нормальном распределении выборки.

Поскольку коэффициент вариации находится в пределах [30%; 70%], то вариация умеренная.

Гипотеза о том, что случайная величина Х подчинена нормальному закону распределения, отвергается (по критерию согласия Пирсона).

Значения As и Ex мало отличаются от нуля. Поэтому можно предположить близость данной выборки к нормальному распределению.

Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл > Kkp, поэтому есть основания отвергать основную гипотезу. Данные выборки распределены не по закону Пуассона.

Размещено на Allbest.ru

...

Подобные документы

  • Нахождение вероятности того, что наудачу взятое натуральное число не делится. Построение гистограммы для изображения интервальных рядов, расчет средней арифметической дискретного вариационного ряда, среднего квадратического отклонения и дисперсии.

    контрольная работа [140,8 K], добавлен 18.05.2009

  • Построение интервальных вариационных рядов по показателям. Вычисление средней арифметической, моды и медианы, относительных и абсолютных показателей вариации. Определение количественных характеристик распределений, построение эмпирической функции.

    курсовая работа [179,8 K], добавлен 11.01.2012

  • Алгоритм определения вероятности события и выполнения статистических ожиданий. Оценка возможных значений случайной величины и их вероятности. Расчет математического ожидания, дисперсии и среднего квадратического отклонения. Анализ характеристик признака.

    контрольная работа [263,8 K], добавлен 13.01.2014

  • Определение вероятности того, что из урны взят белый шар. Нахождение математического ожидания, среднего квадратического отклонения и дисперсии случайной величины Х, построение гистограммы распределения. Определение параметров распределения Релея.

    контрольная работа [91,7 K], добавлен 15.11.2011

  • Расчет параметров экспериментального распределения. Вычисление среднего арифметического значения и среднего квадратического отклонения. Определение вида закона распределения случайной величины. Оценка различий эмпирического и теоретического распределений.

    курсовая работа [147,0 K], добавлен 10.04.2011

  • Методы составления закона распределения случайной величины. Вычисление средней арифметической и дисперсии распределения. Расчет средней квадратической ошибки бесповторной выборки. Построение эмпирических линий регрессии, поиск уравнения прямых регрессий.

    контрольная работа [77,6 K], добавлен 20.07.2010

  • Вычисление вероятностей возможных значений случайной величины по формуле Бернулли. Расчет математического ожидания, дисперсии, среднеквадратического отклонения, медианы и моды. Нахождение интегральной функции, построение многоугольника распределения.

    контрольная работа [162,6 K], добавлен 28.05.2012

  • Определение числа исходов, благоприятствующих данному событию. Теорема умножения вероятностей и сложения несовместных событий, локальная теорема Лапласа. Расчет среднеквадратического отклонения величин. Несмещенная оценка генеральной средней и дисперсии.

    контрольная работа [91,0 K], добавлен 31.01.2011

  • Определение вероятность срабатывания устройств при аварии. Расчет математического ожидания, дисперсии и функции распределения по заданному ряду распределения. Построение интервального статистического ряда распределения значений статистических данных.

    контрольная работа [148,8 K], добавлен 12.02.2012

  • Определение вероятности для двух несовместных и достоверного событий. Закон распределения случайной величины; построение графика функции распределения. Нахождение математического ожидания, дисперсии, среднего квадратичного отклонения случайной величины.

    контрольная работа [97,1 K], добавлен 26.02.2012

  • Построение статистического ряда исходной информации. Определение среднего значения показателя надежности и среднеквадратического отклонения. Проверка информации на выпадающие точки. Определение доверительных границ при законе распределения Вейбулла.

    контрольная работа [65,7 K], добавлен 31.01.2014

  • Решение системы уравнений по методу Крамера, Гаусса и с помощью обратной матрицы. Общее число возможных элементарных исходов для заданных испытаний. Расчет математического ожидания, дисперсии и среднего квадратического отклонения, график функции.

    контрольная работа [210,4 K], добавлен 23.04.2013

  • Определение вероятности наступления определенного события по законам теории вероятности. Вычисление математического ожидания, дисперсии и среднего квадратичного отклонения. Нахождение выборочного уравнения регрессии по данным корреляционной таблицы.

    контрольная работа [212,0 K], добавлен 01.05.2010

  • Сущность закона распределения и его практическое применение для решения статистических задач. Определение дисперсии случайной величины, математического ожидания и среднеквадратического отклонения. Особенности однофакторного дисперсионного анализа.

    контрольная работа [328,2 K], добавлен 07.12.2013

  • Способы вычисления наступления некоторого события. Решение задач, связанных с теорией вероятности. Использование таблицы функции Лапласа для определения теоретических частот нормального закона распределения. Определение исправленной выборочной дисперсии.

    контрольная работа [225,3 K], добавлен 14.03.2015

  • Вычисление математического ожидания, дисперсии, функции распределения и среднеквадратического отклонения случайной величины. Закон распределения случайной величины. Классическое определение вероятности события. Нахождение плотности распределения.

    контрольная работа [38,5 K], добавлен 25.03.2015

  • Определение математической вероятности правильного набора, если на нечетных местах комбинации стоят одинаковые цифры. Использование классического определения вероятности. Расчет математического ожидания и дисперсии для очков, выпавших на игральных костях.

    контрольная работа [90,2 K], добавлен 04.01.2011

  • Первичный анализ и основные характеристики статистических данных. Точечные оценки параметров распределения. Доверительные интервалы для неизвестного математического ожидания и для среднего квадратического отклонения. Проверка статистических гипотез.

    дипломная работа [850,9 K], добавлен 18.01.2016

  • Определение вероятности определенного события. Вычисление математического ожидания, дисперсии, среднеквадратического отклонения дискретной случайной величины Х по известному закону ее распределения, заданному таблично. Расчет корреляционных признаков.

    контрольная работа [725,5 K], добавлен 12.02.2010

  • Определение типа кривой по виду уравнения, уравнение с угловым коэффициентом, в отрезках и общее уравнение. Определение медианы, уравнения средней линии в треугольнике. Вопросы по линейной алгебре. Решение системы уравнения при помощи обратной матрицы.

    контрольная работа [97,5 K], добавлен 31.10.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.