Этапы статистического анализа
Определение средней по сгруппированным данным. Использование метода определения средней арифметической взвешенной. Расчет моды в интервальных рядах распределения с равными интервалами. Определение медианы, дисперсии и среднего квадратического отклонения.
Рубрика | Математика |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 18.06.2023 |
Размер файла | 178,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
РАСЧЁТНО-ГРАФИЧЕСКОЕ ЗАДАНИЕ
по дисциплине «Теория вероятностей и математическая статистика»
Цель работы: освоить основные этапы статистического анализа, научиться собирать и анализировать статистические данные.
Возраст |
До 20 |
20 - 30 |
30 - 40 |
40 - 50 |
50 - 60 |
60 и более |
Итого |
|
% обращавшихся за кредитом |
8 |
25 |
52 |
7 |
5 |
3 |
100 |
Решение:
Данный интервальный вариационный ряд содержит открытые интервалы, которые предварительно необходимо закрыть. Для этого из величины верхней границы первого интервала надо вычесть величину второго интервала. Получим нижнюю границу первого интервала.
20 - 10 = 10.
Первый интервал: 10 - 20.
а) Определение средней по сгруппированным данным производится по формуле средней арифметической взвешенной:
Чтобы применить эту формулу, необходимо варианты признака выразить одним числом (дискретным). За такое дискретное число принимается средняя арифметическая простая из верхнего и нижнего значения каждого интервала.
Так, например, дискретная величина х для первого интервала будет равна: (10 - 20) / 2 = 15.
Построим таблицу рассчётных данных:
х |
f |
хf |
|||||
15 |
8 |
120 |
148 |
2738 |
-50653 |
937080,5 |
|
25 |
25 |
625 |
212,5 |
1806,25 |
-15353,1 |
130501,6 |
|
35 |
52 |
1820 |
78 |
117 |
175,5 |
263,3 |
|
45 |
7 |
315 |
80,5 |
925,75 |
10646,1 |
122430,4 |
|
55 |
5 |
275 |
107,5 |
2311,25 |
49691,9 |
1068375,3 |
|
65 |
3 |
195 |
94,5 |
2976,75 |
93767,6 |
2953680,2 |
|
Итого |
100 |
3350 |
721 |
10875 |
88275 |
5212331,3 |
Дальнейший расчёт производится обычным методом определения средней арифметической взвешенной.
Определим моду.
Мода - это величина признака наиболее часто встречающегося в совокупности.
В интервальных рядах распределения с равными интервалами мода определяется по формуле:
где
хМо - начальное значение интервала, содержащего моду;
iМо - величина модального интервала,
fМо - частота модального интервала,
fМо-1 - частота интервала, предшествующего модальному,
fМо - 1 - частота интервала, следующего за модальным.
Мода содержится в интервале от 30 до 40, так как у этого интервала наибоьшая частота при x = 35 (f = 52). Следовательно, мода равна 35.
Моду легко отыскать по таблице, и ещё легче на полигоне частот - это абсцисса самой высокой точки:
Медиана.
Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности.
Это значение xi = 35. Таким образом, медиана равна 35.
Медиана служит хорошей характеристикой при ассиметричном распределении данных, т.к. даже при наличии "выбросов" данных, медиана более устойчива к воздействию отклоняющихся данных.
В симметричных рядах распределения значение моды и медианы совпадают со средней величиной (xср=Me=Mo), а в умеренно асимметричных они соотносятся таким образом: 3(xср-Me) ? xср-Mo
Найдём среднее квадратическое отклонение:
средняя взвешенная интервальный квадратический
Дисперсия будет равна:
у2 = 108,75=10,428
Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.
Поскольку v>30%,но v<70%, то вариация умеренная.
Показатель асимметрии
где м3 - центральный момент третьего порядка, рассчитываемый по формуле:
м3 = 88 275 / 100 = 882,75
Положительная величина указывает на наличие правосторонней асимметрии
Оценка существенности показателя асимметрии дается с помощью средней квадратической ошибки коэффициента асимметрии:
Далее рассчитаем показатель эксцесса (Еk). Наиболее точно он определяется по формуле с использованием центрального момента четвёртого порядка:
м4 = 52 123 312 500 / 100 = 521 233 125
у4 = 118 265 625
Ek = 521 233 125 / 118 265 625 - 3 = 4,41 - 3 = 1,41
Так как Ek > 0 распределение является островершинным.
Проверка гипотез о виде распределения.
1. Проверим гипотезу о том, что Х распределено по нормальному закону с помощью критерия согласия Пирсона.
где f*i - теоретические частоты:
Вычислим теоретические частоты, учитывая, что:
N = 100, h=10 (ширина интервала), у = 10.428, xср = 34
i |
xi |
ui |
цi |
fi* |
|
1 |
15 |
-1.774 |
0,0818 |
7.844 |
|
2 |
25 |
-0.8151 |
0,285 |
27.329 |
|
3 |
35 |
0.1438 |
0,3939 |
37.772 |
|
4 |
45 |
1.1028 |
0,2155 |
20.665 |
|
5 |
55 |
2.0617 |
0,0468 |
4.488 |
|
6 |
65 |
3.0206 |
0,004 |
0.384 |
Сравним эмпирические и теоретические частоты. Составим расчетную таблицу, из которой найдем наблюдаемое значение критерия:
i |
fi |
f*i |
fi-fi* |
(fi-fi*)2 |
(fi-fi*)2/fi* |
|
1 |
8 |
7.844 |
-0.156 |
0.02433 |
0.0031 |
|
2 |
25 |
27.3294 |
2.3294 |
5.4261 |
0.199 |
|
3 |
52 |
37.7721 |
-14.2279 |
202.4326 |
5.359 |
|
4 |
7 |
20.6649 |
13.6649 |
186.7286 |
9.036 |
|
5 |
5 |
4.4878 |
-0.5122 |
0.2624 |
0.0585 |
|
6 |
3 |
0.3836 |
-2.6164 |
6.8457 |
17.847 |
|
? |
100 |
100 |
32.503 |
Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл, тем сильнее довод против основной гипотезы.
Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp; - ?).
Её границу Kkp = ч2(k-r-1;б) находим по таблицам распределения ч2 и заданным значениям у, k = 6, r=2 (параметры xcp и у оценены по выборке).
Kkp(0.05;3) = 7.81473; Kнабл = 32.5
Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл > Kkp, поэтому есть основания отвергать основную гипотезу. Данные выборки распределены не по нормальному закону. Другими словами, эмпирические и теоретические частоты различаются значимо.
Проверим гипотезу о том, что Х распределено по закону Пуассона.
где pi -- вероятность попадания в i-й интервал случайной величины, распределенной по гипотетическому закону.
а) Находим по заданному эмпирическому распределению выборочную среднюю (xВ = 33.5).
б) Принимаем в качестве оценки параметра л распределения Пуассона выборочную среднюю xср = 33.5. Следовательно, предполагаемый закон Пуассона имеет вид:
в) Найдем по формуле Пуассона вероятности Pi, появления ровно i событий в n испытаниях. Находим теоретические частоты по формуле npi
i = 0: p0 = 0, np0 = 0
i = 1: p1 = 0, np1 = 0
i = 2: p2 = 0, np2 = 0
i = 3: p3 = 0, np3 = 0
i = 4: p4 = 0, np4 = 0
i = 5: p5 = 0, np5 = 0
в) Вычисляем слагаемые статистики Пирсона по формуле (5 столбец таблицы):
i |
ni |
pi |
Ожидаемая частота npi |
Слагаемые статистики Пирсона Ki |
|
0 |
8 |
0 |
0 |
2.2648795879183E - 14 |
|
1 |
25 |
0 |
0 |
66023775300745 |
|
2 |
52 |
0 |
0 |
17053448445350 |
|
3 |
7 |
0 |
0 |
27674389740.06 |
|
4 |
5 |
0 |
0 |
1685920779.16 |
|
5 |
3 |
0 |
0 |
90586782.671 |
|
100 |
3.0959463343523E - 14 |
Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл, тем сильнее довод против основной гипотезы.
Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp; - ?).
Её границу Kkp = ч2(k-r-1;б) находим по таблицам распределения г2 и заданным значениям s, k (число интервалов), r=1 (параметр л).
Kkp(0.1;4) = 7.77944; Kнабл = 3.0959463343523E - 14
Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл > Kkp, поэтому есть основания отвергать основную гипотезу. Данные выборки распределены не по закону Пуассона.
Гистограмма
Вывод
Среднее значение примерно равно моде и медиане, что свидетельствует о нормальном распределении выборки.
Поскольку коэффициент вариации находится в пределах [30%; 70%], то вариация умеренная.
Гипотеза о том, что случайная величина Х подчинена нормальному закону распределения, отвергается (по критерию согласия Пирсона).
Значения As и Ex мало отличаются от нуля. Поэтому можно предположить близость данной выборки к нормальному распределению.
Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл > Kkp, поэтому есть основания отвергать основную гипотезу. Данные выборки распределены не по закону Пуассона.
Размещено на Allbest.ru
...Подобные документы
Нахождение вероятности того, что наудачу взятое натуральное число не делится. Построение гистограммы для изображения интервальных рядов, расчет средней арифметической дискретного вариационного ряда, среднего квадратического отклонения и дисперсии.
контрольная работа [140,8 K], добавлен 18.05.2009Построение интервальных вариационных рядов по показателям. Вычисление средней арифметической, моды и медианы, относительных и абсолютных показателей вариации. Определение количественных характеристик распределений, построение эмпирической функции.
курсовая работа [179,8 K], добавлен 11.01.2012Алгоритм определения вероятности события и выполнения статистических ожиданий. Оценка возможных значений случайной величины и их вероятности. Расчет математического ожидания, дисперсии и среднего квадратического отклонения. Анализ характеристик признака.
контрольная работа [263,8 K], добавлен 13.01.2014Определение вероятности того, что из урны взят белый шар. Нахождение математического ожидания, среднего квадратического отклонения и дисперсии случайной величины Х, построение гистограммы распределения. Определение параметров распределения Релея.
контрольная работа [91,7 K], добавлен 15.11.2011Расчет параметров экспериментального распределения. Вычисление среднего арифметического значения и среднего квадратического отклонения. Определение вида закона распределения случайной величины. Оценка различий эмпирического и теоретического распределений.
курсовая работа [147,0 K], добавлен 10.04.2011Методы составления закона распределения случайной величины. Вычисление средней арифметической и дисперсии распределения. Расчет средней квадратической ошибки бесповторной выборки. Построение эмпирических линий регрессии, поиск уравнения прямых регрессий.
контрольная работа [77,6 K], добавлен 20.07.2010Вычисление вероятностей возможных значений случайной величины по формуле Бернулли. Расчет математического ожидания, дисперсии, среднеквадратического отклонения, медианы и моды. Нахождение интегральной функции, построение многоугольника распределения.
контрольная работа [162,6 K], добавлен 28.05.2012Определение числа исходов, благоприятствующих данному событию. Теорема умножения вероятностей и сложения несовместных событий, локальная теорема Лапласа. Расчет среднеквадратического отклонения величин. Несмещенная оценка генеральной средней и дисперсии.
контрольная работа [91,0 K], добавлен 31.01.2011Определение вероятность срабатывания устройств при аварии. Расчет математического ожидания, дисперсии и функции распределения по заданному ряду распределения. Построение интервального статистического ряда распределения значений статистических данных.
контрольная работа [148,8 K], добавлен 12.02.2012Определение вероятности для двух несовместных и достоверного событий. Закон распределения случайной величины; построение графика функции распределения. Нахождение математического ожидания, дисперсии, среднего квадратичного отклонения случайной величины.
контрольная работа [97,1 K], добавлен 26.02.2012Построение статистического ряда исходной информации. Определение среднего значения показателя надежности и среднеквадратического отклонения. Проверка информации на выпадающие точки. Определение доверительных границ при законе распределения Вейбулла.
контрольная работа [65,7 K], добавлен 31.01.2014Решение системы уравнений по методу Крамера, Гаусса и с помощью обратной матрицы. Общее число возможных элементарных исходов для заданных испытаний. Расчет математического ожидания, дисперсии и среднего квадратического отклонения, график функции.
контрольная работа [210,4 K], добавлен 23.04.2013Определение вероятности наступления определенного события по законам теории вероятности. Вычисление математического ожидания, дисперсии и среднего квадратичного отклонения. Нахождение выборочного уравнения регрессии по данным корреляционной таблицы.
контрольная работа [212,0 K], добавлен 01.05.2010Сущность закона распределения и его практическое применение для решения статистических задач. Определение дисперсии случайной величины, математического ожидания и среднеквадратического отклонения. Особенности однофакторного дисперсионного анализа.
контрольная работа [328,2 K], добавлен 07.12.2013Способы вычисления наступления некоторого события. Решение задач, связанных с теорией вероятности. Использование таблицы функции Лапласа для определения теоретических частот нормального закона распределения. Определение исправленной выборочной дисперсии.
контрольная работа [225,3 K], добавлен 14.03.2015Вычисление математического ожидания, дисперсии, функции распределения и среднеквадратического отклонения случайной величины. Закон распределения случайной величины. Классическое определение вероятности события. Нахождение плотности распределения.
контрольная работа [38,5 K], добавлен 25.03.2015Определение математической вероятности правильного набора, если на нечетных местах комбинации стоят одинаковые цифры. Использование классического определения вероятности. Расчет математического ожидания и дисперсии для очков, выпавших на игральных костях.
контрольная работа [90,2 K], добавлен 04.01.2011Первичный анализ и основные характеристики статистических данных. Точечные оценки параметров распределения. Доверительные интервалы для неизвестного математического ожидания и для среднего квадратического отклонения. Проверка статистических гипотез.
дипломная работа [850,9 K], добавлен 18.01.2016Определение вероятности определенного события. Вычисление математического ожидания, дисперсии, среднеквадратического отклонения дискретной случайной величины Х по известному закону ее распределения, заданному таблично. Расчет корреляционных признаков.
контрольная работа [725,5 K], добавлен 12.02.2010Определение типа кривой по виду уравнения, уравнение с угловым коэффициентом, в отрезках и общее уравнение. Определение медианы, уравнения средней линии в треугольнике. Вопросы по линейной алгебре. Решение системы уравнения при помощи обратной матрицы.
контрольная работа [97,5 K], добавлен 31.10.2010