Основы статистики
Построение статистического ряда, группирование выборки. Построение гистограммы, кумуляты. Проверка гипотезы о нормальном законе распределения случайной величины X по критерию Пирсона. Выборочное среднее, коэффициент линейной вариации, асимметрия, эксцесс.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 11.06.2016 |
Размер файла | 181,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИИ
федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ТЕХНОЛОГИИ И ДИЗАЙНА СЕВЕРО-
ЗАПАДНЫЙ ИНСТИТУТ ПЕЧАТИ
Факультет Полиграфических технологий и оборудования
Направление 080200.62 Менеджмент
Кафедра Технологии полиграфического производства
КОНТРОЛЬНАЯ РАБОТА
по дисциплине: Статистика
Выполнил студент 1 курса, группы 1-ТИЗ-1
Фёдоров Михаил Викторович
Проверила Камартина Наталья Михайловна
Санкт-Петербург 2013г
Оглавление
Задание
Записать исходную выборку в виде таблицы
Построить статистический ряд
Записать сгруппированную выборку в виде таблицы
Построить гистограмму и кумуляту
Проверить гипотезу о нормальном законе распределения случайной величины X по критерию Пирсона и записать вычисления в таблицу
Исследовать вариацию признака X, найдя для этого числовые характеристики (выборочное среднее, среднее квадратическое отклонение, коэффициент линейной вариации, асимметрию и эксцесс)
Список использованных источников
Задание
кумулята асимметрия распределение
Каждому студенту в соответствии со своим номером варианта требуется:
1) записать исходную выборку в виде таблицы;
2) построить статистический ряд;
3) записать сгруппированную выборку в виде таблицы;
4) построить гистограмму и кумуляту;
5) проверить гипотезу о нормальном законе распределения случайной величины Х по критерию Пирсона и записать вычисления в таблицу;
6) исследовать вариацию признака Х, найдя для этого числовые характеристики (выборочное среднее, среднее квадратическое отклонение, коэффициент линейной вариации, асимметрию и эксцесс).
При проверке гипотезы о нормальном распределении принять уровень значимости = 0,05. Варианты индивидуальных заданий приведены в таблице. Номер варианта определяется по номеру фамилии студента в списке его группы.
Варианту номер к соответствуют элементы выборки, расположенные в 15-ти следующих строчках таблицы, начиная со строки номер к (объем выборки при этом n = 150).
Записать исходную выборку в виде таблицы
Таблица 1
Номер варианта |
Элементы выборки |
||||||||||
3 |
43 |
46 |
34 |
35 |
42 |
32 |
41 |
34 |
42 |
42 |
|
4 |
38 |
40 |
46 |
47 |
34 |
42 |
38 |
40 |
38 |
36 |
|
5 |
30 |
43 |
41 |
40 |
40 |
35 |
35 |
41 |
38 |
45 |
|
6 |
37 |
42 |
38 |
36 |
44 |
39 |
32 |
48 |
43 |
39 |
|
7 |
43 |
30 |
32 |
36 |
42 |
34 |
49 |
48 |
49 |
50 |
|
8 |
37 |
30 |
44 |
48 |
44 |
35 |
45 |
34 |
33 |
41 |
|
9 |
43 |
45 |
50 |
34 |
33 |
39 |
41 |
39 |
46 |
31 |
|
10 |
40 |
52 |
44 |
39 |
35 |
45 |
33 |
42 |
42 |
36 |
|
11 |
44 |
51 |
45 |
39 |
34 |
44 |
40 |
37 |
43 |
32 |
|
12 |
33 |
42 |
40 |
35 |
37 |
43 |
48 |
48 |
50 |
32 |
|
13 |
40 |
48 |
45 |
43 |
36 |
36 |
42 |
40 |
37 |
30 |
|
14 |
44 |
50 |
46 |
39 |
41 |
48 |
44 |
42 |
36 |
51 |
|
15 |
44 |
50 |
47 |
37 |
33 |
34 |
42 |
43 |
43 |
47 |
|
16 |
33 |
48 |
38 |
42 |
45 |
32 |
34 |
44 |
39 |
45 |
|
17 |
48 |
26 |
31 |
34 |
38 |
36 |
46 |
49 |
40 |
48 |
Построить статистический ряд
Первым этапом статистического изучения вариации является построение ряда распределения (или вариационного ряда) - упорядоченного распределения единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчёт числа единиц с тем или иным значением признака.
Вариационный ряд: 26, 30, 30, 30, 30, 31, 31, 32, 32, 32, 32, 32, 32, 33, 33, 33, 33, 33, 33, 34, 34, 34, 34, 34, 34, 34, 34, 34, 34, 35, 35, 35, 35, 35, 35, 36, 36, 36, 36, 36, 36, 36, 36, 37, 37, 37, 37, 37, 37, 38, 38, 38, 38, 38, 38, 38, 39, 39, 39, 39, 39, 39, 39, 39, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 41, 41, 41, 41, 41, 41, 42, 42, 42, 42, 42, 42, 42, 42, 42, 42, 42, 42, 42, 43, 43, 43, 43, 43, 43, 43, 43, 43, 43, 44, 44, 44, 44, 44, 44, 44, 44, 44, 44, 45, 45, 45, 45, 45, 45, 45, 45, 46, 46, 46, 46, 46, 47, 47, 47, 48, 48, 48, 48, 48, 48, 48, 48, 48, 48, 49, 49, 49, 50, 50, 50, 50, 50, 51, 51, 52.
Он достаточно громоздкий, поэтому из полученных данных составим ранжированный дискретный ряд.
Записать сгруппированную выборку в виде таблицы
Таблица 2
X |
26 |
30 |
31 |
32 |
33 |
34 |
35 |
36 |
37 |
38 |
39 |
40 |
варианта (значение) |
|
f |
1 |
4 |
2 |
6 |
6 |
10 |
6 |
8 |
6 |
7 |
8 |
10 |
частота |
X |
41 |
42 |
43 |
44 |
45 |
46 |
47 |
48 |
49 |
50 |
51 |
52 |
варианта (значение) |
|
f |
6 |
13 |
10 |
10 |
8 |
5 |
3 |
10 |
3 |
5 |
2 |
1 |
частота |
Построить гистограмму и кумуляту
Гистограмма - интервальный ряд, изображаемый столбиковой диаграммой, в которой основания столбиков, расположенные по оси абсцисс (x), являются интервалами значений варьирующего признака; а высоты столбиков - это частоты, соответствующие масштабу по оси ординат (y).
Соответственно, дискретный ряд надо преобразовать в интервальный. Для этого воспользуемся формулой Стёрджесса, чтобы определить число групп:
k = 1 + 3,322 lgN
где k - число групп, округляемое до ближайшего целого числа, а N - численность совокупности.
k = 1 + 3,322 lg150 = 1 + 3,322 2,176 = 8,229 ? 8
Можно было воспользоваться готовой таблицей оптимальных соотношений числа единиц статистической совокупности и числа групп. Значения вычислены по той же формуле Стёрджесса:
Таблица 3
N |
15-24 |
25-44 |
44-89 |
90-179 |
180-359 |
360-719 |
|
k |
5 |
6 |
7 |
8 |
9 |
10 |
Зная число групп, рассчитаем длину (размах) интервала по формуле:
где Xmax и Xmin - максимальное и минимальное значения в совокупности.
По правилу записи числа шага интервала: «если величина интервала, рассчитанная по формуле, представляет собой величину, которая имеет один знак до запятой (например, 0,88; 1,585; 4,71), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве шага интервала».
Теперь построим интервальный ряд, состоящий из 8 групп с интервалом 3,3.
Таблица 4
№ интервала (i) |
Размах интервала (Xi ) |
Частоты (fi ) |
|
А |
1 |
2 |
|
1 |
26 - 29,3 |
1 |
|
2 |
29,3 - 32,6 |
12 |
|
3 |
32,6 - 35,9 |
22 |
|
4 |
35,9 - 39,2 |
29 |
|
5 |
39,2 - 42,5 |
29 |
|
6 |
42,5 - 45,8 |
28 |
|
7 |
45,8 - 49,1 |
21 |
|
8 |
49,1 - 52,4 |
8 |
|
Итого |
150 |
На основании данных Таблица 4 построим гистограмму:
Рисунок 1
Для построения кумуляты значения варьирующего признака откладываются по оси абсцисс (x), а на оси ординат (y) помещаются накопленные итоги частот или частостей (от f1 до ?f).
Составим кумулятивный вариационный ряд, по которому и построим кумуляту.
Таблица 5
X |
26 |
30 |
31 |
32 |
33 |
34 |
35 |
36 |
37 |
38 |
39 |
40 |
41 |
|
f |
1 |
4 |
2 |
6 |
6 |
10 |
6 |
8 |
6 |
7 |
8 |
10 |
6 |
|
?f |
1 |
5 |
7 |
13 |
19 |
29 |
35 |
43 |
49 |
56 |
64 |
74 |
80 |
X |
42 |
43 |
44 |
45 |
46 |
47 |
48 |
49 |
50 |
51 |
52 |
|
f |
13 |
10 |
10 |
8 |
5 |
3 |
10 |
3 |
5 |
2 |
1 |
|
?f |
93 |
103 |
113 |
121 |
126 |
129 |
139 |
142 |
147 |
149 |
150 |
Рисунок 2
Проверить гипотезу о нормальном законе распределения случайной величины X по критерию Пирсона и записать вычисления в таблицу
Критерий согласия Пирсона:
где k - число интервалов; fi - эмпирическая частота i-го интервала; ft - теоретическая частота.
Таблица 6
№ интервала (i) |
Размах интервала (Xi ) |
Частоты (fi ) |
Середина интервала (X?i) |
(t) |
ц(t) |
Теоретические частоты (f?t) |
|||
А |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
1 |
26 - 29,3 |
1 |
27,65 |
-2,31 |
0,0277 |
2,475 |
-1,475 |
0,879 |
|
2 |
29,3 - 32,6 |
12 |
30,95 |
-1,71 |
0,0925 |
8,266 |
3,734 |
1,687 |
|
3 |
32,6 - 35,9 |
22 |
34,25 |
-1,12 |
0,2131 |
19,044 |
2,956 |
0,459 |
|
4 |
35,9 - 39,2 |
29 |
37,55 |
-0,52 |
0,3485 |
31,144 |
-2,144 |
0,148 |
|
5 |
39,2 - 42,5 |
29 |
40,85 |
0,08 |
0,3977 |
35,541 |
-6,541 |
1,204 |
|
6 |
42,5 - 45,8 |
28 |
44,15 |
0,67 |
0,3187 |
28,481 |
-0,481 |
0,008 |
|
7 |
45,8 - 49,1 |
21 |
47,45 |
1,27 |
0,1781 |
15,916 |
5,084 |
1,624 |
|
8 |
49,1 - 52,4 |
8 |
50,75 |
1,86 |
0,0707 |
6,318 |
1,682 |
0,448 |
|
Итого |
150 |
- |
- |
- |
147,185 |
- |
6,457 |
Найдём среднюю величину. При использовании интервального ряда, допускаем, что распределение в границах i-го интервала является равномерным и как вариант Xi, используем середину интервала (X?).
Определим среднее квадратическое отклонение.
Определим нормированное отклонение t для каждого варианта (Таблица 6 графа 4).
По таблице распределения функции ц(t) определим её значения (Таблица 6 графа 5).
Определим теоретические частоты f? по формуле:
где k - длина интервала.
В нашем случае, при одинаковых интервалах:
3,3 150 / 5,539 ? 89,366. Полученное значение (const) умножим на величину ц(t) при данном t и получим искомую теоретическую частоту (Таблица 6 графа 6).
В графах 7 и 8 произведём вспомогательные расчёты.
В задании было поставлено условие: «при проверке гипотезы о нормальном распределении принять уровень значимости б = 0,05».
Уровень значимости б - это вероятность ошибочного отклонения выдвинутой гипотезы. Тогда, по условию, статистическая достоверность принятия правильной гипотезы P = 0,95.
Число степеней свободы н определяется по формуле:
н = k - z - 1,
где k - число интервалов;
z - число параметров, задающих теоретический закон распределения.
Для нормального распределения z = 2, так как нормальное распределение зависит от двух параметров - средней арифметической () и среднего квадратического отклонения (у).
В рассматриваемом примере ряд имеет 8 групп вариантов, следовательно, и 8 групп частот. Поэтому число степеней свободы (при выравнивании по кривой нормального распределения) будет равно н = 8 - 2 - 1=5.
По таблице значение ч2-критерия Пирсона для степеней свободы н = 5 и уровня значимости = 0,05 определяем, что ч2табл =11,07. Так как полученное в ходе расчётов фактическое значение ч2рас = 6,457, меньше табличного, можно считать с вероятностью 0,95 случайными расхождения между эмпирическими и теоретическими частотами. Выдвинутая гипотеза о близости эмпирического распределения к нормальному не опровергается.
Исследовать вариацию признака X, найдя для этого числовые характеристики (выборочное среднее, среднее квадратическое отклонение, коэффициент линейной вариации, асимметрию и эксцесс)
Расчёты будут производится по данным Таблица 2 на 5стр.
Выборочной средней величиной называют среднее взвешенное арифметическое значение признака совокупности. Эта величина характеризует типичный уровень признака для данного ряда:
где m - число групп.
Среднее квадратическое отклонение показывает на сколько в среднем отклоняются конкретные варианты признака от его среднего значения:
Коэффициент линейной вариации определяет однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному) при отсутствии других нормативов:
для этого вычислим среднее линейное отклонение:
Отсюда также видно, что среднее квадратическое отклонение по величине больше среднего модуля отклонений. Разница между ними тем больше, чем больше в изучаемой совокупности резких, выделяющихся отклонений. Для закона нормального распределения отношение . В нашем примере:.
Для дальнейшего изучения характера вариации используются средние значения разных степеней отклонений отдельных величин признака от его средней арифметической величины. Эти показатели называются центральные моменты распределения определённого порядка. Порядок соответствует степени, в которую возводятся отклонения.
Симметричным называется распределение, в котором частоты любых двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой.
Асимметрия:
Для этого вычислим величину центрального момента третьего порядка:
Асимметрия имеет отрицательное значение, соответственно в ряду распределения преобладают варианты, которые меньше, чем средняя, то есть ряд отрицательно асимметричен. Графически же, более длинная ветвь графика расположена слева от вершины (левосторонняя скошенность). Асимметрия незначительна, так как 0,0140,25.
Эксцесс. При оценке крутизны (заострённости) в качестве эталонного выбирается нормальное распределение, которое сравнивается с фактическим и вычисляется показатель эксцесса распределения:
Для этого вычислим величину центрального момента четвёртого порядка:
Ex 0, значит, полученный график будет ниже графика нормального распределения (низковершинное распределение).
По значениям показателей асимметрии и эксцесса распределения можно судить о близости распределения к нормальному. Показатели асимметрии и эксцесса не должны превышать своих двукратных средних квадратических отклонений, то есть и . Эти средние квадратические отклонения вычисляются по формулам:
Получается:
Показатель асимметрии не превышает своего двукратного среднего квадратического отклонения (As = |- 0,07| < 0,1982). То же и с показателем эксцесса Ex = |- 0,778| < 0,788 (0,3942). Поэтому можно говорить, что анализируемое распределение схоже с нормальным.
Список использованных источников
1. Практикум по теории статистики: Учеб. пособие/Р.А. Шмойлова, В.Г. Минашкин, Н.А. Садовникова; Под ред. Р.А. Шмойловой. - 2-е изд., перераб. и доп. - М.: Финансы и статистика, 2006.-416 с: ил.
2. Материалы с сайта http://chaliev.ru/
3. Табличные данные:
http://helpstat.ru/statisticheskie-tablitsyi/tablitsa-znacheniy-lokalnoy-funktsii-laplasa/
http://helpstat.ru/statisticheskie-tablitsyi/kriticheskie-tochki-2-raspredeleniya/
Размещено на Allbest.ru
...Подобные документы
Особенности метода проверки гипотезы о законе распределения по критерию согласия хи-квадрат Пирсона. Свойства базовой псевдослучайной последовательности. Методы оценки закона распределения и вероятностных характеристик случайной последовательности.
лабораторная работа [234,7 K], добавлен 28.02.2010Построение вариационного (статистического) ряда, гистограммы и эмпирической функции распределения. Определение выборочных оценок числовых характеристик случайной величины. Расчет матрицы парных коэффициентов корреляции и создание модели парной регрессии.
контрольная работа [2,0 M], добавлен 05.04.2014Проверка гипотезы о нормальности распределения дневных логарифмических доходностей, рассчитанных по котировкам акций. Принятие в расчет достаточного объема выборок данных. Расчет характеристик временных рядов. Оценка статистического критерия Фроцини.
курсовая работа [307,0 K], добавлен 29.08.2015Построение гистограммы и эмпирической функции распределения. Нахождение доверительного интервала для оценки математического распределения. Проверка статистической гипотезы о равенстве средних значений, дисперсий, их величине, о виде закона распределения.
курсовая работа [1,7 M], добавлен 29.11.2014Анализ различных подходов к определению вероятности. Примеры стохастических зависимостей в экономике. Проверка ряда гипотез о свойствах распределения вероятностей для случайной компоненты как один из этапов эконометрического исследования. Вариации.
реферат [261,0 K], добавлен 17.11.2008Расчет показателей вариации: среднее арифметическое, мода, медиана, размах вариации, дисперсия, стандартное и среднее линейное отклонения, коэффициенты осцилляции и вариации. Группировка данных по интервалам равной длины, составление вариационного ряда.
курсовая работа [429,7 K], добавлен 09.06.2011Средняя величина анализируемого признака. Размах и коэффициент вариации. Среднее линейное и квадратическое отклонение. Мода, медиана, первый и третий квартиль. Расчет медианы для интервального ряда. Основные аналитические показатели рядов динамики.
контрольная работа [301,9 K], добавлен 22.04.2015Вид одномерного распределения для номинальной шкалы с совместимыми альтернативами. Меры центральной тенденции. Математическое ожидание, отклонение. Показатели асимметрии, эксцесса. Построение распределений в пакете ОСА и SPSS, визуальное представление.
курс лекций [2,4 M], добавлен 09.10.2013Статистический анализ курса Центрального банка валютной пары евро/рубль, построение соответствующих гистограмм. Выполнение описательной статистики выборочных данных, проверка гипотезы о нормальном распределении, равенстве средних и равенстве дисперсий.
курсовая работа [2,5 M], добавлен 08.07.2015Построение интервального вариационного ряда распределения предприятий по объему реализации. Графическое изображение ряда (гистограмма, кумулята, огива). Расчет средней арифметической; моды и медианы; коэффициента асимметрии; показателей вариации.
контрольная работа [91,1 K], добавлен 10.12.2013Способы описания случайной величины, основные распределения и их генерация в Excel. Дисперсионный анализ как особая форма анализа регрессии. Применение элементов линейной алгебры в моделировании экономических процессов и решение транспортной задачи.
курс лекций [1,6 M], добавлен 05.05.2010Построение и анализ классической многофакторной линейной эконометрической модели. Вид линейной двухфакторной модели, её оценка в матричной форме и проверка адекватности по критерию Фишера. Расчет коэффициентов множественной детерминации и корреляции.
контрольная работа [131,9 K], добавлен 01.06.2010Выравнивание заданного динамического ряда по линейной зависимости. Определение параметров и тесноты связи меду ними. Построение графика зависимости переменной и коэффициента корреляции для линейной зависимости. Расчет критериев автокорреляции остатков.
контрольная работа [112,5 K], добавлен 13.08.2010Построение уравнения множественной регрессии в линейной форме с полным набором факторов, отбор информативных факторов. Проверка значимости уравнения регрессии по критерию Фишера и статистической значимости параметров регрессии по критерию Стьюдента.
лабораторная работа [217,9 K], добавлен 17.10.2009Предмет, метод, показатели статистики. Понятия и категории статистического наблюдения. Показатели вариации, абсолютные и относительные величины, графический и индексный методы. Взаимосвязь социально-экономических явлений. Сглаживание рядов динамики.
курс лекций [132,9 K], добавлен 23.02.2009Построение эконометрической модели. Описания, анализ и прогнозирование явлений и процессов в экономике. Использование регрессионных моделей. Построение корреляционной матрицы. Коэффициент множественной детерминации. Значение статистики Дарбина-Уотсона.
курсовая работа [61,0 K], добавлен 10.03.2013Определение среднего значения показателя надежности сельскохозяйственной техники и ее элементов. Нахождение коэффициента вариации. Построение графиков дифференциальных и интегральных функций закона распределения Вейбулла. Расчет критерия согласия Пирсона.
курсовая работа [843,0 K], добавлен 07.08.2013Построение временной ряда величины по данным об уровне безработицы в России за 10 месяцев 2010 г., вычисление ее числовых характеристик. Регрессионная модель временного тренда. Краткосрочный и долгосрочный прогнозы изменения рассматриваемой величины.
контрольная работа [118,1 K], добавлен 26.02.2012Использование статистических характеристик для анализа ряда распределения. Частотные характеристики ряда распределения. Показатели дифференциации, абсолютные характеристики вариации. Расчет дисперсии способом моментов. Теоретические кривые распределения.
курсовая работа [151,4 K], добавлен 11.09.2010Построение рядов распределения с произвольными интервалами и с помощью формулы Стерджесса. Построение статистических графиков. Расчет и построение структурных характеристик вариационного ряда. Общая характеристика исследуемых статистических совокупностей.
курсовая работа [654,9 K], добавлен 12.04.2009