Построение вариационного ряда
Построение полигона относительных частот. Расчет среднего арифметического по сгруппированным данным для непрерывного распределения. Особенность создания несмещенной дисперсии и стандартного отклонения. Анализ нахождения интерквартильного размаха.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 08.08.2020 |
Размер файла | 463,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Контрольная работа
По дисциплине: Анализ данных
Москва, 2017
ЗАДАНИЕ 1
Имеются данные (табл. 1) по числу автомобилей, купленных в 30-ти автосалонах г. Санкт-Петербург за период с 1.06.2011 по 31.08.2011 г.
Постройте вариационный ряд.
Заполните таблицу абсолютных, относительных и накопленных частот (выборку считать дискретной).
Постройте полигон относительных частот.
Постройте эмпирическую функцию распределения.
Найдите все известные Вам характеристики положения (среднее, мода, медиана).
Найдите все известные Вам характеристики разброса (дисперсия, стандартное отклонение, квартиль).
Таблица 1. Фрагмент данных по числу автомобилей, купленных в 30-ти автосалонах г. Санкт-Петербург за период с 1.06.2011 по 31.07.2011 г.
Дата |
номер автосалона |
Дата |
номер автосалона |
Дата |
номер автосалона |
Дата |
номер автосалона |
|
01 июн 11 |
18 |
24 июн 11 |
9 |
17 июл 11 |
11 |
09 авг 11 |
18 |
|
02 июн 11 |
16 |
25 июн 11 |
12 |
18 июл 11 |
12 |
10 авг 11 |
15 |
|
03 июн 11 |
8 |
26 июн 11 |
8 |
19 июл 11 |
12 |
11 авг 11 |
9 |
|
04 июн 11 |
19 |
27 июн 11 |
12 |
20 июл 11 |
10 |
12 авг 11 |
9 |
|
05 июн 11 |
14 |
28 июн 11 |
14 |
21 июл 11 |
11 |
13 авг 11 |
9 |
|
06 июн 11 |
10 |
29 июн 11 |
16 |
22 июл 11 |
9 |
14 авг 11 |
20 |
|
07 июн 11 |
10 |
30 июн 11 |
20 |
23 июл 11 |
16 |
15 авг 11 |
16 |
|
08 июн 11 |
18 |
01 июл 11 |
16 |
24 июл 11 |
10 |
16 авг 11 |
18 |
|
09 июн 11 |
16 |
02 июл 11 |
11 |
25 июл 11 |
14 |
17 авг 11 |
7 |
|
10 июн 11 |
18 |
03 июл 11 |
13 |
26 июл 11 |
16 |
18 авг 11 |
15 |
|
11 июн 11 |
14 |
04 июл 11 |
16 |
27 июл 11 |
10 |
19 авг 11 |
12 |
|
12 июн 11 |
18 |
05 июл 11 |
11 |
28 июл 11 |
6 |
20 авг 11 |
9 |
|
13 июн 11 |
8 |
06 июл 11 |
19 |
29 июл 11 |
11 |
21 авг 11 |
16 |
|
14 июн 11 |
13 |
07 июл 11 |
11 |
30 июл 11 |
10 |
22 авг 11 |
22 |
|
15 июн 11 |
21 |
08 июл 11 |
11 |
31 июл 11 |
10 |
23 авг 11 |
8 |
|
16 июн 11 |
9 |
09 июл 11 |
12 |
01 авг 11 |
10 |
24 авг 11 |
16 |
|
17 июн 11 |
10 |
10 июл 11 |
18 |
02 авг 11 |
11 |
25 авг 11 |
11 |
|
18 июн 11 |
10 |
11 июл 11 |
4 |
03 авг 11 |
14 |
26 авг 11 |
11 |
|
19 июн 11 |
12 |
12 июл 11 |
14 |
04 авг 11 |
15 |
27 авг 11 |
9 |
|
20 июн 11 |
18 |
13 июл 11 |
6 |
05 авг 11 |
12 |
28 авг 11 |
15 |
|
21 июн 11 |
20 |
14 июл 11 |
10 |
06 авг 11 |
10 |
29 авг 11 |
13 |
|
22 июн 11 |
10 |
15 июл 11 |
19 |
07 авг 11 |
13 |
30 авг 11 |
13 |
|
23 июн 11 |
9 |
16 июл 11 |
14 |
08 авг 11 |
14 |
31 авг 11 |
10 |
РЕШЕНИЕ:
1. В данной задаче идет речь о дискретной случайной величине. для того чтобы построить вариационный ряд упорядочим по возрастанию все значения случайной величины. В столбце Xi запишем все возможные значения случайной величины в порядке возрастания.
2. Заполняем таблицу абсолютных, относительных и накопленных частот.
2.1. Для нахождения абсолютной величины Ni используем функцию =СЧЕТЕСЛИ($D$13:$D$104;"="&F14), где $D$13:$D$104 - вариационный ряд, F14 - ячейка со значением Xi.
Посчитаем сумму значений столбца Ni, используя функцию =СУММ(G14:G30).
2.2. Чтобы найти относительную частоту fi используем формулу:
fi= Ni/? Ni
и функцию =G14/$G$31, где G14 - значения Ni, $G$31 - сумма всех значений Ni. Посчитаем сумму всех значений: =СУММ(Н14:Н30).
2.3. Накопленную частоту найдем, используя функцию $I13+H14.
В итоге получаем таблицу:
3. Чтобы построить полигон относительных частот выделяем данные столбца fi (H14:H30), выбираем меню Вставить - График.
арифметический дисперсия отклонение интерквартильный
4. Чтобы построить эмпирическую функцию выделяем диапазон ячеек столбца Fi, выбираем меню Вставка - Гистограмма.
5. Найдем характеристики положения:
Среднее найдем при помощи функции СРЗНАЧ(B14:B105);
Моду - МОДА.НСК(B14:B105);
Медиану - МЕДИАНА(B14:B105).
Найдем характеристики разброса используя функции:
Дисперсия:
Смещенная - =ДИСП.Г(B14:B105);
Несмещенная - =ДИСП.В(B14:B105);
Стандартное отклонение:
Смещенное - =СТАНДОТКЛОН.Г(B14:B105);
Несмещенное - =СТАНДОТКЛОН.В(B14:B105);
Квартиль:
Верхний - =КВАРТИЛЬ.ВКЛ(B14:B105;3);
Нижний - =КВАРТИЛЬ.ВКЛ(B14:B105;1);
Интерквартильный размах - разница между нижним и верхним квартилем =L42-K42.
Размах - разница между максимальным значением и минимальным значением случайной величины =МАКС(B14:B105)-МИН(B14:B105)
ЗАДАНИЕ 2
Даны выборки цен на хлеб по 30-ти российским городам в августе 2006 года (табл. 2). В каждом из городов было обследовано своё количество магазинов, поэтому объёмы всех выборок разные. Номер Вашего варианта совпадает с номером города. (Для КР_ан_дан_2БИБз2_2015.xls, лист «Задание 2»).
Постройте вариационный ряд.
Сгруппируйте данные в интервалы.
Заполните таблицу абсолютных, относительных и накопленных частот.
Постройте гистограмму относительных частот.
Постройте эмпирическую функцию распределения.
Найдите все известные Вам характеристики положения.
Найдите все известные Вам характеристики разброса.
Таблица 2.
Фрагмент выборки цен на хлеб по 30-ти российским городам в августе 2006 года
Номер города 2 |
||||||
11,21р. |
11,15р. |
13,28р. |
12,78р. |
14,91р. |
13,20р. |
|
12,04р. |
14,31р. |
13,76р. |
12,27р. |
13,18р. |
||
12,69р. |
12,24р. |
13,19р. |
16,41р. |
15,84р. |
||
11,91р. |
12,71р. |
12,35р. |
14,78р. |
14,09р. |
||
13,06р. |
13,10р. |
13,05р. |
12,20р. |
11,69р. |
||
13,44р. |
13,90р. |
13,38р. |
14,48р. |
13,13р. |
||
12,96р. |
13,43р. |
13,35р. |
13,37р. |
11,78р. |
||
12,44р. |
12,69р. |
13,51р. |
12,91р. |
12,98р. |
||
13,96р. |
13,43р. |
13,42р. |
14,43р. |
13,29р. |
||
13,77р. |
12,98р. |
11,65р. |
12,63р. |
14,73р. |
1. Чтобы сгруппировать случайные величины необходимо определить число интервалов для группировки и шаг.
Интервал рассчитаем по формуле Старжессона:
k=1.44*ln(n)+1
функция:
F24 =1,44*LN(51)+1.
Шаг:
F25 =(МАКС(C15:C65)-МИН(C15:C65))/F24, где
МАКС(C15:C65) - максимальное значение случайной величины;
МИН(C15:C65) - минимальное значение случайной величины;
F24 = k - количество интервалов для группировки.
2. Рассчитываем при помощи функций следующие велечины:
Абсолютная частота:
J15=СЧЁТЕСЛИМН($A$15:$A$65;">="&E15;$A$15:$A$65;"<"&F15);
Относительная частота:
H15=G15/$G$22,
Где G15 - абсолютная частота, G22 - сумма абсолютных частот.
Накопительная частота:
I15=0+H15
I16=I15+H16 - где I15 относительная частота, H16 предыдущее значение накопленной частоты.
Высота деленная на длину интервала:
J15=H15/(F15-E15)
где H15- относительная частота; F15,E15- значение случайной величины
2. Постройте гистограмму относительных частот.
3. Постройте эмпирическую функцию распределения.
4. Найдите все известные Вам характеристики положения.
Среднее:
E33=СРЗНАЧ(C15:C65);
Мода:
F33=МОДА.НСК(C15:C65);
Медиана:
G33=МЕДИАНА(C15:C65).
5. Найдите все известные Вам характеристики разброса.
Дисперсия:
смещенная
I34=ДИСП.Г(C15:C65)
несмещенная
J34=ДИСП.В(C15:C65)
Стандартное отклонение
смещенное
K34=СТАНДОТКЛОН.Г(C15:C65)
несмещенное
L34=СТАНДОТКЛОН.В(C14:C65)
Размах:
M34=МАКС(C15:C65)-МИН(C15:C65)
Нижний квартиль
N34=КВАРТИЛЬ.ВКЛ(C15:C65;1)
Верхний квартиль
O34=КВАРТИЛЬ.ВКЛ(C15:C65;3)
Интерквартильный размах
P34=O34-N34 - разница между верхним и нижнем квартилем
ЗАДАНИЕ 3
В таблице 3 приведены данные по возрастному составу 30 филиалов компании Газпром в январе 2005 года.
Найдите среднее значение возраста.
Найдите моду.
Найдите медиану.
Найдите дисперсию и стандартное отклонение.
Найдите размах.
Найдите интерквартильный размах.
Постройте гистограмму относительных частот.
Таблица 3. Фрагмент данных по возрастному составу 30 филиалов компании Газпром в январе 2005 года
Возраст |
Количество сотрудников по каждому филиалу |
||
от |
до |
2 |
|
15 |
20 |
21 |
|
20 |
25 |
71 |
|
25 |
30 |
72 |
|
30 |
35 |
87 |
|
35 |
40 |
237 |
|
40 |
45 |
166 |
|
45 |
50 |
137 |
|
50 |
55 |
35 |
|
55 |
60 |
27 |
|
60 |
65 |
10 |
|
65 |
70 |
3 |
Найдите среднее значение возраста.
E15=Xi= СРЗНАЧ(A15:B15), где A15:B15 все значения возраста;
Относительная частота:
F15=C15/$C$26, где С26 - количество сотрудников.
Накопленная частота Fi:
G15=0+Н15;
G16=H15+F16 и т.д.
Среднее арифметическое по сгруппированным данным для непрерывного распределения рассчитывается по формуле:
где - середины интервалов.
H15=E15*F15
где E15 - середина интервала Xi; F15 - относительная частота fi.
Среднее значение:
I26=СУММ(I15:I25).
Найдите моду.
Моду найдем по формуле:
где Мо - мода;
ХНМо - нижняя граница модального интервала;
hMo - размах модального интервала;
fMo - частота модального интервала;
fMo-1 - частота интервала, предшествующего модальному;
fMo+1 - частота интервала, следующего за модальным;
мода:
F29=A19+(B19-A19)*((F19-F18)/(2*F19-F18-F20));
где А19 - ХНМо;
B19-A19 - hMo;
F19 - fMo;
F18 - fMo-1;
F20 - fMo+1
Найдите медиану.
Найдем медиану по формуле:
где Ме - медиана;
ХНМе - нижняя граница медианного интервала;
hMe - размах медианного интервала
fMe - частота медианного интервала;
?fMe-1 - сумма частот интервалов, предшествующая медианному.
Медиана:
G29=A19+(B19-A19)*(0,5*F26-СУММ(F15:F18)/F19),
где A19 - ХНМе B19-A19 - hMe
СУММ (F15:F18) - ?fMe-1
F19 - fMe
Найдите дисперсию и стандартное отклонение.
Дисперсию найдем по формуле:
Для начала найдем Xi2*fi
I15=E15^2*F15, где E15 - Xi, F15 - fi
Сумма:
I26=СУММ(I15:I25)
дисперсия:
Е34=I26-E29^2
Е29 - среднее значение.
Дисперсия несмещенная находится по формуле:
Дисперсия несмещенная:
F34=E34*(C26/(C26-1)).
Стандартное отклонение это корень из дисперсии:
G34=КОРЕНЬ(E34), где Е34 - дисперсия смещенная;
H34=КОРЕНЬ(F34), где F34 - дисперсия несмещенная.
Найдите размах.
I34=МАКС(E15:E25)-МИН(E15:E25)
Найдите интерквартильный размах.
Нижний квартиль:
J34 =КВАРТИЛЬ.ВКЛ(E15:E25;1)
Верхний квартиль:
K34=КВАРТИЛЬ.ВКЛ(E15:E25;3)
Интерквартильный размах:
L34=K34-J34.
Постройте гистограмму относительных частот.
Размещено на Allbest.ru
...Подобные документы
Построение рядов распределения с произвольными интервалами и с помощью формулы Стерджесса. Построение статистических графиков. Расчет и построение структурных характеристик вариационного ряда. Общая характеристика исследуемых статистических совокупностей.
курсовая работа [654,9 K], добавлен 12.04.2009Структурная, аналитическая и комбинационная группировка по признаку-фактору. Расчет среднего количества балансовой прибыли, среднего арифметического значения признака, медианы, моды, дисперсии, среднего квадратического отклонения и коэффициента вариаций.
контрольная работа [194,5 K], добавлен 06.04.2014Построение интервального вариационного ряда распределения предприятий по объему реализации. Графическое изображение ряда (гистограмма, кумулята, огива). Расчет средней арифметической; моды и медианы; коэффициента асимметрии; показателей вариации.
контрольная работа [91,1 K], добавлен 10.12.2013Формулы вычисления критерия Пирсона, среднего квадратического отклонения и значений функций Лапласа. Определение свойств распределения хи-квадрата. Критерий согласия Колмогорова-Смирнова. Построение графика распределения частот в заданном массиве.
контрольная работа [172,2 K], добавлен 27.02.2011Расчет выборочной средней, дисперсии, среднего квадратического отклонения и коэффициента вариации. Точечная оценка параметра распределения методом моментов. Решение системы уравнений по формулам Крамера. Определение уравнения тренда для временного ряда.
контрольная работа [130,4 K], добавлен 16.01.2015Использование статистических характеристик для анализа ряда распределения. Частотные характеристики ряда распределения. Показатели дифференциации, абсолютные характеристики вариации. Расчет дисперсии способом моментов. Теоретические кривые распределения.
курсовая работа [151,4 K], добавлен 11.09.2010Построение вариационного (статистического) ряда, гистограммы и эмпирической функции распределения. Определение выборочных оценок числовых характеристик случайной величины. Расчет матрицы парных коэффициентов корреляции и создание модели парной регрессии.
контрольная работа [2,0 M], добавлен 05.04.2014Понятие корреляционно-регрессионного анализа как метода изучения по выборочным данным статистической зависимости ряда величин. Оценка математического ожидания, дисперсии, среднего квадратического отклонения и коэффициента корреляции случайных величин.
курсовая работа [413,0 K], добавлен 11.08.2012Описание оборудования предприятия автосервиса. Построение интервального ряда экспериментального распределения. Проверка адекватности математической модели экспериментальным данным. Расчет значений интегральной и дифференциальной функции распределения.
курсовая работа [522,9 K], добавлен 03.12.2013Методика нахождения основных числовых характеристик с помощью эконометрического анализа. Вычисление среднего значения, дисперсии. Построение корреляционного поля (диаграммы рассеивания), расчет общего разброса данных. Нахождение значения критерия Фишера.
контрольная работа [38,2 K], добавлен 16.07.2009Оценка среднего значения выручки по кварталам на примере ОАО "РуссНефть". Оценка моды, медианы, абсолютных и относительных показателей. Построение тренда на 3 периода вперед. Анализ колеблемости и экспоненциальное сглаживание динамического ряда.
курсовая работа [1,4 M], добавлен 18.04.2011Расчет показателей показательной статистики, построение графического изображения вариационного ряда с их использованием и оценка изучаемого явления, общая характеристика. Расчет средней арифметической, методы расчета. Уровень доверительной вероятности.
контрольная работа [592,1 K], добавлен 10.02.2009Определение дисперсии и среднего квадратичного отклонения цен. Построение системы индексов товарооборота и физического объема продаж. Оценка влияния изменения структуры продаж на уровень цен. Общие индексы цен Паше, Ласпрейса, Фишера, структурных сдвигов.
контрольная работа [66,8 K], добавлен 09.07.2013Определение среднего арифметического исправленных результатов многократных наблюдений, оценка среднего квадратического отклонения. Расчет доверительных границ случайной составляющей погрешности результата измерения. Методика выполнения прямых измерений.
лабораторная работа [806,9 K], добавлен 26.05.2014Построение временной ряда величины по данным об уровне безработицы в России за 10 месяцев 2010 г., вычисление ее числовых характеристик. Регрессионная модель временного тренда. Краткосрочный и долгосрочный прогнозы изменения рассматриваемой величины.
контрольная работа [118,1 K], добавлен 26.02.2012Построение графиков исходного ряда зависимой переменной, оценочного ряда и остатков. Изучение динамики показателей экономического развития РФ за период: январь 1994 - декабрь 1997 годов. Вычисление обратной матрицы со стандартным обозначением элементов.
контрольная работа [99,8 K], добавлен 11.09.2012Построение ряда динамики. Расчет параметров линейного, степенного, экспоненциального (показательного), параболического, гиперболического трендов с помощью пакета Excel. Вычисление относительной ошибки аппроксимации. Оценка адекватности линейной модели.
практическая работа [165,9 K], добавлен 13.05.2014Расчет показателей вариации: среднее арифметическое, мода, медиана, размах вариации, дисперсия, стандартное и среднее линейное отклонения, коэффициенты осцилляции и вариации. Группировка данных по интервалам равной длины, составление вариационного ряда.
курсовая работа [429,7 K], добавлен 09.06.2011Расчет коэффициентов регрессии. Теоретическая и экспериментальная зависимость параметров а и b. Определение значений статистической дисперсии и среднеквадратического отклонения. Составление графика гистограммы распределения признака и кумулятивной прямой.
контрольная работа [679,1 K], добавлен 12.05.2014Расчёт скользящего среднего методом математического усреднения цифровых величин согласно условию задач. Составление таблицы и построение графика полученных результатов расчета. Сравнительный анализ решений трех заданий, построение их общего графика.
лабораторная работа [26,9 K], добавлен 15.11.2010