Расчет количества интервалов по формуле Стерджеса
Ранжирование ряда данных сортировкой по значениям от минимального к максимальному. Определение количества, величины и границ интервалов по формуле Стерджеса. Количество единиц совокупности, принадлежащих интервалам. Построить гистограмму распределения.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 28.05.2023 |
Размер файла | 152,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.Allbest.Ru/
Расчет количества интервалов по формуле Стерджеса
Содержание
- Задания для выполнения рейтинговой работы
- Выполнение задания
- Список использованных источников
Задания для выполнения рейтинговой работы
1. Скопировать данные своего варианта.
2. Ранжировать ряд данных сортировкой по значениям от минимального к максимальному.
3. Рассчитать количество интервалов по формуле Стерджеса, округлив вверх до целых единиц.
4. Рассчитать величину интервала h, округлить до десятков.
5. Рассчитать границы интервалов:
6. Подсчитать количество единиц совокупности, принадлежащих каждому из интервалов.
7. Построить интервальный вариационный ряд в виде таблицы
8. Построить гистограмму распределения для интервалов и полигон распределения для вариант, кумуляту.
9. Вычислить среднее арифметическое, моду, медиану, квартили, децили.
10. Вычислить показатели вариации: R, dср, s2, s, Vr, Vd, V. Вычислить асимметрию и эксцесс.
11. Сделать вывод об однородности вариационного ряда, о симметричности и остро- или плоско-вершинности распределения.
1. Скопируем исходные данные
Исходные данные приведены в таблице 1.
Таблица 1
Исходные данные для 12-го варианта
125 |
|
97 |
|
122 |
|
74 |
|
65 |
|
65 |
|
121 |
|
66 |
|
154 |
|
48 |
|
125 |
|
214 |
|
101 |
|
89 |
|
50 |
|
76 |
|
151 |
|
32 |
|
63 |
|
90 |
|
154 |
|
105 |
|
105 |
|
111 |
|
85 |
|
81 |
|
143 |
|
185 |
|
93 |
|
89 |
|
150 |
|
116 |
|
146 |
|
88 |
|
78 |
|
78 |
|
145 |
|
79 |
|
184 |
|
57 |
|
150 |
|
256 |
|
121 |
|
106 |
|
60 |
|
91 |
|
181 |
|
38 |
|
75 |
|
108 |
|
184 |
|
126 |
|
126 |
|
133 |
|
102 |
|
97 |
|
171 |
|
222 |
|
111 |
2. Ранжировать ряд данных сортировкой
Ранжированный ряд представлен в таблице 2.
Таблица 2
Ранжированные данные
32 |
|
38 |
|
48 |
|
50 |
|
57 |
|
60 |
|
63 |
|
65 |
|
65 |
|
66 |
|
74 |
|
75 |
|
76 |
|
78 |
|
78 |
|
79 |
|
81 |
|
85 |
|
88 |
|
89 |
|
89 |
|
90 |
|
91 |
|
93 |
|
97 |
|
97 |
|
101 |
|
102 |
|
105 |
|
105 |
|
106 |
|
108 |
|
111 |
|
111 |
|
116 |
|
121 |
|
121 |
|
122 |
|
125 |
|
125 |
|
126 |
|
126 |
|
133 |
|
143 |
|
145 |
|
146 |
|
150 |
|
150 |
|
151 |
|
154 |
|
154 |
|
171 |
|
181 |
|
184 |
|
184 |
|
185 |
|
214 |
|
222 |
|
256 |
Число наблюдений п = 59.
3. Рассчитаем количество интервалов по формуле Стерджеса:
k = 1 + 3,322 Ч lg n = 1 + 3,322 Ч lg 59 = 6,883
Округляем вверх до целых единиц. Таким образом, будем строить ряд, образовав 7 групп с равными интервалами.
4. Определим величину интервала
При построении интервального ряда с равными интервалами величина интервала h определяется по формуле:
,
где хmax и хmin - наибольшее и наименьшее значения признака в исследуемой совокупности; k- число групп интервального ряда.
Расчет величины интервалов:
Округляя до десятков, получаем h = 30.
5. Рассчитаем границы интервалов
Путем последовательного прибавления величины интервала h = 30 к нижней границе, получаем следующие границы интервалов ряда распределения:
До 3060 - 9090 - 120120 - 150
150 - 180180 - 210210 и более
6, 7. Рассчитаем частоты групп и получим интервальный ряд распределения
Определяем число единиц, входящих в каждую группу, используя принцип полуоткрытого интервала), согласно которому единицы со значениями признаков, которые служат одновременно верхними и нижними границами смежных интервалов, будем относить ко второму из смежных интервалов. Помимо количества единиц в абсолютном выражении (частот) в таблице 4 рассчитываем относительные частоты (частости) по формуле:
.
Таблица 3
Интервальный ряд распределения
Интервалы групп |
Число наблюдений в группе, единиц |
В % к итогу |
|
До 60 |
5 |
8,5 |
|
60 - 90 |
16 |
27,1 |
|
90 - 120 |
14 |
23,7 |
|
120 - 150 |
11 |
18,6 |
|
150 - 180 |
6 |
10,2 |
|
180 - 210 |
4 |
6,8 |
|
210 и более |
3 |
5,1 |
|
Итого |
59 |
100,0 |
Вывод. Распределение наблюдений по группам не является полностью равномерным. Преобладают наблюдения со значениями признака от 60 до 90 единиц. Это 16 наблюдений, доля которых составляет 27,01% от общего числа наблюдений. Самая малочисленная группа с наибольшим значением признака (свыше 210 единиц). В данную группу попадает 5,1% от общего числа наблюдений (3 единицы).
8. Построим графики ряда распределения
Гистограмма - столбиковая диаграмма, она позволяет визуально оценит симметричность распределения, его близость к нормальному. Для построения полигона в прямоугольной системе координат на оси абсцисс откладывают значения интервалов, а на оси ординат - значения частот или относительных частот Гистограмма строится по 1-му и 2-му столбцу таблицы 3 и представлена на рисунке 1.
Рисунок 1 - Гистограмма распределения
Полигон чаще используют для изображения дискретных рядов. Для построения полигона в прямоугольной системе координат на оси абсцисс откладывают значения аргумента, т. е. варианты, а на оси ординат - значения частот или относительных частот. Далее в этой системе координат строят точки, координатами которых являются пары соответствующих чисел из вариационного ряда. Полученные точки последовательно соединяют отрезками прямой. Крайнюю «левую» точку соединяют с точкой оси абсцисс, абсцисса которой находится слева от рассматриваемой точки на таком же расстоянии, как абсцисса ближайшей справа точки. Аналогично крайнюю «правую» точку также соединяют с точкой оси абсцисс. Для интервального ряда в качестве значений признака принимаем середины интервалов.
Середину интервала находим как среднюю арифметическую из нижней и верхней границ интервалов:
Расчет представлен в таблице 4. Таким образом, полигон строим по 2-му и 3-му столбцу таблицы 4.
Рисунок 2 - Полигон распределения
Кумулята строится по накопленным частотам (расчет представлен в таблице 4). Она начинается с нижней границы 1-го интервала (30), накопленная частота откладывается в верхней границе интервала:
Рисунок 3 - Кумулята распределения
9. Вычислим среднее арифметическое, моду, медиану, квартили, децили
граница интервал серджес совокупность распределение
Для расчета показателей строим вспомогательную таблицу 4.
Таблица 4
Вспомогательная таблица для расчета показателей вариации и центра распределения
Интервалы групп |
Число единиц в группе(частота) |
Середина интервала, |
накопленная частота |
||||
До 60 |
5 |
45 |
225 |
24976,87 |
353,39 |
5 |
|
60 - 90 |
16 |
75 |
1200 |
26475,15 |
650,85 |
21 |
|
90 - 120 |
14 |
105 |
1470 |
1596,27 |
149,49 |
35 |
|
120 - 150 |
11 |
135 |
1485 |
4106,75 |
212,54 |
46 |
|
150 - 180 |
6 |
165 |
990 |
14595,98 |
295,93 |
52 |
|
180 - 210 |
4 |
195 |
780 |
25167,94 |
317,29 |
56 |
|
210 и более |
3 |
225 |
675 |
35853,92 |
327,97 |
59 |
|
Итого |
59 |
6825 |
132772,88 |
2307,46 |
- |
Для расчета среднего в интервальном ряду используется формула средней арифметической взвешенной:
Вывод. В рассматриваемой совокупности среднее значение признака составляет 115,68 единицы.
Мода и медиана являются структурными средними величинами, характеризующими (наряду со средней арифметической) центр распределения единиц совокупности по изучаемому признаку.
Мода Мо - значение признака, которое встречается наиболее часто в рассматриваемой совокупности. В интервальном вариационном ряду модой приближенно считается центральное значение модального интервала (имеющего наибольшую частоту).
Конкретное значение моды для интервального ряда рассчитывается по формуле:
,
Где хМo - нижняя граница модального интервала,
h - величина модального интервала,
fMo - частота модального интервала,
fMo-1 - частота интервала, предшествующего модальному,
fMo+1 - частота интервала, следующего за модальным.
Согласно данным модальным интервалом ряда является интервал 60-90, так как его частота максимальна (f1 = 16).
Расчет моды:
85,38
Вывод. Для рассматриваемой совокупности наиболее часто встречаются значения признака равные 85,38 единиц.
Медиана Ме - это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности.
Конкретное значение медианы для интервального ряда рассчитывается по формуле:
, где
- нижняя граница медианного интервала,
h - величина медианного интервала;
- сумма всех частот ряда;
- частота медианного интервала;
- сумма частот, накопившихся до начала медианного интервала.
Медианным интервалом является интервал 90-120, так как именно в этом интервале накопленная частота S3 =35 впервые превышает величину, равную половине совокупности (0,5?59 = 29,5).
Расчет медианы:
108,21
Вывод. В рассматриваемой совокупности половина значение признак не менее 108,21 единиц, а другая половина - не более 108,21 единиц.
, следовательно, асимметрия правосторонняя, гистограмма сдвинута от центра влево. В совокупности преобладают единицы с более низкими значениями признака, чем среднее значение.
Квартили - это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине Q1; 25% будут заключены между Q1 и Q2; 25% - между Q2 и Q3; остальные 25% превосходят Q3.
0-й квартиль - минимальное значение признака;
2-й квартиль - медиана;
1-й и 3-й квартиль рассчитываются аналогично медиане.
Значение Q1 будет находиться в интервале 60-90, т.к. именно в этом интервале накопленная частота равна 21 впервые превышает четверть суммы частот .
78,28
Значение Q3 будет находиться в интервале 120-150, т.к. именно в этом интервале накопленная частота 46 впервые превышает три четверти суммы частот .
145,23
Децили делят совокупность на 10 равных частей. Рассчитываются аналогично медиане и квартилям.
Интервалом 1-го дециля d1 будет является интервал 60-90, т.к. именно в этом интервале накопленная частота 21 впервые превышает 1/10 суммы частот .
61,69
Интервалом 9-го дециля d9 будет интервал 180-210, т.к. в этом интервале накопленная частота 56 впервые превышает 9/10 суммы частот
188,25
10. Вычислим показатели вариации
Вспомогательные расчеты приведены в таблице 5.
Размах вариации характеризует амплитуду колебаний значений признака, рассчитывается как разность максимального и минимального значения признака. Рассчитываем размах по исходным данным:
256 - 32 = 224
Среднее линейное отклонение показывает, насколько в среднем отклоняются конкретные варианты признака от среднего значения. Для сгруппированных данных рассчитываем взвешенное среднее линейное отклонение:
38,46
Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины. Для интервального ряда используется формула взвешенной дисперсии:
2212,88
Среднее квадратическое отклонение также как и среднее линейное отклонение показывает, насколько в среднем отклоняются конкретные варианты признака от среднего значения. Однако является более точной характеристикой. Рассчитывается, как корень квадратный из дисперсии:
47,04
Расчет исправленной (скорректированной) дисперсии:
2212,88Ч59/58 = 2249,76
Расчет исправленного (скорректированного) среднего квадратического отклонения:
47,43
Вывод. Отклонение от среднего значения признака в ту или иную сторону составляет 47,43 единиц. Наиболее характерные значения признака в рассматриваемой совокупности находятся в пределах от 68,25 до 163,11 (диапазон ).
Коэффициент вариации является мерой относительной колеблемости признака около средней и характеризует степень однородности признака в изучаемой совокупности:
41,0%
Вывод. Значение коэффициента вариации превышает 40%, следовательно, вариация признака в исследуемой совокупности единиц умеренная и совокупность не является однородной. Найденное среднее значение признака не является типичной и надежной характеристикой среднего.
Относительное линейное отклонение
33,2%
Коэффициент осцилляции:
= 193,6%
Вывод. Доля среднего линейного отклонения в среднем значении признака составляет 33,2%. Доля размаха вариации в среднем значении - 193,6%.
11. Рассчитаем показатели формы распределения
К показателям формы распределения относятся коэффициент асимметрии и эксцесса.
Для расчета показателей формы распределения строим вспомогательную таблицу 5.
Рассчитываем центральный момент третьего порядка:
Таблица 5
Вспомогательная таблица для расчета показателей формы распределения
Интервалы групп |
Число единиц в группе(частота) |
Середина интервала, |
|||
До 60 |
5 |
45 |
-1765314,69 |
124768851,57 |
|
60 - 90 |
16 |
75 |
-1076955,29 |
43808350,68 |
|
90 - 120 |
14 |
105 |
-17044,87 |
182004,53 |
|
120 - 150 |
11 |
135 |
79350,78 |
1533218,48 |
|
150 - 180 |
6 |
165 |
719903,33 |
35507096,44 |
|
180 - 210 |
4 |
195 |
1996372,21 |
158356304,07 |
|
210 и более |
3 |
225 |
3919623,60 |
428501223,88 |
|
Итого |
59 |
3855935,08 |
792657049,65 |
Расчет коэффициента асимметрии:
0,612
Вывод. Значение коэффициента асимметрии положительное, что свидетельствует о правосторонней асимметрии распределения, т.е. в совокупности преобладают единицы со значением признака меньшие, чем среднее.
Рассчитываем центральный момент четвертого порядка:
Расчет коэффициента эксцесса:
-0,346
Вывод: Показатель эксцесса отрицательный, т.е. вершина кривой распределения лежит ниже вершины кривой нормального закона распределения, а форма кривой более пологая по сравнению с кривой нормального закона. Это означает, что значения признака не концентрируются в центральной части ряда, а рассеяны по всему диапазону.
Список использованных источников
1. Бережной В.И. Статистика в примерах и задачах [Электронный ресурс]: учебное пособие / В.И. Бережной, О.Б. Бигдай, О.В. Бережная, Киселева О.А. - М.: НИЦ ИНФРА-М, 2016. - 288 с.
2. Глинский, В.В. Статистика: учебник / В.В. Глинский, В.Г. Ионин, Л.К. Серга [и др.]; под ред. В.Г. Ионина. - 4-е изд., перераб. и доп. - М.: ИНФРА-М, 2017. - 355 с.
3. Гужова, О.А. Статистика в управлении социально-экономическими процессами: учеб. пособие / О.А. Гужова, Ю.А. Токарев. - М.: ИНФРА-М, 2017. - 172 с.
4. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики / [Текст] Учебник. - М.: ИНФРА - М, 2015. - 416 с.
5. Рудакова Р.П., Букин Л.Л., Гаврилов В.И. Статистика. [Текст] 2-е изд. - СПб.: Питер, 2017. - 288 с.: ил.
Размещено на allbest.ru
...Подобные документы
Построение вариационного (статистического) ряда, гистограммы и эмпирической функции распределения. Определение выборочных оценок числовых характеристик случайной величины. Расчет матрицы парных коэффициентов корреляции и создание модели парной регрессии.
контрольная работа [2,0 M], добавлен 05.04.2014Объявление торгов администрацией штата на определенное количество строительных подрядов для определенного количества фирм. Экономико-математическая модели для минимизации затрат. Определение количества песцов и лисиц для получения максимальной прибыли.
контрольная работа [18,2 K], добавлен 05.03.2010Использование статистических характеристик для анализа ряда распределения. Частотные характеристики ряда распределения. Показатели дифференциации, абсолютные характеристики вариации. Расчет дисперсии способом моментов. Теоретические кривые распределения.
курсовая работа [151,4 K], добавлен 11.09.2010Составление сетевой модели подготовки документации на основании данных проекта прокладки участка нефтепровода. Определение максимального количества квартир, которые можно построить из имеющихся ограниченных ресурсов методом симплексных преобразований.
контрольная работа [56,8 K], добавлен 10.05.2010Задача линейного программирования. Определение количества листов фанеры и по какому способу их следует раскроить так, чтобы было получено не менее нужного количества заготовок при минимальной стоимости. Регрессионный анализ данных доходов и сбережений.
контрольная работа [444,2 K], добавлен 24.11.2013Расчет зависимости курса акций от эффективности рынка ценных бумаг. Построение графика экспериментальных данных и модельной прямой. Нахождение значения стандартных погрешностей для определения доверительных интервалов для значений зависимой переменной.
контрольная работа [441,9 K], добавлен 13.10.2014Расчет доверительных интервалов прогноза для линейного тренда с использованием уравнения экспоненты. Оценка адекватности и точности моделей. Использование адаптивных методов в экономическом прогнозировании. Экспоненциальные средние для временного ряда.
контрольная работа [916,2 K], добавлен 13.08.2010Расчет показателей вариации: среднее арифметическое, мода, медиана, размах вариации, дисперсия, стандартное и среднее линейное отклонения, коэффициенты осцилляции и вариации. Группировка данных по интервалам равной длины, составление вариационного ряда.
курсовая работа [429,7 K], добавлен 09.06.2011Построение адаптивной мультипликативной модели Хольта-Уинтерса с учетом сезонного фактора. Определение эффективной ставки процента по вкладу в банке, номинальной ставки при начислении процента. Расчет дисконта по формуле математического дисконтирования.
контрольная работа [756,3 K], добавлен 05.04.2011Оценка уравнений парной и множественной регрессии. Ковариация, корреляция, дисперсия. Определение доверительных интервалов для параметров. Статистические уравнения зависимостей. Расчет нормативных микроэкономических показателей хозяйственной деятельности.
дипломная работа [1,9 M], добавлен 20.10.2014Методика установления необходимого объема статистической выборки (количества наблюдений). Проверка на нормальность распределения выборочной совокупности. План проведения экспериментов. Регрессионная модель, коэффициенты детерминации и корреляции.
контрольная работа [79,5 K], добавлен 13.05.2011Основные понятия теории графов. Схема построения сетевой модели рынка. Основная идея бутстрэпа. Процедура проверки многих гипотез сравнения распределения вершин двух выборочных MST. Значения доверительных интервалов векторов наблюдений за два года.
курсовая работа [1,0 M], добавлен 19.09.2016Расчет показателей, характеризующих уровень жизни населения: величин их доходов и расходов, количества накопленного имущества, уровня границ бедности. Применение модели множественной линейной регрессии для создания стратификационной системы населения.
курсовая работа [592,5 K], добавлен 18.04.2011Определение наиболее выгодного сочетания технологических процессов переработки имеющегося количества нефти, количества ингредиентов, образующих кормовую смесь, еженедельных затрат времени на производство изделия, наибольшего дохода от выпуска продукции.
контрольная работа [204,2 K], добавлен 06.03.2010Анализ упорядоченных данных, полученных последовательно (во времени). Модели компонентов детерминированной составляющей временного ряда. Свободные от закона распределения критерии проверки ряда на случайность. Теоретический анализ системы линейного вида.
учебное пособие [459,3 K], добавлен 19.03.2011Построение интервального вариационного ряда распределения предприятий по объему реализации. Графическое изображение ряда (гистограмма, кумулята, огива). Расчет средней арифметической; моды и медианы; коэффициента асимметрии; показателей вариации.
контрольная работа [91,1 K], добавлен 10.12.2013Обзор методов решения задачи. Расчет количества клиентов, выручки, средний размер очереди и количество отказов за период моделирования. Алгоритм моделирования процесса, разработка его программной реализации. Машинный эксперимент с разработанной моделью.
курсовая работа [932,5 K], добавлен 15.01.2011Устойчивость двойственных оценок. Чувствительность оптимального решения задачи к изменению свободных членов. Графический метод решения задачи линейного программирования. Прогнозирование экономических процессов с использованием моделей временных рядов.
курсовая работа [2,3 M], добавлен 05.12.2011Планирование деятельности предприятия по производству продуктов питания. Прогнозирование объема продаж продукции на заданный период времени, построение графика изменения, используя метод трехчленной скользящей средней; расчет доверительных интервалов.
контрольная работа [668,5 K], добавлен 02.01.2012Экономическая модель туристической фирмы, определение управленческих решений по нахождению оптимального количества сотрудников по критерию увеличения дохода от продаж. Эксперименты по оптимизации количества менеджеров первой и второй категорий турфирмы.
курсовая работа [1,4 M], добавлен 26.12.2014