Расчет количества интервалов по формуле Стерджеса

Ранжирование ряда данных сортировкой по значениям от минимального к максимальному. Определение количества, величины и границ интервалов по формуле Стерджеса. Количество единиц совокупности, принадлежащих интервалам. Построить гистограмму распределения.

Рубрика Экономико-математическое моделирование
Вид контрольная работа
Язык русский
Дата добавления 28.05.2023
Размер файла 152,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.Allbest.Ru/

Расчет количества интервалов по формуле Стерджеса

Содержание

  • Задания для выполнения рейтинговой работы
  • Выполнение задания
  • Список использованных источников

Задания для выполнения рейтинговой работы

1. Скопировать данные своего варианта.

2. Ранжировать ряд данных сортировкой по значениям от минимального к максимальному.

3. Рассчитать количество интервалов по формуле Стерджеса, округлив вверх до целых единиц.

4. Рассчитать величину интервала h, округлить до десятков.

5. Рассчитать границы интервалов:

6. Подсчитать количество единиц совокупности, принадлежащих каждому из интервалов.

7. Построить интервальный вариационный ряд в виде таблицы

8. Построить гистограмму распределения для интервалов и полигон распределения для вариант, кумуляту.

9. Вычислить среднее арифметическое, моду, медиану, квартили, децили.

10. Вычислить показатели вариации: R, dср, s2, s, Vr, Vd, V. Вычислить асимметрию и эксцесс.

11. Сделать вывод об однородности вариационного ряда, о симметричности и остро- или плоско-вершинности распределения.

1. Скопируем исходные данные

Исходные данные приведены в таблице 1.

Таблица 1

Исходные данные для 12-го варианта

125

97

122

74

65

65

121

66

154

48

125

214

101

89

50

76

151

32

63

90

154

105

105

111

85

81

143

185

93

89

150

116

146

88

78

78

145

79

184

57

150

256

121

106

60

91

181

38

75

108

184

126

126

133

102

97

171

222

111

2. Ранжировать ряд данных сортировкой

Ранжированный ряд представлен в таблице 2.

Таблица 2

Ранжированные данные

32

38

48

50

57

60

63

65

65

66

74

75

76

78

78

79

81

85

88

89

89

90

91

93

97

97

101

102

105

105

106

108

111

111

116

121

121

122

125

125

126

126

133

143

145

146

150

150

151

154

154

171

181

184

184

185

214

222

256

Число наблюдений п = 59.

3. Рассчитаем количество интервалов по формуле Стерджеса:

k = 1 + 3,322 Ч lg n = 1 + 3,322 Ч lg 59 = 6,883

Округляем вверх до целых единиц. Таким образом, будем строить ряд, образовав 7 групп с равными интервалами.

4. Определим величину интервала

При построении интервального ряда с равными интервалами величина интервала h определяется по формуле:

,

где хmax и хmin - наибольшее и наименьшее значения признака в исследуемой совокупности; k- число групп интервального ряда.

Расчет величины интервалов:

Округляя до десятков, получаем h = 30.

5. Рассчитаем границы интервалов

Путем последовательного прибавления величины интервала h = 30 к нижней границе, получаем следующие границы интервалов ряда распределения:

До 3060 - 9090 - 120120 - 150

150 - 180180 - 210210 и более

6, 7. Рассчитаем частоты групп и получим интервальный ряд распределения

Определяем число единиц, входящих в каждую группу, используя принцип полуоткрытого интервала), согласно которому единицы со значениями признаков, которые служат одновременно верхними и нижними границами смежных интервалов, будем относить ко второму из смежных интервалов. Помимо количества единиц в абсолютном выражении (частот) в таблице 4 рассчитываем относительные частоты (частости) по формуле:

.

Таблица 3

Интервальный ряд распределения

Интервалы групп

Число наблюдений в группе, единиц

В % к итогу

До 60

5

8,5

60 - 90

16

27,1

90 - 120

14

23,7

120 - 150

11

18,6

150 - 180

6

10,2

180 - 210

4

6,8

210 и более

3

5,1

Итого

59

100,0

Вывод. Распределение наблюдений по группам не является полностью равномерным. Преобладают наблюдения со значениями признака от 60 до 90 единиц. Это 16 наблюдений, доля которых составляет 27,01% от общего числа наблюдений. Самая малочисленная группа с наибольшим значением признака (свыше 210 единиц). В данную группу попадает 5,1% от общего числа наблюдений (3 единицы).

8. Построим графики ряда распределения

Гистограмма - столбиковая диаграмма, она позволяет визуально оценит симметричность распределения, его близость к нормальному. Для построения полигона в прямоугольной системе координат на оси абсцисс откладывают значения интервалов, а на оси ординат - значения частот или относительных частот Гистограмма строится по 1-му и 2-му столбцу таблицы 3 и представлена на рисунке 1.

Рисунок 1 - Гистограмма распределения

Полигон чаще используют для изображения дискретных рядов. Для построения полигона в прямоугольной системе координат на оси абсцисс откладывают значения аргумента, т. е. варианты, а на оси ординат - значения частот или относительных частот. Далее в этой системе координат строят точки, координатами которых являются пары соответствующих чисел из вариационного ряда. Полученные точки последовательно соединяют отрезками прямой. Крайнюю «левую» точку соединяют с точкой оси абсцисс, абсцисса которой находится слева от рассматриваемой точки на таком же расстоянии, как абсцисса ближайшей справа точки. Аналогично крайнюю «правую» точку также соединяют с точкой оси абсцисс. Для интервального ряда в качестве значений признака принимаем середины интервалов.

Середину интервала находим как среднюю арифметическую из нижней и верхней границ интервалов:

Расчет представлен в таблице 4. Таким образом, полигон строим по 2-му и 3-му столбцу таблицы 4.

Рисунок 2 - Полигон распределения

Кумулята строится по накопленным частотам (расчет представлен в таблице 4). Она начинается с нижней границы 1-го интервала (30), накопленная частота откладывается в верхней границе интервала:

Рисунок 3 - Кумулята распределения

9. Вычислим среднее арифметическое, моду, медиану, квартили, децили

граница интервал серджес совокупность распределение

Для расчета показателей строим вспомогательную таблицу 4.

Таблица 4

Вспомогательная таблица для расчета показателей вариации и центра распределения

Интервалы групп

Число единиц в группе(частота)

Середина интервала,

накопленная частота

До 60

5

45

225

24976,87

353,39

5

60 - 90

16

75

1200

26475,15

650,85

21

90 - 120

14

105

1470

1596,27

149,49

35

120 - 150

11

135

1485

4106,75

212,54

46

150 - 180

6

165

990

14595,98

295,93

52

180 - 210

4

195

780

25167,94

317,29

56

210 и более

3

225

675

35853,92

327,97

59

Итого

59

6825

132772,88

2307,46

-

Для расчета среднего в интервальном ряду используется формула средней арифметической взвешенной:

Вывод. В рассматриваемой совокупности среднее значение признака составляет 115,68 единицы.

Мода и медиана являются структурными средними величинами, характеризующими (наряду со средней арифметической) центр распределения единиц совокупности по изучаемому признаку.

Мода Мо - значение признака, которое встречается наиболее часто в рассматриваемой совокупности. В интервальном вариационном ряду модой приближенно считается центральное значение модального интервала (имеющего наибольшую частоту).

Конкретное значение моды для интервального ряда рассчитывается по формуле:

,

Где хМo - нижняя граница модального интервала,

h - величина модального интервала,

fMo - частота модального интервала,

fMo-1 - частота интервала, предшествующего модальному,

fMo+1 - частота интервала, следующего за модальным.

Согласно данным модальным интервалом ряда является интервал 60-90, так как его частота максимальна (f1 = 16).

Расчет моды:

85,38

Вывод. Для рассматриваемой совокупности наиболее часто встречаются значения признака равные 85,38 единиц.

Медиана Ме - это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности.

Конкретное значение медианы для интервального ряда рассчитывается по формуле:

, где

- нижняя граница медианного интервала,

h - величина медианного интервала;

- сумма всех частот ряда;

- частота медианного интервала;

- сумма частот, накопившихся до начала медианного интервала.

Медианным интервалом является интервал 90-120, так как именно в этом интервале накопленная частота S3 =35 впервые превышает величину, равную половине совокупности (0,5?59 = 29,5).

Расчет медианы:

108,21

Вывод. В рассматриваемой совокупности половина значение признак не менее 108,21 единиц, а другая половина - не более 108,21 единиц.

, следовательно, асимметрия правосторонняя, гистограмма сдвинута от центра влево. В совокупности преобладают единицы с более низкими значениями признака, чем среднее значение.

Квартили - это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине Q1; 25% будут заключены между Q1 и Q2; 25% - между Q2 и Q3; остальные 25% превосходят Q3.

0-й квартиль - минимальное значение признака;

2-й квартиль - медиана;

1-й и 3-й квартиль рассчитываются аналогично медиане.

Значение Q1 будет находиться в интервале 60-90, т.к. именно в этом интервале накопленная частота равна 21 впервые превышает четверть суммы частот .

78,28

Значение Q3 будет находиться в интервале 120-150, т.к. именно в этом интервале накопленная частота 46 впервые превышает три четверти суммы частот .

145,23

Децили делят совокупность на 10 равных частей. Рассчитываются аналогично медиане и квартилям.

Интервалом 1-го дециля d1 будет является интервал 60-90, т.к. именно в этом интервале накопленная частота 21 впервые превышает 1/10 суммы частот .

61,69

Интервалом 9-го дециля d9 будет интервал 180-210, т.к. в этом интервале накопленная частота 56 впервые превышает 9/10 суммы частот

188,25

10. Вычислим показатели вариации

Вспомогательные расчеты приведены в таблице 5.

Размах вариации характеризует амплитуду колебаний значений признака, рассчитывается как разность максимального и минимального значения признака. Рассчитываем размах по исходным данным:

256 - 32 = 224

Среднее линейное отклонение показывает, насколько в среднем отклоняются конкретные варианты признака от среднего значения. Для сгруппированных данных рассчитываем взвешенное среднее линейное отклонение:

38,46

Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины. Для интервального ряда используется формула взвешенной дисперсии:

2212,88

Среднее квадратическое отклонение также как и среднее линейное отклонение показывает, насколько в среднем отклоняются конкретные варианты признака от среднего значения. Однако является более точной характеристикой. Рассчитывается, как корень квадратный из дисперсии:

47,04

Расчет исправленной (скорректированной) дисперсии:

2212,88Ч59/58 = 2249,76

Расчет исправленного (скорректированного) среднего квадратического отклонения:

47,43

Вывод. Отклонение от среднего значения признака в ту или иную сторону составляет 47,43 единиц. Наиболее характерные значения признака в рассматриваемой совокупности находятся в пределах от 68,25 до 163,11 (диапазон ).

Коэффициент вариации является мерой относительной колеблемости признака около средней и характеризует степень однородности признака в изучаемой совокупности:

41,0%

Вывод. Значение коэффициента вариации превышает 40%, следовательно, вариация признака в исследуемой совокупности единиц умеренная и совокупность не является однородной. Найденное среднее значение признака не является типичной и надежной характеристикой среднего.

Относительное линейное отклонение

33,2%

Коэффициент осцилляции:

= 193,6%

Вывод. Доля среднего линейного отклонения в среднем значении признака составляет 33,2%. Доля размаха вариации в среднем значении - 193,6%.

11. Рассчитаем показатели формы распределения

К показателям формы распределения относятся коэффициент асимметрии и эксцесса.

Для расчета показателей формы распределения строим вспомогательную таблицу 5.

Рассчитываем центральный момент третьего порядка:

Таблица 5

Вспомогательная таблица для расчета показателей формы распределения

Интервалы групп

Число единиц в группе(частота)

Середина интервала,

До 60

5

45

-1765314,69

124768851,57

60 - 90

16

75

-1076955,29

43808350,68

90 - 120

14

105

-17044,87

182004,53

120 - 150

11

135

79350,78

1533218,48

150 - 180

6

165

719903,33

35507096,44

180 - 210

4

195

1996372,21

158356304,07

210 и более

3

225

3919623,60

428501223,88

Итого

59

3855935,08

792657049,65

Расчет коэффициента асимметрии:

0,612

Вывод. Значение коэффициента асимметрии положительное, что свидетельствует о правосторонней асимметрии распределения, т.е. в совокупности преобладают единицы со значением признака меньшие, чем среднее.

Рассчитываем центральный момент четвертого порядка:

Расчет коэффициента эксцесса:

-0,346

Вывод: Показатель эксцесса отрицательный, т.е. вершина кривой распределения лежит ниже вершины кривой нормального закона распределения, а форма кривой более пологая по сравнению с кривой нормального закона. Это означает, что значения признака не концентрируются в центральной части ряда, а рассеяны по всему диапазону.

Список использованных источников

1. Бережной В.И. Статистика в примерах и задачах [Электронный ресурс]: учебное пособие / В.И. Бережной, О.Б. Бигдай, О.В. Бережная, Киселева О.А. - М.: НИЦ ИНФРА-М, 2016. - 288 с.

2. Глинский, В.В. Статистика: учебник / В.В. Глинский, В.Г. Ионин, Л.К. Серга [и др.]; под ред. В.Г. Ионина. - 4-е изд., перераб. и доп. - М.: ИНФРА-М, 2017. - 355 с.

3. Гужова, О.А. Статистика в управлении социально-экономическими процессами: учеб. пособие / О.А. Гужова, Ю.А. Токарев. - М.: ИНФРА-М, 2017. - 172 с.

4. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики / [Текст] Учебник. - М.: ИНФРА - М, 2015. - 416 с.

5. Рудакова Р.П., Букин Л.Л., Гаврилов В.И. Статистика. [Текст] 2-е изд. - СПб.: Питер, 2017. - 288 с.: ил.

Размещено на allbest.ru

...

Подобные документы

  • Построение вариационного (статистического) ряда, гистограммы и эмпирической функции распределения. Определение выборочных оценок числовых характеристик случайной величины. Расчет матрицы парных коэффициентов корреляции и создание модели парной регрессии.

    контрольная работа [2,0 M], добавлен 05.04.2014

  • Объявление торгов администрацией штата на определенное количество строительных подрядов для определенного количества фирм. Экономико-математическая модели для минимизации затрат. Определение количества песцов и лисиц для получения максимальной прибыли.

    контрольная работа [18,2 K], добавлен 05.03.2010

  • Использование статистических характеристик для анализа ряда распределения. Частотные характеристики ряда распределения. Показатели дифференциации, абсолютные характеристики вариации. Расчет дисперсии способом моментов. Теоретические кривые распределения.

    курсовая работа [151,4 K], добавлен 11.09.2010

  • Составление сетевой модели подготовки документации на основании данных проекта прокладки участка нефтепровода. Определение максимального количества квартир, которые можно построить из имеющихся ограниченных ресурсов методом симплексных преобразований.

    контрольная работа [56,8 K], добавлен 10.05.2010

  • Задача линейного программирования. Определение количества листов фанеры и по какому способу их следует раскроить так, чтобы было получено не менее нужного количества заготовок при минимальной стоимости. Регрессионный анализ данных доходов и сбережений.

    контрольная работа [444,2 K], добавлен 24.11.2013

  • Расчет зависимости курса акций от эффективности рынка ценных бумаг. Построение графика экспериментальных данных и модельной прямой. Нахождение значения стандартных погрешностей для определения доверительных интервалов для значений зависимой переменной.

    контрольная работа [441,9 K], добавлен 13.10.2014

  • Расчет доверительных интервалов прогноза для линейного тренда с использованием уравнения экспоненты. Оценка адекватности и точности моделей. Использование адаптивных методов в экономическом прогнозировании. Экспоненциальные средние для временного ряда.

    контрольная работа [916,2 K], добавлен 13.08.2010

  • Расчет показателей вариации: среднее арифметическое, мода, медиана, размах вариации, дисперсия, стандартное и среднее линейное отклонения, коэффициенты осцилляции и вариации. Группировка данных по интервалам равной длины, составление вариационного ряда.

    курсовая работа [429,7 K], добавлен 09.06.2011

  • Построение адаптивной мультипликативной модели Хольта-Уинтерса с учетом сезонного фактора. Определение эффективной ставки процента по вкладу в банке, номинальной ставки при начислении процента. Расчет дисконта по формуле математического дисконтирования.

    контрольная работа [756,3 K], добавлен 05.04.2011

  • Оценка уравнений парной и множественной регрессии. Ковариация, корреляция, дисперсия. Определение доверительных интервалов для параметров. Статистические уравнения зависимостей. Расчет нормативных микроэкономических показателей хозяйственной деятельности.

    дипломная работа [1,9 M], добавлен 20.10.2014

  • Методика установления необходимого объема статистической выборки (количества наблюдений). Проверка на нормальность распределения выборочной совокупности. План проведения экспериментов. Регрессионная модель, коэффициенты детерминации и корреляции.

    контрольная работа [79,5 K], добавлен 13.05.2011

  • Основные понятия теории графов. Схема построения сетевой модели рынка. Основная идея бутстрэпа. Процедура проверки многих гипотез сравнения распределения вершин двух выборочных MST. Значения доверительных интервалов векторов наблюдений за два года.

    курсовая работа [1,0 M], добавлен 19.09.2016

  • Расчет показателей, характеризующих уровень жизни населения: величин их доходов и расходов, количества накопленного имущества, уровня границ бедности. Применение модели множественной линейной регрессии для создания стратификационной системы населения.

    курсовая работа [592,5 K], добавлен 18.04.2011

  • Определение наиболее выгодного сочетания технологических процессов переработки имеющегося количества нефти, количества ингредиентов, образующих кормовую смесь, еженедельных затрат времени на производство изделия, наибольшего дохода от выпуска продукции.

    контрольная работа [204,2 K], добавлен 06.03.2010

  • Анализ упорядоченных данных, полученных последовательно (во времени). Модели компонентов детерминированной составляющей временного ряда. Свободные от закона распределения критерии проверки ряда на случайность. Теоретический анализ системы линейного вида.

    учебное пособие [459,3 K], добавлен 19.03.2011

  • Построение интервального вариационного ряда распределения предприятий по объему реализации. Графическое изображение ряда (гистограмма, кумулята, огива). Расчет средней арифметической; моды и медианы; коэффициента асимметрии; показателей вариации.

    контрольная работа [91,1 K], добавлен 10.12.2013

  • Обзор методов решения задачи. Расчет количества клиентов, выручки, средний размер очереди и количество отказов за период моделирования. Алгоритм моделирования процесса, разработка его программной реализации. Машинный эксперимент с разработанной моделью.

    курсовая работа [932,5 K], добавлен 15.01.2011

  • Устойчивость двойственных оценок. Чувствительность оптимального решения задачи к изменению свободных членов. Графический метод решения задачи линейного программирования. Прогнозирование экономических процессов с использованием моделей временных рядов.

    курсовая работа [2,3 M], добавлен 05.12.2011

  • Планирование деятельности предприятия по производству продуктов питания. Прогнозирование объема продаж продукции на заданный период времени, построение графика изменения, используя метод трехчленной скользящей средней; расчет доверительных интервалов.

    контрольная работа [668,5 K], добавлен 02.01.2012

  • Экономическая модель туристической фирмы, определение управленческих решений по нахождению оптимального количества сотрудников по критерию увеличения дохода от продаж. Эксперименты по оптимизации количества менеджеров первой и второй категорий турфирмы.

    курсовая работа [1,4 M], добавлен 26.12.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.