Анализ эмпирического распределения
Рассмотрение табличного и графического представления вариационного ряда. Характеристика центральной тенденции распределения. Определение вариации изучаемого признака. Сглаживание эмпирического распределения. Проверка гипотезы о законе распределения.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 07.12.2016 |
Размер файла | 538,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Курсовая работа
По дисциплине «Статистика»
На тему «Анализ эмпирического распределения»
Содержание
Введение
1. Табличное и графическое представление вариационного ряда
2. Основные характеристики вариационного ряда
2.1 Характеристика центральной тенденции распределения
2.2 Оценка вариации изучаемого признака
2.3 Характеристика структуры распределения
2.4 Характеристика формы распределения
3. Сглаживание эмпирического распределения. Проверка гипотезы о законе распределения
Заключение
Список использованных источников
Введение
распределение центральный эмпирический графический
Исследование любого социально-экономического явления или процесса осуществляется на основе анализа статистических данных, который включает в себя их сбор, систематизацию и обработку с целью удобного представления, интерпретации и формирования практических выводов.
Важнейшей частью статистического анализа является построение рядов распределения с целью выделения характерных свойств и закономерностей изучаемой совокупности. Статистический ряд распределения - это упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку, при этом если в основу положен количественный признак, то речь идет вариационном ряде распределения.
В курсовой работе проведен анализ эмпирического распределения регионов Российской Федерации по общей площади жилых помещений, приходящейся в среднем на одного жителя.
Потребность в жилище относится к числу первичных жизненных потребностей человека. Показатель обеспеченности жильём является одним из элементов, характеризующих благосостояние населения страны. На сегодняшний день удовлетворение потребностей в жилище, улучшение жилищных условий населения является важнейшим элементом социальной политики, оказывающим влияние на демографическое и социально-экономическое развитие общества, состояние здоровья населения. Выбор конкретных целей, разработка механизма жилищной политики и контроль над ее реализацией невозможны без наличия информации, характеризующей фактическое положение на рынке жилья. Это обуславливает актуальность темы исследования.
Цель исследования состоит в статистическом анализе эмпирического распределения регионов РФ по показателю общей площади жилых помещений, приходящейся в среднем на одного жителя, в 2005 году, для достижения которой было осуществлено табличное и графическое представление ряда распределение, рассчитаны и проанализированы основные статистические характеристики, проведена аппроксимация эмпирического распределения и подбор распределения с использованием критерия согласия.
Информационной базой исследования послужили статистические данные сборника «Регионы России. Социально-экономические показатели», размещенного на сайте федеральной службы государственной статистики.
Расчеты проводились в пакете STATISTICA.
1. Табличное и графическое представление вариационного ряда
Исходные данные по общей площади жилых помещений, приходящейся в среднем на одного жителя, для 80 регионов РФ в 2005 году представлены в таблице 1.
Таблица 1 - Общая площадь жилых помещений, приходящаяся в среднем на одного жителя, по регионам РФ в 2005 году (квадратных метров)
Регионы РФ |
Общая площадь жилых помещений |
Регионы РФ |
Общая площадь жилых помещений |
|
Белгородская область |
23 |
Республика Башкортостан |
19,1 |
|
Брянская область |
23,1 |
Республика Марий Эл |
20,7 |
|
Владимирская область |
23 |
Республика Мордовия |
21,8 |
|
Воронежская область |
23,4 |
Республика Татарстан |
20,5 |
|
Ивановская область |
22,4 |
Удмуртская Республика |
18,4 |
|
Калужская область |
22,9 |
Чувашская Республика |
20,8 |
|
Костромская область |
23,8 |
Пермский край |
19,8 |
|
Курская область |
23,2 |
Кировская область |
21,2 |
|
Липецкая область |
22,7 |
Нижегородская область |
22,1 |
|
Московская область |
24,3 |
Оренбургская область |
20,3 |
|
Орловская область |
22,2 |
Ставропольский край |
19,6 |
|
Рязанская область |
23,4 |
Пензенскаяобласть |
21,8 |
|
Тамбовская область |
22,3 |
Саратовская область |
22,7 |
|
Смоленская область |
23,3 |
Самарская область |
20,5 |
|
Тверская область |
25,4 |
Ульяновская область |
21,3 |
|
Тульская область |
23,2 |
Курганская область |
19,7 |
|
Ярославская область |
22,5 |
Свердловская область |
21,1 |
|
г. Москва |
18,5 |
Тюменская область |
18,9 |
|
Республика Карелия |
23,1 |
Челябинская область |
20,7 |
|
Республика Коми |
23,1 |
Республика Алтай |
16 |
|
Архангельская область |
23,5 |
Республика Бурятия |
17,9 |
|
Вологодская область |
23,8 |
Республика Тыва |
12,7 |
|
Калининградская область |
20 |
Республика Хакасия |
19,6 |
|
Ленинградская область |
23,5 |
Алтайский край |
20,1 |
|
Мурманская область |
23,2 |
Забайкальский край |
18,6 |
|
Новгородская область |
24,7 |
Красноярский край |
21 |
|
Псковская область |
25,6 |
Иркутская область |
20 |
|
г. Санкт-Петербург |
21,3 |
Кемеровская область |
20,4 |
|
Республика Адыгея |
23,3 |
Новосибирская область |
19,2 |
|
Республика Калмыкия |
19,9 |
Омская область |
20,4 |
|
Краснодарский край |
19,3 |
Томская область |
19,8 |
|
Астраханская область |
19,2 |
Республика Саха (Якутия) |
19,4 |
|
Волгоградская область |
20 |
Камчатский край |
22,4 |
|
Ростовская область |
19,7 |
Приморский край |
19,4 |
|
Республика Дагестан |
15,6 |
Хабаровский край |
20,4 |
|
Республика Ингушетия |
12,4 |
Амурская область |
20,6 |
|
Кабардино-Балкарская Республика |
16,8 |
Магаданская область |
26,6 |
|
Карачаево-Черкесская Республика |
17,9 |
Сахалинская область |
21,6 |
|
Республика Северная Осетия - Алания |
25,3 |
Еврейская автономная область |
20,8 |
|
Чеченская Республика |
4,2 |
Чукотский автономный округ |
27,9 |
Прежде чем приступать к построению и анализу ряда распределения необходимо из исходной совокупности исключить выбросы - единицы совокупности, значения которых резко отличаются в большую или в меньшую сторону от значений признака у основной единицы совокупности.
С целью выявления выбросов проведем ранжирование исходных данных по возрастанию значений признака общей площади жилых помещений, приходящейся в среднем на одного жителя (таблица 2).
Таблица 2 - Исходные данные, ранжированные по возрастанию общей площади жилых помещений, приходящейся в среднем на одного жителя, по регионам РФ в 2005 году (квадратных метров)
Регионы РФ |
Общая площадь жилых помещений |
Регионы РФ |
Общая площадь жилых помещений |
|
Чеченская Республика |
4,2 |
Кемеровская область |
20,4 |
|
Республика Ингушетия |
12,4 |
Свердловская область |
21,1 |
|
Республика Тыва |
12,7 |
Кировская область |
21,2 |
|
Республика Дагестан |
15,6 |
г. Санкт-Петербург |
21,3 |
|
Республика Алтай |
16 |
Ульяновская область |
21,3 |
|
Кабардино-Балкарская Республика |
16,8 |
Сахалинская область |
21,6 |
|
Карачаево-Черкесская Республика |
17,9 |
Республика Мордовия |
21,8 |
|
Республика Бурятия |
17,9 |
Пензенская область |
21,8 |
|
Удмуртская Республика |
18,4 |
Нижегородская область |
22,1 |
|
г. Москва |
18,5 |
Орловская область |
22,2 |
|
Забайкальский край |
18,6 |
Тамбовская область |
22,3 |
|
Тюменская область |
18,9 |
Ивановская область |
22,4 |
|
Республика Башкортостан |
19,1 |
Камчатский край |
22,4 |
|
Астраханская область |
19,2 |
Ярославская область |
22,5 |
|
Новосибирская область |
19,2 |
Липецкая область |
22,7 |
|
Краснодарский край |
19,3 |
Саратовская область |
22,7 |
|
Республика Саха (Якутия) |
19,4 |
Калужская область |
22,9 |
|
Приморский край |
19,4 |
Белгородская область |
23 |
|
Ставропольский край |
19,6 |
Владимирская область |
23 |
|
Республика Хакасия |
19,6 |
Брянская область |
23,1 |
|
Ростовская область |
19,7 |
Республика Карелия |
23,1 |
|
Курганская область |
19,7 |
Республика Коми |
23,1 |
|
Пермский край |
19,8 |
Курская область |
23,2 |
|
Томская область |
19,8 |
Тульская область |
23,2 |
|
Республика Калмыкия |
19,9 |
Мурманская область |
23,2 |
|
Калининградская область |
20 |
Смоленская область |
23,3 |
|
Волгоградская область |
20 |
Республика Адыгея |
23,3 |
|
Иркутская область |
20 |
Воронежская область |
23,4 |
|
Алтайский край |
20,1 |
Рязанская область |
23,4 |
|
Оренбургская область |
20,3 |
Архангельская область |
23,5 |
|
Омская область |
20,4 |
Ленинградская область |
23,5 |
|
Хабаровский край |
20,4 |
Костромская область |
23,8 |
|
Республика Татарстан |
20,5 |
Вологодская область |
23,8 |
|
Самарская область |
20,5 |
Московская область |
24,3 |
|
Амурская область |
20,6 |
Новгородская область |
24,7 |
|
Республика Марий Эл |
20,7 |
Республика Северная Осетия - Алания |
25,3 |
|
Челябинская область |
20,7 |
Тверская область |
25,4 |
|
Чувашская Республика |
20,8 |
Псковская область |
25,6 |
|
Еврейская автономная область |
20,8 |
Магаданская область |
26,6 |
|
Красноярский край |
21 |
Чукотский автономный округ |
27,9 |
Анализ таблицы 2 показывает, что существует дифференциация регионов РФ по общей площади жилых помещений, приходящейся в среднем на одного жителя. Минимальное значение этого показателя наблюдается в Чеченской республике (4,2 квадратных метров), максимальное значение - в Чукотском автономном округе (27,9 квадратных метров).
Таким образом, можно предположить, что в данной совокупности выбросом является Чеченская Республика, для которой общая площадь жилых помещений, приходящаяся в среднем на одного жителя, является существенно выше, чем в остальных регионах РФ, что связано, скорее всего, с боевыми действиями на территории данного региона. Поэтому при анализе совокупности в дальнейшем исключим Чеченскую Республику из рассмотрения. В итоге изучаемая совокупность будет состоять из 79 регионов РФ.
Следующим этапом анализа является построение таблицы вариационного ряда, которая позволяет не только выявить ту или иную закономерность распределения, но и подробно охарактеризовать структуру изучаемой совокупности.
Подберем число интервалов таким образом, чтобы не было малонаполненных и нулевых групп, распределение было одномодальным, по обе стороны от максимальной частоты должно наблюдаться закономерное убывание частот. На рисунках 1, 2, 3, 4 приведены таблицы распределения регионов РФ по общей площади жилых помещений, приходящейся в среднем на одного жителя, для числа интервалов соответственно.
Рис. 1. Распределение регионов РФ по показателю общей площади жилых помещений, приходящейся в среднем на одного жителя, в 2005 г. с числом интервалов
Рис. 2. Распределение регионов РФ по показателю общей площади жилых помещений, приходящейся в среднем на одного жителя, в 2005 г. с числом интервалов
Рис. 3. Распределение регионов РФ по показателю общей площади жилых помещений, приходящейся в среднем на одного жителя, в 2005 г. с числом интервалов
Рис. 4. Распределение регионов РФ по показателю общей площади жилых помещений, приходящейся в среднем на одного жителя, в 2005 г. с числом интервалов
Наиболее приемлемым числом интервалов при распределении регионов РФ по показателю общей площади жилых помещений, приходящейся в среднем на одного жителя, является . При наблюдается «плосковершинное» распределение (приблизительно равные частоты в двух группах в центре распределения). При и получаем малонаполненные группы.
В пользу того, что распределение целесообразно представить в виде 7 интервалов, свидетельствует и формула Стерджесса: .
Следует отметить, что левая граница первого интервала во всех случаях меньше минимального значения. Чтобы устранить это, воспользуемся ручной установкой левой границы, выбрав ее равной минимальному элементу выборки.
Ширину интервала вычислим по формуле (1):
, (1)
где - число интервалов.
Учитывая, что , и получим:
.
В результате получим таблицу частот, представленную на рисунке 5.
Рис. 5. Распределение регионов РФ по показателю общей площади жилых помещений, приходящейся в среднем на одного жителя, в 2005 г. с числом интервалов (ручной расчет)
Анализируя результаты, представленные на рисунке 5, можно сделать вывод, что в 31 регионе РФ (или 39,24% от числа всех регионов) общая площадь жилых помещений, приходящаяся в среднем на одного жителя составляет, от 19,06 квадратных метров до 21,28 квадратных метров. В двух регионах, Магаданской области и Чукотском автономном округе (или 2,53% от числа всех регионов) наблюдается наибольшее значение общей площади жилых помещений, приходящейся в среднем на одного жителя, от 25,7 квадратных метров до 27,94 квадратных метров. Наименьшее значение общей площади жилых помещений, приходящейся в среднем на одного жителя, от 12,4 квадратных метров до 14,62 квадратных метров наблюдается в двух регионах РФ (или 2,53% от числа всех регионов) - Республиках Ингушетия и Тыва.
На основе таблиц распределения строятся графики, наглядно представляющие закономерность распределения анализируемой статистической совокупности. На рисунках 6, 7 и 8 представлены гистограмма частот, полигон частот и кумулята соответственно, построенные по распределению регионов РФ по показателю общей площади жилых помещений, приходящейся в среднем на одного жителя, в 2005 г. с числом интервалов (ручной расчет).
Рис. 6. Гистограмма распределения регионов РФ по показателю общей площади жилых помещений, приходящейся в среднем на одного жителя, в 2005 г. с наложенной кривой нормального распределения с числом интервалов (ручной расчет)
Рис. 7. Полигон распределения регионов РФ по показателю общей площади жилых помещений, приходящейся в среднем на одного жителя, в 2005 г. (, ручной счет)
По виду гистограммы и полигона можно предположить, что распределение регионов РФ по общей площади жилых помещений, приходящейся в среднем на одного жителя, близко к нормальному.
Рис. 8. Кумулята распределения регионов РФ по показателю общей площади жилых помещений, приходящейся в среднем на одного жителя, в 2005 г. (, ручной счет)
Одним из приемов компактного изображения распределений является "Box-and-Whisker Plot" - «ящик с усами», который обеспечивает как диагностическую, так и описательную информацию об исследуемой совокупности. На рисунке 9 представлена одна из разновидностей «ящика с усами» для показателя общей площади жилых помещений, приходящейся в среднем на одного жителя.
Рис. 9. Диаграмма «Box & Whisker Plot» для общей площади жилых помещений, приходящейся в среднем на одного жителя, в 2005 г.
На графике указана медиана распределения, равная 21 квадратному метру. Это означает, что половина регионов, представленных в выборке, имеют общую площадь жилых помещений, приходящуюся в среднем на одного жителя, ниже 21 квадратного метра, а половина - выше этого значения.
Границы ящика соответствует нижнему и верхнему квартилю. Таким образом, общая площадь жилых помещений, приходящаяся в среднем на одного жителя, от 19,7 квадратных метров до 23,1 квадратных метров характерна для 50% регионов, представленных в выборке. При этом у 25% регионов общая площадь жилых помещений, приходящаяся в среднем на одного жителя, ниже 19,7 квадратных метров и у 25% регионов - выше 23,1 квадратных метров.
Усы на графике соответствуют минимальному (12,4 квадратных метров) и максимальному (27,9 квадратных метров) элементам выборки. Небольшие размеры ящика (по сравнению с расстоянием между усами) указывают на дифференциацию регионов по общей площади жилых помещений, приходящейся в среднем на одного жителя. Причем чуть в большей степени эта дифференциация характерна для регионов, приходящихся на нижний квартиль, т.е. регионов с меньшим значением общей площади жилых помещений, приходящейся в среднем на одного жителя.
2. Основные характеристики вариационного ряда
Построение вариационного ряда является первоначальным этапом в изучении статистических данных. Для более глубокого исследования необходимы обобщающие количественные показатели, вскрывающие общие свойства статистической совокупности. Эти показатели позволяют охарактеризовать центр распределения, его структуру, оценить степень вариации и дифференциации изучаемого признака, а также формы распределения. Следовательно, основные характеристики вариационного ряда можно разделить на четыре группы:
показатели центра распределения, к которым относятся среднее арифметическое значение, мода, медиана;
показатели степени вариации и дифференциации изучаемого признака - размах вариации, дисперсия, среднее квадратическое отклонение, коэффициент вариации;
показатели структуры распределения - медиана, квартили, децили и др.;
показатели формы распределения, к которым относятся асимметрия и эксцесс.
2.1 Характеристика центральной тенденции распределения
Средняя величина - это обобщающая характеристика размера изучаемого признака. Она позволяет одним числом количественно охарактеризовать качественно однородную совокупность. В статистике принято выделять следующие виды средних величин:
- Средняя арифметическая, которая рассчитывается по формуле (2):
, (2)
где - значение признака у -ой единицы совокупности;
- объем выборки.
- Мода - значение признака, наиболее часто встречающееся в исследуемой совокупности. Для моды по интервальному вариационному ряду необходимо сначала определить модальный интервал (тот интервал, которому соответствует максимальная частота), а затем рассчитать ее значение по формуле (3):
, (3)
где - левая граница модального интервала
- ширина модального интервала,
- частота интервала, предшествующего модальному,
- частота интервала, следующего за модальным,
- частота модального интервала.
- Медиана - значение признака у единицы, стоящей в центре ранжированного ряда, то есть величина признака, которая делит упорядоченную последовательность его значений на две равные по численности части (4).
(4)
На рисунке 10 приведены результаты расчета показателей центра распределения для ряда общей площади жилых помещений, приходящейся в среднем на одного жителя.
Рис. 10. Показатели центра распределения регионов РФ по показателю общей площади жилых помещений, приходящейся в среднем на одного жителя, в 2005 г.
Всего в выборку вошло 79 регионов РФ. Среднее значение общей площади жилых помещений, приходящейся в среднем на одного жителя, по всем регионам составило 21,13 квадратных метров. Медианное значение общей площади жилых помещений, приходящейся в среднем на одного жителя, равно 21 квадратному метру. Так как объем выборки нечетный, то в качестве медианы выступает значение общей площади жилых помещений, приходящейся в среднем на одного жителя для 40-го элемента ранжированной совокупности. Так как медиана меньше среднего значения, следовательно, больше половины регионов в выборке имеют общую площадь жилых помещений, приходящуюся в среднем на одного жителя, ниже среднего значения. Следует отметить, что приблизительно равные значения средней и медианы свидетельствует о близости распределения регионов РФ по показателю общей площади жилых помещений, приходящейся в среднем на одного жителя, к симметричному (нормальному) распределению.
Поскольку в данной выборочной совокупности одинаковую наибольшую частоту имеет несколько элементов выборки, а именно 3 региона, то в поле Mode представлено Multiple (множественная). Такой способ расчета моды подходит для дискретных признаков, но не подходит для признаков, имеющих непрерывный спектр значений, как общая площадь жилых помещений, приходящаяся в среднем на одного жителя. Поэтому вычислим моду вручную с помощью приведенной выше формулы (3).
По рисунку 5 определим модальный интервал с наибольшей частотой: [19,06; 21,28), частота модального интервала , ширина модального интервала , частота интервала, предшествующего модальному , частота интервала, следующего за модальным, .
Получим:
.
Таким образом, наиболее частым значением общей площади жилых помещений, приходящейся в среднем на одного жителя, в выборке является 20,9 квадратных метров. В частности, для 31 региона РФ значение общей площади жилых помещений, приходящейся в среднем на одного жителя, лежит в интервале от 19,06 квадратных метров до 21,28 квадратных метров.
2.2 Оценка вариации изучаемого признака
Показатели вариации делятся на абсолютные и относительные. К абсолютным показателям относятся: размах, дисперсия, среднее квадратическое отклонение, а к относительным - коэффициент вариации.
Размах () рассчитывается как разность между максимальным и минимальным значениями в выборке (формула 5):
. (5)
Размах показывает, насколько максимальное значение признака совокупности превосходит минимальное.
Дисперсия () - это средний квадрат отклонений значений переменной от среднего арифметического значения. Эта характеристика является мерой разброса исследуемой величины вокруг своего среднего значения. Дисперсия рассчитывается по формуле 6:
. (6)
Среднее квадратическое отклонение ():
. (7)
Среднее квадратическое отклонение определяет, на сколько в среднем индивидуальные значения признака отклоняются от среднего уровня.
Коэффициент вариации (V) - относительный показатель вариации, является наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин. На основе этого показателя делается вывод об однородности или неоднородности совокупности по изучаемому признаку. Коэффициент вариации рассчитывается по формуле 8:
. (8)
Данный коэффициент характеризует долю величины стандартного отклонения к величине типического уровня. Совокупности, имеющие коэффициент вариации больше 30-35 %, принято считать неоднородными.
На рисунке 11 приведены результаты расчета показателей вариации и дифференциации распределения для ряда общей площади жилых помещений, приходящейся в среднем на одного жителя,
Рис. 11. Показатели вариации и дифференциации распределения регионов РФ по показателю общей площади жилых помещений, приходящейся в среднем на одного жителя, в 2005 г.
Размах составил 27,9-12,4=15,5, это означает, что разница между максимальным и минимальным значением общей площади жилых помещений, приходящейся в среднем на одного жителя, в выборке равна 15,5 квадратных метров. Стандартное отклонение, равное 2,68, показывает, что общая площадь жилых помещений, приходящаяся в среднем на одного жителя, для отдельных регионов в среднем отличается от среднего арифметического по совокупности на 2,68 квадратных метра. Коэффициент вариации составил 12,7%, что меньше 30%, следовательно, совокупность можно считать достаточно однородной.
2.3 Характеристика структуры распределения
К основным показателям структуры распределения относят медиану, квартили, которые делят совокупность на четыре части, децили, которые делят совокупность на 10 частей. Формула для расчета медианы приводилась ранее.
Для расчёта квартилей в интервальном вариационном ряду распределения применяются следующие формулы:
, (9)
где и - нижний и верхний квартили;
и - нижние границы квартильных интервалов;
- величина группировочного интервала;
и - абсолютные частоты квартильных интервалов;
и - накопленные (кумулятивные) частоты интервалов, предшествующих квартильным.
На рисунке 12 приведены результаты расчета показателей структуры распределения для ряда общей площади жилых помещений, приходящейся в среднем на одного жителя.
Рис. 12. Показатели структуры распределения регионов РФ по показателю общей площади жилых помещений, приходящейся в среднем на одного жителя, в 2005 г.
Значения верхнего и нижнего квартилей показывают, что в 25% регионов России значения общей площади жилых помещений, приходящейся в среднем на одного жителя, не превосходят 19,7 квадратных метров и в 25% регионов - выше 23,1 квадратных метра. Соответственно, в 50% регионов значение общей площади жилых помещений, приходящейся в среднем на одного жителя, лежит в интервале от 19,7 квадратных метров до 23,1 квадратных метров.
2.4 Характеристика формы распределения
К показателям формы распределения относятся коэффициенты асимметрии (Skewness) и эксцесса (Kurtosis).
Коэффициент асимметрии оценивает симметричность эмпирического распределения относительно вертикальной оси симметрии, проходящей через среднюю арифметическую. Для нормального закона распределения асимметрия равна нулю. Поэтому, если асимметрия значительно отличается от нуля, то гипотезу о том, что данные взяты из нормально распределенной генеральной совокупности, следует отвергнуть. Если асимметрия больше 0, то чаще в распределении встречаются значения меньше среднего. Такая асимметрия называется положительной. Если асимметрия меньше 0, то в распределении чаще встречаются значения больше среднего. Такая асимметрия называется отрицательной. Коэффициент асимметрии рассчитывается по формуле 10:
. (10)
Для оценки существенности отличия асимметрии от 0 рассчитывается стандартизованная ошибка асимметрии . Если , то распределение близко к нормальному.
Эксцесс - числовая характеристика степени остроты пика распределения случайной величины. Нормальное распределение имеет нулевой эксцесс. Если хвосты распределения «легче», а пик острее, чем у нормального распределения, то эксцесс положительный. Если хвосты распределения «тяжелее», а пик более «приплюснутый», чем у нормального распределения, то эксцесс отрицательный. Эксцесс вычисляется по формуле (11):
. (11)
Для оценки существенности отличия эксцесса от 0 рассчитывается стандартизованная ошибка эксцесса . Если , то распределение близко к нормальному.
На рисунке 13 приведены результаты расчета показателей формы распределения для ряда общей площади жилых помещений, приходящейся в среднем на одного жителя.
Рис. 13. Показатели формы распределения регионов РФ по показателю общей площади жилых помещений, приходящейся в среднем на одного жителя, в 2005 г.
Асимметрия для показателя общей площади жилых помещений, приходящейся в среднем на одного жителя, составила -0,59. Стандартизованная ошибка асимметрии равна 0,27. Так как 0,59 меньше, чем утроенная стандартизованная ошибка, то распределение не существенно отличается от нормального, что подтверждает сделанные ранее выводы по гистограмме, полигону и таблице частот. Асимметрия отрицательна, следовательно, распределению характерна незначительная левосторонняя асимметрия.
Эксцесс для показателя общей площади жилых помещений, приходящейся в среднем на одного жителя, составил 1,7. Стандартизованная ошибка эксцесса равна 0,53. Так как 1,7 больше, чем утроенная стандартизованная ошибка, то степень остроты пика распределения существенно отличается от степени остроты пика нормального распределения.
3. Сглаживание эмпирического распределения. проверка гипотезы о законе распределения
Процедура сглаживания анализируемого распределения заключается в замене эмпирических частот теоретическими, которые определяются по формуле теоретического распределения, но с учетом фактических значений переменной. На основе сравнения эмпирических и теоретических частот рассчитываются критерии согласия, которые используются для проверки гипотезы о соответствии исследуемого распределения тому или иному типу теоретических распределений.
Выбор конкретного типа теоретического распределения осуществляется на основе содержательного анализа ранее полученных статистических характеристик вариационного ряда, а также на визуальном анализе построенных графиков распределения. Для проверки статистической гипотезы о законе распределения наиболее универсальным является критерий ч2 - критерий Пирсона. Статистикой этого критерия является величина:
, (12)
где - число интервалов,
- эмпирические абсолютные частоты,
- абсолютные частоты теоретического распределения.
Для корректности применения критерия Пирсона необходимо, чтобы для всех интервалов. Если частота теоретического распределения, в каком либо интервале меньше, либо равна 5, то этот интервал объединяется с соседним интервалом.
Расчетное значение критерия Пирсона сравнивается с критическим для распределения хи-квадрат с степенями свободы, которое может быть вычислено в вероятностном калькуляторе. Здесь - число интервалов, - число параметров распределения. Если расчетное значение меньше критического, то принимается гипотеза о соответствии эмпирического распределения теоретическому.
Для ряда общей площади жилых помещений, приходящейся в среднем на одного жителя, проверим гипотезы о соответствии распределения нормальному и логнормальному распределениям. Предварительный анализ показал, что распределение, близко к нормальному, имеет незначительную отрицательную асимметрию. Логнормальное распределение имеет положительную асимметрию, поэтому оно, скорее всего, будет менее подходящим для анализируемого показателя.
На рисунке 14 приведены результаты расчета статистики критерия хи-квадрат для проверки гипотезы о соответствия распределения ряда общей площади жилых помещений, приходящейся в среднем на одного жителя, нормальному распределению.
Рис. 14. Результаты проверки гипотезы о соответствии распределения ряда общей площади жилых помещений, приходящейся в среднем на одного жителя, нормальному распределению с помощью критерия хи-квадрат
Статистика критерия составила 6,03. Сравним это число с критическим значением. Для этого в вероятностном калькуляторе вычислим критическое значение для хи-квадрат распределения с 4 степенями свободы и уровнем значимости : .
Так как 6,03<9,488, то гипотеза о соответствии эмпирического распределения регионов по общей площади жилых помещений, приходящейся в среднем на одного жителя, нормальному принимается, как и предполагалось ранее. На рисунке 15 представлена гистограмма для анализируемого ряда вместе с теоретическим нормальным распределением.
Рис. 15. Гистограмма и расчетная кривая нормального распределения для показателя общей площади жилых помещений, приходящейся в среднем на одного жителя, в 2005 г.
На рисунке 16 приведены результаты расчета статистики критерия хи-квадрат для проверки гипотезы о соответствия распределения ряда общей площади жилых помещений, приходящейся в среднем на одного жителя, логнормальному распределению.
Рис. 16. Результаты проверки гипотезы о соответствии распределения ряда общей площади жилых помещений, приходящейся в среднем на одного жителя, логнормальному распределению с помощью критерия хи-квадрат
Статистика критерия составила 9,78. Сравним это число с критическим значением. Для этого в вероятностном калькуляторе вычислим критическое значение для хи-квадрат распределения с 3 степенями свободы и уровнем значимости : . Так как 9,78>7,815, то гипотеза о соответствии эмпирического распределения регионов по общей площади жилых помещений, приходящейся в среднем на одного жителя, логнормальному отвергается. Если взять уровень значимости , то и гипотеза о соответствии эмпирического распределения регионов по общей площади жилых помещений, приходящейся в среднем на одного жителя, логнормальному принимается (9,78<11,345).
На рисунке 17 представлена гистограмма для анализируемого ряда вместе с теоретическим логнормальным распределением.
Рис. 17. Гистограмма и расчетная кривая логнормального распределения для показателя общей площади жилых помещений, приходящейся в среднем на одного жителя, в 2005 г.
Таким образом, распределение регионов по общей площади жилых помещений, приходящейся в среднем на одного жителя, достаточно хорошо аппроксимируется нормальным распределением, логнормальное распределение является менее подходящим для данного ряда.
Заключение
Статистический анализ ряда распределения регионов РФ по общей площади жилых помещений, приходящейся в среднем на одного жителя, позволил получить следующие результаты и выводы.
Исходная совокупность содержала один выброс (Чеченская Республика), который был удален из рассмотрения на первоначальном этапе.
Минимальное значение общей площади жилых помещений, приходящейся в среднем на одного жителя, составило 12,4 квадратных метра для республики Ингушетия, а максимальное - 27,9 квадратных метра для Чукотского автономного округа. Разница между максимальным и минимальным значением общей площади жилых помещений, приходящейся в среднем на одного жителя, в выборке равна 15,5 квадратных метров.
Половина регионов, представленных в выборке, имеют общую площадь жилых помещений, приходящуюся в среднем на одного жителя, меньше 21 квадратного метра, половина - выше этого значения. Общую площадь жилых помещений, приходящуюся в среднем на одного жителя, от 19,7 квадратных метра до 23,1 квадратных метра имеет 50% регионов, представленных в выборке. При этом у 25% регионов РФ значение общей площади жилых помещений, приходящейся в среднем на одного жителя, не превосходит 19,7 квадратных метра и у 25% регионов - выше 23,1 квадратных метра.
Модальным интервалом в таблице частот для общей площади жилых помещений, приходящейся в среднем на одного жителя, является интервал [19,06; 21,28), в который попал 31 регион, что составляет 39,24% всех регионов.
Среднее значение общей площади жилых помещений, приходящейся в среднем на одного жителя, по всем регионам составило 21,13 квадратных метра.
Стандартное отклонение показывает, что общая площадь жилых помещений, приходящаяся в среднем на одного жителя, для отдельных регионов в среднем отличается от среднего арифметического по совокупности на 2,68 квадратных метра.
Коэффициент вариации составил 12,7%, что меньше 30%, следовательно, совокупность можно считать достаточно однородной.
Асимметрия для показателя общей площади жилых помещений, приходящейся в среднем на одного жителя, составила -0,59, является отрицательной величиной, поэтому распределению характерна незначительная левосторонняя асимметрия.
Эксцесс для показателя общей площади жилых помещений, приходящейся в среднем на одного жителя, составил 1,7. Степень остроты пика распределения существенно отличается от степени остроты пика нормального распределения, поскольку значение эксцесса превосходят утроенную стандартизованную ошибку.
Предположения о нормальном законе распределения, выдвинутые на основе гистограммы, были проверены с помощью критерия Хи-квадрат Пирсона. Гипотеза о соответствии эмпирического распределения регионов по общей площади жилых помещений, приходящейся в среднем на одного жителя, нормальному принимается на уровне значимости 0,05.
Гипотеза о соответствии эмпирического распределения регионов по общей площади жилых помещений, приходящейся в среднем на одного жителя, логнормальному отвергается на уровне значимости 0,05, но принимается на уровне значимости 0,01.
Таким образом, распределение регионов по общей площади жилых помещений, приходящейся в среднем на одного жителя, достаточно хорошо аппроксимируется нормальным распределением, логнормальное распределение является менее подходящим для данного ряда.
Список использованных источников
1. Н.В. Куприенко Статистика. Анализ эмпирических распределений.: учеб. пособие. / Н.В. Куприенко, О.А. Пономарева, Д.В. Тихонов. - СПб.: Изд-во Политехн. ун-та, 2011. - 137 с.
2. Регионы России. Социально-экономические показатели. Электронный ресурс. URL: http://www.gks.ru/bgd/regl/B13_14p/IssWWW.exe/Stg/d1/04-26.htm.
3. Ефимова М. Р. Общая теория статистики [Текст] : учебник / М. Р. Ефимова, Е. В. Петрова, В. Н. Румянцев.- 2-е изд., испр. и доп. - М. : ИНФРА-М, 2001. - 416 с.
4. Теория статистики : учеб. для экон. вузов / под ред. Р. А. Шмойловой.- 4-е изд., доп. и перераб. - М. : Финансы и статистика, 2007. - 656 с.
5. Вуколов Э. А. Основы статистического анализа. Практикум по статистическим методам и исследованию операций с использованием пакетов STATISTICA и EXCEL: учебное пособие по специальности "Менеджмент организации" / Э. А. Вуколов. - Москва : Форум : ИНФРА-М, 2004. - 464 с.
6. Салин В. Н. Практикум по курсу "Статистика" в системе STATISTICA: учеб. пособие для студентов / В. Н. Салин, Э. Ю. Чурилова. - М. : Социальные отношения : Перспектива, 2002. - 188 с.
7. Боровиков В.П. STATISTICA. Искусство анализа данных на компьютере: для профессионалов / В.П. Боровиков. - 2-е изд. СПб. : - 2003. - 688 с.
Размещено на Allbest.ru
...Подобные документы
Понятие и виды статистических рядов распределения, основные формы их представления. Расчет и анализ показателей, характеризующих центральную тенденцию, вариацию, структуру и форму ряда распределения. Проведение сглаживания эмпирического распределения.
курсовая работа [698,3 K], добавлен 07.06.2011Вариация признаков в совокупности. Типы рядов распределения: атрибутивные и вариационные. Классификация по характеру вариации. Основные характеристики и графическое изображение вариационного ряда. Показатели центра распределения и колеблемости признака.
курсовая работа [110,0 K], добавлен 23.07.2009Проверка гипотезы о законе распределения. Определение значения вероятности по классам распределения случайных величин нефтеносных залежей. Расчет распределения эффективных мощностей месторождения, которое подчиняется нормальному закону распределения.
презентация [187,0 K], добавлен 15.04.2019Составление характеристики непрерывного признака. Методы составления приближенного распределения признака, имеющего непрерывное распределения. Относительные частоты и их плотности. Статистическое распределение частот интервального вариационного ряда.
творческая работа [17,8 K], добавлен 10.11.2008Интервальный вариационный ряд. Построение гистограммы плотности относительных частот. Выдвижение гипотезы о законе распределения генеральной совокупности Х. Функция плотности рассматриваемого закона распределения "Построение ее на гистограмме".
курсовая работа [104,4 K], добавлен 20.03.2011Построение полигона относительных частот, эмпирической функции распределения, кумулянты и гистограммы. Расчет точечных оценок неизвестных числовых характеристик. Проверка гипотезы о виде распределения для простого и сгруппированного ряда распределения.
курсовая работа [216,2 K], добавлен 28.09.2011Поиск вариационного ряда по выборке. Функция распределения, полигон частот. Ранжированный и дискретный вариационный ряды. Вычисление числа групп в вариационном ряду по формуле Стерджесса. Гипотеза о нормальном характере эмпирического распределения.
контрольная работа [57,6 K], добавлен 12.04.2010Расчет параметров экспериментального распределения. Вычисление среднего арифметического значения и среднего квадратического отклонения. Определение вида закона распределения случайной величины. Оценка различий эмпирического и теоретического распределений.
курсовая работа [147,0 K], добавлен 10.04.2011Определение закона распределения вероятностей результатов измерения в математической статистике. Проверка соответствия эмпирического распределения теоретическому. Определение доверительного интервала, в котором лежит значение измеряемой величины.
курсовая работа [2,0 M], добавлен 11.02.2012Задачи математической статистики. Распределение случайной величины на основе опытных данных. Эмпирическая функция распределения. Статистические оценки параметров распределения. Нормальный закон распределения случайной величины, проверка гипотезы.
курсовая работа [57,0 K], добавлен 13.10.2009Определение вероятность срабатывания устройств при аварии. Расчет математического ожидания, дисперсии и функции распределения по заданному ряду распределения. Построение интервального статистического ряда распределения значений статистических данных.
контрольная работа [148,8 K], добавлен 12.02.2012Оценивание параметров закона распределения случайной величины. Точечная и интервальная оценки параметров распределения. Проверка статистической гипотезы о виде закона распределения, нахождение параметров системы. График оценки плотности вероятности.
курсовая работа [570,4 K], добавлен 28.09.2014Числовые характеристики непрерывных величин. Точечные оценки параметров распределения. Статистическая проверка гипотез. Сравнение средних известной и неизвестной точности измерений. Критерий Хи-квадрат для проверки гипотезы о виде распределения.
курсовая работа [79,0 K], добавлен 23.01.2012Изучение сути и выдвижение предположения о законе распределения вероятности экспериментальных данных. Понятие и оценка асимметрии. Принятие решения о виде закона распределения вероятности результата. Переход от случайного значения к неслучайной величине.
курсовая работа [126,0 K], добавлен 27.04.2013Проверка выполнимости теоремы Бернулли на примере вероятности прохождения тока по цепи. Моделирование дискретной случайной величины, имеющей закон распределения Пуассона. Подтверждение гипотезы данного закона распределения с помощью критерия Колмогорова.
курсовая работа [134,2 K], добавлен 31.05.2010Критерий Пирсона, формулировка альтернативной гипотезы о распределении случайной величины. Нахождение теоретических частот и критического значения. Отбрасывание аномальных результатов измерений при помощи распределения. Односторонний критерий Фишера.
лекция [290,6 K], добавлен 30.07.2013Расчет моментов ряда, построение функции распределения и плотности функции распределения, ее аппроксимация теоретическими зависимостями. Определение стационарности ряда. Вычисление куммулятивной частоты превышения уровня. Прогноз превышения уровня.
практическая работа [137,2 K], добавлен 11.02.2010Определение математического ожидания и дисперсии параметров распределения Гаусса. Расчет функции распределения случайной величины Х, замена переменной. Значения функций Лапласа и Пуассона, их графики. Правило трех сигм, пример решения данной задачи.
презентация [131,8 K], добавлен 01.11.2013Плотность распределения непрерывной случайной величины. Характеристика особенностей равномерного и нормального распределения. Вероятность попадания случайной величины в интервал. Свойства функции распределения. Общее понятие о регрессионном анализе.
контрольная работа [318,9 K], добавлен 26.04.2013Пространства элементарных событий. Совместные и несовместные события. Функция распределения системы случайных величин. Функции распределения и плотности распределения отдельных составляющих системы случайных величин. Условные плотности распределения.
задача [45,4 K], добавлен 15.06.2012