Группировки в статистике
Изложение процесса составления статистических группировок. Структурная равноинтервальная группировка по обоим признакам. Аналитическая группировка с определением признака-фактора и результата. Комбинационная группировка по признаку-фактору и результату.
Рубрика | Экономика и экономическая теория |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 17.07.2014 |
Размер файла | 252,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Содержание
- Задание № 1
- Задание № 2
- Задание № 3
- Задание № 4
- Задание № 5
- Список литературы
- Задание № 1
- На основе данных и требований преподавателя об интервале наблюдения, составить таблицу исходных данных и выполнить следующее:
1. Структурную равноинтервальную группировку по обоим признакам. Если вариация группировочного признака значительна, то при построении группировки по признаку № 1 необходимо определить оптимальное число равноинтервальных групп, а по признаку № 2 разбить совокупность на четыре группы. При небольшом числе вариант признака, положенного в основу группировки, каждая варианта представляет отдельную группу. результаты группировки необходимо представить в таблице и сделать выводы.
2. Аналитическую группировку, для этого определить признак-фактор и признак-результат, обосновав их выбор. Результаты представить в таблице. Сделать выводы о наличии и направлении взаимосвязи между признаками.
3. Комбинационную группировку по признаку-фактору и признаку-результату. Сделать выводы.
Решение
аналитический комбинационный равноинтервальный группировка
Таблица 1. Исходные данные
п/п |
Регионы |
Среднегодовая численность занятых в экономике, млн. чел. |
Число дорожно-транспортных происшествий на 100 тыс.населения |
|
1 |
Ульяновская область |
0,61 |
124,6 |
|
2 |
Курганская область |
0,38 |
152,7 |
|
3 |
Свердловская область |
2,04 |
127,8 |
|
4 |
Тюменская область |
1,96 |
180,0 |
|
5 |
Челябинская область |
1,67 |
143,8 |
|
6 |
Алтайский край |
1,08 |
142,2 |
|
7 |
Забайкальский край |
0,49 |
125,8 |
|
8 |
Красноярский край |
1,44 |
174,6 |
|
9 |
Иркутская область |
1,14 |
148,5 |
|
10 |
Кемеровская область |
1,31 |
126,9 |
|
11 |
Новосибирская область |
1,35 |
103,5 |
|
12 |
Омская область |
0,94 |
148,7 |
|
13 |
Томская область |
0,49 |
88,9 |
|
14 |
Камчатский край |
0,19 |
196,0 |
|
15 |
Приморский край |
0,98 |
193,8 |
|
16 |
Амурская область |
0,43 |
149,9 |
|
17 |
Магаданская область |
0,09 |
218,0 |
|
18 |
Сахалинская область |
0,29 |
158,6 |
|
19 |
Еврейская автономная область |
0,08 |
242,4 |
|
20 |
Чукотский автономный округ |
0,03 |
59,2 |
|
21 |
Белгородская область |
0,70 |
95,8 |
|
22 |
Брянская область |
0,56 |
123,9 |
|
23 |
Владимирская область |
0,70 |
230,6 |
|
24 |
Воронежская область |
1,06 |
165,5 |
|
25 |
Ивановская область |
0,49 |
189,5 |
|
26 |
Калужская область |
0,49 |
181,1 |
|
27 |
Костромская область |
0,31 |
145,2 |
|
28 |
Курская область |
0,58 |
173,7 |
|
29 |
Липецкая область |
0,54 |
143,5 |
|
30 |
Московская область |
2,93 |
174,7 |
1. Структурная равноинтервальная группировку по обоим признакам.
Группировка - это распределение единиц совокупности по группам в соответствии с группировочным признаком. Назначение группировки состоит в том, что этот метод обеспечивает обобщение данных, представление их в компактном, обозримом виде.
Формула Стерджесса для определения оптимального числа групп:
n=1+3.322*lgN,
где n - число групп;
N - число единиц совокупности.
N=30
n=1+3.322*lgN = 1+3.322*lg30=6
Число групп: n=6.
Признак № 1: Среднегодовая численность занятых в экономике, млн. чел.
Ширина интервала составит:
Xmax - максимальное значение группировочного признака в совокупности.
Xmin - минимальное значение группировочного признака.
Результаты группировки оформим в виде таблицы:
Таблица 1.1. Структурная равноинтервальная группировка по признаку 1
Группы |
№ совокупности |
Частота fi |
|
0.03 - 0.51 |
1,2,3,4,5,6,7,8,9,10,11,12 |
12 |
|
0.51 - 0.99 |
13,14,15,16,17,18,19,20 |
8 |
|
0.99 - 1.47 |
21,22,23,24,25,26 |
6 |
|
1.47 - 1.95 |
27 |
1 |
|
1.95 - 2.43 |
28,29 |
2 |
|
2.43 - 2.91 |
30 |
1 |
Вывод: На основании данной таблицы можно сделать вывод: самая многочисленная группа регионов (12 регионов из 30 или 40,00%) имеет значения от 0,03 до 0,51 млн. чел. Самая малочисленная группировка - по одному региону (3,33%) в интервалах от 1,47 до 1,95 млн.чел. и от 2,43 до 2,91 млн.чел.
Признак № 2 - число дорожно-транспортных происшествий на 100 тыс. человек населения
Ширина интервала составит:
Xmax - максимальное значение группировочного признака в совокупности.
Xmin - минимальное значение группировочного признака.
Результаты группировки оформим в виде таблицы:
Таблица 1.2. Структурная группировка по признаку 2
Группы |
№ совокупности |
Частота fi |
|
59.2 - 105 |
1,2,3,4 |
4 |
|
105 - 150.8 |
5,6,7,8,9,10,11,12,13,14,15,16 |
12 |
|
150.8 - 196.6 |
17,18,19,20,21,22,23,24,25,26,27 |
11 |
|
196.6 - 242.4 |
28,29,30 |
3 |
Вывод: наименьший удельный вес в группах от 196,6 до 242,4 дтп (один регион из 30 или 3,33%), самый большой удельный вес в группе от 105 до 150,8 дтп. (12 регионов или 40%)
2. Аналитическая группировка.
Служит для выявления аналитической зависимости между группировочными признаками.
В данном случае признаком-фактором является среднегодовая численность занятых в экономике, млн. чел., а признаком результатом - число дорожно-транспортных происшествий на 100 тыс. населения.
Таблица 1.3. Аналитическая таблица
Группы |
Кол-во, nj |
?Y |
Ycp = ?Yj / nj |
|
0.03 - 0.51 |
12 |
1907.3 |
158.94 |
|
0.51 - 1 |
8 |
1234.6 |
154.33 |
|
1 - 1.48 |
6 |
861.2 |
143.53 |
|
1.48 - 1.97 |
2 |
323.8 |
161.9 |
|
1.97 - 2.45 |
1 |
127.8 |
127.8 |
|
2.45 - 2.93 |
1 |
174.7 |
174.7 |
|
Итого |
30 |
4629.4 |
Анализируя данную таблицу, можно сделать вывод: что между рассматриваемыми признаками не наблюдается ярко выраженной связи.
3. Проследить зависимость между признаками можно также на основе комбинационной группировки. Комбинационная группировка осуществляется по двум и более признакам, взятым в сочетании.
Таблица 1.4. Комбинационная таблица числа занятых в экономике и число дорожно-транспортных происшествий.
Среднегодовая численность занятых в экономике, млн. чел. |
Число дорожно-транспортных происшествий на 100 тыс. населения |
Итого количество регионов |
||||
59,2 - 105 |
105 - 150,8 |
150,8 - 196,6 |
196,6 - 242,4 |
|||
0.03 - 0.51 |
2 |
3 |
5 |
2 |
12 |
|
0.51 - 1 |
1 |
4 |
2 |
1 |
8 |
|
1 - 1.48 |
1 |
3 |
2 |
- |
6 |
|
1.48 - 1.97 |
- |
1 |
1 |
- |
2 |
|
1.97 - 2.45 |
- |
1 |
- |
- |
1 |
|
2.45 - 2.93 |
- |
- |
1 |
- |
1 |
|
Итого количество регионов |
4 |
12 |
11 |
3 |
30 |
На основании полученных данных, можно сделать вывод: между рассматриваемыми признаками не наблюдается явной связи.
Задание № 2
1. На основе структурных группировок из задания 1 построить вариационные частотные и кумулятивные ряды распределения (по каждому признаку), оформить в таблицы, изобразить графически.
2. Проанализировать вариационные ряды распределения, вычислив для каждого из них:
· среднее арифметическое значение признака;
· медиану, квартили и моду;
· среднее квадратическое отклонение;
· коэффициент вариации.
3. Проверить теорему о разложении дисперсии, используя данные о аналитической группировки.
4. Изобразить корреляционное поле. Построить уравнение регрессии. Определить тесноту связи между признаками, используя дисперсионный и корреляционный анализ.
5. Сделать выводы.
Ряд распределения - это числовой ряд, который представляет собой упорядоченное распределение единиц статистической совокупности. Он характеризует состав (структуру) изучаемого явления.
Объем совокупности: N = 30.
Таблица 2.1. Вариационный частотный и кумулятивный ряд распределения по среднегодовой численности, занятых в экономике, млн. чел.
Группы |
xi |
Кол-во, fi |
xi * fi |
Накопленная частота, S |
(x - xср)2*f |
|
0.03 - 0.51 |
0.27 |
12 |
3.24 |
12 |
3.98 |
|
0.51 - 0.99 |
0.75 |
8 |
6 |
20 |
0.0737 |
|
0.99 - 1.47 |
1.23 |
6 |
7.38 |
26 |
0.88 |
|
1.47 - 1.95 |
1.71 |
1 |
1.71 |
27 |
0.75 |
|
1.95 - 2.43 |
2.19 |
2 |
4.38 |
29 |
3.61 |
|
2.43 - 2.91 |
2.67 |
1 |
2.67 |
30 |
3.33 |
|
Итого |
30 |
25.38 |
12.63 |
Гистограмма - графическое изображение интервального ряда распределения. При ее построении на оси абсцисс откладывают интервалы ряда. Над осью абсцисс строятся прямоугольники, основанием которых является интервал, а высота - соответствующая этому интервалу частота.
Кумулята - ломаная линия, изображающая ряд накопленных частот. Накопленные частоты наносятся в системе координат в виде ординат для границ интервалов; соединяя нанесенные точки отрезками прямых, получаем кумуляту. Кумуляту называют также полигоном накопленных частот.
Рис.2.1. Гистограмма вариационного ряда по среднегодовой численности занятых в экономике, млн.чел.
Рис. 2.2. Кумулята вариационного ряда по среднегодовой численности занятых в экономике, млн.чел.
Рис. 2.3. Полигон вариационного ряда по среднегодовой численности занятых в экономике, млн. чел.
Таблица 2.2. Вариационный частотный и кумулятивный ряд распределения по числу дорожно-транспортных происшествий на 100 тыс. населения
Группы |
xi |
Кол-во, fi |
xi * fi |
Накопленная частота, S |
(x - xср)2*f |
|
59.2 - 105 |
82.1 |
4 |
328.4 |
4 |
17237.94 |
|
105 - 150.8 |
127.9 |
12 |
1534.8 |
16 |
4726.68 |
|
150.8 - 196.6 |
173.7 |
11 |
1910.7 |
27 |
7409.33 |
|
196.6 - 242.4 |
219.5 |
3 |
658.5 |
30 |
15445.62 |
|
Итого |
30 |
4432.4 |
44819.57 |
Рис. 2.4. Гистограмма вариационного ряда по числу дорожно-транспортных происшествий.
Рис. 2.5. Кумулята вариационного ряда по числу дорожно-транспортных происшествий.
Рис. 2.6. Полигон вариационного ряда по числу дорожно-транспортных происшествий.
Признак № 1: Среднегодовая численность занятых в экономике, млн. чел.
Таблица 2.3. Вычисление среднего арифметического значения признака, среднего квадратического отклонения для вариационного ряда среднегодовой численности, занятых в экономике
Группы |
xi |
Кол-во, fi |
xi * fi |
Накопленная частота, S |
(x - xср)2*f |
|
0.03 - 0.51 |
0.27 |
12 |
3.24 |
12 |
3.98 |
|
0.51 - 0.99 |
0.75 |
8 |
6 |
20 |
0.0737 |
|
0.99 - 1.47 |
1.23 |
6 |
7.38 |
26 |
0.88 |
|
1.47 - 1.95 |
1.71 |
1 |
1.71 |
27 |
0.75 |
|
1.95 - 2.43 |
2.19 |
2 |
4.38 |
29 |
3.61 |
|
2.43 - 2.91 |
2.67 |
1 |
2.67 |
30 |
3.33 |
|
Итого |
30 |
25.38 |
12.63 |
Мода
Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
где x0 - начало модального интервала; h - величина интервала; f2 -частота, соответствующая модальному интервалу; f1 - предмодальная частота; f3 - послемодальная частота.
Выбираем в качестве начала интервала 0.03, так как именно на этот интервал приходится наибольшее количество.
Наиболее часто встречающееся значение ряда - 0.39
Медиана
Медиана делит выборку на две части: половина вариант меньше медианы, половина - больше.
В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 0.03 - 0.51, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).
Таким образом, 50% единиц совокупности будут меньше по величине 0.69
Квартили.
Квартили - это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине Q1; 25% будут заключены между Q1 и Q2; 25% - между Q2 и Q3; остальные 25% превосходят Q3.
Таким образом, 25% единиц совокупности будут меньше по величине 0.33 Q2 совпадает с медианой, Q2 = 0.69
Остальные 25% превосходят значение 1.19.
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
Среднее квадратическое отклонение (средняя ошибка выборки).
Каждое значение ряда отличается от среднего значения 0.85 в среднем на 0.65
Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.
Поскольку v>70%, то совокупность приближается к грани неоднородности, а вариация сильная.
Признак № 2 - число дорожно-транспортных происшествий на 100 тыс. населения
Таблица 2.4. Вычисление среднего арифметического значения признака для вариационного ряда распределения числа дорожно-транспортных происшествий на 100 тыс. населения
Группы |
xi |
Кол-во, fi |
xi * fi |
Накопленная частота, S |
(x - xср)2*f |
|
59.2 - 105 |
82.1 |
4 |
328.4 |
4 |
17237.94 |
|
105 - 150.8 |
127.9 |
12 |
1534.8 |
16 |
4726.68 |
|
150.8 - 196.6 |
173.7 |
11 |
1910.7 |
27 |
7409.33 |
|
196.6 - 242.4 |
219.5 |
3 |
658.5 |
30 |
15445.62 |
|
Итого |
30 |
4432.4 |
44819.57 |
Мода
Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
где x0 - начало модального интервала; h - величина интервала; f2 -частота, соответствующая модальному интервалу; f1 - предмодальная частота; f3 - послемодальная частота.
Выбираем в качестве начала интервала 105, так как именно на этот интервал приходится наибольшее количество.
Наиболее часто встречающееся значение ряда - 145.71
Медиана
Медиана делит выборку на две части: половина вариант меньше медианы, половина - больше.
В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 105 - 150.8, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).
Таким образом, 50% единиц совокупности будут меньше по величине 146.98
Квартили.
Квартили - это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине Q1; 25% будут заключены между Q1 и Q2; 25% - между Q2 и Q3; остальные 25% превосходят Q3.
Таким образом, 25% единиц совокупности будут меньше по величине 118.36
Q2 совпадает с медианой, Q2 = 146.98
Остальные 25% превосходят значение 177.86.
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
Среднее квадратическое отклонение (средняя ошибка выборки).
Каждое значение ряда отличается от среднего значения 147.75 в среднем на 38.65
Относительные показатели вариации.
К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.
Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.
Поскольку v ? 30%, то совокупность однородна, а вариация слабая. Полученным результатам можно доверять.
3.По аналитической группировке измеряют связь при помощи эмпирического корреляционного отношения. Оно основано на правиле разложения дисперсии: общая дисперсия равна сумме внутригрупповой и межгрупповой дисперсий.
1. Находим средние значения каждой группы.
Общее средние значение для всей совокупности:
2. Дисперсия внутри группы при относительном постоянстве признака-фактора возникает за счет других факторов (не связанных с изучением). Эта дисперсия называется остаточной:
Расчет для группы: 0.03 - 0.51 (1,2,3,4,5,6,7,8,9,10,11,12)
Таблица 2.5 Расчетная таблица
yj |
(yj - yср)2 |
Результат |
|
59.2 |
(59.2 - 158.94)2 |
9948.4 |
|
242.4 |
(242.4 - 158.94)2 |
6965.29 |
|
218 |
(218.0 - 158.94)2 |
3487.89 |
|
196 |
(196.0 - 158.94)2 |
1373.32 |
|
158.6 |
(158.6 - 158.94)2 |
0.12 |
|
145.2 |
(145.2 - 158.94)2 |
188.83 |
|
152.7 |
(152.7 - 158.94)2 |
38.96 |
|
149.9 |
(149.9 - 158.94)2 |
81.75 |
|
125.8 |
(125.8 - 158.94)2 |
1098.37 |
|
88.9 |
(88.9 - 158.94)2 |
4905.84 |
|
189.5 |
(189.5 - 158.94)2 |
933.81 |
|
181.1 |
(181.1 - 158.94)2 |
490.99 |
|
Итого |
29513.57 |
Определим групповую (частную) дисперсию для 1-ой группы:
Расчет для группы: 0.51 - 1 (13,14,15,16,17,18,19,20)
Таблица 2.6. Расчетная таблица
yj |
(yj - yср)2 |
Результат |
|
143.5 |
(143.5 - 154.33)2 |
117.18 |
|
123.9 |
(123.9 - 154.33)2 |
925.68 |
|
173.7 |
(173.7 - 154.33)2 |
375.39 |
|
124.6 |
(124.6 - 154.33)2 |
883.58 |
|
95.8 |
(95.8 - 154.33)2 |
3425.18 |
|
230.6 |
(230.6 - 154.33)2 |
5817.88 |
|
148.7 |
(148.7 - 154.33)2 |
31.64 |
|
193.8 |
(193.8 - 154.33)2 |
1558.28 |
|
Итого |
13134.8 |
Определим групповую (частную) дисперсию для 2-ой группы:
Расчет для группы: 1 - 1.48 (21,22,23,24,25,26)
Таблица 2.7. Расчетная таблица
yj |
(yj - yср)2 |
Результат |
|
165.5 |
(165.5 - 143.53)2 |
482.53 |
|
142.2 |
(142.2 - 143.53)2 |
1.78 |
|
148.5 |
(148.5 - 143.53)2 |
24.67 |
|
126.9 |
(126.9 - 143.53)2 |
276.67 |
|
103.5 |
(103.5 - 143.53)2 |
1602.67 |
|
174.6 |
(174.6 - 143.53)2 |
965.14 |
|
Итого |
3353.45 |
Определим групповую (частную) дисперсию для 3-ой группы:
Расчет для группы: 1.48 - 1.97 (27,28)
Таблица 2.8. Расчетная таблица
yj |
(yj - yср)2 |
Результат |
|
143.8 |
(143.8 - 161.9)2 |
327.61 |
|
180 |
(180.0 - 161.9)2 |
327.61 |
|
Итого |
655.22 |
Определим групповую (частную) дисперсию для 4-ой группы:
Расчет для группы: 1.97 - 2.45 (29)
Таблица 2.9. Расчетная таблица
yj |
(yj - yср)2 |
Результат |
|
127.8 |
(127.8 - 127.8)2 |
0 |
|
Итого |
0 |
Определим групповую (частную) дисперсию для 5-ой группы:
Расчет для группы: 2.45 - 2.93 (30)
Таблица 2.10. Расчетная таблица
yj |
(yj - yср)2 |
Результат |
|
174.7 |
(174.7 - 174.7)2 |
0 |
|
Итого |
0 |
Определим групповую (частную) дисперсию для 6-ой группы:
3. Внутригрупповые дисперсии объединяются в средней величине внутригрупповых дисперсий:
Средняя из частных дисперсий:
4. Межгрупповая дисперсия относится на счет изучаемого фактора, она называется факторной
д2 = ((158.94-154.31)2*12 + (154.33-154.31)2*8 + (143.53-154.31)2*6 + (161.9-154.31)2*2 + (127.8-154.31)2*1 + (174.7-154.31)2*1 + ...)/30 = 72.93
Определяем общую дисперсию по всей совокупности, используя правило сложения дисперсий:
у2 = 1555.23 + 72.93 = 1628.17
Проверка:
Проверим этот вывод путем расчета общей дисперсии обычным способом:
Таблица 2.11. Расчетная таблица
yi |
(yi - yср)2 |
Результат |
|
59.2 |
(59.2 - 154.31)2 |
9046.55 |
|
242.4 |
(242.4 - 154.31)2 |
7759.26 |
|
218 |
(218.0 - 154.31)2 |
4055.99 |
|
196 |
(196.0 - 154.31)2 |
1737.78 |
|
158.6 |
(158.6 - 154.31)2 |
18.38 |
|
145.2 |
(145.2 - 154.31)2 |
83.05 |
|
152.7 |
(152.7 - 154.31)2 |
2.6 |
|
149.9 |
(149.9 - 154.31)2 |
19.48 |
|
125.8 |
(125.8 - 154.31)2 |
813.01 |
|
88.9 |
(88.9 - 154.31)2 |
4278.9 |
|
189.5 |
(189.5 - 154.31)2 |
1238.1 |
|
181.1 |
(181.1 - 154.31)2 |
717.53 |
|
143.5 |
(143.5 - 154.31)2 |
116.93 |
|
123.9 |
(123.9 - 154.31)2 |
924.97 |
|
173.7 |
(173.7 - 154.31)2 |
375.84 |
|
124.6 |
(124.6 - 154.31)2 |
882.88 |
|
95.8 |
(95.8 - 154.31)2 |
3423.81 |
|
230.6 |
(230.6 - 154.31)2 |
5819.66 |
|
148.7 |
(148.7 - 154.31)2 |
31.51 |
|
193.8 |
(193.8 - 154.31)2 |
1559.2 |
|
165.5 |
(165.5 - 154.31)2 |
125.14 |
|
142.2 |
(142.2 - 154.31)2 |
146.73 |
|
148.5 |
(148.5 - 154.31)2 |
33.79 |
|
126.9 |
(126.9 - 154.31)2 |
751.49 |
|
103.5 |
(103.5 - 154.31)2 |
2581.99 |
|
174.6 |
(174.6 - 154.31)2 |
411.55 |
|
143.8 |
(143.8 - 154.31)2 |
110.53 |
|
180 |
(180.0 - 154.31)2 |
659.8 |
|
127.8 |
(127.8 - 154.31)2 |
702.96 |
|
174.7 |
(174.7 - 154.31)2 |
415.62 |
|
Итого |
48845.03 |
Рис. 2.7 Поле корреляции и уравнение линейной регрессии
Для расчета параметров регрессии построим расчетную таблицу
Таблица 2.12.Расчетная таблица для нахождения параметров регрессии
x |
y |
x2 |
y2 |
x * y |
|
0.61 |
124.6 |
0.37 |
15525.16 |
76.01 |
|
0.38 |
152.7 |
0.14 |
23317.29 |
58.03 |
|
2.04 |
127.8 |
4.16 |
16332.84 |
260.71 |
|
1.96 |
180 |
3.84 |
32400 |
352.8 |
|
1.67 |
143.8 |
2.79 |
20678.44 |
240.15 |
|
1.08 |
142.2 |
1.17 |
20220.84 |
153.58 |
|
0.49 |
125.8 |
0.24 |
15825.64 |
61.64 |
|
1.44 |
174.6 |
2.07 |
30485.16 |
251.42 |
|
1.14 |
148.5 |
1.3 |
22052.25 |
169.29 |
|
1.31 |
126.9 |
1.72 |
16103.61 |
166.24 |
|
1.35 |
103.5 |
1.82 |
10712.25 |
139.73 |
|
0.94 |
148.7 |
0.88 |
22111.69 |
139.78 |
|
0.49 |
88.9 |
0.24 |
7903.21 |
43.56 |
|
0.19 |
196 |
0.0361 |
38416 |
37.24 |
|
0.98 |
193.8 |
0.96 |
37558.44 |
189.92 |
|
0.43 |
149.9 |
0.18 |
22470.01 |
64.46 |
|
0.09 |
218 |
0.0081 |
47524 |
19.62 |
|
0.29 |
158.6 |
0.0841 |
25153.96 |
45.99 |
|
0.08 |
242.4 |
0.0064 |
58757.76 |
19.39 |
|
0.03 |
59.2 |
0.0009 |
3504.64 |
1.78 |
|
0.7 |
95.8 |
0.49 |
9177.64 |
67.06 |
|
0.56 |
123.9 |
0.31 |
15351.21 |
69.38 |
|
0.7 |
230.6 |
0.49 |
53176.36 |
161.42 |
|
1.06 |
165.5 |
1.12 |
27390.25 |
175.43 |
|
0.49 |
189.5 |
0.24 |
35910.25 |
92.86 |
|
0.49 |
181.1 |
0.24 |
32797.21 |
88.74 |
|
0.31 |
145.2 |
0.0961 |
21083.04 |
45.01 |
|
0.58 |
173.7 |
0.34 |
30171.69 |
100.75 |
|
0.54 |
143.5 |
0.29 |
20592.25 |
77.49 |
|
2.93 |
174.7 |
8.58 |
30520.09 |
511.87 |
|
25.35 |
4629.4 |
34.24 |
763223.18 |
3881.33 |
Параметры уравнения регрессии.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
Коэффициент корреляции
Ковариация.
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
Линейный коэффициент корреляции принимает значения от -1 до +1.
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 < rxy < 0.3: слабая;
0.3 < rxy < 0.5: умеренная;
0.5 < rxy < 0.7: заметная;
0.7 < rxy < 0.9: высокая;
0.9 < rxy < 1: весьма высокая;
В нашем примере связь между признаком Y фактором X слабая и обратная.
Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b:
Уравнение регрессии (оценка уравнения регрессии).
Линейное уравнение регрессии имеет вид y = -2.38 x + 156.32
Коэффициентам уравнения линейной регрессии можно придать экономический смысл.
Коэффициент регрессии b = -2.38 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y понижается в среднем на -2.38.
Коэффициент a = 156.32 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями.
Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.
Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.
Связь между у и х определяет знак коэффициента регрессии b (если > 0 - прямая связь, иначе - обратная). В нашем примере связь обратная.
Задание № 3
1.Используя результаты расчетов, выполненных в задании 2 курсовой работы по признаку 1, и полагая, что эти данные получены при помощи собственно-случайного 40% бесповторного отбора, определить:
а) пределы, за которые с доверительной вероятностью 0,954 не выйдет значение признака, рассчитанное по генеральной совокупности;
б) как нужно изменить объем выборки, чтобы снизить предельную ошибку средней величины на 50%.
2. Используя результаты расчетов, выполненных в задании № 2 курсовой работы по признаку 2 и полагая, что эти данные получены при помощи повторного отбора, определить:
а) пределы, за которые в генеральной совокупности не выйдет значение доли предприятий, у которых индивидуальные значения признака превышают моду (уровень доверительной вероятности установите по своему усмотрению);
б) как изменить объем выборки, чтобы снизить предельную ошибку доли на 30%.
Решение
1. а) Возможные расхождения между характеристиками выборочной и генеральной совокупности измеряются средней ошибкой выборки, которая представляет собой среднее квадратическое отклонение возможных значений выборочных характеристик (оценок) от генеральных. Она определяется в зависимости от метода отбора.
При бесповторном отборе, при котором повторное попадание в выборку одних и тех же единиц исключено, средняя ошибка выборки определяется следующим образом:
Средняя ошибка выборки для признака № 1:
(тыс.кв.км.)
Т.к. величина выборки: n = 30 регионов - 40%
Значит: N = 75 регионов - 100%
Теория устанавливает соотношение между предельной и средней ошибкой выборки, гарантируемое с некоторой вероятностью:
? = µ * t ,
где ? - предельная ошибка выборки
µ - средняя ошибка выборки
t - коэффициент доверия.
При этом, коэффициент доверия определяется в зависимости от того, с какой достоверной вероятностью надо гарантировать результаты выборочного исследования. Для определения коэффициента доверия пользуются готовыми таблицами. Некоторые наиболее часто встречающиеся значения этого коэффициента приведены ниже:
Доверительная вероятность |
Коэффициент доверия |
|
0,683 |
1 |
|
0,954 |
2 |
|
0,990 |
2,5 |
|
0,997 |
3 |
Предельная ошибка выборки для признак-фактора
? = 0,09* 2 = 0.18 млн.чел.
Таким образом, границы доверительного интервала признак фактора могут быть представлены как:
, то есть
Где - среднее значение переменной в выборке (выборочное среднее)
- среднее генеральной совокупности.
Границы доверительного интервала признак-фактора могут быть определены:
, то есть
или
б) Чтобы снизить предельную ошибку средней величины на 50% (в 2 раза) необходимо, чтобы предельная ошибка выборки (?) уменьшилась в два раза, поэтому необходимая численность выборки составит:
регион
Следовательно, для того, чтобы снизить предельную ошибку средней величины на 50%, необходимая численность выборки должна составлять 55 регионов.
2. а) Возможные расхождения между характеристиками выборочной и генеральной совокупности измеряются средней ошибкой выборки, которая представляет собой среднее квадратическое отклонение возможных значений выборочных характеристик (оценок) от генеральных. Она определяется в зависимости от метода обора.
Доля альтернативного признака в выборочной совокупности определяется по формуле:
р = m / n ,
где m - число элементов совокупности, которые больше моды ( m =17).
n - объем выборочной совокупности
р = 17 / 30 = 0,26*100%=256,67%
При повторном отборе, когда каждая отобранная и обследованная единица возвращается в генеральную совокупность, где ей опять предоставляется возможность попасть в выборку, средняя ошибка выборки определяется следующим образом:
Теория устанавливает соотношения между предельной и средней ошибкой выборки, гарантируемая с некоторой вероятностью. Выберем доверительную вероятность 0,954. Значит, коэффициент доверия равен 2.
? = µ * t ,
Где ? - предельная ошибка выборки
µ - средняя ошибка выборки
t - коэффициент доверия.
? =0,09 *2= 0,18
Определим пределы, за которые не выйдет значение доли регионов, у которых Число собственных легковых автомобилей на 1000 человек населения выше моды:
б) При повторном отборе необходимая численность выборки:
n = (w*(1 - w)*t2 ) / ?2 (1)
Считая w маломеняющейся при изменении выборки, имеем:
n = (w*(1 - w)*t2 ) / (0,7?)2 (2)
Разделив (1) на (2) имеем:
Из (1) выражаем: и подставим во (2):
n = 61,2региона.
При повторном отборе необходимая численность выборки должна составлять 62 региона.
Задание № 4
1. Пользуясь данными из статистических ежегодников, составить 2 динамических ряда для характеристики изменения социально-экономических показателей по районам Псковской области.
Районы и направление определяются для каждого студента по последним цифрам номера зачетной книжки.
2. Рассчитать:
а) Среднегодовой уровень динамики;
б) Цепные и базисные показатели динамики: абсолютный прирост, темп роста, темп прироста;
в) Средний абсолютный прирост, средний темп роста, средний темп прироста.
3. Произвести сглаживание ряда динамики трехлетней скользящей средней.
4. Произвести аналитическое выравнивание ряда динамики.
5. Изобразить фактический и выровненный ряды динамики графически.
6. Сделать сравнительные выводы и прогнозы по районам. Дать общую характеристику развития районов по данному направлению.
Решение
Туризм в Псковском и Печорском районах
Таблица 4.1. Число посещений музеев на 100 человек населения в 2005- 2012 гг.
Год |
Число посещений музеев на 1000 человек населения. |
||
Псковский район |
Печорский район |
||
2005 |
145 |
235 |
|
2006 |
163 |
248 |
|
2007 |
165 |
249 |
|
2008 |
165 |
253 |
|
2009 |
166 |
265 |
|
2010 |
167 |
268 |
|
2011 |
169 |
273 |
|
2012 |
170 |
293 |
а) Динамические средние
Средний уровень интервального ряда, если интервалы расположены через равные промежутки времени определяется как простое среднее арифметическое:
где - значение уровня ряда динамики;
п - число уровней ряда динамики;
Псковский район:
=
=
Печорский район:
=
б) Базисные и цепные показатели динамики
Псковский район
Таблица 4.2. Число посещений музеев на 1000 населения в 2005 - 2012 г.г.
Год |
Число посещений музеев на 1000 человек населения. (по Псковскому району) |
Базисные показатели |
Цепные показатели |
|||||
Абсолютный прирост, тыс. чел. |
Темп роста, % |
Прирост, % |
Абсолютный прирост, тыс. чел. |
Темп роста, % |
Прирост, % |
|||
2005 |
145 |
0 |
100 |
0 |
* |
* |
* |
|
2006 |
163 |
18 |
112,41 |
12,41 |
18 |
112,41 |
12,41 |
|
2007 |
165 |
20 |
113,79 |
13,79 |
2 |
101,23 |
1,23 |
|
2008 |
165 |
20 |
113,79 |
13,79 |
0 |
100,00 |
0,00 |
|
2009 |
166 |
21 |
114,48 |
14,48 |
1 |
100,61 |
0,61 |
|
2010 |
167 |
22 |
115,17 |
15,17 |
1 |
100,60 |
0,60 |
|
2011 |
169 |
24 |
116,55 |
16,55 |
2 |
101,20 |
1,20 |
|
2012 |
170 |
25 |
117,24 |
17,24 |
1 |
100,59 |
0,59 |
|
Всего: |
1310 |
* |
* |
* |
* |
* |
* |
Базисные показатели динамики:
Абсолютный прирост:
Темп роста:
Темп прироста:
Вывод: Число посещений музеев на 1000 человек населения в Псковском районе в 2012г. по сравнению с 2005 годом увеличилось на 25, темп роста составил 117,24%.
Цепные показатели динамики:
Абсолютный прирост:
Темп роста:
Темп прироста:
Вывод: Число посещений музеев на 1000 человек населения в Псковском районе в 2012г. по сравнению с 2011 годом увеличилось на 1, темп роста составил 100,59%.
Печорский район
Таблица 4.3. Число посещений музеев на 1000 населения в 2005 - 2012 г.г.
Год |
Число посещений музеев на 1000 человек населения. (по Печорскому району) |
Базисные показатели |
Цепные показатели |
|||||
Абсолютный прирост, тыс. чел. |
Темп роста, % |
Прирост, % |
Абсолютный прирост, тыс. чел. |
Темп роста, % |
Прирост, % |
|||
2005 |
235 |
0 |
100 |
0 |
* |
Подобные документы
Аналитическая группировка по факторному признаку. Построение вариационного частотного и кумулятивного рядов распределения на основе равно интервальной структурной группировки результативного признака – дивидендов, начисленных по результатам деятельности.
контрольная работа [109,4 K], добавлен 07.05.2009Структурная группировка по рыночной капитализации компаний. Расчет среднего процента выполнения плана выпуска продукции. Взаимосвязь ВВП на душу населения и среднего уровня потребительских расходов. Мультипликативная модель динамики себестоимости.
контрольная работа [576,0 K], добавлен 27.11.2013Систематизация материалов статистического наблюдения. Понятие статистической сводки как сводной характеристики объекта исследования. Статистические группировки, их виды. Принципы выбора группированного признака. Статистические таблицы и ряд распределения.
реферат [196,8 K], добавлен 04.10.2016Структурно-аналитическая группировка по двум признакам-факторам, расчет среднего значения группировочного признака. Сущность правила сложения дисперсий и коэффициента регрессии. Характеристика и расчет систематической вариации результативного порядка.
контрольная работа [86,4 K], добавлен 02.09.2009Понятие сводки и группировки статистических данных, их содержание, виды и основные элементы. Цели и задачи сводки и группировки данных, решаемые задачи и правила проведения. Этапы составления и назначение, виды и характеристика статистических таблиц.
контрольная работа [22,6 K], добавлен 20.04.2009Основные виды статистических группировок. Значения группировочного признака. Интервальный ряд распределения. Проведение статистического исследования и формула Стерджесса. Основные ряды распределения и группировки. Графические способы отображения.
реферат [2,3 M], добавлен 19.12.2010Понятие и виды статистической группировки, производимой с целью установления статистических связей и закономерностей, выявления структуры изучаемой совокупности. Построение интервального ряда распределения предприятий по признаку "торговая площадь".
дипломная работа [1,6 M], добавлен 14.02.2016Структурная группировка по данным, полученным в ходе контроля диаметра заготовок. Аналитическая группировка зависимости оплаты труда от стажа работы. Расчет средних величин. Вычисление ошибки выборки при тестировании. Определение индексов отпускных цен.
контрольная работа [111,7 K], добавлен 08.08.2011Задачи сводки и её основное содержание. Сведение воедино материалов статистического наблюдения и получение обобщающих статистических показателей как цель сводки. Разновидности группировок, задачи группировок и их значение в статистическом исследовании.
реферат [15,1 K], добавлен 04.06.2010Методика ранжирования данных по размеру ОФ и их группировки. Расчет равновеликого интервала группировки. Определение средних затрат времени на продукцию предприятия в базисном и отчетном годах. Характер взаимосвязи цепных и базисных темпов роста.
контрольная работа [51,9 K], добавлен 14.10.2009Основные показатели, характеризующие рабочих фирмы. Аналитическая группировка для оценки связи уровня образования со стажем работы, уровнями выработки и заработной платы. Среднее квадратическое отклонение размера вклада в районном отделении Сбербанка.
контрольная работа [113,2 K], добавлен 25.10.2010Структурная группировка предприятий по среднегодовой стоимости промышленно производственных основных фондов. Построение гистограммы распределения фирм. Кумулятивная кривая их распределения по среднегодовой стоимости производственных основных фондов.
контрольная работа [176,6 K], добавлен 22.08.2014Понятие о статистической сводке и группировке. Группировка предприятий по объему реализованной продукции, по численности и фонду заработной платы, товарной продукции в фиксированных оптовых ценах. Проведение экономической интерпретации сделанному анализу.
курсовая работа [33,6 K], добавлен 14.06.2014Понятие о классификациях, группировках и номенклатурах, их роль в статистическом исследовании. Отраслевые классификации видов экономической деятельности. Классификация продукции, работ, услуг. Экономические группировки и системы обозначения в статистике.
реферат [37,5 K], добавлен 10.10.2014Основные категории статистики. Группировка - основа научной обработки данных статистики. Содержание сводки и статистическая совокупность. Построение вариационного, ранжированного и дискретного рядов распределения. Группировка предприятий по числу рабочих.
контрольная работа [23,3 K], добавлен 17.03.2015Виды группировок, используемых в статистике. Разнообразие взаимосвязей между признаками, выступающими в роли причины или следствия явления. Структурные группировки предприятий по численности работников, по доходу и по объему перевезенных грузов.
контрольная работа [565,1 K], добавлен 19.01.2015Особенности построения статистических сводок и рядов распределения в экономическом исследовании. Практическое применение метода группировок при анализе кадрового состава современной организации. Этапы изучения взаимосвязей социально-экономических явлений.
курсовая работа [240,4 K], добавлен 20.01.2015Метод статистических группировок: сущность, этапы построения и основные классификации. Определение числа групп, расчет ширины интервала группировки. Определение признаков, которые в комбинации друг с другом будут характеризовать каждую выделенную группу.
курсовая работа [538,2 K], добавлен 26.10.2009Группировка предприятий по факторному признаку, расчет размаха вариации и длины интервала. Виды и формулы расчета средних величин и дисперсии. Расчет абсолютного прироста, темпов роста и темпов прироста, среднегодовых показателей численности населения.
контрольная работа [219,7 K], добавлен 24.02.2011Статистическое наблюдение. Понятие и содержание статистической сводки. Группировка – основа статистической сводки. Статистические ряды распределения. Осуществление конкретной аналитической группировки. Табличное представление статистических данных.
курсовая работа [172,8 K], добавлен 22.12.2010