Группировки в статистике

Изложение процесса составления статистических группировок. Структурная равноинтервальная группировка по обоим признакам. Аналитическая группировка с определением признака-фактора и результата. Комбинационная группировка по признаку-фактору и результату.

Рубрика Экономика и экономическая теория
Вид контрольная работа
Язык русский
Дата добавления 17.07.2014
Размер файла 252,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Содержание

  • Задание № 1
  • Задание № 2
  • Задание № 3
  • Задание № 4
  • Задание № 5
  • Список литературы
  • Задание № 1
  • На основе данных и требований преподавателя об интервале наблюдения, составить таблицу исходных данных и выполнить следующее:

1. Структурную равноинтервальную группировку по обоим признакам. Если вариация группировочного признака значительна, то при построении группировки по признаку № 1 необходимо определить оптимальное число равноинтервальных групп, а по признаку № 2 разбить совокупность на четыре группы. При небольшом числе вариант признака, положенного в основу группировки, каждая варианта представляет отдельную группу. результаты группировки необходимо представить в таблице и сделать выводы.

2. Аналитическую группировку, для этого определить признак-фактор и признак-результат, обосновав их выбор. Результаты представить в таблице. Сделать выводы о наличии и направлении взаимосвязи между признаками.

3. Комбинационную группировку по признаку-фактору и признаку-результату. Сделать выводы.

Решение

аналитический комбинационный равноинтервальный группировка

Таблица 1. Исходные данные

п/п

Регионы

Среднегодовая численность занятых в экономике, млн. чел.

Число дорожно-транспортных происшествий на 100 тыс.населения

1

Ульяновская область

0,61

124,6

2

Курганская область

0,38

152,7

3

Свердловская область

2,04

127,8

4

Тюменская область

1,96

180,0

5

Челябинская область

1,67

143,8

6

Алтайский край

1,08

142,2

7

Забайкальский край

0,49

125,8

8

Красноярский край

1,44

174,6

9

Иркутская область

1,14

148,5

10

Кемеровская область

1,31

126,9

11

Новосибирская область

1,35

103,5

12

Омская область

0,94

148,7

13

Томская область

0,49

88,9

14

Камчатский край

0,19

196,0

15

Приморский край

0,98

193,8

16

Амурская область

0,43

149,9

17

Магаданская область

0,09

218,0

18

Сахалинская область

0,29

158,6

19

Еврейская автономная область

0,08

242,4

20

Чукотский автономный округ

0,03

59,2

21

Белгородская область

0,70

95,8

22

Брянская область

0,56

123,9

23

Владимирская область

0,70

230,6

24

Воронежская область

1,06

165,5

25

Ивановская область

0,49

189,5

26

Калужская область

0,49

181,1

27

Костромская область

0,31

145,2

28

Курская область

0,58

173,7

29

Липецкая область

0,54

143,5

30

Московская область

2,93

174,7

1. Структурная равноинтервальная группировку по обоим признакам.

Группировка - это распределение единиц совокупности по группам в соответствии с группировочным признаком. Назначение группировки состоит в том, что этот метод обеспечивает обобщение данных, представление их в компактном, обозримом виде.

Формула Стерджесса для определения оптимального числа групп:

n=1+3.322*lgN,

где n - число групп;

N - число единиц совокупности.

N=30

n=1+3.322*lgN = 1+3.322*lg30=6

Число групп: n=6.

Признак № 1: Среднегодовая численность занятых в экономике, млн. чел.

Ширина интервала составит:

Xmax - максимальное значение группировочного признака в совокупности.

Xmin - минимальное значение группировочного признака.

Результаты группировки оформим в виде таблицы:

Таблица 1.1. Структурная равноинтервальная группировка по признаку 1

Группы

№ совокупности

Частота fi

0.03 - 0.51

1,2,3,4,5,6,7,8,9,10,11,12

12

0.51 - 0.99

13,14,15,16,17,18,19,20

8

0.99 - 1.47

21,22,23,24,25,26

6

1.47 - 1.95

27

1

1.95 - 2.43

28,29

2

2.43 - 2.91

30

1

Вывод: На основании данной таблицы можно сделать вывод: самая многочисленная группа регионов (12 регионов из 30 или 40,00%) имеет значения от 0,03 до 0,51 млн. чел. Самая малочисленная группировка - по одному региону (3,33%) в интервалах от 1,47 до 1,95 млн.чел. и от 2,43 до 2,91 млн.чел.

Признак № 2 - число дорожно-транспортных происшествий на 100 тыс. человек населения

Ширина интервала составит:

Xmax - максимальное значение группировочного признака в совокупности.

Xmin - минимальное значение группировочного признака.

Результаты группировки оформим в виде таблицы:

Таблица 1.2. Структурная группировка по признаку 2

Группы

№ совокупности

Частота fi

59.2 - 105

1,2,3,4

4

105 - 150.8

5,6,7,8,9,10,11,12,13,14,15,16

12

150.8 - 196.6

17,18,19,20,21,22,23,24,25,26,27

11

196.6 - 242.4

28,29,30

3

Вывод: наименьший удельный вес в группах от 196,6 до 242,4 дтп (один регион из 30 или 3,33%), самый большой удельный вес в группе от 105 до 150,8 дтп. (12 регионов или 40%)

2. Аналитическая группировка.

Служит для выявления аналитической зависимости между группировочными признаками.

В данном случае признаком-фактором является среднегодовая численность занятых в экономике, млн. чел., а признаком результатом - число дорожно-транспортных происшествий на 100 тыс. населения.

Таблица 1.3. Аналитическая таблица

Группы

Кол-во, nj

?Y

Ycp = ?Yj / nj

0.03 - 0.51

12

1907.3

158.94

0.51 - 1

8

1234.6

154.33

1 - 1.48

6

861.2

143.53

1.48 - 1.97

2

323.8

161.9

1.97 - 2.45

1

127.8

127.8

2.45 - 2.93

1

174.7

174.7

Итого

30

4629.4

Анализируя данную таблицу, можно сделать вывод: что между рассматриваемыми признаками не наблюдается ярко выраженной связи.

3. Проследить зависимость между признаками можно также на основе комбинационной группировки. Комбинационная группировка осуществляется по двум и более признакам, взятым в сочетании.

Таблица 1.4. Комбинационная таблица числа занятых в экономике и число дорожно-транспортных происшествий.

Среднегодовая численность занятых в экономике, млн. чел.

Число дорожно-транспортных происшествий на 100 тыс. населения

Итого количество регионов

59,2 - 105

105 - 150,8

150,8 - 196,6

196,6 - 242,4

0.03 - 0.51

2

3

5

2

12

0.51 - 1

1

4

2

1

8

1 - 1.48

1

3

2

-

6

1.48 - 1.97

-

1

1

-

2

1.97 - 2.45

-

1

-

-

1

2.45 - 2.93

-

-

1

-

1

Итого количество регионов

4

12

11

3

30

На основании полученных данных, можно сделать вывод: между рассматриваемыми признаками не наблюдается явной связи.

Задание № 2

1. На основе структурных группировок из задания 1 построить вариационные частотные и кумулятивные ряды распределения (по каждому признаку), оформить в таблицы, изобразить графически.

2. Проанализировать вариационные ряды распределения, вычислив для каждого из них:

· среднее арифметическое значение признака;

· медиану, квартили и моду;

· среднее квадратическое отклонение;

· коэффициент вариации.

3. Проверить теорему о разложении дисперсии, используя данные о аналитической группировки.

4. Изобразить корреляционное поле. Построить уравнение регрессии. Определить тесноту связи между признаками, используя дисперсионный и корреляционный анализ.

5. Сделать выводы.

Ряд распределения - это числовой ряд, который представляет собой упорядоченное распределение единиц статистической совокупности. Он характеризует состав (структуру) изучаемого явления.

Объем совокупности: N = 30.

Таблица 2.1. Вариационный частотный и кумулятивный ряд распределения по среднегодовой численности, занятых в экономике, млн. чел.

Группы

xi

Кол-во, fi

xi * fi

Накопленная частота, S

(x - xср)2*f

0.03 - 0.51

0.27

12

3.24

12

3.98

0.51 - 0.99

0.75

8

6

20

0.0737

0.99 - 1.47

1.23

6

7.38

26

0.88

1.47 - 1.95

1.71

1

1.71

27

0.75

1.95 - 2.43

2.19

2

4.38

29

3.61

2.43 - 2.91

2.67

1

2.67

30

3.33

Итого

30

25.38

12.63

Гистограмма - графическое изображение интервального ряда распределения. При ее построении на оси абсцисс откладывают интервалы ряда. Над осью абсцисс строятся прямоугольники, основанием которых является интервал, а высота - соответствующая этому интервалу частота.

Кумулята - ломаная линия, изображающая ряд накопленных частот. Накопленные частоты наносятся в системе координат в виде ординат для границ интервалов; соединяя нанесенные точки отрезками прямых, получаем кумуляту. Кумуляту называют также полигоном накопленных частот.

Рис.2.1. Гистограмма вариационного ряда по среднегодовой численности занятых в экономике, млн.чел.

Рис. 2.2. Кумулята вариационного ряда по среднегодовой численности занятых в экономике, млн.чел.

Рис. 2.3. Полигон вариационного ряда по среднегодовой численности занятых в экономике, млн. чел.

Таблица 2.2. Вариационный частотный и кумулятивный ряд распределения по числу дорожно-транспортных происшествий на 100 тыс. населения

Группы

xi

Кол-во, fi

xi * fi

Накопленная частота, S

(x - xср)2*f

59.2 - 105

82.1

4

328.4

4

17237.94

105 - 150.8

127.9

12

1534.8

16

4726.68

150.8 - 196.6

173.7

11

1910.7

27

7409.33

196.6 - 242.4

219.5

3

658.5

30

15445.62

Итого

30

4432.4

44819.57

Рис. 2.4. Гистограмма вариационного ряда по числу дорожно-транспортных происшествий.

Рис. 2.5. Кумулята вариационного ряда по числу дорожно-транспортных происшествий.

Рис. 2.6. Полигон вариационного ряда по числу дорожно-транспортных происшествий.

Признак № 1: Среднегодовая численность занятых в экономике, млн. чел.

Таблица 2.3. Вычисление среднего арифметического значения признака, среднего квадратического отклонения для вариационного ряда среднегодовой численности, занятых в экономике

Группы

xi

Кол-во, fi

xi * fi

Накопленная частота, S

(x - xср)2*f

0.03 - 0.51

0.27

12

3.24

12

3.98

0.51 - 0.99

0.75

8

6

20

0.0737

0.99 - 1.47

1.23

6

7.38

26

0.88

1.47 - 1.95

1.71

1

1.71

27

0.75

1.95 - 2.43

2.19

2

4.38

29

3.61

2.43 - 2.91

2.67

1

2.67

30

3.33

Итого

30

25.38

12.63

Мода

Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

где x0 - начало модального интервала; h - величина интервала; f2 -частота, соответствующая модальному интервалу; f1 - предмодальная частота; f3 - послемодальная частота.

Выбираем в качестве начала интервала 0.03, так как именно на этот интервал приходится наибольшее количество.

Наиболее часто встречающееся значение ряда - 0.39

Медиана

Медиана делит выборку на две части: половина вариант меньше медианы, половина - больше.

В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 0.03 - 0.51, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).

Таким образом, 50% единиц совокупности будут меньше по величине 0.69

Квартили.

Квартили - это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине Q1; 25% будут заключены между Q1 и Q2; 25% - между Q2 и Q3; остальные 25% превосходят Q3.

Таким образом, 25% единиц совокупности будут меньше по величине 0.33 Q2 совпадает с медианой, Q2 = 0.69

Остальные 25% превосходят значение 1.19.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 0.85 в среднем на 0.65

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70%, то совокупность приближается к грани неоднородности, а вариация сильная.

Признак № 2 - число дорожно-транспортных происшествий на 100 тыс. населения

Таблица 2.4. Вычисление среднего арифметического значения признака для вариационного ряда распределения числа дорожно-транспортных происшествий на 100 тыс. населения

Группы

xi

Кол-во, fi

xi * fi

Накопленная частота, S

(x - xср)2*f

59.2 - 105

82.1

4

328.4

4

17237.94

105 - 150.8

127.9

12

1534.8

16

4726.68

150.8 - 196.6

173.7

11

1910.7

27

7409.33

196.6 - 242.4

219.5

3

658.5

30

15445.62

Итого

30

4432.4

44819.57

Мода

Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

где x0 - начало модального интервала; h - величина интервала; f2 -частота, соответствующая модальному интервалу; f1 - предмодальная частота; f3 - послемодальная частота.

Выбираем в качестве начала интервала 105, так как именно на этот интервал приходится наибольшее количество.

Наиболее часто встречающееся значение ряда - 145.71

Медиана

Медиана делит выборку на две части: половина вариант меньше медианы, половина - больше.

В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 105 - 150.8, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).

Таким образом, 50% единиц совокупности будут меньше по величине 146.98

Квартили.

Квартили - это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине Q1; 25% будут заключены между Q1 и Q2; 25% - между Q2 и Q3; остальные 25% превосходят Q3.

Таким образом, 25% единиц совокупности будут меньше по величине 118.36

Q2 совпадает с медианой, Q2 = 146.98

Остальные 25% превосходят значение 177.86.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 147.75 в среднем на 38.65

Относительные показатели вариации.

К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v ? 30%, то совокупность однородна, а вариация слабая. Полученным результатам можно доверять.

3.По аналитической группировке измеряют связь при помощи эмпирического корреляционного отношения. Оно основано на правиле разложения дисперсии: общая дисперсия равна сумме внутригрупповой и межгрупповой дисперсий.

1. Находим средние значения каждой группы.

Общее средние значение для всей совокупности:

2. Дисперсия внутри группы при относительном постоянстве признака-фактора возникает за счет других факторов (не связанных с изучением). Эта дисперсия называется остаточной:

Расчет для группы: 0.03 - 0.51 (1,2,3,4,5,6,7,8,9,10,11,12)

Таблица 2.5 Расчетная таблица

yj

(yj - yср)2

Результат

59.2

(59.2 - 158.94)2

9948.4

242.4

(242.4 - 158.94)2

6965.29

218

(218.0 - 158.94)2

3487.89

196

(196.0 - 158.94)2

1373.32

158.6

(158.6 - 158.94)2

0.12

145.2

(145.2 - 158.94)2

188.83

152.7

(152.7 - 158.94)2

38.96

149.9

(149.9 - 158.94)2

81.75

125.8

(125.8 - 158.94)2

1098.37

88.9

(88.9 - 158.94)2

4905.84

189.5

(189.5 - 158.94)2

933.81

181.1

(181.1 - 158.94)2

490.99

Итого

29513.57

Определим групповую (частную) дисперсию для 1-ой группы:

Расчет для группы: 0.51 - 1 (13,14,15,16,17,18,19,20)

Таблица 2.6. Расчетная таблица

yj

(yj - yср)2

Результат

143.5

(143.5 - 154.33)2

117.18

123.9

(123.9 - 154.33)2

925.68

173.7

(173.7 - 154.33)2

375.39

124.6

(124.6 - 154.33)2

883.58

95.8

(95.8 - 154.33)2

3425.18

230.6

(230.6 - 154.33)2

5817.88

148.7

(148.7 - 154.33)2

31.64

193.8

(193.8 - 154.33)2

1558.28

Итого

13134.8

Определим групповую (частную) дисперсию для 2-ой группы:

Расчет для группы: 1 - 1.48 (21,22,23,24,25,26)

Таблица 2.7. Расчетная таблица

yj

(yj - yср)2

Результат

165.5

(165.5 - 143.53)2

482.53

142.2

(142.2 - 143.53)2

1.78

148.5

(148.5 - 143.53)2

24.67

126.9

(126.9 - 143.53)2

276.67

103.5

(103.5 - 143.53)2

1602.67

174.6

(174.6 - 143.53)2

965.14

Итого

3353.45

Определим групповую (частную) дисперсию для 3-ой группы:

Расчет для группы: 1.48 - 1.97 (27,28)

Таблица 2.8. Расчетная таблица

yj

(yj - yср)2

Результат

143.8

(143.8 - 161.9)2

327.61

180

(180.0 - 161.9)2

327.61

Итого

655.22

Определим групповую (частную) дисперсию для 4-ой группы:

Расчет для группы: 1.97 - 2.45 (29)

Таблица 2.9. Расчетная таблица

yj

(yj - yср)2

Результат

127.8

(127.8 - 127.8)2

0

Итого

0

Определим групповую (частную) дисперсию для 5-ой группы:

Расчет для группы: 2.45 - 2.93 (30)

Таблица 2.10. Расчетная таблица

yj

(yj - yср)2

Результат

174.7

(174.7 - 174.7)2

0

Итого

0

Определим групповую (частную) дисперсию для 6-ой группы:

3. Внутригрупповые дисперсии объединяются в средней величине внутригрупповых дисперсий:

Средняя из частных дисперсий:

4. Межгрупповая дисперсия относится на счет изучаемого фактора, она называется факторной

д2 = ((158.94-154.31)2*12 + (154.33-154.31)2*8 + (143.53-154.31)2*6 + (161.9-154.31)2*2 + (127.8-154.31)2*1 + (174.7-154.31)2*1 + ...)/30 = 72.93

Определяем общую дисперсию по всей совокупности, используя правило сложения дисперсий:

у2 = 1555.23 + 72.93 = 1628.17

Проверка:

Проверим этот вывод путем расчета общей дисперсии обычным способом:

Таблица 2.11. Расчетная таблица

yi

(yi - yср)2

Результат

59.2

(59.2 - 154.31)2

9046.55

242.4

(242.4 - 154.31)2

7759.26

218

(218.0 - 154.31)2

4055.99

196

(196.0 - 154.31)2

1737.78

158.6

(158.6 - 154.31)2

18.38

145.2

(145.2 - 154.31)2

83.05

152.7

(152.7 - 154.31)2

2.6

149.9

(149.9 - 154.31)2

19.48

125.8

(125.8 - 154.31)2

813.01

88.9

(88.9 - 154.31)2

4278.9

189.5

(189.5 - 154.31)2

1238.1

181.1

(181.1 - 154.31)2

717.53

143.5

(143.5 - 154.31)2

116.93

123.9

(123.9 - 154.31)2

924.97

173.7

(173.7 - 154.31)2

375.84

124.6

(124.6 - 154.31)2

882.88

95.8

(95.8 - 154.31)2

3423.81

230.6

(230.6 - 154.31)2

5819.66

148.7

(148.7 - 154.31)2

31.51

193.8

(193.8 - 154.31)2

1559.2

165.5

(165.5 - 154.31)2

125.14

142.2

(142.2 - 154.31)2

146.73

148.5

(148.5 - 154.31)2

33.79

126.9

(126.9 - 154.31)2

751.49

103.5

(103.5 - 154.31)2

2581.99

174.6

(174.6 - 154.31)2

411.55

143.8

(143.8 - 154.31)2

110.53

180

(180.0 - 154.31)2

659.8

127.8

(127.8 - 154.31)2

702.96

174.7

(174.7 - 154.31)2

415.62

Итого

48845.03

Рис. 2.7 Поле корреляции и уравнение линейной регрессии

Для расчета параметров регрессии построим расчетную таблицу

Таблица 2.12.Расчетная таблица для нахождения параметров регрессии

x

y

x2

y2

x * y

0.61

124.6

0.37

15525.16

76.01

0.38

152.7

0.14

23317.29

58.03

2.04

127.8

4.16

16332.84

260.71

1.96

180

3.84

32400

352.8

1.67

143.8

2.79

20678.44

240.15

1.08

142.2

1.17

20220.84

153.58

0.49

125.8

0.24

15825.64

61.64

1.44

174.6

2.07

30485.16

251.42

1.14

148.5

1.3

22052.25

169.29

1.31

126.9

1.72

16103.61

166.24

1.35

103.5

1.82

10712.25

139.73

0.94

148.7

0.88

22111.69

139.78

0.49

88.9

0.24

7903.21

43.56

0.19

196

0.0361

38416

37.24

0.98

193.8

0.96

37558.44

189.92

0.43

149.9

0.18

22470.01

64.46

0.09

218

0.0081

47524

19.62

0.29

158.6

0.0841

25153.96

45.99

0.08

242.4

0.0064

58757.76

19.39

0.03

59.2

0.0009

3504.64

1.78

0.7

95.8

0.49

9177.64

67.06

0.56

123.9

0.31

15351.21

69.38

0.7

230.6

0.49

53176.36

161.42

1.06

165.5

1.12

27390.25

175.43

0.49

189.5

0.24

35910.25

92.86

0.49

181.1

0.24

32797.21

88.74

0.31

145.2

0.0961

21083.04

45.01

0.58

173.7

0.34

30171.69

100.75

0.54

143.5

0.29

20592.25

77.49

2.93

174.7

8.58

30520.09

511.87

25.35

4629.4

34.24

763223.18

3881.33

Параметры уравнения регрессии.

Выборочные средние.

Выборочные дисперсии:

Среднеквадратическое отклонение

Коэффициент корреляции

Ковариация.

Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:

Линейный коэффициент корреляции принимает значения от -1 до +1.

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:

0.1 < rxy < 0.3: слабая;

0.3 < rxy < 0.5: умеренная;

0.5 < rxy < 0.7: заметная;

0.7 < rxy < 0.9: высокая;

0.9 < rxy < 1: весьма высокая;

В нашем примере связь между признаком Y фактором X слабая и обратная.

Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b:

Уравнение регрессии (оценка уравнения регрессии).

Линейное уравнение регрессии имеет вид y = -2.38 x + 156.32

Коэффициентам уравнения линейной регрессии можно придать экономический смысл.

Коэффициент регрессии b = -2.38 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y понижается в среднем на -2.38.

Коэффициент a = 156.32 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями.

Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.

Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.

Связь между у и х определяет знак коэффициента регрессии b (если > 0 - прямая связь, иначе - обратная). В нашем примере связь обратная.

Задание № 3

1.Используя результаты расчетов, выполненных в задании 2 курсовой работы по признаку 1, и полагая, что эти данные получены при помощи собственно-случайного 40% бесповторного отбора, определить:

а) пределы, за которые с доверительной вероятностью 0,954 не выйдет значение признака, рассчитанное по генеральной совокупности;

б) как нужно изменить объем выборки, чтобы снизить предельную ошибку средней величины на 50%.

2. Используя результаты расчетов, выполненных в задании № 2 курсовой работы по признаку 2 и полагая, что эти данные получены при помощи повторного отбора, определить:

а) пределы, за которые в генеральной совокупности не выйдет значение доли предприятий, у которых индивидуальные значения признака превышают моду (уровень доверительной вероятности установите по своему усмотрению);

б) как изменить объем выборки, чтобы снизить предельную ошибку доли на 30%.

Решение

1. а) Возможные расхождения между характеристиками выборочной и генеральной совокупности измеряются средней ошибкой выборки, которая представляет собой среднее квадратическое отклонение возможных значений выборочных характеристик (оценок) от генеральных. Она определяется в зависимости от метода отбора.

При бесповторном отборе, при котором повторное попадание в выборку одних и тех же единиц исключено, средняя ошибка выборки определяется следующим образом:

Средняя ошибка выборки для признака № 1:

(тыс.кв.км.)

Т.к. величина выборки: n = 30 регионов - 40%

Значит: N = 75 регионов - 100%

Теория устанавливает соотношение между предельной и средней ошибкой выборки, гарантируемое с некоторой вероятностью:

? = µ * t ,

где ? - предельная ошибка выборки

µ - средняя ошибка выборки

t - коэффициент доверия.

При этом, коэффициент доверия определяется в зависимости от того, с какой достоверной вероятностью надо гарантировать результаты выборочного исследования. Для определения коэффициента доверия пользуются готовыми таблицами. Некоторые наиболее часто встречающиеся значения этого коэффициента приведены ниже:

Доверительная вероятность

Коэффициент доверия

0,683

1

0,954

2

0,990

2,5

0,997

3

Предельная ошибка выборки для признак-фактора

? = 0,09* 2 = 0.18 млн.чел.

Таким образом, границы доверительного интервала признак фактора могут быть представлены как:

, то есть

Где - среднее значение переменной в выборке (выборочное среднее)

- среднее генеральной совокупности.

Границы доверительного интервала признак-фактора могут быть определены:

, то есть

или

б) Чтобы снизить предельную ошибку средней величины на 50% (в 2 раза) необходимо, чтобы предельная ошибка выборки (?) уменьшилась в два раза, поэтому необходимая численность выборки составит:

регион

Следовательно, для того, чтобы снизить предельную ошибку средней величины на 50%, необходимая численность выборки должна составлять 55 регионов.

2. а) Возможные расхождения между характеристиками выборочной и генеральной совокупности измеряются средней ошибкой выборки, которая представляет собой среднее квадратическое отклонение возможных значений выборочных характеристик (оценок) от генеральных. Она определяется в зависимости от метода обора.

Доля альтернативного признака в выборочной совокупности определяется по формуле:

р = m / n ,

где m - число элементов совокупности, которые больше моды ( m =17).

n - объем выборочной совокупности

р = 17 / 30 = 0,26*100%=256,67%

При повторном отборе, когда каждая отобранная и обследованная единица возвращается в генеральную совокупность, где ей опять предоставляется возможность попасть в выборку, средняя ошибка выборки определяется следующим образом:

Теория устанавливает соотношения между предельной и средней ошибкой выборки, гарантируемая с некоторой вероятностью. Выберем доверительную вероятность 0,954. Значит, коэффициент доверия равен 2.

? = µ * t ,

Где ? - предельная ошибка выборки

µ - средняя ошибка выборки

t - коэффициент доверия.

? =0,09 *2= 0,18

Определим пределы, за которые не выйдет значение доли регионов, у которых Число собственных легковых автомобилей на 1000 человек населения выше моды:

б) При повторном отборе необходимая численность выборки:

n = (w*(1 - w)*t2 ) / ?2 (1)

Считая w маломеняющейся при изменении выборки, имеем:

n = (w*(1 - w)*t2 ) / (0,7?)2 (2)

Разделив (1) на (2) имеем:

Из (1) выражаем: и подставим во (2):

n = 61,2региона.

При повторном отборе необходимая численность выборки должна составлять 62 региона.

Задание № 4

1. Пользуясь данными из статистических ежегодников, составить 2 динамических ряда для характеристики изменения социально-экономических показателей по районам Псковской области.

Районы и направление определяются для каждого студента по последним цифрам номера зачетной книжки.

2. Рассчитать:

а) Среднегодовой уровень динамики;

б) Цепные и базисные показатели динамики: абсолютный прирост, темп роста, темп прироста;

в) Средний абсолютный прирост, средний темп роста, средний темп прироста.

3. Произвести сглаживание ряда динамики трехлетней скользящей средней.

4. Произвести аналитическое выравнивание ряда динамики.

5. Изобразить фактический и выровненный ряды динамики графически.

6. Сделать сравнительные выводы и прогнозы по районам. Дать общую характеристику развития районов по данному направлению.

Решение

Туризм в Псковском и Печорском районах

Таблица 4.1. Число посещений музеев на 100 человек населения в 2005- 2012 гг.

Год

Число посещений музеев на 1000 человек населения.

Псковский район

Печорский район

2005

145

235

2006

163

248

2007

165

249

2008

165

253

2009

166

265

2010

167

268

2011

169

273

2012

170

293

а) Динамические средние

Средний уровень интервального ряда, если интервалы расположены через равные промежутки времени определяется как простое среднее арифметическое:

где - значение уровня ряда динамики;

п - число уровней ряда динамики;

Псковский район:

=

=

Печорский район:

=

б) Базисные и цепные показатели динамики

Псковский район

Таблица 4.2. Число посещений музеев на 1000 населения в 2005 - 2012 г.г.

Год

Число посещений музеев на 1000 человек населения. (по Псковскому району)

Базисные показатели

Цепные показатели

Абсолютный прирост, тыс. чел.

Темп роста, %

Прирост, %

Абсолютный прирост, тыс. чел.

Темп роста, %

Прирост, %

2005

145

0

100

0

*

*

*

2006

163

18

112,41

12,41

18

112,41

12,41

2007

165

20

113,79

13,79

2

101,23

1,23

2008

165

20

113,79

13,79

0

100,00

0,00

2009

166

21

114,48

14,48

1

100,61

0,61

2010

167

22

115,17

15,17

1

100,60

0,60

2011

169

24

116,55

16,55

2

101,20

1,20

2012

170

25

117,24

17,24

1

100,59

0,59

Всего:

1310

*

*

*

*

*

*

Базисные показатели динамики:

Абсолютный прирост:

Темп роста:

Темп прироста:

Вывод: Число посещений музеев на 1000 человек населения в Псковском районе в 2012г. по сравнению с 2005 годом увеличилось на 25, темп роста составил 117,24%.

Цепные показатели динамики:

Абсолютный прирост:

Темп роста:

Темп прироста:

Вывод: Число посещений музеев на 1000 человек населения в Псковском районе в 2012г. по сравнению с 2011 годом увеличилось на 1, темп роста составил 100,59%.

Печорский район

Таблица 4.3. Число посещений музеев на 1000 населения в 2005 - 2012 г.г.

Год

Число посещений музеев на 1000 человек населения. (по Печорскому району)

Базисные показатели

Цепные показатели

Абсолютный прирост, тыс. чел.

Темп роста, %

Прирост, %

Абсолютный прирост, тыс. чел.

Темп роста, %

Прирост, %

2005

235

0

100

0

*


Подобные документы

  • Аналитическая группировка по факторному признаку. Построение вариационного частотного и кумулятивного рядов распределения на основе равно интервальной структурной группировки результативного признака – дивидендов, начисленных по результатам деятельности.

    контрольная работа [109,4 K], добавлен 07.05.2009

  • Структурная группировка по рыночной капитализации компаний. Расчет среднего процента выполнения плана выпуска продукции. Взаимосвязь ВВП на душу населения и среднего уровня потребительских расходов. Мультипликативная модель динамики себестоимости.

    контрольная работа [576,0 K], добавлен 27.11.2013

  • Систематизация материалов статистического наблюдения. Понятие статистической сводки как сводной характеристики объекта исследования. Статистические группировки, их виды. Принципы выбора группированного признака. Статистические таблицы и ряд распределения.

    реферат [196,8 K], добавлен 04.10.2016

  • Структурно-аналитическая группировка по двум признакам-факторам, расчет среднего значения группировочного признака. Сущность правила сложения дисперсий и коэффициента регрессии. Характеристика и расчет систематической вариации результативного порядка.

    контрольная работа [86,4 K], добавлен 02.09.2009

  • Понятие сводки и группировки статистических данных, их содержание, виды и основные элементы. Цели и задачи сводки и группировки данных, решаемые задачи и правила проведения. Этапы составления и назначение, виды и характеристика статистических таблиц.

    контрольная работа [22,6 K], добавлен 20.04.2009

  • Основные виды статистических группировок. Значения группировочного признака. Интервальный ряд распределения. Проведение статистического исследования и формула Стерджесса. Основные ряды распределения и группировки. Графические способы отображения.

    реферат [2,3 M], добавлен 19.12.2010

  • Понятие и виды статистической группировки, производимой с целью установления статистических связей и закономерностей, выявления структуры изучаемой совокупности. Построение интервального ряда распределения предприятий по признаку "торговая площадь".

    дипломная работа [1,6 M], добавлен 14.02.2016

  • Структурная группировка по данным, полученным в ходе контроля диаметра заготовок. Аналитическая группировка зависимости оплаты труда от стажа работы. Расчет средних величин. Вычисление ошибки выборки при тестировании. Определение индексов отпускных цен.

    контрольная работа [111,7 K], добавлен 08.08.2011

  • Задачи сводки и её основное содержание. Сведение воедино материалов статистического наблюдения и получение обобщающих статистических показателей как цель сводки. Разновидности группировок, задачи группировок и их значение в статистическом исследовании.

    реферат [15,1 K], добавлен 04.06.2010

  • Методика ранжирования данных по размеру ОФ и их группировки. Расчет равновеликого интервала группировки. Определение средних затрат времени на продукцию предприятия в базисном и отчетном годах. Характер взаимосвязи цепных и базисных темпов роста.

    контрольная работа [51,9 K], добавлен 14.10.2009

  • Основные показатели, характеризующие рабочих фирмы. Аналитическая группировка для оценки связи уровня образования со стажем работы, уровнями выработки и заработной платы. Среднее квадратическое отклонение размера вклада в районном отделении Сбербанка.

    контрольная работа [113,2 K], добавлен 25.10.2010

  • Структурная группировка предприятий по среднегодовой стоимости промышленно производственных основных фондов. Построение гистограммы распределения фирм. Кумулятивная кривая их распределения по среднегодовой стоимости производственных основных фондов.

    контрольная работа [176,6 K], добавлен 22.08.2014

  • Понятие о статистической сводке и группировке. Группировка предприятий по объему реализованной продукции, по численности и фонду заработной платы, товарной продукции в фиксированных оптовых ценах. Проведение экономической интерпретации сделанному анализу.

    курсовая работа [33,6 K], добавлен 14.06.2014

  • Понятие о классификациях, группировках и номенклатурах, их роль в статистическом исследовании. Отраслевые классификации видов экономической деятельности. Классификация продукции, работ, услуг. Экономические группировки и системы обозначения в статистике.

    реферат [37,5 K], добавлен 10.10.2014

  • Основные категории статистики. Группировка - основа научной обработки данных статистики. Содержание сводки и статистическая совокупность. Построение вариационного, ранжированного и дискретного рядов распределения. Группировка предприятий по числу рабочих.

    контрольная работа [23,3 K], добавлен 17.03.2015

  • Виды группировок, используемых в статистике. Разнообразие взаимосвязей между признаками, выступающими в роли причины или следствия явления. Структурные группировки предприятий по численности работников, по доходу и по объему перевезенных грузов.

    контрольная работа [565,1 K], добавлен 19.01.2015

  • Особенности построения статистических сводок и рядов распределения в экономическом исследовании. Практическое применение метода группировок при анализе кадрового состава современной организации. Этапы изучения взаимосвязей социально-экономических явлений.

    курсовая работа [240,4 K], добавлен 20.01.2015

  • Метод статистических группировок: сущность, этапы построения и основные классификации. Определение числа групп, расчет ширины интервала группировки. Определение признаков, которые в комбинации друг с другом будут характеризовать каждую выделенную группу.

    курсовая работа [538,2 K], добавлен 26.10.2009

  • Группировка предприятий по факторному признаку, расчет размаха вариации и длины интервала. Виды и формулы расчета средних величин и дисперсии. Расчет абсолютного прироста, темпов роста и темпов прироста, среднегодовых показателей численности населения.

    контрольная работа [219,7 K], добавлен 24.02.2011

  • Статистическое наблюдение. Понятие и содержание статистической сводки. Группировка – основа статистической сводки. Статистические ряды распределения. Осуществление конкретной аналитической группировки. Табличное представление статистических данных.

    курсовая работа [172,8 K], добавлен 22.12.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.