Изучение состава и структуры выборочной совокупности регионов

Осуществление проверки значимости уравнения регрессии на основе критерия Фишера. Изучение множественного коэффициента корреляции и детерминации. Распределение регионов по уровню занятости населения. Расчет дисперсии и среднего квадратического отклонения.

Рубрика Экономико-математическое моделирование
Вид задача
Язык русский
Дата добавления 27.12.2017
Размер файла 221,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

КОМПЛЕКСНАЯ ЗАДАЧА

Для оценки влияния факторов на результативный признак (ВРП на 1000 человек занятого населения) требуется провести отбор факторов в модель линейной регрессии на основе данных по 30 регионам Российской Федерации, а также изучить состав и структуру выборочный совокупности. Выборочные данные представлены в табл. 1.

Таблица 1

№ п/п

ВРП на 1000 человек занятого населения, тыс.руб. (Y)

Степень износа основных средств(Х1)

Уровень занятости населения, % (Х2)

Коэффициент естественной убыли, (Х3)

Коэффициент демографии-

ческой нагрузки, (Х4)

1

2

3

4

5

6

1

246,3

39,2

59,2

4,5

605

2

124

40,6

60,6

7,6

629

3

142,2

40,7

63,4

8,5

625

4

145,7

48,1

59,1

8,7

641

5

91,9

44,2

63,4

9,0

630

6

154,7

41,8

65,3

7,3

617

7

140,6

29,5

66,1

7,1

610

8

167,5

48,6

62,5

7,9

639

9

312,9

44,1

63,3

6,8

626

10

248,8

40,1

69,7

7,0

584

11

146,2

41,1

62,2

7,9

626

12

173,1

43,3

62,2

9,6

663

13

148,9

40,3

63,4

10,0

596

14

143,2

55,4

57,3

8,7

655

15

171,3

36,1

64,9

10,4

658

16

174,9

47,1

64,1

12,0

666

17

221,9

45,1

65,2

7,6

623

18

297,4

41,9

64,4

2,8

557

19

313,9

46,1

66,2

4,3

585

20

192,1

32,6

66,8

4,5

548

21

288,5

34,4

67,2

9,9

574

22

311,8

41,2

66,1

1,4

451

23

216,6

38,6

62,2

9,4

640

24

133,9

40,0

62,7

11,2

642

25

162,2

51,0

61,6

0,6

572

26

182,2

50,1

61,9

3,9

615

27

153,1

40,3

60,3

4,8

611

28

274,2

59,4

61,0

2,5

576

29

273,9

48,9

67,5

4,6

582

30

149,2

53,7

59,9

5,1

602

Для решения задачи воспользуемся методом исключения факторов.

На первом шаге включим в модель все факторы. В качестве программного средства реализации анализа воспользуемся пакетом Анализ данных табличного процессора EXCEL, инструмент Регрессия. Результаты представлены в табл.2.

Модель зависимости ВРП на 1000 человек занятого населения от всех факторов имеет вид

Y(x) = ?1345,163 + 38,501x1 + 365,813x2 ? 53,927x3 ? 22,695x4.

Проверку значимости уравнения регрессии осуществим на основе F-критерия Фишера. Расчетное значение (Fрасч) равно 9,70. Табличное значение F-критерия при доверительной вероятности 0,95 и числе степеней свободы г1 = k = 4 и г2 = n - k - 1 = 30 - 4 - 1 = 25 составляет 2,76.

Таблица 2 Вывод итогов инструмента «Регрессия» (множественная регрессия)

Регрессионная статистика

Множественный R-квадрат Нормированный R-квадрат Стандартная ошибка Наблюдения

0,7799097

0,60825914

0,545580603

1478,204769

30

Дисперсионный анализ

df

SS

MS

F

Регрессия

Остаток

Итого

4

25

29

84820138,8

54627233,5

139447372,3

21205034,7

2185089,34

9,70442458

Коэффициенты

Стандартная ошибка

t-статистика

P-значение

Y-пересечение

Переменная X1

Переменная X2

Переменная X3

Переменная X4

?1345,162778

38,50079336

365,8129324

?53,92748015

?22,6951331

12868,27095

51,80876316

126,7681316

167,0696427

11,94533174

?0,10453329

0,743132841

2,885685289

?0,32278443

?1,89991651

0,91758029

0,46432795

0,00793276

0,74954267

0,06903804

Поскольку Fрасч > F табл, уравнение регрессии следует признать адекватным.

Множественный коэффициент корреляции R, равный 0,780, свидетельствует о тесной связи между признаками.

Множественный коэффициент детерминации RІ, равный 0,608, показывает, что около 61% вариации зависимой переменной обусловлено влиянием включенных в модель факторов и на 39% ? другими факторами, не учтенными в модели.

Значимость коэффициентов регрессии оценим с помощью t - критерия Стьюдента.

Расчетные значения критерия Стьюдента следующие: ta1 = 0,743, ta2 = 2,886, ta3 = ?0,323, ta4 = ?1,900. Табличное значение критерия при уровне значимости б = 0,05 и числе степеней свободы г = n - k - 1 = 25 равно 2,06. Значит, выполняются следующие неравенства: ta1 < tтабл; ¦ta3, ta4¦< tтабл. Таким образом, коэффициенты регрессии a1, a3, a4 незначимы и из модели следует исключить факторные признаки x1, x3, x4.

На втором шаге построим модель зависимости ВРП на 1000 человек занятого населения от уровня занятости населения. Расчеты представлены в таблице 3.

Таблица 3 Вывод итогов инструмента «Регрессия» (парная регрессия)

Регрессионная статистика

Множественный R-квадрат Нормированный R-квадрат Стандартная ошибка Наблюдения

0,434149761

0,188486015

0,159503373

59,88254056

30

Дисперсионный анализ

df

SS

MS

F

Регрессия

Остаток

Итого

1

28

29

23320,70042

100405,7226

123726,423

23320,70042

3585,918664

6,5034103

Коэффициенты

Стандартная ошибка

t-статистика

P-значение

Y-пересечение

Переменная X1

?433,702811

9,956405922

247,4685597

3,904199637

?1,75255722

2,550178487

0,090623

0,016523

Величина коэффициента корреляции (ryx = 0,434) свидетельствует об умеренной связи между признаками.

Парный коэффициент детерминации (rІyx = 0,188) показывает, что на 18,8% изменение зависимой переменной объясняется изменениями факторного признака.

Значимость коэффициента корреляции проверим с помощью t-критерия Стьюдента по формуле

tрасч = ryx = 0,434 = 2,55.

Табличное значение t-критерия Стьюдента при доверительной вероятности 0,95 и числе степеней свободы г = (n - k - 1) = 28 составляет 2,05.

Так как tрасч > tтабл, то значение коэффициента корреляции признается значимым и делается вывод о том, что между признаками есть статистическая взаимосвязь.

Коэффициент регрессии a1 = 9,96 показывает, что с увеличением уровня занятости населения на 1% ВРП на 1000 человек занятого населения возрастает на 9,96 тыс.руб.

Уравнение парной регрессии имеет вид

= ?433,70 + 9,96x2.

Табличное значение t-критерия с г = (n - k - 1) = 28 степенями свободы при доверительной вероятности 0,95 (б = 0,05) равно 2,05. Расчетные значения критерия равны ¦ta0¦= 1,75, ta1 = 2,25.

Значит, имеем следующие результаты:

¦ta0¦< tтабл параметр a0 незначим;

¦ta1¦> tтабл параметр a1 значим.

Для проверки значимости уравнения регрессии в целом воспользуемся F-критерием Фишера. Табличное значение воспользуемся F-критерия с г1 = k = 1 и г2 = n - k - 1 = 28 степенями свободы и при доверительной вероятности 0,95 (б = 0,05) равно 4,20. Расчетное значение критерия составляет 6,503.

Так как Fрасч > Fтабл, уравнение парной линейной регрессии с вероятностью 0,95 в целом статистически значимое.

Рассчитаем коэффициент эластичности по формуле

Эi = ai Ч ,

где ai - коэффициент регрессии при i-м факторе;

- среднее значение i-го фактора;

-среднее значение результативного признака.

Эi = ai Ч = 9,96 = 3,2%.

Коэффициент эластичности показывает, что на 3,2% в среднем изменится результативный признак при изменении факторного признака на 1%.

Для изучения состава и структуры выборочной совокупности регионов построим статистический ряд распределения регионов по признаку «уровень занятости населения». Расположим значения признака х2 в порядке возрастания с помощью табличного процессора EXCEL, инструмент Данные, сортировка. Результаты представлены в табл.4.

Разработанная таблица для построения ряда распределения

x2

y

x2

y

x2

y

57,3

143,2

62,2

173,1

64,9

171,3

59,1

145,7

62,2

216,6

65,2

221,9

59,2

246,3

62,5

167,5

65,3

154,7

59,9

149,2

62,7

133,9

66,1

140,6

60,3

153,1

63,3

312,9

66,1

311,8

60,6

124,0

63,4

142,2

66,2

313,9

61,0

274,2

63,4

91,9

66,8

192,1

61,6

162,2

63,4

148,9

67,2

288,5

61,9

182,2

64,1

174,9

67,5

273,9

62,2

146,2

64,4

297,4

69,7

248,8

Число групп n определим по формуле Стерджесса:

n = 1 + 3,22lgN = 1 + 3,322lg30 ? 6 групп

Величину интервала группировки рассчитаем по формуле:

h = = (69,7 - 57,3) : 6 = 2,07 ? 2,1%.

Значения границ интервалов ряда распределения при h = 2,1% приведены в табл.5.

Таблица 5 Расчет интервальных границ группировки

№ группы

Граница, %

нижняя

верхняя

1

57,3

59,4

2

59,4

61,5

3

61,5

63,6

4

63,6

65,7

5

65,7

67,8

6

67,8

69,9

На основе данных табл. 4 и 5 составим табл. 6, в которой представлен ряд распределения регионов по уровню занятости населения.

Таблица 6 Распределение регионов по уровню занятости населения (структурная группировка)

№ группы

Группы регионов по уровню занятости населения,%

Число регионов

Накопленная частота

Накопленная частность, %

всего

В% к итогу

А

Б

1

2

3

4

1

57,3-59,4

3

10,0

3

10,0

2

59,4-61,5

4

13,3

7

23,3

3

61,5-63,6

11

36,7

18

60,0

4

63,6-65,7

5

16,7

23

76,7

5

65,7-67,8

6

20,0

29

96,7

6

67,8 и более

1

3,3

30

100,0

Итого

30

100,0

Графически ряд распределения изображается с помощью гистограммы и кумуляты. В качестве программного средства графического изображения ряда распределения воспользуемся табличным процессором EXCEL, инструмент Мастер диаграмм. Результаты представлены на рис. 1.

Рисунок 1 Гистограмма распределения регионов по уровню занятости населения

На рис. 1 показано нахождение значения моды. Конкретное значение моды для интервального ряда распределения определяется по формуле

,

Где - нижняя граница модального интервала;

- величина модального интервала;

- частота модального интервала;

- частота интервала, предшествующего модальному интервалу;

- частота интервала, следующего за модальным интервалом.

Модальным интервалом является интервал 61,5-63,6%, так ему соответствует наибольшая частота (=11, табл.6).

,

Таким образом, в выборочной совокупности чаще всего встречаются регионы со средним уровнем занятости населения равным 62,6%.

Для нахождения значения медианы строится кумулята (рис.2).

Накопленные частоты

Рис.2. Кумулята распределения регионов по уровню занятости населения

Конкретное значение медианы для интервального ряда распределения определяется по формуле

,

Где - нижняя граница медианного интервала;

- величина медианного интервала;

- частота медианного интервала;

- накопленная частота интервалов, предшествующих медианному интервалу;

- сумма частот.

Согласно данным таблицы 6 медианным интервалом является интервал 61,5 - 63,6 %, так как в этом интервале сумма накопленных частот превышает величину , равную половине численности единиц совокупности =15).

,

В выборочной совокупности половина регионов имеют в среднем уровень занятости не более 63,0%, другая половина - не менее 63,0%.

Для расчета характеристик ряда распределения построим вспомогательную табл. 7.

Расчет средней арифметической взвешенной:

,

Расчет дисперсии и среднего квадратического отклонения:

Таблица 7 Расчетная таблица для нахождения характеристик ряда распределения

№ группы

Группы регионов по уровню занятости населения, %

Число регионов

(

Середина интервала, %

(

А

Б

1

2

3

4

5

6

1

57,3-59,4

3

58,35

175,05

-4,9

24,01

72,03

2

59,4-61,5

4

60,45

241,80

-2,8

7,84

31,36

3

61,5-63,6

11

62,55

688,05

-0,7

0,49

5,39

4

63,6-65,7

5

64,65

323,25

1,4

1,96

9,8

5

65,7-67,8

6

66,75

400,50

3,5

12,25

73,5

6

67,8 и более

1

68,85

68,85

5,6

31,36

31,36

Итого

30

1897,5

223,44

Расчет коэффициента вариации

,

На основе проведенных расчетов можно сделать выводы о том, что средний уровень занятости населения в данной совокупности равен 63,25%, отклонение от среднего значения в ту или иную сторону составляет в среднем 2,73%, вариация уровня занятости населения в рассматриваемой совокупности регионов незначительна ( V=4,32% <33%) и совокупность по данному признаку качественно однородна.

Рассчитать показатели ряда распределения по несгруппированным данным можно с помощью табличного редактора EXCEL, инструмент Сервис регрессия корреляция детерминация дисперсия

Анализ данных Описательная статистика. Результаты представлены в табл. 8.

Таблица 8 Выход итогов инструмента «Описательная статистика»

ВРП на 1000 человек занятого населения

Уровень занятости населения

Среднее

196,77

Среднее

63,32333333

Стандартная ошибка

11,92536286

Стандартная ошибка

0,520006263

Медиана

172,2

Медиана

63,35

Мода

172,2

Мода

63,4

Стандартное отклонение

65,31790244

Стандартное отклонение

2,848191602

Дисперсия выборки

4266,428379

Дисперсия выборки

8,112195402

Эксцесс

-0,93908265

Эксцесс

-0,24363222

Асимметричность

0,618746627

Асимметричность

0,066377268

Интервал

222

Интервал

12,4

Минимум

91,9

Минимум

57,2

Максимум

313,9

Максимум

69,7

Сумма

5903,1

Сумма

1899,7

Счет

30

Счет

30

Уровень надежности (95,0%)

24,39010524

Уровень надежности (95,0%)

1,063532207

Значения табл. 8 несущественно расходятся с приведенными ранее расчетами, так как они определены по фактическим несгруппированным данным, тогда как значения показателей, полученные на основе данных табл. 7, определялись по серединам интервалов, взятым в качестве значений признака.

На основе данных табл. 4 построим аналитическую группировку (табл. 9).

Таблица 9 Зависимость объемов ВРП на 1000 занятого населения от уровня занятости населения (аналитическая группировка)

№ группы

Группы регионов по уровню занятости населения

Число регионов

Объем ВРП на 1000 человек занятого населения, тыс.руб.

всего

В среднем на один регион

А

Б

1

2

3

1

57,3-59,4

3

535,2

178,40

2

59,4-61,5

4

700,5

175,12

3

61,5-63,6

11

1877,6

170,69

4

63,6-65,7

5

1020,2

204,04

5

65,7-67,8

6

1520,8

253,47

6

67,8 и более

1

248,8

248,8

Итого

30

5903,1

196,77

Построенная группировка не дает представления о направлении связи между признаками (с ростом значений факторного признака не наблюдается рост или снижение среднего значения результативного признака).

Для измерения тесноты связи между признаками рассчитываются эмпирический коэффициент детерминации и эмпирическое корреляционное отношение :

,

Где - общая дисперсия признака Y;

межгрупповая дисперсия признака Y.

Общая дисперсия вычисляется по формуле

,

Для расчета общей дисперсии воспользуемся табличным процессором EXCEL, инструмент Мастер функций, статистическая функция ДИСПР. Расчетное значение дисперсии равно .

Межгрупповая дисперсия определяется по формуле

.

Для расчета межгрупповой дисперсии составим табл. 10.

Таблица 10 Расчет межгрупповой дисперсии

№ группы

Группы регионов по уровню занятости населения, %

Число регионов,

Групповая средняя

А

Б

1

2

3

4

1

57,3-59,4

3

178,40

-18,37

1012,37

2

59,4-61,5

4

175,12

-21,65

1874,89

3

61,5-63,6

11

170,69

-26,08

7481,83

4

63,6-65,7

5

204,04

7,27

264,26

5

65,7-67,8

6

253,47

56,7

19289,34

6

67,8 и более

1

248,8

52,03

2707,12

Итого

30

196,77

32629,81

Межгрупповая дисперсия равна:

.

Эмпирический коэффициент детерминации равен:

,

Эмпирическое корреляционное отношение составляет:

=0,514.

Полученное значение эмпирического корреляционного отношения подтверждает наличие умеренной связи между рассматриваемыми признаками. Эмпирический коэффициент детерминации показывает, что 26,4% общей вариации изучаемого признака (ВРП на 1000 занятого населения) обусловлено вариацией группировочного признака (коэффициента уровня занятости населения).

Размещено на Allbest.ru

...

Подобные документы

  • Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.

    контрольная работа [248,4 K], добавлен 26.12.2010

  • Построение модели множественной линейной регрессии по заданным параметрам. Оценка качества модели по коэффициентам детерминации и множественной корреляции. Определение значимости уравнения регрессии на основе F-критерия Фишера и t-критерия Стьюдента.

    контрольная работа [914,4 K], добавлен 01.12.2013

  • Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.

    контрольная работа [681,9 K], добавлен 03.08.2010

  • Экономическая интерпретация коэффициента регрессии. Нахождение статочной суммы квадратов и оценка дисперсии остатков. Проверка значимости параметров уравнения регрессии с помощью t-критерия Стьюдента. Расчет средней относительной ошибки аппроксимации.

    контрольная работа [261,1 K], добавлен 23.03.2010

  • Расчет выборочной средней, дисперсии, среднего квадратического отклонения и коэффициента вариации. Точечная оценка параметра распределения методом моментов. Решение системы уравнений по формулам Крамера. Определение уравнения тренда для временного ряда.

    контрольная работа [130,4 K], добавлен 16.01.2015

  • Построение поля корреляции. Расчет параметров уравнений парной регрессии. Зависимость средней ожидаемой продолжительности жизни от некоторых факторов. Изучение "критерия Фишера". Оценка тесноты связи с помощью показателей корреляции и детерминации.

    контрольная работа [173,8 K], добавлен 22.11.2010

  • Расчет параметров уравнения линейной регрессии, оценка тесноты связи с помощью показателей корреляции и детерминации. Определение средней ошибки аппроксимации. Статистическая надежность моделирования с помощью F-критерия Фишера и t-критерия Стьюдента.

    контрольная работа [58,3 K], добавлен 17.10.2009

  • Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.

    контрольная работа [141,3 K], добавлен 05.05.2010

  • Построение поля корреляции, расчет уравнений линейной парной регрессии, на основе данных о заработной плате и потребительских расходах в расчете на душу населения. Анализ коэффициента эластичности, имея уравнение регрессии себестоимости единицы продукции.

    контрольная работа [817,3 K], добавлен 01.04.2010

  • Построение модели для зависимой переменной, используя пошаговую множественную регрессию. Рассчет индекса корреляции, оценка качества полученного уравнения регрессии с помощью коэффициента детерминации. Оценка статистической значимости уравнения регрессии.

    лабораторная работа [2,1 M], добавлен 25.05.2009

  • Нахождение уравнения линейной регрессии, парного коэффициента корреляции. Вычисление точечных оценок для математического ожидания, дисперсии, среднеквадратического отклонения показателей x и y. Построение точечного прогноза для случая расходов на рекламу.

    контрольная работа [216,6 K], добавлен 12.05.2010

  • Методика расчета линейной регрессии и корреляции, оценка их значимости. Порядок построения нелинейных регрессионных моделей в MS Exсel. Оценка надежности результатов множественной регрессии и корреляции с помощью F-критерия Фишера и t-критерия Стьюдента.

    контрольная работа [3,6 M], добавлен 29.05.2010

  • Построение доверительного интервала для коэффициента регрессии. Определение ошибки аппроксимации, индекса корреляции и F-критерия Фишера. Оценка эластичности изменения материалоемкости продукции. Построение линейного уравнения множественной регрессии.

    контрольная работа [250,5 K], добавлен 11.04.2015

  • Вычисление уравнений регрессии для различных показателей продукции. Определение выборочной корреляции между двумя величинами. Расчет коэффициента детерминации и статистики Дарбина-Уотсона. Вычисление выборочной частной автокорреляции 1-го порядка.

    контрольная работа [29,7 K], добавлен 07.05.2009

  • Расчет линейного коэффициента парной и частной корреляции. Статистическая значимость параметров регрессии и корреляции. Анализ корреляционного поля данных. Точность прогноза, расчет ошибки и доверительный интервал. Коэффициент множественной детерминации.

    контрольная работа [155,8 K], добавлен 11.12.2010

  • Структурная, аналитическая и комбинационная группировка по признаку-фактору. Расчет среднего количества балансовой прибыли, среднего арифметического значения признака, медианы, моды, дисперсии, среднего квадратического отклонения и коэффициента вариаций.

    контрольная работа [194,5 K], добавлен 06.04.2014

  • Ковариационная матрица оценок коэффициентов регрессии. Оценка дисперсии ошибок. Сущность теоремы Гаусса-Маркова. Проверка статистических гипотез, доверительные интервалы. Расчет коэффициента детерминации, скорректированного коэффициента детерминации.

    контрольная работа [1,4 M], добавлен 28.07.2013

  • Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.

    контрольная работа [1,6 M], добавлен 14.05.2008

  • Построение уравнения множественной регрессии в линейной форме с полным набором факторов, отбор информативных факторов. Проверка значимости уравнения регрессии по критерию Фишера и статистической значимости параметров регрессии по критерию Стьюдента.

    лабораторная работа [217,9 K], добавлен 17.10.2009

  • Выполнение кластерного анализа предприятий с помощью программы Statgraphics Plus. Построение линейного уравнения регрессии. Расчет коэффициентов эластичности по регрессионным моделям. Оценка статистической значимости уравнения и коэффициента детерминации.

    задача [1,7 M], добавлен 16.03.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.