Средние величины и показатели вариации. Корреляционный анализ. Регрессионный анализ

Основные задачи статистики: сбор, обработка, анализ и хранение информации. Теоретическое обоснование сущности, общих понятий и методов расчета средних величин. Исследование системы показателей и информационной базы корреляционно-регрессионного анализа.

Рубрика Экономико-математическое моделирование
Вид курсовая работа
Язык русский
Дата добавления 22.02.2019
Размер файла 1,3 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

ПЕНЗЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ФАКУЛЬТЕТ «ЭКОНОМИКА И УПРАВЛЕНИЕ»

КАФЕДРА «Бухгалтерский учет и аудит»

КУРСОВАЯ РАБОТА

по дисциплине:

«Общая теория статистики»

Автор работы:

Антонова А.Д.

Специальность: Экономика

Группа: 16ЭЭ3

Руководитель работы

В.Н. Деркаченко

Пенза 2017

Содержание

1. Средние величины и показатели вариации

Задача 1.1

Задача 1.2

Задача 1.3

Задача 1.4

Задача 1.5

2. Корреляционный анализ

Задача 2.1

Задача 2.2

Задача 2.3

3. Регрессионный анализ

Задача 3.1

Задача 3.2

Задача 3.3

Задача 3.4

Задача 3.5

Список используемых источников

Введение

Статистика играет важную роль в системе управления экономикой, она позволяет структурировать значительные массивы данных, которые необходимы для возможности предоставления информации о положении дел в определённых сферах. Так, важную роль она играет для инвесторов, поскольку дает возможность наблюдать за динамикой роста экономик государств. Предоставляет интерес статистика и для граждан и властей, говоря им о процессах в стране: демографический рост или кризис, возрастание благосостояния или его падение и так далее.

Особенность заключается в том, что статистические данные сообщаются в количественной форме, т.е. статистика говорит языком цифр, отображающих общественную жизнь во всем многообразии ее проявлений. Кроме того ее интересуют те выводы, которые можно сделать на основе анализа надлежащим образом собранных и обработанных цифровых данных.

Развитие общественного производства, внутренней и внешней торговли, торговых и международных товарно-денежных отношений увеличило потребность в статистической информации. Это расширило сферу деятельности статистики.

Основными задачами статистики являются:

1. Сбор, обработка, анализ и хранение информации;

2. Ознакомление широкой общественности и населения с динамикой и дислокацией социально-экономических явлений в стране путем издания статистических сборников, справочников, обзоров, публикаций в печатных и электронных СМИ;

3. Доведение обработанной информации до органов управления всех уровней;

Статистика играет важную роль в жизни общества. Проблема статистического анализа является актуальной, общественно значимой, так как статистика имеет прямую связь с экономической теорией и другими науками. Экономическая теория служит для определения основных экономических законов и категорий, а статистика является их доказательным инструментом. Основными функциями статистики являются: аналитическая, учетная, распределительная, стимулирующая, контрольная, функция сравнения, оценочная и функция прогнозная.

Данная курсовая работа состоит из трех частей - средние величины и показатели вариации, корреляционный анализ, регрессионный анализ. В каждой из этих частей будет подробно рассмотрена теория, необходимые расчеты, и сделан грамотный, обоснованный вывод.

Целью написания работы является расчет средних величин, показателей вариации, а также проведение корреляционно-регрессионного анализа. Основными задачами исследования в работе являются:

1. Теоретическое обоснование сущности, общих понятий и методов расчета средних величин;

2. Исследование системы показателей и информационной базы корреляционно-регрессионного анализа;

3. Выполнение расчетов.

средняя величина корреляционный регрессионный

1. Средние величины и показатели вариации

Средняя величина - это обобщающий показатель статистической совокупности, который погашает индивидуальные различия значений статистических величин, позволяя сравнивать разные совокупности между собой.

Существует 2 класса средних величин: степенные и структурные.

К структурным средним относятся мода и медиана, но наиболее часто применяются степенные средние различных видов.

Степенные средние могут быть простыми и взвешенными.

Простая средняя величина рассчитывается при наличии двух и более несгруппированных статистических величин, расположенных в произвольном порядке по следующей общей формуле:

(1)

Взвешенная средняя величина рассчитывается по сгруппированным статистическим величинам с использованием следующей общей формулы:

(2)

? где X - значения отдельных статистических величин или середин группировочных интервалов;

? m - показатель степени, от значения которого зависят следующие виды степенных средних величин:

? при m = -1 средняя гармоническая;

? при m = 0 средняя геометрическая;

? при m = 1 средняя арифметическая;

? при m = 2 средняя квадратическая;

? при m = 3 средняя кубическая.

Используя общие формулы простой и взвешенной средних при разных показателях степени m, получаем частные формулы каждого вида, которые будут далее подробно рассмотрены.

Средняя арифметическая - это самая часто используемая средняя величина, которая получается, если подставить в общую формулу m=1. Средняя арифметическая простая имеет следующий вид:

(3)

? где X - значения величин, для которых необходимо рассчитать среднее значение;

? N - общее количество значений X (число единиц в изучаемой совокупности).

Средняя арифметическая взвешенная имеет следующий вид:

(4)

? где f - количество величин с одинаковым значением X (частота).

Если значения X заданы в виде интервалов, то для расчетов используют середины интервалов X, которые определяются как полусумма верхней и нижней границ интервала. А если у интервала X отсутствует нижняя или верхняя граница (открытый интервал), то для ее нахождения применяют размах (разность между верхней и нижней границей) соседнего интервала X.

Средняя арифметическая применяется чаще всего, но бывают случаи, когда необходимо применение других видов средних величин. Рассмотрим такие случаи далее.

Средняя гармоническая применяется, когда исходные данные не содержат частот f по отдельным значениям X, а представлены как их произведение Xf. Обозначив Xf=w, выразим f=w/X, и, подставив эти обозначения в формулу средней арифметической взвешенной, получим формулу средней гармонической взвешенной:

(5)

Таким образом, средняя гармоническая взвешенная применяется тогда, когда неизвестны частоты f, а известно w=Xf. В тех случаях, когда все w=1, то есть индивидуальные значения X встречаются по 1 разу, применяется формула средней гармонической простой:

(6)

Средняя геометрическая применяется при определении средних относительных изменений, о чем сказано в теме Ряды динамики. Геометрическая средняя величина дает наиболее точный результат осреднения, если задача стоит в нахождении такого значения X, который был бы равноудален как от максимального, так и от минимального значения X.

(7)

Средняя квадратическая применяется в тех случая, когда исходные значения X могут быть как положительными, так и отрицательными, например при расчете средних отклонений.

(8)

Средняя кубическая применяется крайне редко, например, при расчете индексов нищеты населения для развивающихся стран (ИНН-1) и для развитых (ИНН-2), предложенных и рассчитываемых ООН.

(9)

К наиболее часто используемым структурным средним относятся статистическая мода и статистическая медиана.

Мода ? это величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности. Для дискретных рядов распределения модой будет значение варианта с наибольшей частотой.[2]

Для интервальных рядов распределения с равными интервалами мода определяется по формуле:

(10)

? где - нижняя граница модального интервала и ширина интервала;

? - величина модального интервала;

? - частота модального интервала;

? - частота интервала, предшествующего модальному;

? - частота интервала, следующего за модальным.

Медиана ? это варианта, расположенная в середине вариационного ряда. Если ряд распределения дискретный и имеет нечетное число членов, то медианой будет варианта, находящаяся в середине упорядоченного ряда. Если дискретный упорядоченный ряд состоит из чётного числа членов, то медианой будет средняя арифметическая из двух смежных вариант, стоящих в центре ряда.[4]

Медиана интервального вариационного ряда распределения определяется по формуле:

(11)

где,нижняя граница модального интервала и ширина интервала;

Основными обобщающими показателями вариации в статистике являются дисперсии и среднее квадратическое отклонение.[3]

Дисперсия - это средняя арифметическая квадратов отклонений каждого значения признака от общей средней.

(12)

(13)

Взвешенная дисперсия используется тогда, когда данные представлены в виде интервального ряда и вместо берётся среднее значение интервала и соответственно частота .

Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии.

(14)

(15)

А для изучения вариации по группам используются внутригрупповые дисперсии, а также средняя из внутригрупповых. Для изучения вариации между группами используется межгрупповая дисперсия.

Общая дисперсия равна сумме средней внутригрупповой дисперсии и межгрупповой дисперсии.

Данное выражение называется в статистике правилом сложения дисперсий. Согласно этому правилу, общая дисперсия, которая возникает под влиянием всех факторов, равна сумме дисперсий, которые появляются как под влиянием признака-фактора, положенного в основу группировки, так и под влиянием других факторов. Благодаря правилу сложения дисперсий можно определить, какая часть общей дисперсии находится под влиянием признака-фактора, положенного в основу группировки..

Коэффициент вариации

(16)

Коэффициент детерминации, который показывает какую часть общей вариации изучаемого признака составляет вариация межгрупповая, т.е. обусловленная группировочным признаком:

(17)

Учитывая, что среднеквадратическое отклонение дает обобщающую характеристику колеблемости всех вариантов совокупности, коэффициент вариации является наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин. При этом исходят из того, что если V больше 33 %, то это говорит о большой колеблемости признака в изучаемой совокупности.

Задача 1.1. По статистическим данным: 3; 5; 2; 4; 7; 3; 8; 3; 10 определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации. Каждое значение увеличить на свой номер классного журнала. Дисперсия до одного знака после запятой; среднеквадратическое - до двух; коэффициент вариации - до одного в процентах.

Решение:

А)

Мо=3 (наиболее часто встречающийся вариант ряда)

Ме=4

Б)

Мо =3+2=5

Ме =4+2=6

GІ=6,7+2=8,7

G=2,58+2=4,58

V=51,6+2=53,6

Задача 1.2. По данным статистики в отчетном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 21%, стоимость основных фондов увеличилась на 10%. Определить изменение фондоотдачи. Значения дохода и стоимости основных фондов увеличить на свой номер классного журнала.

Решение:

Доход от реализации продукции предприятия: 21+2=23%

Стоимость основных фондов: 10+2=12%

Доход по сравнению с базисным годом вырос и составил 123%, стоимость основных фондов также выросла и составила 112%.

Так как в базисном году фондоотдача была равна 1, следовательно, или 9%.

Задача 1.3. Объем оборота (У) и число работников (m) приведены в таблице 1. Определить среднее значение, моду и медиану.

Таблица 1 - Исходные данные

y

80-100

100-120

120-140

140-160

160-180

180-200

m

6

17

25

28

14

10

Итого

100

 

Задача 1.4. По данным таблицы определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации. В таблице: Х-объем оборота предприятий, млн. руб., mг - число государственных предприятий; mч - частных; mо - общее число (таблица 2).

Таблица 2 - Исходные данные по объему оборота предприятий

Хi

mгi

mчi

moi

1,0-1,2

3

3

1,2-1,4

4

4

1,4-1,6

17

17

1,6-1,8

11

15

26

1,8-2,0

13

6

19

2,0-2,2

18

5

23

2,2-2,4

6

6

2,4-2,6

2

2

Итого:

50

50

100

С учетом номера классного журнала:

Так как коэффициент детерминации составляет 40%, это указывает на то, что линейная зависимость между составными частями очень низкая.

Задача 1.5. Определить среднюю внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из трех групп (таблица 3).

Таблица 3 - Исходные данные

1 - группа

Хi

1

2

8

mi

30

15

5

2 - группа

Хi

1

6

mi

10

15

3 - группа

Хi

3

8

mi

20

5

6

2. Корреляционный анализ

Задача статистики состоит не только в количественной оценке изучаемых показателей, но и в определении формы влияния факторных признаков на результативный. Для ее решения применятся метод корреляционного и регрессионного анализа.[7]

Корреляционная связь (которую также называют неполной, или статистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной.

Коэффициент корреляции - двумерная описательная статистика, количественная мера взаимосвязи (совместной изменчивости) двух переменных

Можно ввести три градации величин корреляции по силе связи:

r < 0,3 -- слабая связь (менее 10% от общей доли дисперсии);

0,3 < r < 0,7 -- умеренная связь (от 10 до 50% от общей доли дисперсии);

r > 0,7 -- сильная связь (50% и более от общей доли дисперсии).

Вычислить коэффициент корреляции можно по следующей формуле:

(11)

Поскольку оценка коэффициента корреляции вычислена на конечной выборке, и поэтому может отклоняться от своего генерального значения, необходимо проверить значимость коэффициента корреляции. Проверка производится с помощью t-критерия. [8]

Случайная величина t следует t-распределению Стьюдента и по таблице t-распределения необходимо найти критическое значение критерия (tкр.б) при заданном уровне значимости б. Если вычисленное по формуле ( 2 ) t по модулю окажется меньше чем tкр.б, то зависимости между случайными величинами X и Y нет. В противном случае, экспериментальные данные не противоречат гипотезе о зависимости случайных величин.

Задача 2. 1. Определить коэффициент корреляции между У и Х.

Х: 3,5; 4,6; 5,8; 4,2; 5,2;

УХ:28,35; 43,24; 65,54; 28,98; 50,44.

Оценить значимость коэффициента корреляции при уровне 0,05. Расчеты и ответы до двух знаков. Вначале определить У, а затем У и Х увеличить на свой номер классного журнала. Результаты:

1) коэффициент корреляции;

2) расчетное и табличное значения критерия Стьюдента и вывод.

Решение:

Рассчитаем значения Y, как отношениеYX к X:

Х:

3,5

4,6

5,8

4,2

5,2

УХ:

28,35

43,24

65,54

29,98

50,44

У:

8,1

9,4

11,3

7,1

9,7

Данные с учетом номера по журналу:

Х:

5,5

6,6

7,8

6,2

7,2

У:

30,35

45,24

67,54

31,98

52,44

YX:

10,1

11,4

13,3

9,1

11,7

1)

Табличное значение t-критерия для числа степеней свободы и уровня значимости составляет .

Поскольку , то коэффициент корреляции статистически не значим.

Задача 2.2. Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость. Исходные данные:

х 18 22 13 20 15 14

у 17 20 11 18 14 10

Результаты:

1. Коэффициент корреляции.

2.Расчетное и табличное значения критерия Стьюдента, вывод о значимости. ВСЕ РЕЗУЛЬТАТЫ до 2-х знаков после запятой.

Решение:

Х:

20

24

15

22

17

16

У:

19

22

13

20

16

20

YX:

380

528

195

440

272

320

= 2,9

= 2,1

Табличное значение t-критерия для числа степеней свободы и уровня значимости составляет .

Задача 2.3. В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистики по сто балльной системе:

Теория вероятностей: 65 90 42 47 84 58 50

Статистика: 51 85 36 63 72 80 40.

Определить коэффициент ранговой корреляции Спирмена и его значимость.

Результаты:

1. Коэффициент ранговой корреляции.

2. Расчетное и табличное значения критерия Стьюдента при уровне значимости равном 0,05 и выводы.

Решение: Для расчета составим вспомогательную таблицу

№, п/п

Баллы по ТВ

Баллы по Стат

)

1

67

53

5

6

-1

1

2

92

87

7

7

0

0

3

44

38

1

5

-4

16

4

49

65

6

3

3

9

5

86

74

6

3

3

9

6

60

82

5

3

2

4

7

52

42

3

7

-4

16

?

55

- ранги студентов по количеству набранных баллов по теории вероятностей и статистике соответственно

Величина коэффициента Спирмена указывает на высокую тесноту связи между баллами, набранными по теории вероятностей и по статистике.

Табличное значение t-критерия для числа степеней свободы и уровня значимости составляет .

Поскольку , то коэффициент ранговой корреляции Спирмена статистически значим.

Далее рассчитаем значение коэффициента Стьюдента. Для его расчета необходимы дополнительные расчеты, представленные в таблице

№ студента

1

2

3

4

5

6

7

Теория вероятностей (x)

67

92

44

49

86

60

52

450

Статистика (y)

53

87

38

65

74

82

42

441

хi-x?

2,72

27,72

-20,28

-15,28

21,72

-4,28

-12,28

 

yi-y?

-10

24

-25

2

11

19

-21

 

i-x?)(yi-y?)

-27,2

665,28

507

-30,56

238,92

-81,32

257,88

1530

i-x?)І

7,3984

768,3984

411,2784

233,4784

471,7584

18,3184

150,7984

2061,4288

(yi-y?)І

100

576

625

4

121

361

441

2228

Среднее значение баллов по теории вероятности: х? = 64,28

Определим корреляционный момент:

Кху = 218,57 (2.1.5)

Вычислим дисперсии:

уІх = 294,49 (1.2)

уІy = 318,29

Коэффициент корреляции:

0,714 (2.1.1)

Определим расчетное значение критерия Стьюдента:

2,28 (2.1.3)

Затем определим табличное значение критерия: 2,57

Таким образом, можно сделать вывод, что коэффициент корреляции не значим, так как табличное значение критерия Стьюдента больше расчетного критерия.

3. Регрессионный анализ

Задача 3.1. Построить нелинейную обратную модель связи единицы продукции (у) со стоимостью основных фондов (х). Определить характеристики модели.

Исходные данные:

у: 21; 16; 15; 14; 13; 12,5; 11; 11,5; 10; 8

х: 1; 2; 3; 4; 5; 6; 7; 8; 9; 10

Характеристики модели:

1) модель (коэффициенты до 4-х знаков);

2) индекс детерминации (до 2-х знаков);

3) стандартную ошибку (до 4-х знаков);

4) расчетное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели;

5) вывод о значимости коэффициентов модели;

6) доверительные интервалы коэффициентов модели (до 4-х знаков)

Решение:

1) Уравнение обратной модели имеет вид:

2)

Произведем замену . В результате получим линейное уравнение .

y

x

X

yX

1

23

3

0,33

7,59

0,1089

28,32

1,74

60,84

2

18

4

0,25

4,5

0,0625

21,87

0,02

7,84

3

17

5

0,2

3,4

0,04

19,68

1,74

3,24

4

16

6

0,16

2,56

0,0256

18,65

1,82

0,64

5

15

7

0,14

2,1

0,0196

18

1

0,04

6

14,5

8

0,125

1,8125

0,0156

17,61

0,79

0,49

7

13

9

0,11

1,43

0,0121

17,23

0,05

4,84

8

13,5

10

0,1

1,35

0,01

17,1

0,16

2,89

9

12

11

0,09

1,08

0,0081

16,84

0,7

10,24

10

10

12

0,08

0,8

0,0064

16,71

7,34

27,04

Итого

152

75

1,585

26,62

0,3088

192,01

15,36

118,1

Среднее

15,2

7,5

0,1585

2,66

0,0308

19,2

1,536

11,81

Получим следующее уравнение гиперболической модели:

3) Определим индекс детерминации

Вариация результата у (себестоимость единицы продукции) на 87% объясняется вариацией фактора х (стоимостью основных фондов).

4) Определим стандартную ошибку модели:

5)

6) Определим F - критерий Фишера

По таблице Фишера определим критическое значение F-критерия при уровне значимости и числе степеней свободы . .

Уравнение регрессии с вероятностью 0,95 статистически значимое, так как .

7) Оценку статистической значимости параметров регрессии и корреляции проведем с помощь t - статистики Стьюдента и путем расчета доверительного интервала каждого из параметров.

Табличное значение t-критерия для числа степеней свободы и уровня значимости составляет .

Рассчитаем остаточную дисперсию:

Определим стандартные ошибки:

Тогда:

Фактические значения t - статистики для параметров , превышают табличные:

поэтому параметр статистически значимы.

8) Рассчитаем доверительные интервалы для параметов регрессии a и b. Определим предельную ошибку для каждого показателя:

Доверительные интервалы:

Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью p=1-б= 1-0,05=0,95% параметры и будут находиться в указанных границах.

Задача 3.2. Построить полулогарифмическую модель вида: y=a0+a1lnx по данным:

у 10; 13,4; 15,4; 16,5; 18,6; 19,1

х 1; 2; 3; 4; 5; 6.

Определить характеристики модели.

Каждое значение (у) увеличить на свой номер классного журнала.

Характеристики модели: 1) модель (коэффициенты до 2-х знаков);

2) индекс детерминации (до 2-х знаков);

3) стандартную ошибку (до 4-х знаков);

4) расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели.

Решение: 1) Построим уравнение полулогарифмической модели:

Произведем замену . В результате получим линейное уравнение .

y

x

X

yX

1

12

1

0

0

0

15,97

0,0009

30,25

2

15,4

2

0,69

10,62

0,48

19,44

0,0016

4,41

3

17,4

3

1,1

29,14

1,21

21,5

0,01

0,01

4

18,5

4

1,39

25,71

1,93

22,96

0,21

1

5

20,6

5

1,61

33,16

2,59

24,07

0,28

9,61

6

21,1

6

1,79

37,76

3,2

24,97

0,02

12,96

Итого

105

21

6,58

136,39

9,41

128,91

0,52

58,24

Среднее

17,5

3,5

1,1

22,73

1,57

21,49

0,09

9,7

Получим следующее уравнение обратной модели:

1) Рассчитаем коэффициент детерминации:

2)

Значение коэффициента детерминации указывает на то, что вариация Y на 99% обусловлена вариацией показателя X и на 1% - влиянием прочих факторов, не учтенных в модели.

3) Определим стандартную ошибку модели:

4)

5) Проведем оценку значимости уравнения регрессии с помощью F-критерия Фишера:

По таблице Фишера определим критическое значение F-критерия при уровне значимости и числе степеней свободы . .

Так как наблюдаемое значение критерия больше табличного , следовательно, с вероятностью 0,95 уравнение регрессии признается статистически значимым.

Задача 3.3 Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 3.1.

Динамика коэффициента рождаемости в Пензенской области

Год

2000

2001

2002

2003

2004

2005

Коэффициент рождаемости

7,5

7,5

8,0

8,4

8,6

8,4

Год

2006

2007

2008

2009

2010

2011

Коэффициент рождаемости

8,6

9,7

10,2

10,3

10,2

10,1

Год

2012

2013

2014

2015

2016

Коэффициент рождаемости

10,8

10,6

10,8

10,7

10,2

Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г. В электронную таблицу вместо года ставить 1,2,…

Решение: 1) Построим линейную модель , параметры которой оценим МНК

Данные для расчета линейного уравнения тренда

Год

t

Коэффициент рождаемости,

2000

1

7,5

-8

64

-1,98

15,84

7,72

-0,22

2,9

2001

2

7,5

-7

49

-1,98

13,86

7,94

-0,44

5,87

2002

3

8

-6

36

-1,48

8,88

8,16

-0,16

2

2003

4

8,4

-5

25

-1,08

5,4

8,38

0,04

0,48

2004

5

8,6

-4

16

-0,88

3,52

8,6

0

0

2005

6

8,4

-3

9

-1,08

3,24

8,82

-0,42

5

2006

7

8,6

-2

4

-0,88

1,76

9,04

-0,44

5,12

2007

8

9,7

-1

1

-0,22

0,22

9,26

0,44

4,5

2008

9

10,2

0

0

0,72

0

9,48

0,72

7,06

2009

10

10,3

1

1

0,82

0,82

9,7

0,6

5,83

2010

11

10,2

2

4

0,72

1,44

9,92

0,28

2,75

2011

12

10,1

3

9

0,62

1,86

10,14

-0,04

0,4

2012

13

10,8

4

16

1,32

5,28

10,36

0,44

4,07

2013

14

10,6

5

25

1,12

5,6

10,58

0,02

0,19

2014

15

10,8

6

36

1,32

7,92

10,8

0

0

2015

16

10,7

7

49

1,22

8,54

11,02

-0,32

2,99

2016

17

10,2

8

64

0,72

5,76

11,24

-1,04

10,2

Итого

153

160,6

0

408

-1

89,94

161,16

-0,54

59,36

Cред.знач

9

9,48

Линейная модель имеет вид

2) Определим

В среднем, расчетные значения отклоняются от фактических на 3,5%. Поскольку ошибка меньше 5%, то данное уравнение качественно описывает тенденцию изменения коэффициент рождаемости.

3) Определим стандартную ошибку модели по формуле [9]

.

4) Определим коэффициент детерминации

Расчеты для коэффициента детерминации

t

у

ур

еt

еt2

1

7,5

7,72

-0,22

0,05

-1,98

3,92

2

7,5

7,94

-0,44

0,19

-1,98

3,92

3

8

8,16

-0,16

0,03

-1,48

2,19

4

8,4

8,38

0,04

0,0016

-1,08

1,17

5

8,6

8,6

0

0

-0,88

0,77

6

8,4

8,82

-0,42

0,18

-1,08

1,17

7

8,6

9,04

-0,44

0,19

-0,88

0,77

8

9,7

9,26

0,44

0,19

-0,22

0,05

9

10,2

9,48

0,72

0,52

0,72

0,52

10

10,3

9,7

0,6

0,36

0,82

0,67

11

10,2

9,92

0,28

0,08

0,72

0,52

12

10,1

10,14

-0,04

0,0016

0,62

0,38

13

10,8

10,36

0,44

0,19

1,32

1,74

14

10,6

10,58

0,02

0,0004

1,12

1,25

15

10,8

10,8

0

0

1,32

1,74

16

10,7

11,02

-0,32

0,10

1,22

1,49

17

10,2

11,24

-1,04

1,08

0,72

0,52

Итого

160,6

161,16

-0,54

3,16

-1

22,79

Ср. знач.

9,48

Таким образом, на 86% вариация коэффициента рождаемости обусловлена зависимостью от времени, на 14% - влиянием прочих факторов, не включенных в данную модель.

Оценим статистическую значимость уравнения регрессии в целом с помощью F-критерия Фишера. Фактическое значение F-критерия рассчитаем по формуле:

При уровне значимости и степенях свободы табличное значение критерия составляет . Так как , то уравнение регрессии признается статистически значимым.

По уравнению тренда найдем прогноз величины коэффициента рождаемости на 2017 год:

Задача 3.4. Реальные статистические данные о курсе валют приведены в таблице 3.2. Построить линейную и нелинейные регрессионные модели вида: у = ао + а1t; lnу = ао + а1t; у = 1/(ао + а1t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. В электронную таблицу вместо года записывать 1,2,… По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.

Курс рубля к доллару

Месяц и год

январь

2017

февраль

март

апрель

май

июнь

июль

август

2017

Цена одного доллара

59,6

58,5

58,0

56,4

57,0

57,9

59,7

59,6

Построим линейную модель , параметры которой оценим МНК

Данные для расчета линейного уравнения тренда

месяц

t

Курс доллара,руб

Январь

1

59,6

-3,5

1,3

-4,55

12,25

58,08

1,52

2,3

2,55

Февраль

2

58,5

-2,5

0,2

-0,5

6,25

58,15

0,35

0,12

0,6

Март

3

58

-1,5

-0,3

0,45

2,25

58,23

-0,23

0,05

0,4

Апрель

4

56,4

-0,5

-1,9

0,95

0,25

58,3

-1,9

3,61

3,37

Май

5

57

0,5

-1,3

-0,65

0,25

58,38

-1,38

1,9

2,42

Июнь

6

57,9

1,5

-0,4

-0,6

2,25

58,45

-0,55

0,3

0,95

Июль

7

59,7

2,5

1,4

3,5

6,25

58,53

1,17

1,37

1,96

Август

8

59,6

3,5

1,3

4,55

12,25

58,6

1

1

1,68

Итого

36

466,7

0

0,3

3,15

42

466,7

-0,02

10,65

13,93

Сред.знач

4,5

58,3

Линейная модель имеет вид

Положительное значение коэффициента при t указывает на то, что имеется тенденция роста курса доллара, причем величина прироста ежегодно составляет в среднем 0,075 руб.

Определим

В среднем, расчетные значения отклоняются от фактических на 1,74%. Поскольку ошибка меньше 5%, то данное уравнение качественно описывает тенденцию изменения коэффициент рождаемости.

1) Определим стандартную ошибку модели по формуле

.

Определим коэффициент детерминации

Расчеты для коэффициента детерминации

t

Курс доллара,руб

1

59,6

58,08

1,52

2,3

1,3

1,69

2

58,5

58,15

0,35

0,12

0,2

0,04

3

58

58,23

-0,23

0,05

-0,3

0,09

4

56,4

58,3

-1,9

3,61

-1,9

3,61

5

57

58,38

-1,38

1,9

-1,3

1,69

6

57,9

58,45

-0,55

0,3

-0,4

0,16

7

59,7

58,53

1,17

1,37

1,4

1,96

8

59,6

58,6

1

1

1,3

1,69

Итого

466,7

466,7

-0,02

10,65

0,3

10,93

Ср. знач.

58,3

Таким образом, на 2,6% вариация курса доллара обусловлена зависимостью от времени, на 97,4% - влиянием прочих факторов, не включенных в данную модель.

Оценим статистическую значимость уравнения регрессии в целом с помощью F-критерия Фишера. Фактическое значение F-критерия рассчитаем по формуле:

При уровне значимости и степенях свободы табличное значение критерия составляет .[10]

Так как , то делается вывод о наличии статистически значимых различий частоты исхода в зависимости от воздействия фактора риска

Построим уравнение нелинейного тренда курса доллара, которое имеет вид:

Введем замену . В результате получим линейное уравнение .

Данные для расчета уравнения тренда

месяц

t

Курс доллара,руб.

t2

Январь

1

59,6

4,09

1

4,09

58,62

0,97

1,59

0,02

Февраль

2

58,5

4,07

4

8,14

59,26

0,58

0,03

0,01

Март

3

58

4,06

9

12,18

59,92

3,68

0,11

0,03

Апрель

4

56,4

4,03

16

16,13

60,58

17,49

3,75

0,07

Май

5

57

4,04

25

20,22

61,25

18,08

1,79

0,07

Июнь

6

57,9

4,06

36

24,35

61,93

16,24

0,19

0,07

Июль

7

59,7

4,09

49

28,63

62,61

8,50

1,86

0,05

Август

8

59,6

4,09

64

32,70

63,31

13,74

1,59

0,06

Итого

36...


Подобные документы

  • Изучение качества продукции и услуг с помощью системы общих и частных статистических показателей: сводка и группировка, средние величины и показатели вариации, корреляционно-регрессионный анализ. Прогнозирование качества продукции, его цели и задачи.

    курсовая работа [438,0 K], добавлен 23.09.2016

  • Понятие о средних величинах как обобщении в экономике. Виды средних величин: арифметическая, гармоническая, геометрическая, квадратическая и кубическая. Показатели вариации. Методика и примеры решения типовых задач на нахождение средних величин.

    курсовая работа [27,7 K], добавлен 31.05.2008

  • Понятие корреляционно-регрессионного анализа как метода изучения по выборочным данным статистической зависимости ряда величин. Оценка математического ожидания, дисперсии, среднего квадратического отклонения и коэффициента корреляции случайных величин.

    курсовая работа [413,0 K], добавлен 11.08.2012

  • Сущность корреляционно-регрессионного анализа и его использование в сельскохозяйственном производстве. Этапы проведения корреляционно-регрессионного анализа. Области его применения. Анализ объекта и разработка числовой экономико-математической модели.

    курсовая работа [151,0 K], добавлен 27.03.2009

  • Сущность корреляционно-регрессионного анализа и экономико-математической модели. Обеспечение объема и случайного состава выборки. Измерение степени тесноты связи между переменными. Составление уравнений регрессии, их экономико-статистический анализ.

    курсовая работа [440,3 K], добавлен 27.07.2015

  • Особенности корреляционно-регрессионного анализа, его основные этапы. Характеристика показателей социально-экономического развития стран Африки. Этапы построения уравнения регрессии. Анализ средней продолжительности жизни населения в странах Африки.

    контрольная работа [47,2 K], добавлен 17.04.2012

  • Определение задачи регрессионного анализа как установления формы корреляционной связи (линейной, квадратичной, показательной). Графическая интерпретация коэффициента детерминации. Виды регрессий: линейная, нелинейная, гипербола, экспонента и парабола.

    доклад [131,5 K], добавлен 13.12.2011

  • Понятие, задачи и основные цели регрессионного анализа. Прогнозирование, основанное на использовании моделей временных рядов. Определение степени детерминированности вариации критериальной переменной предикторами. Ошибки, возникающие при измерении данных.

    контрольная работа [785,9 K], добавлен 13.11.2011

  • Связь между случайными переменными и оценка её тесноты как основная задача корреляционного анализа. Регрессионный анализ, расчет параметров уравнения линейной парной регрессии. Оценка статистической надежности результатов регрессионного моделирования.

    контрольная работа [50,4 K], добавлен 07.06.2011

  • Задачи на выявление зависимости между объемом продаж и расходами на рекламу методом парного корреляционно-регрессионного анализа. Построение поля корреляции. Использование для аппроксимации прямолинейной, параболической и логарифмической зависимости.

    контрольная работа [118,6 K], добавлен 11.12.2009

  • Получение функции отклика показателя качества Y2 и формирование выборки объемом 15 и более 60. Зависимость выбранного Y от одного из факторов Х. Дисперсионный анализ и планирование эксперимента. Проведение корреляционного и регрессионного анализа.

    курсовая работа [827,2 K], добавлен 19.06.2012

  • Навыки применения теоретических знаний по теме "Одномерный регрессионный анализ" при решении экономических задач с помощью системы GRETL. Анализ затрат в зависимости от числа ящиков, готовых к разгрузке. Обоснование результатов регрессионного анализа

    лабораторная работа [27,2 K], добавлен 15.12.2008

  • Проведение корреляционно-регрессионного анализа в зависимости выплаты труда от производительности труда. Построение поля корреляции, выбор модели уравнения и расчет его параметров. Вычисление средней ошибки аппроксимации и тесноту связи между признаками.

    практическая работа [13,1 K], добавлен 09.08.2010

  • Метод статистического исследования. Генеральная совокупность и выборка. Приведение статистики темпа инфляции за 10 лет. Выборочное обследование торговых предприятий, оценка величины запаса (в днях оборота). Этапы корреляционно-регрессионного анализа.

    контрольная работа [170,0 K], добавлен 20.01.2014

  • Абсолютные и относительные величины. Виды средних величин. Формы количественного выражения статистических показателей. Абсолютные размеры явлений и их признаков. Выбор единиц измерения величин. Индивидуальные, групповые и общие абсолютные величины.

    презентация [135,5 K], добавлен 16.03.2014

  • Теоретические основы прикладного регрессионного анализа. Проверка предпосылок и предположений регрессионного анализа. Обнаружение выбросов в выборке. Рекомендации по устранению мультиколлинеарности. Пример практического применения регрессионного анализа.

    курсовая работа [1,2 M], добавлен 04.02.2011

  • Задачи и этапы проведения корреляционного анализа, экономическая интерпретация его результатов. Критерии качественной и количественной однородности исходных данных: среднеквадратическое отклонение и коэффициент вариации. Показатели оценки уравнения связи.

    контрольная работа [76,9 K], добавлен 12.11.2013

  • Показатели статистики занятости и безработицы, а также баланс трудовых ресурсов. Изучение межрегиональной вариации уровня безработицы. Построение уравнения регрессии. Регрессионная модель зависимости уровня безработицы и внутреннего валового продукта.

    курсовая работа [604,2 K], добавлен 16.09.2014

  • Построение рядов динамики; определение закономерностей развития общественных явлений во времени. Интерпретация динамических характеристик. Аналитическое выравнивание и прогнозирование, дисперсионный и корреляционно-регрессионный анализ показателей.

    практическая работа [1014,3 K], добавлен 18.04.2014

  • Корреляционный и регрессионный анализ экономических показателей. Построение матрицы парных коэффициентов корреляции. Расчет и сравнение частных и парных коэффициентов корреляции. Построение регрессионной модели и её интерпретация, мультиколлинеарность.

    курсовая работа [314,1 K], добавлен 21.01.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.