Общая теория статистики

Статистика как самостоятельная общественная наука. Изучение методов статистических исследований, применяемых в области экономики, менеджмента. Способы проведения корреляционного и регрессионного анализа. Определение средних величин и показателей вариации.

Рубрика Экономика и экономическая теория
Вид курсовая работа
Язык русский
Дата добавления 22.02.2019
Размер файла 1,0 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ПЕНЗЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ФАКУЛЬТЕТ «ЭКОНОМИКА И УПРАВЛЕНИЕ»

КАФЕДРА «ЭКОНОМИКА И ФИНАНСЫ»

КУРСОВАЯ РАБОТА

по дисциплине: «Общая теория статистики»

Автор работы

Федорова Л.Н.

Специальность: 38.03.01 Экономика.

Группа: 16ЭЭ3

Руководитель работы

В.Н. Деркаченко

Пенза 2017

Введение

Статистика - самостоятельная общественная наука, которая, как и любая другая наука, имеет свои методы исследования.

Для принятия наиболее оптимальных решений в области своей деятельности таким специалистам, как экономисты и менеджеры, необходимо овладеть методами статистических исследований, ведь в дальнейшем знания и умения пользоваться методами статистических исследований помогут более эффективно изучать тенденции рыночной конъюнктуры товаров и услуг.

Статистика играет огромную роль в области экономики, а статистическая информация является важнейшей составной частью глобальной информационной системы государства.

Можно сказать, что статистика обеспечивает анализ количественной стороны, а также служит основой для принятия соответствующих управленческих решений.

Развитие экономики характеризуется еще и тем, насколько эффективно используются ресурсы, имеющиеся в государстве, и прежде всего рабочая сила. Поддержание занятости - одно из важнейших цель экономической политики. статистика экономика менеджмент корреляционный

Основными задачами данной курсовой работы являются: - проведение корреляционного анализа;

- определение средних величин и показателей вариации;

- проведение регрессионного анализа.

Целью данной курсовой работы является решение задач по каждому из разделов.

Мой номер классного журнала - 21.

1. Средние величины и показатели вариации

Средние величины относятся к обобщающим статистическим показателям, которые дают сводную (итоговую) характеристику массовых общественных явлений, так как строятся на основе большого количества индивидуальных значений варьирующего признака. Для выяснения сущности средней величины необходимо рассмотреть особенности формирования значений признаков тех явлений, по данным которых исчисляют среднюю величину[2].

В статистике используют различные виды средних величин, которые делятся на два больших класса:

1) степенные средние (средняя гармоническая, средняя геометрическая, средняя арифметическая, средняя квадратическая, средняя кубическая);

2) структурные средние (мода, медиана).

Для вычисления степенных средних необходимо использовать все имеющиеся значения признака. Мода и медиана определяются лишь структурой распределения. Поэтому их именуют структурными, позиционными средними. Медиану и моду часто используют как среднюю характеристику в тех совокупностях, где расчет средней степенной невозможен или нецелесообразен.

Самый распространенный вид средней - средняя арифметическая. Средней арифметической называется такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности. [2].

(1.1)

Наряду с простой средней арифметической изучают среднюю арифметическую взвешенную.

= (1.2)

Также известны другие средние, их можно определить по общей формуле:

(1.3), где k - степень, определяющая различные средние.

Средняя гармоническая взвешенная находится по формуле:

гм= (1.4)

Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой - больше ее. Медиана используется при изучении элемента, значение которого больше или равно или одновременно меньше или равно половине элементов ряда распределения. Медиана дает общее представление о том, где сосредоточены значения признака, иными словами, где находится их центр. [1].

Ме = Xн + i ) (1.5),

где Хн - нижняя граница интервала;

i - ширина интервала;

n - объем выборки (число наблюдений);

- накопленная частота интервала, предшествующего медианному;

mме - частота медианного интервала;

Также существует такой показатель как мода, который находится как:

М0 = хн + i (1.6),

где Хн - нижняя граница интервала, содержащего моду;

i - ширина интервала;

m2 - частота модального интервала;

m1- частота интервала, предшествующего модальному;

m3 - частота интервала, следующего за модальным.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности, формально имеем:

R = Xmax - Xmin (1,7)

Простое среднее линейное отклонение:

= (1.8)

Взвешенное среднее линейное отклонение:

вз = (1.9)

Среднеквадратическое отклонение:

у = (1.10).

Средняя дисперсия :

уІ = (1.11).

Взвешенная дисперсия:

уІвз = (1.12).

Среднее квадратическое отклонение:

) = (1.13)

Взвешенное среднее квадратическое отклонение:

= (1.14)

Коэффициент вариации - наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% для распределений, близких к нормальному.

V = 100% (1.15)

Задача 1.1. По статистическим данным: 3; 5; 2; 4; 7; 3; 8; 3; 10 определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации. Каждое значение увеличить на свой номер классного журнала. Дисперсия до одного знака после запятой; среднеквадратическое - до двух; коэффициент вариации - до одного в процентах.

Решение:

Увеличим значения на 21 и получим следующие данные:

24; 26; 23; 25; 28; 24; 29; 24; 31.

Определим среднее значение по формуле 1.1

= = 26

Мода = 24, так как это часто встречающее значение.

Чтобы определить медиану, необходимо расставить ряд в порядке возрастания.

Получим: 23; 24; 24; 24; 25; 26; 28; 29;31.

Количество значений нечетное, поэтому медианой будет являться число 25, т. к. оно занимает центральное положение в ряду.

Далее, определим среднюю дисперсию:

уІ(sІ) = =

Теперь вычислим среднеквадратическое отклонение:

у = = 2,24

Наконец, найдем коэффициент вариации:

V = = 8,6 %

Задача 1.2. По данным статистики в отчетном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 42%, стоимость основных фондов увеличилась на 31%. Определить изменение фондоотдачи.

Решение:

Фондоотдача = * 100% = *100% = 108%

Фондоотдача = 108%-100% = 8%

Таким образом, при увеличении дохода от реализации продукции в отчетном периоде по сравнению с базисным 42% на и увеличении стоимости основных средств на 31%, то фондоотдача изменится на 8%.

Задача 1. 3. Объем оборота (У) и число работников (m) приведены в таблице 1.1. Определить среднее значение, моду и медиану.

Таблица 1.1 - Исходные данные

У

80-100

100-120

120-140

140-160

160-180

180-200

m

6

17

25

28

14

10

Решение:

Таблица 1.2

У

m

Середина интервала

Накопленная частота

80-100

6

90

6

100-120

17

110

23

120-140

25

130

48

140-160

28

150

76

160-180

14

170

90

180-200

10

190

100

Итого

100

Найдем среднюю простую:

x?= 141,4

Для определения моды и медианы, необходимо найти медийный интервал.

Медианным интервалом будет интервал 140-160, так как накопленная частота на этом промежутке превысит значение

50. (76 >50).

Найдем медиану:

140+20 =141,43

Вычисляем моду:

М0 = хн + i = 140 + 20[] =143,53

Задача 1.4. По данным таблицы определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации. В таблице: Х-объем оборота предприятий, млн. руб., mг - число государственных предприятий; mч - частных; mо - общее число (таблица 1.3). Каждое значение Хi увеличить на свой номер классного журнала.

Таблица 1.3. Исходные данные по объему оборота предприятий

Хi

mгi

mчi

moi

22,0-22,2

3

3

22,2-22,4

4

4

22,4-22,6

17

17

22,6-22,8

11

15

26

22,8-23,0

13

6

19

23,0-23,2

18

5

23

23,2-23,4

6

6

23,4-23,6

2

2

50

50

100

Результаты, например, общая дисперсия равна 97830 руб. и коэффициент детерминации, целое число в %.

Решение:

Чтобы определить общую дисперсию, необходимо знать значение общей средней:

При расчете общей дисперсии необходимо использовать вид взвешенной, т.к. имеется частота:

= = 0,09 или 90 000 руб.

Для вычисления внутригрупповой дисперсии по группам необходимо рассчитать среднее значение:

= = 23

Внутригрупповая дисперсия определяется по формуле:

или 556 000 руб.

Межгрупповая дисперсия вычисляется следующим образом:

или 344 000 руб.

Теперь необходимо рассчитать коэффициент детерминации:

- связь умеренная, т.к. находится в интервале 30% - 50%.

Таким образом,

Задача 1. 5. Определить среднюю внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из трех групп (таблица 1.4).

Таблица 1.4 - Исходные данные

1 группа

Хi

1

2

8

mi

30

15

5

2 группа

Хi

1

6

mi

10

15

3 группа

Хi

3

8

mi

20

5

Решение:

В первую очередь, необходимо определить среднее значение для 3-х групп, и используя получившиеся результаты, рассчитать для них взвешенные дисперсии.

Для нахождения средней внутригрупповой дисперсии необходимо просуммировать получившиеся взвешенные и поделить их на 3:

Теперь необходимо рассчитать общее среднее значение и общую дисперсию:

Ответ:

2. Корреляционный анализ

Корреляционный анализ -- это метод, применяющийся с целью проверки гипотезы о статистической значимости двух и более переменных, если исследователь их может измерять, но не изменять[3].

Корреляционный анализ предполагает определение зависимости между изучаемыми признаками, в связи, с чем задачи корреляционного анализа можно дополнить следующими:

1) выявление факторов, оказывающих наибольшее влияние на результативный признак;

2) выявление неизученных ранее причин связей;

3) построение корреляционной модели с ее параметрическим анализом;

4) исследование значимости параметров связи и их интервальная оценка.

На величину показателей влияет несколько факторов, поэтому для оценки тесноты связи между показателем и факторами используются множественный корреляционный анализ. [3].

Корреляционный момент определяется:

(2.1),

где n - объем выборки, число наблюдений;

Xi , Yi - i-тое значение фактора и показателя;

X?, - средние значения фактора и показателя.

Корреляционный момент имеет размерность, то переходят к безразмерному коэффициенту корреляции:

rxy = (2.2),

где - среднеквадратические отклонения фактора и показателя.

Для расчета коэффициента корреляции также используется следующая зависимость:

rxy = (2.3),

где - среднее значения произведения фактора на показатель.

Коэффициент корреляции изменяется в пределах: -1 r +1

Значимость коэффициента корреляции базируется на проверке статистических гипотез, выдвигается нулевая гипотеза о том, что коэффициент корреляции равен нулю и контр гипотеза, что он не равен нулю: H0: r=0; H1: r 0.

После этого определяется расчетное значение критерия Стьюдента по формуле:

t = (2.4).

Далее находится табличное значение критерия Стьюдента. Входом в табличное значение является уровень значимости и степень свободы . На практике, чаще всего, принимают за 0; 0,5; = n2. Если расчетное значение критерия Стьюдента больше табличного, то нулевая гипотеза отвергается и, следовательно, коэффициент корреляции значим. Если же, табличное значение критерия Стьюдента больше расчетного значения критерия, то нулевая гипотеза подтверждается, а, следовательно, коэффициент корреляции не значим. [3].

Также для расчетов в этом разделе используется коэффициент ранговой корреляции Спирмена:

(2.5)

Корреляционный момент:

Кху = (2.6)

Задача 2. 1. Определить коэффициент корреляции между У и Х. Х: 3,5; 4,6; 5,8; 4,2; 5,2;

УХ: 28,35; 43,24; 65,54; 28,98; 50,44.

Оценить значимость коэффициента корреляции при уровне 0,05. Расчеты и ответы до двух знаков. Результаты:

1) коэффициент корреляции;

2) расчетное и табличное значения критерия Стьюдента и вывод.

Решение:

Таблица 2.1

У

29,1

30,4

32,3

27,9

30,7

150,4

Х

24,5

25,6

26,8

25,2

26,2

128,3

ХУ

712,95

778,24

865,64

703,08

804,34

3864,25

(Хi-Х?)І

1,3456

0,0036

1,2996

0,2116

0,2916

3,152

(Уi-У?)І

0,9604

0,1024

4,9284

4,7524

0,3844

11,128

Вычислим средние значения:

X?=

У?=

Перед расчетом коэффициента корреляции необходимо вычислить среднее квадратическое отклонение для показателей x и y:

= 0,6304

Коэффициент корреляции определяется по формуле:\

В соответствии с данными задачи, расчет выглядит следующим образом:

Вывод: связь между показателем и фактором сильная, т.к. её значение находится в интервале 0,6-0,8. Значимость коэффициента корреляции проверяется по критерию Стьюдента. Вначале вычисляется расчетное значение критерия по формуле:

Табличное значение критерия Стьюдента:

Вывод: расчетное значение меньше табличного, то коэффициент корреляции не значимый, необходимо увеличить объем выборки.

Ответ: = ; ; коэффициент не значим.

Задача 2.2. Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость.

Таблица 2.2 Исходные данные

х

у

39

38

43

41

34

32

41

39

36

35

35

31

Решение:

Таблица 2.3

x

y

x2

y2

x * y

39

38

1521

1444

1482

43

41

1849

1681

1763

34

32

1156

1024

1088

41

39

1681

1521

1599

36

35

1296

1225

1260

35

31

1225

961

1085

228

216

8728

7856

8277

Для наших данных система уравнений имеет вид

6a + 228*b = 216

228*a + 8728*b = 8277

Домножим уравнение (1) на -38, получим систему, которую можно решить методом алгебраического сложения.

-228а - 8664*b = -8208

228*а + 8728*b = 8277

64*b = 69

b =1.0781

Теперь найдем коэффициент «а» из уравнения 1:

6*а + 228*1,0781 = 216

6*а = - 29813

а = -4,9688

Получаем эмпирические коэффициенты регрессии: b = 1.0781, a = -4.9688

Уравнение регрессии (эмпирическое уравнение регрессии):

y = 1.0781 x -4.9688

Параметры уравнения регрессии

Выборочные дисперсии:

Среднеквадратическое отклонение:

Коэффициент корреляции:

Значимость коэффициента корреляции:

По таблице Стьюдента с уровнем значимости б=0.05 и степенями свободы k=4 находим tкрит:

tкрит (n-m-1;б/2) = (4;0.025) = 2.776

Поскольку |tнабл| > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим

Задача 2.3.

В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистики по сто балльной системе.

Решение:

Таблица 2.4

Теория вероятности

Статистика

86

72

111

106

63

57

68

84

105

93

79

101

71

61

Матрица рангов.

Таблица 2.5

ранг (Rтв), dx

ранг (Rс), dy

(dx - dy)2

5

3

4

7

7

0

1

1

0

2

4

4

6

5

1

4

6

4

3

2

1

28

28

14

Проверка правильности составления матрицы на основе исчисления контрольной суммы:

Сумма по столбцам матрицы равны между собой и контрольной суммы, значит, матрица составлена правильно.

По формуле вычислим коэффициент ранговой корреляции Спирмена.

Связь между признаком Y и фактором X сильная и прямая

3. Регрессионный анализ

Регрессионный анализ - это метод установления аналитического выражения стохастической зависимости между исследуемыми признаками. Уравнение регрессии показывает, как в среднем изменяется у при изменении любого из xi.

В ходе регрессионного анализа решаются две основные задачи:

- построение уравнения регрессии, т.е. нахождение вида зависимости между результатным показателем и независимыми факторами x1, x2, …, xn.

- оценка значимости полученного уравнения, т.е. определение того, насколько выбранные факторные признаки объясняют вариацию признака у.

Применяется регрессионный анализ главным образом для планирования, а также для разработки нормативной базы[6].

В отличие от корреляционного анализа, который только отвечает на вопрос, существует ли связь между анализируемыми признаками, регрессионный анализ дает и ее формализованное выражение. Кроме того, если корреляционный анализ изучает любую взаимосвязь факторов, то регрессионный - одностороннюю зависимость, т.е. связь, показывающую, каким образом изменение факторных признаков влияет на признак результативный.

Формулы и модели регрессионного анализа:

1) линейная модель

y= a0+a1x (3.1)

2) нахождение коэффициента а1 модели:

а1 = (3.2)

3) нахождение коэффициента a0 модели:

a0 = а1 (3.3)

4) стандартная ошибка :

Sy= (3.4)

5) коэффициент детерминации:

R 2 = 1- (3.5)

6) критерий Стьюдента для коэффициентов:

(3.6)

7) случайные отклонения a1 и a0

; (3.7)

8) критерий Фишера :

(3.8)

9) стандартное отклонение

(3.9)

10) стандартная ошибка:

(3.10)

Задача 3.1. Построить нелинейную обратную модель связи себестоимости единицы продукции (у) со стоимостью основных фондов (х). Определить характеристики модели.

Характеристики модели: 1) модель (коэффициенты до 4-х знаков);

2) индекс детерминации (до 2-х знаков);

3) стандартную ошибку (до 4-х знаков);

4) расчетное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели;

5) вывод о значимости коэффициентов модели;

6) доверительные интервалы коэффициентов модели (до 4-х знаков).

Решение: Для расчета параметров регрессии построим расчетную таблицу (табл. 3.1)

Таблица 3.1

y

y2

1/х

у/х

1/x2

х

42

1764

1

42

1

1

37

1369

0,5

18,5

0,25

2

36

1296

0,333

12

0,11

3

35

1225

0,25

8,75

0,625

4

34

1156

0,2

6,8

0,04

5

33,5

1122,25

0,167

5,583

0,028

6

32

1024

0,143

4,571

0,0204

7

32,5

1056,25

0,125

4,0625

0,016

8

31

961

0,111

3,44

0,0123

9

29

841

0,1

2,9

0,01

10

342

11814,5

2,929

108,4965

2,1117

55

Среднее значение

34,2

1181,45

0,293

10,84965

0,21117

5,5

Можно вычислить коэффициент a0 и коэффициент а1, для модели, которую необходимо поcтроить:

а1 = = = 6,6154

а0 = а1 = 34,2 - 6,6154 0,293 = 32,2617

Формально а0 показывает прогнозируемый уровень у, но только в том случае, если х0 находится близко с выборочными значениями.

Но если х0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.

По имеющимся данным можно построить модель. Она будет иметь следующий вид:

= 32,2617 +

Определим каждое значение .

Таблица 3.2 - Расчет показателей индекса детерминации, стандартной ошибки

y

Х

y?

(y-yЇ)І

(y-y^)І

42

1

38,8771

60,84

9,75250441

20,25

37

2

35,5694

7,84

2,04661636

12,25

36

3

34,4668

3,24

2,35070224

6,25

35

4

33,91555

0,64

1,1760318

2,25

34

5

33,58478

0,04

0,1724076

0,25

33,5

6

33,36427

0,49

0,0184226

0,25

32

7

33,2068

4,84

1,456366

2,25

32,5

8

33,088625

2,89

0,346479

6,25

31

9

32,99674

10,24

3,9869706

12,25

29

10

32,92324

27,04

15,391812

20,25

342

55

341,9933

118,1

36,69831

82,5

Ср.

знач.

34,2

5,5

34,19933

11,81

8,25

По данной таблице определим коэффициент детерминации:

R2 = 1- = 1- = 0,69

Можно вычислить индекс детерминации (R), он равен:

R = = 0,83. В нашем примере связь между признаком Y и фактором X весьма высокая и прямая.

По данной таблице рассчитаем стандартную ошибку модели, а также расчетное значение критерия Фишера:

Стандартная ошибка :

Sy= = = 12,9748

Критерий Фишера (F):

= = 17,81

Найдем табличное значение коэффициента Фишера. Оно будет равно 5,32 при значимости б=0,05 и критерием f = 8 . Уравнение регрессии с вероятностью 0,95 статистически значимое, так как F Fтаб.

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается нулевая гипотеза Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля.

Чтобы проверить, значимы ли параметры, т.е. значимо ли они отличаются от нуля, для генеральной совокупности используют статистические методы проверки гипотез.

В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности.

Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости б=0.05.

H0: b = 0, то есть между переменными x и y отсутствует линейная взаимосвязь в генеральной совокупности;

H1: b ? 0, то есть между переменными x и y есть линейная взаимосвязь в генеральной совокупности. В случае если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется t-критерий Стьюдента.

Вычислим стандартные отклонения величин параметров модели:

0,125

Далее определим случайные отклонения a0 и а1:

4,7698

32,848

Далее определим критерий Стьюдента для коэффициентов:

0,20139

6,76374

Фактические значения t - статистики для параметров , превышают табличные:

6,76 ?= 2,306; =0,201 < 2,306

Рассчитаем доверительные интервалы для параметров регрессии a0 и а1. Определим предельную ошибку для каждого показателя:

= 2,306·4,7698 = 10,9991

= 2,306·32,848 = 75,7475

Доверительные интервалы:

Таким образом, доверительный интервал для а0:

32,2614-10,9991? a0?32,2614+10,9991

21,2623? a0?43,2305

6,6154 - 75,7475? a1?6,6154 + 75,7475

-69,1321 а182,3629

Таким образом, на основе анализа верхних и нижних границ доверительных интервалов можно сделать вывод, что параметры и с вероятностью 95% будут находиться в указанных границах интервалов.

Задача 3.2. Построить полулогарифмическую модель вида: y=a0+a1lnx по данным: Определить характеристики модели.

Характеристики модели:

1) модель (коэффициенты до 2-х знаков);

2) индекс детерминации (до 2-х знаков);

3) стандартную ошибку (до 4-х знаков);

4) расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели.

Решение:

Таблица 3.3

х

у

1

31

0

0

0

2

34,4

0,69

0,48

23,736

3

36,4

1,10

1,21

40,04

4

37,5

1,39

1,93

52,125

5

39,6

1,61

2,59

63,756

6

40,1

1,79

3,20

71,779

21

219

6,58

9,41

251,436

Определим а0 и а1 для построения модели:

а1 = = = 5,14

а0 = = = 30,8631

Далее, найдя коэффициенты, можем построить модель: = 30,8631 + 5,14lnx

Для расчета индекса детерминации, а также для других показателей, построим еще одну таблицу, с промежуточными вычислениями.

Таблица 3.4 - Расчет индекса детерминации

Y

X

y?

(y-yЇ)І

(y-y^)І

31

1

30,8631

30,25

0,0187

34,4

2

34,4097

4,41

0,0001

36,4

3

36,5171

0,01

0,0137

37,5

4

38,0077

1

0,2578

39,6

5

39,1385

9,61

0,212

40,1

6

40,0631

12,96

0,0013

219

21

219,0685

58,24

0,5036

Ср.знач.

36,5

3,5

По найденным значениям определим индекс детерминации:

0,99

Получается, что связь между признаком Y и фактором X высокая и прямая.

Определим стандартную ошибку:

0,1259 (3.1.9)

Проведем оценку значимости уравнения регрессии с помощью F-критерия Фишера:

По таблице Фишера определим критическое значение F-критерия при уровне значимости б=0,05 и числе степеней свободы k1 = 1, k2 = n - 2 = 6 - 2 = 4. Fкр=7,71.

Так как наблюдаемое значение критерия больше табличного F = 396 ? Fкр = 7,71 следовательно, с вероятностью 0,95 уравнение регрессии считается статистически значимым.

Задача 3.3. Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 3.5.

Таблица 3.5. Динамика коэффициента рождаемости в Пензенской области

Год

2000

2001

2002

2003

2004

2005

Коэффициент рождаемости

7,5

7,5

8,0

8,4

8,6

8,4

Год

2006

2007

2008

2009

2010

2011

Коэффициент рождаемости

8,6

9,7

10,2

10,3

10,2

10,1

Год

2012

2013

2014

2015

2016

Коэффициент рождаемости

10,8

10,6

10,8

10,7

10,2

Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г.

Решение:

1) Построим линейную модель У(t) = а0 + аit, параметры которой:

;

Таблица 3.6 - Промежуточные расчеты.

Год (t)

У

t - t?

(t-tЇ)І

y-y?

(t-t?)(y-y?)

ур

y-y?

(y-y^)І

(y-yЇ)І

1

7,5

-8

64

-1,947

15,576

7,692

-0,192

0,03694

2,56

3,791

2

7,5

-7

49

-1,947

13,629

7,912

-0,412

0,16933

5,49

3,791

3

8

-6

36

-1,447

8,6824

8,131

-0,131

0,01713

1,64

2,094

4

8,4

-5

25

-1,047

5,2353

8,350

0,050

0,00248

0,59

1,096

5

8,6

-4

16

-0,847

3,3882

8,570

0,030

0,00092

0,35

0,718

6

8,4

-3

9

-1,047

3,1412

8,789

-0,389

0,15132

4,63

1,096

7

8,6

-2

4

-0,847

1,6941

9,008

-0,408

0,16671

4,75

0,718

8

9,7

-1

1

0,2529

-0,253

9,228

0,472

0,22307

4,87

0,064

9

10,2

0

0

0,7529

0

9,447

0,753

0,56686

7,38

0,567

10

10,3

1

1

0,8529

0,8529

9,666

0,634

0,40145

6,15

0,728

11

10,2

2

4

0,7529

1,5059

9,886

0,314

0,09872

3,08

0,567

12

10,1

3

9

0,6529

1,9588

10,105

-0,005

0,00003

0,05

0,426

13

10,8

4

16

1,3529

5,4118

10,325

0,476

0,22610

4,40

1,83

14

10,6

5

25

1,1529

5,7647

10,544

0,056

0,00315

0,53

1,329

15

10,8

6

36

1,3529

8,1176

10,763

0,037

0,00135

0,34

1,83

16

10,7

7

49

1,2529

8,7706

10,983

-0,283

0,07986

2,64

1,57

17

10,2

8

64

0,7529

6,0235

11,202

-1,002

1,00400

9,82

0,567

153

160,6

0

408

0

89,5

160,6

0

3,14943

59,281

22,78

9

9,4471

0,219 , соответственно =9,4471-0,219·9 = 7,476

Отсюда уравнение линейного тренда принимает окончательный вид: y?t=0,219t +7,476

Положительное значение коэффициента при t указывает на то, что имеется тенденция роста, причем величина роста ежегодно составляет в среднем 0,219 единиц. Определим коэффициент детерминации:

0,8617

- т.е. в 86,17 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 13.83% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).

Определим стандартную ошибку:

0,4582 (3.1.9)

Оценим значимость модели с помощью критерия Фишера:

93,46.

Табличное значение критерия со степенями свободы k1=1 и k2=15, Fтабл = 4,54. Поскольку F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).

Определим ошибку аппроксимации:

100% = 3,492%.

В среднем, расчетные значения отклоняются от фактических на 3,49%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

Спрогнозируем коэффициент рождаемости в 2017:

y?2017=0,219·18+7,476 = 11,4.

Задача 3.4. Реальные статистические данные о курсе валют приведены в таблице 3.2. Построить линейную и нелинейные регрессионные модели вида: у = ао + а1t; lnу = ао + а1t; у = 1/(ао + а1t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. В электронную таблицу вместо года записывать 1,2,… По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.

Таблица 3.7. Курс рубля к доллару

Месяц и год

январь

2017

февраль

март

апрель

май

июнь

июль

август

2017

Цена одного доллара

59,6

58,5

58,0

56,4

57,0

57,9

59,7

59,6

Решение:

1) Построим уравнение линейного тренда курса доллара, которое имеет вид: , где и найдем из системы нормальных уравнений. (МНК) :

Таблица 3.8 - промежуточные расчеты

T

Цена (y)

t-t?

y-y?

(t-t?)( y-y?)

(t-tЇ)І

y?

y-y?

(y-y^)І

(y-y?)І

1

59,6

-3,5

1,2625

-4,41875

12,25

58,075

1,525

2,325625

2,5587

1,5939

2

58,5

-2,5

0,1625

-0,40625

6,25

58,15

0,35

0,1225

0,59829

0,0264

3

58

-1,5

-0,3375

0,50625

2,25

58,225

-0,225

0,050625

0,38793

0,1139

4

56,4

-0,5

-1,9375

0,96875

0,25

58,3

-1,9

3,61

3,36879

3,7539

5

57

0,5

-1,3375

-0,66875

0,25

58,375

-1,375

1,890625

2,41228

1,7889

6

57,9

1,5

-0,4375

-0,65625

2,25

58,45

-0,55

0,3025

0,94991

0,1914

7

59,7

2,5

1,3625

3,40625

6,25

58,525

1,175

1,380625

1,96817

1,8564

8

59,6

3,5

1,2625

4,41875

12,25

58,6

1

1

1,67785

1,5939

36

466,7

0

0

3,15

42

466,7

0

10,6825

13,92196

10,91875

Сред. знач 4,5

58,3375

58,3375

0,075. тогда : a0= 58,3375 - 4,5?0,075 = 58

Таким образом, линейная модель будет выглядеть как:

Определим коэффициент детерминации:

0,0216.

Определим стандартную ошибку: 1,3343.

Определим значимость модели используя критерий Фишера:

0,1325.

Табличное значение критерия со степенями свободы k1=1 и k2=6, Fтабл = 5,99. Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

Вычислим ошибку аппроксимации:

1,74

- в среднем, расчетные значения отклоняются от фактических на 1,74%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

Осуществим прогноз на декабрь 2017 года:=12·0,075+58=58,9

Построим регрессионную модель вида: lnу = ао + а1t. Все промежуточные расчеты приведем в таблице 3.2.2. Для удобства расчета проведем замену: lny=У

Таблица 3.9 - Промежуточные расчеты для модели lnу = ао + а1t

t

Цена (y)

У

1

59,6

4,0877

1

4,0877

4,061592

0,02611

0,02165

0,0006817

0,000468723

0,6387455

2

58,5

4,069

4

8,138

4,062865

0,00613

0,00295

0,00003758

0,0000087025

0,15065127

3

58

4,0604

9

12,1812

4,064139

-0,00374

-0,00565

0,00001399

0,0000319225

0,09210915

4

56,4

4,0325

16

16,13

4,065413

-0,03291

-0,03355

0,00108307

0,001125603

0,81611903

5

57

4,0431

25

20,2155

4,066687

-0,02359

-0,02295

0,000556488

0,000526703

0,58346318

6

57,9

4,0587

36

24,3522

4,067961

-0,00926

-0,00735

0,0000857

0,00005402

0,22815187

7

59,7

4,0893

49

28,6251

4,069235

0,02007

0,02325

0,000402805

0,000540563

0,49079305

8

59,6

4,0877

64

32,7016

4,070508

0,01719

0,02165

0,000295496

0,000468723

0,42052988

?36

466,7

32,5284

204

146,4313

32,5284

0

0

0,003156901

0,00322496

3,42056294

Ср.

знач

4,5

58,3375

4,06605

25,5

18,3039

4,06605

0,00127;

a0 = 4,06605 - 4,5?0,00127 = 4,0603.

Таким образом, модель будет иметь вид:

lny = 0,00127t + 4,0603

Определим коэффициент детерминации:

0,0211.

Определим стандартную ошибку:

0,0299.

Определим значимость модели, используя критерий Фишера:

0,1293.

Табличное значение критерия со степенями свободы k1=1 и k2=6, Fтабл = 5.99. Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (найденная оценка уравнения регрессии статистически не надежна).

Вычислим ошибку аппроксимации:

0,4276

Осуществим прогноз на декабрь: 58,9

Построим регрессионную модель вида: у =1/(ао + а1t). Все промежуточные расчеты приведем в таблице 3.2.3. Для удобства расчета проведем замену : 1/у = У

Таблица 3.10 - Промежуточные расчеты для модели у = 1/(ао + а1t)

t

Цена (y)

У

y-y?

(y-y^)І

...

Подобные документы

  • Предмет статистики. Метод статистики. Расчёт показателей вариации. Ряды динамики. Выборочное наблюдение. Для общеэкономических специальностей, статистика является основой для разработки и совершенствования методов экономического анализа.

    курсовая работа [134,4 K], добавлен 21.10.2004

  • Предмет и метод статистики, сводка и группировка, абсолютные и относительные величины. Определение показателей вариации и дисперсии. Понятие о выборочном наблюдении и его задачи. Классификация экономических индексов. Основы корреляционного анализа.

    контрольная работа [80,0 K], добавлен 05.06.2012

  • Предмет и метод статистики. Группировка и ряд распределения. Абсолютные, относительные, средние величины, показатели вариации. Выборочное наблюдение, ряды динамики. Основы корреляционного и регрессионного анализа. Статистика населения и рынка труда.

    методичка [2,2 M], добавлен 16.02.2011

  • Статистика занятости и безработицы. Определение численности и состава занятых лиц. Выборочное наблюдение, сводка и группировка, ряд распределения. Характеристика статистических показателей. Расчет средних величин и показателей вариации, ошибок выборки.

    курсовая работа [180,5 K], добавлен 10.08.2009

  • Статистика как общественная наука, изучающая количественную сторону массовых общественных явлений с целью выявления их особенностей и закономерностей развития. Понятия, предмет, задачи, система статистических показателей. Организация статистики в России.

    реферат [16,8 K], добавлен 04.06.2010

  • Сущность и разновидности средних величин в статистике. Определение и особенности однородной статистической совокупности. Расчет показателей математической статистики. Что такое мода и медиана. Основные показатели вариации и их значение в статистике.

    реферат [162,6 K], добавлен 04.06.2010

  • Определение термина "статистика" и история ее возникновения. Взаимосвязь статистики с другими науками. Виды статистических исследований. Предназначение корреляционно-регрессионного анализа и выборочного метода. Методика анализа сезонных колебаний.

    реферат [33,1 K], добавлен 10.01.2015

  • Сущность статистического изучения браков. Система статистических показателей, используемых в изучении браков в Амурской области. Анализ браков с помощью расчета средних величин и показателей вариации. Корреляционно–регрессионный анализ структуры браков.

    курсовая работа [895,1 K], добавлен 20.03.2015

  • Целостная система научных дисциплин: общая теория статистики, социально-экономическая статистика, математическая статистика и теория вероятности, международная и отраслевая статистика. Формы, виды, способы наблюдения. Процесс статистического исследования.

    эссе [18,7 K], добавлен 17.10.2014

  • Статистика денежного обращения, инфляции и цен. Построение сводки и ряда распределения. Характеристика используемых статистических показателей. Расчет средних величин и показателей вариации, ошибок выборки. Корреляционный анализ количественных признаков.

    контрольная работа [564,1 K], добавлен 13.09.2012

  • Понятие статистики как науки, предмет и методы ее изучения, основные цели и задачи. Категории статистики и ее показатели, способы представления результатов. Сущность и классификация относительных и средних величин. Понятие ряда динамики и его анализ.

    реферат [192,6 K], добавлен 15.05.2009

  • Организация статистики и источники статистических данных. Наблюдение по способу регистрации данных. Выявление и изучение связи и взаимозависимости между явлениями. Система статистических показателей. Определение средних и относительных величин.

    контрольная работа [53,6 K], добавлен 27.01.2011

  • Абсолютные и относительные статистические величины. Понятие и принципы применения средних величин и показателей вариации. Правила применения средней арифметической и гармонической взвешенных. Коэффициенты вариации. Определение дисперсии методом моментов.

    учебное пособие [276,4 K], добавлен 23.11.2010

  • Виды и применение абсолютных и относительных статистических величин. Сущность средней в статистике, виды и формы средних величин. Формулы и техника расчетов средней арифметической, средней гармонической, структурной средней. Расчет показателей вариации.

    лекция [985,6 K], добавлен 13.02.2011

  • История развития статистики в России. Деятельность видных ученых в развитии статистики как науки. Основные задачи статистики. Общая теория статистики, экономическая статистика, социальная статистика. Отраслевая статистика.

    реферат [23,9 K], добавлен 12.12.2006

  • Основные категории и понятия теории статистики. Ряды динамики и их применение в анализе социально-экономических явлений. Сводка и группировка статистических данных. Общая характеристика системы национальных счетов. Статистика рынка товаров и услуг.

    курс лекций [68,4 K], добавлен 08.08.2009

  • Понятие статистического изучения рождаемости населения. Анализ рождаемости в Амурской области за 1999-2008 годы. Система показателей рождаемости. Показатели рождаемости для условного и реального поколения. Расчет средних величин и показателей вариации.

    курсовая работа [240,1 K], добавлен 26.11.2009

  • Социально-экономическая статистика как общественная наука. Ее сущность и основные методы, применяемые в ней. Проблемы интеграции отечественной статистики в международную статистику. Задачи социально-экономической статистики в условиях рыночной экономики.

    лекция [17,4 K], добавлен 14.03.2010

  • Определение сущности оплаты труда, ее показателей и методики расчетов. Описание индексного метода статистики и его роли в изучении заработной платы. Изучение техники проведения группировки. Определение показателей вариации ряда распределения и др.

    контрольная работа [41,7 K], добавлен 27.01.2011

  • Статистический анализ производства и себестоимости. Использование формул средних величин в решении задач, вычисление дисперсии, среднего квадратичного отклонения, коэффициента вариации, предельной ошибки выборки. Практическое применение индексного метода.

    контрольная работа [59,3 K], добавлен 26.06.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.