Основные функции статистики

Рассмотрение теоретического обоснования сущности, общих понятий и методов расчета средних величин. Исследование системы показателей и информационной базы корреляционно-регрессионного анализа. Рассмотрение значения результатов произведенного расчета.

Рубрика Экономика и экономическая теория
Вид курсовая работа
Язык русский
Дата добавления 22.02.2019
Размер файла 662,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Оглавление

Введение

1. Средние величины и показатели вариации

1.1 Теоретическая часть

1.2 Практическая часть

2. Корреляционный анализ статистических исследований

2.1 Теоретическая часть

2.2 Практическая часть

3. Регрессионный анализ статистических исследований

3.1 Теоретическая часть

3.2 Практическая часть

Заключение

Список использованной литературы

Введение

В современном обществе важную роль в механизме управления экономикой выполняет статистика. Статистика - самостоятельная общественная наука, имеющая свой предмет и методы исследования, которая возникла из потребностей общественной жизни. Термин «статистика» происходит от латинского слова «статус», которое означает «положение, порядок».

В настоящее время термин «статистика» употребляется в трех значениях:

- особая отрасль практической деятельности людей, направленная на сбор, обработку и анализ данных, характеризующих социально-экономическое развитие страны, ее регионов, отдельных отраслей экономики или предприятий;

- наука, занимающаяся разработкой теоретических положений и методов, используемых в статистической практике;

- статистические данные, представленные в отчетности предприятий, отраслей экономики, а также данные, публикуемые в сборниках, различных справочниках, бюллетенях и т. п.

Предметом исследования в статистике являются закономерности массовых социально-экономических явлений и процессов. Чтобы познать закономерность какого-либо аспекта общественной жизни, статистика изучает количественную сторону определенной совокупности однотипных явлений в неразрывной связи с их качественным содержанием в конкретных условиях места и времени.

Объектом статистического исследования является статистическая совокупность, под которой понимается множество качественно однородных варьирующих единиц совокупности.

Основными задачами статистики являются:

1. Сбор, обработка, анализ и хранение информации.

2. Доведение обработанной информации до органов управления всех уровней.

3. Ознакомление широкой общественности с динамикой и дислокацией социально-экономических явлений в стране путем издания статистических сборников, справочников, обзоров, публикаций в печатных и электронных СМИ.

4. Международное сопоставление уровня социально-экономического развития разных стран.

Итак, статистика играет важную роль в жизни общества. Проблема статистического анализа является актуальной, общественно значимой, так как статистика имеет прямую связь с экономической теорией и другими науками. Экономическая теория служит для определения основных экономических законов и категорий, а статистика является их доказательным инструментом. Основными функциями статистики являются: аналитическая, учетная, распределительная, стимулирующая, контрольная, функция сравнения, оценочная и функция прогнозная.

Данная курсовая работа состоит из трех частей: средние величины и показатели вариации, корреляционный анализ и регрессионный анализ.

В каждой будет изложена как теория, так и расчеты, необходимые для решения задач.

Целью написания данной курсовой работы является расчет средних величин, показателей вариации и проведение корреляционно-регрессионного анализа. корреляционный регрессионный величина информационный

Можно выделить следующие основные задачи исследования:

1. Теоретическое обоснование сущности, общих понятий и методов расчета средних величин;

2. Исследование системы показателей и информационной базы корреляционно-регрессионного анализа;

3. Выполнение расчетов.

1. Средние величины и показатели вариации

1.1 Теоретическая часть

Средней величиной в статистике называется обобщающий показатель, который характеризует типичный уровень варьирующего признака в расчете на единицу совокупности (или какой-либо элемент в составе единиц совокупности) в конкретных условиях места и времени. Средние величины бывают следующих видов: арифметическая, геометрическая, гармоническая, квадратическая, кубическая и др. В зависимости от частоты повторения вариант средние исчисляются как простые не взвешенные, так и взвешенные [2].

Среднюю арифметическую простую рассчитывают по формуле:

(1.1)

где х - варианты;

n - число вариантов.

При расчете средних величин отдельные значения усредняемого признака могут повторяться, тогда расчет средней производится по сгруппированным рядам (дискретными или интервальными). В таком случае используется для расчета средней величины формула средней арифметической взвешенной:

(1.2)

где х - варианты;

f - частота (повторяемость индивидуальных значений признака).

Средняя гармоническая простая определяется по формуле:

(1.3)

Если же в условии даны показатели об урожайности культуры и ее валовом сборе, например, то для расчета средней урожайности применяется формула средней гармонической взвешенной:

(1.4)

где х - варианты;

W - объем признака.

Средняя гармоническая вычисляется в тех случаях, когда средняя предназначенная для расчета сумм слагаемых, обратно пропорциональных величине заданного признака, т.е. когда суммированию подлежат не сами варианты, а обратные им величины [4].

Разновидностью средней являются мода и медиана. Эти величины также используются в качестве характеристик вариационного ряда.

Мода (М0) представляет собой значение изучаемого признака, повторяющееся с наибольшей частотой. Для дискретного ряда распределения мода определяется наиболее просто: варианта, против которой располагается наибольшая частота, и будет модой. В интервальном ряду наибольшая частота указывает не на модальную варианту, а на содержащий моду интервал. Поэтому в модальном интервале необходимо определить модальную варианту. При этом надо иметь в виду, что при расчетах будет получено не точное, а некоторое условное значение моды, так как неизвестен характер распределения частоты внутри модального интервала. Вычисление моды в интервальном ряду производится по следующей формуле:

(1.5)

где хмо - нижняя граница интервала, содержащего моду;

iмо - величина модального интервала;

fмо - частота модального интервала;

fмо-1 - частота интервала, предшествующего модальному;

fмо+1 - частота интервала, следующего за модальным.

Медианой (Ме) называется значение признака, приходящееся на середину упорядоченной совокупности. Для ее определения достаточно расположить в порядке возрастания или убывания все варианты. Средняя варианта и будет являться медианой. Расчет медианы для интервального ряда производится по формуле:

(1.6)

где хме - нижняя граница интервала, содержащего медиану;

iме - величина медианного интервала;

? f - сумма частот;

S ме-1 - сумма накопленных частот, предшествующих медианному интервалу;

fме - частота медианного интервала.

Информация о средних уровнях обычно бывает недостаточной для полного анализа изучаемого процесса или явления. Необходимо учитывать и разброс, т.е. вариацию значений отдельных единиц совокупности.

Для характеристики размеров колеблемости признаков в статистике применяется следующие показатели: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратичное отклонение, коэффициент вариации и др. [2].

Размах вариации представляет собой разность между наибольшим и наименьшим значением вариации:

R = xmax -xmin (1.7)

где xmax - наибольшее значение признака;

xmin - наименьшее значение признака.

Среднее линейное отклонение определяется из отношения суммы, взятой по абсолютной величине (без учета знака) отклонения всех вариант от средней арифметической, к объему всей совокупности. Оно бывает взвешенное и невзвешенное и определяется соответственно по формулам:

(простое) (1.8)

(взвешенное) (1.9)

Дисперсия - это средняя из квадратов отклонений значений признака от его средней арифметической величины. Она определяется по формуле арифметической простой:

(1.10)

Или средней арифметической взвешенной:

(1.11)

При анализе относительно небольших выборок (примерно до 30-ти наблюдений) следует использовать несмещенную выборочную дисперсию:

(1.10(а))

Среднее квадратичное отклонение - это корень квадратный из дисперсии - определяется по формулам средней арифметической простой или средней арифметической взвешенной:

= (1.12)

(1.13)

(1.14)

Мерой сравнения степеней колеблемости для двух, трех и более вариационных рядов служит показатель, который носит название коэффициента вариации и определяться по формуле:

* 100% (1.15)

Чем больше коэффициент вариации, тем менее однородна совокупность и тем менее типична средняя величина, тем менее она характеризует изучаемое явление [5].

1.2 Практическая часть

Задача 1.1. По статистическим данным: 10; 12; 9; 11; 14; 10; 15; 10; 17 определить среднее значение (x?), моду, медиану, дисперсию (), среднеквадратическое отклонение (), коэффициент вариации (V).

Решение:

1) x? = 12 (1.1)

2) Мода = 10

3) Медиана = 11

4) = 6,7 (1.10)

5) = 2,58 (1.13)

6) V = 21,5% (1.15)

Задача 1.2. По данным статистики в отчетном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 28%, стоимость основных фондов увеличилась на 17%. Определить изменение фондоотдачи.

Решение:

Фондоотдача = *100% = 109,4%

В отчетном периоде по сравнению с базисным фондоотдача увеличилась на 9,4%.

Задача 1. 3. Объем оборота (У) и число работников (m) приведены в таблице 1. Определить среднее значение, моду и медиану.

Таблица 1 - Исходные данные

У

80-100

100-120

120-140

140-160

160-180

180-200

m

6

17

25

28

14

10

Решение:

1) x? = 141,4 (1.1)

2) Мода = 143,53 (1.5)

3) Медиана = 141,43 (1.6)

Задача 1.4. По данным таблицы определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации (з). В таблице: Х-объем оборота предприятий, млн. руб., mг - число государственных предприятий; mч - частных; mо - общее число (таблица 2).

Таблица 2 - Исходные данные по объему оборота предприятий

Хi

Число предприятий

Расчёт общей дисперсии

mгi

mчi

moi

Хср.i

Хср.i*moi

(Хср.i - x?о)2

(Хср.i- x?о)2* moi

8,0-8,2

3

3

8,1

24,3

0,509796

1,529388

8,2-8,4

4

4

8,3

33,2

0,264196

1,056784

8,4-8,6

17

17

8,5

144,5

0,098596

1,676132

8,6-8,8

11

15

26

8,7

226,2

0,012996

0,337896

8,8-9,0

13

6

19

8,9

169,1

0,007396

0,140524

9,0-9,2

18

5

23

9,1

209,3

0,081796

1,881308

9,2-9,4

6

6

9,3

55,8

0,236196

1,417176

9,4-9,6

2

2

9,5

19

0,470596

0,941192

50

50

100

70,4

881,4

1,681568

8,9804

x?о = = 8 814 000 руб. общая = 89 804 руб. (1.11)

Таблица 3

Хi

mгi

Хср.i

Хср.i*mгi

(Хср.i- x?г)2

8,6-8,8

11

8,7

95,7

0,09

8,8-9,0

13

8,9

115,7

0,01

9,0-9,2

18

9,1

163,8

0,01

9,2-9,4

6

9,3

55,8

0,09

9,4-9,6

2

9,5

19

0,25

50

45,5

450

0,45

x? гос. = = 9 гос. = 46 800 руб. (1.11)

Таблица 4

Хi

mчi

Хср.i

Хср.i*mчi

(Хср.i- x?ч)2

(Хср.i - x?ч)2*mчi

8,0-8,2

3

8,1

24,3

0,278784

0,836352

8,2-8,4

4

8,3

33,2

0,107584

0,430336

8,4-8,6

17

8,5

144,5

0,016384

0,278528

8,6-8,8

15

8,7

130,5

0,005184

0,07776

8,8-9,0

6

8,9

53,4

0,073984

0,443904

9,0-9,2

5

9,1

45,5

0,222784

1,11392

50

51,6

431,4

0,704704

3,1808

x? част. = = 8,628

част. фирм = 63 616 руб. (1.11)

средняя внутригрупповая = = = 55 208

2межгрупповая = 2общая - 2внутригрупповая = 34 596

з2 = * 100% = 38, 52%

Следовательно, 38,52% различий в объеме товарооборота предприятий обусловлены формой собственности, а 61,48% - влиянием других факторов.

Ответ: средняя внутригрупповая дисперсия = 55 208; межгрупповая дисперсия = 34 596; общая дисперсия = 89 804. Коэффициент детерминации = 38,52%

Задача 1.5. Определить среднюю внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из трех групп (таблица 5).

Таблица 5 - Исходные данные

1 - группа

Хi

1

2

8

mi

30

15

5

2 - группа

Хi

1

6

mi

10

15

3 - группа

Хi

3

8

mi

20

5

Таблица 6

Хi

m1

m2

m3

mo.i

Х.i*moi

(Хср.i- x?ч)2

(Хср.i - x?ч)2*mчi

1

30

10

40

40

4

160

2

15

15

30

1

15

3

20

20

60

0

0

6

15

15

90

9

135

8

5

5

10

80

25

250

60

25

25

100

300

560

Решение:

1) x?о = 3

2) 2общая = 5,6 (1.11)

3) x?1 = = 2; x?2 = 4; x?2 = 4

4) 21 = 4,2; 22 = 6; 23 = 4 (1.11)

5) 2внутригрупповая = 4,73 (1.11)

6) 2межгрупповая = 2общая - 2внутригрупповая = 0,87

Ответ: внутригрупповая дисперсия = 4,73; межгрупповая дисперсия = 0,87; общая дисперсия = 5,6

2. Корреляционный анализ статистических исследований

2.1 Теоретическая часть

Корреляционный анализ -- метод обработки статистических данных, заключающийся в изучении связи между переменными. Цель корреляционного анализа - обеспечить получение некоторой информации об одной переменной с помощью другой переменной [1].

Количественная оценка тесноты взаимосвязи двух случайных величин осуществляется с помощью коэффициента корреляции. Значение коэффициента корреляции может изменяться в диапазоне от -1 до +1.

Коэффициент корреляции равен отношению корреляционного момента (ковариации) к произведению стандартных отклонений:

(2.1)

В зависимости от коэффициента корреляции различают следующие корреляционные связи:

- сильная, или тесная при коэффициенте корреляции r>0,70;

- средняя (при 0,50<r<0,69);

- умеренная (при 0,30<r<0,49);

- слабая (при 0,20<r<0,29);

- очень слабая (при r<0,19) [7].

Корреляционный момент находится по следующей формуле:

(2.2)

Корреляционный момент характеризует наличие (отсутствие) связи между величинами X и У.

Формула для коэффициента корреляции может быть записана в виде:

(2.3)

Значимость коэффициента корреляции базируется на проверке статистических гипотез. выдвигается нулевая гипотеза о том, что коэффициент корреляции равен нулю и контр гипотеза, что он не равен нулю: H0: r=0; H1: r 0. После этого определяется расчетное значение критерия Стьюдента по формуле:

(2.4)

Далее находится табличное значение критерия Стьюдента. Входом в табличное значение является уровень значимости и степень свободы . На практике, чаще всего, принимают за 0; 0,5; = n2. Если расчетное значение критерия Стьюдента больше табличного, то нулевая гипотеза отвергается и, следовательно, коэффициент корреляции значим. Если табличное значение критерия Стьюдента больше расчетного значения критерия Стьюдента, значит нулевая гипотеза подтверждается, а, следовательно, коэффициент корреляции не значим.

Коэффициент корреляции Спирмена - мера линейной связи между случайными величинами.

(2.5)

Корреляция Спирмена является ранговой, то есть для оценки силы связи используются не численные значения, а соответствующие им ранги. Коэффициент инвариантен по отношению к любому монотонному преобразованию шкалы измерения [3].

2.2 Практическая часть

Задача 2.1. Определить коэффициент корреляции между y и x.

х: 3,5; 4,6; 5,8; 4,2; 5,2;

yx: 28,35; 43,24; 65,54; 28,98; 50,44.

Оценить значимость коэффициента корреляции при уровне 0,05. Расчеты и ответы до двух знаков. Вначале определить y, а затем y и x увеличить на свой номер классного журнала. Результаты:

1) коэффициент корреляции;

2) расчетное и табличное значения критерия Стьюдента и вывод.

Таблица 7 - Исходные данные:

x

3,5

4,6

5,8

4,2

5,2

x*y

28,35

43,24

65,54

28,98

50,44

y

8,1

9,4

11,3

6,9

9,7

б

0,05

Таблица 8 - Данные по номеру журнала:

1

2

3

4

5

Сумма

Среднее значение

y

15,1

16,4

18,3

13,9

16,7

80,4

16,08

x

10,5

11,6

12,8

11,2

12,2

58,3

11,66

x*y

158,55

190,24

234,24

155,68

203,74

942,45

188,49

(xi - )2

1,35

0,004

1,3

0,21

0,29

3,15

0,63

(yi - ) 2

0,96

0,1

4,93

4,75

0,38

11,12

2,23

x = = 0,79 (1.12)

y = = 1,5 (1.12)

= = 0,84 (2.3)

= 2,69 (2.4)

Табличное значение Стьюдента 3,18.

Вывод: табличное значение критерия Стьюдента больше расчетного значения критерия Стьюдента, значит нулевая гипотеза подтверждается, а, следовательно, коэффициент корреляции незначим.

Задача 2.2. Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость.

Исходные данные:

х 18 22 13 20 15 14

у 17 20 11 18 14 10

Это нулевой вариант. Каждое значение х и у увеличить на свой номер классного журнала.

Результаты:

1.Коэффициент корреляции.

2.Расчетное и табличное значения критерия Стьюдента, вывод о значимости. ВСЕ РЕЗУЛЬТАТЫ до 2-х знаков после запятой.

Таблица 9

x

y

x*y

(xi - )2

(yi - )2

25

24

600

1

4

29

27

783

25

25

20

18

360

16

16

27

25

675

9

9

22

21

462

4

1

21

17

357

9

25

144

132

3237

64

80

= 24

= 22

539,5

10,67

13,33

x = = 3,27 (1.12)

y = = 3,65 (1.12)

= = 0,96 (2.3)

= 6,86 (2.4)

Табличное значение Стьюдента 2,78.

Вывод: табличное значение критерия Стьюдента меньше расчетного значения критерия Стьюдента, значит нулевая гипотеза отвергается, а, следовательно, коэффициент корреляции значим.

Задача 2.3. В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистики по сто балльной системе:

Теория вероятностей: 65 90 42 47 84 58 50

Статистика: 51 85 36 63 72 80 40.

Определить коэффициент ранговой корреляции Спирмена и его значимость. Это нулевой вариант. Каждое значение (балл) увеличить на свой номер классного журнала. Расчеты и результат до двух знаков. Результаты:

1.Коэффициент ранговой корреляции.

2.Расчетное и табличное значения критерия Стьюдента при уровне значимости равным 0,05 и выводы.

Таблица 10

1

2

3

4

5

6

7

Теория вероятностей

72

97

49

54

91

65

57

Статистика

58

92

43

70

79

87

47

Rтв

5

7

1

2

6

4

3

Rст

3

7

1

4

5

6

2

d2

4

0

0

4

1

4

1

Таким образом, коэффициент корреляции Спирмена выявил прямую тесную зависимость. =0,025 (0,02): (2.5)

Вывод: расчетное значение критерия корреляции Спирмена меньше табличного значения критерия. Значит нулевая гипотеза подтверждается, а значит коэффициент ранговой корреляции Спирмена не значим.

Рассчитаем значение коэффициента Стьюдента.

Таблица 11

Исправленное условие

1

2

3

4

5

6

7

Сумма

Среднее значение

Теория вероятностей (x)

72

97

49

54

91

65

57

485

69,29

Статистика (y)

58

92

43

70

79

87

47

476

68,00

х-x?

2,71

27,71

-20,29

-15,29

21,71

-4,29

-12,29

y-y?

-10,00

24,00

-25,00

2,00

11,00

19,00

-21,00

(х-x?)(y-y?)

-27,14

665,14

507,14

-30,571

238,86

-81,43

258

1530

218,57

(х-x?)2

7,3673

768,0816

411,5102

233,6531

471,5102

18,3673

150,9388

2061,4286

294,49

(y-y?)2

100

576

625

4

121

361

441

2228

318,29

1) х? =

2) kху = (2.2)

3) ух = = 17,161

4) уy =

5) (2.1)

(2.4)

Табличное значение критерия

Вывод: Расчетное значение критерия Стьюдента меньше табличного, поэтому нулевая гипотеза подтверждается, следовательно, коэффициент корреляции не значим.

3. Регрессионный анализ статистических исследований

3.1 Теоретическая часть

Регрессионный анализ - это метод установления аналитического выражения стохастической зависимости между исследуемыми признаками. Уравнение регрессии показывает, как в среднем изменяется у при изменении любого из xi, и имеет вид:

где у - зависимая переменная;

хi - независимые переменные (факторы).

Если независимая переменная одна - это простой регрессионный анализ. Если же их несколько (п 2), то такой анализ называется многофакторным [8].

В ходе регрессионного анализа решаются две основные задачи:

- построение уравнения регрессии, т.е. нахождение вида зависимости между результатным показателем и независимыми факторами x1, x2, …, xn.

- оценка значимости полученного уравнения, т.е. определение того, насколько выбранные факторные признаки объясняют вариацию признака у [5].

Применяется регрессионный анализ главным образом для планирования, а также для разработки нормативной базы.

Полный регрессионный анализ включает следующие этапы:

1. Определение вида функции, описывающей функциональную связь между результативным признаком и факторными признаками (этап спецификации);

Выбор модели регрессии может производиться как на основе априорных исследований, так и на основе апостериорных исследований. Модели, в зависимости от вида функции , делятся на линейные модели и нелинейные модели; а также на однофакторные модели (парная модель регрессии) и многофакторные модели (модель множественной регрессии).

2. Определение коэффициентов регрессии (этап идентификации).

Параметры, входящие в модель регрессии, находятся с использованием методики аппроксимации по критерию наименьших квадратов.

3. Расчет теоретических значений результативного признака для отдельных наборов значений факторов;

4. Исследование отклонений расчетных значений от эмпирических данных;

5. Оценка качества полученной модели и проверка соответствующих статистических гипотез о регрессии (этап верификации) [6].

Линейная модель.

Рассмотрим порядок определения параметров линейной модели:

. (3.1)

Коэффициенты а0 и а1 могут быть определены на основе метода наименьших квадратов.

Метод наименьших квадратов обеспечивает такой выбор коэффициентов а0 и а1 для прямой, при котором достигается минимум суммы квадратов отклонений, т.е.

(3.2)

Выражение (3.2) есть числитель остаточной дисперсии. Можно записать:

Минимум функции двух переменных достигается при значениях и , которые обращают в нуль производные:

С учетом выше указанного запишем:

С учетом деления на n имеем:

(3.3)

Имеем без учета деления на n:

(3.4)

и с учетом деления на n:

(3.5)

С использованием метода наименьших квадратов, т.е. исходя из минимума остаточной дисперсии, необходимо определить коэффициенты регрессии.

Имеем две системы нормальных уравнений. Первая система:

(3.6; 3.7)

Опускаем обозначение i=1 до n.

Из (3.6) находим , подставляем в (2.7) и находим :

(3.8)

Из (3.6) находим , подставляем в (2.7) и находим а1:

(3.9)

Рассмотрим вторую систему:

(3.10; 3.11)

Из 3.10 находим а1:

Подставляем а1 в (3.11), имеем:

. (3.12)

Из 3.10 находим а0:

.

Подставляем а0 в (2.11), имеем:

. (3.13)

Коэффициент а1 можно определить по следующей формуле:

. (3.14)

Как перейти от формулы (3.13) к (3.14)?

.

Таким образом, коэффициенты линейной регрессии можно определить различными способами.

В матричной форме коэффициенты регрессии определяются по следующей зависимости:

(3.15)

где - транспонированная матрица;

- обратная матрица.

(3.16)

После определения коэффициентов регрессии проверяется их значимость по критерии Стьюдента.

Значимость коэффициентов регрессии:

Так как то расчетное значение критерия Стьюдента для параметра а1 можно определить, используя выражение:

.

Выдвигается аналогичная гипотеза, как и при проверке «r»: параметр а1 равен нулю. Если расчетное значение при заданном уровне значимости больше табличного, то нулевая гипотеза отвергается и параметр считается значимым.

Расчетное значение критерия Стьюдента для параметра а0 определяется по формуле:

.

Так же данный критерий можно рассчитать через отклонения коэффициентов:

- стандартное отклонение признака а0 , где Sy - стандартная ошибка

- стандартное отклонение величины а1 (3.16)

Для определения критерия Стьюдента для коэффициентов воспользуемся следующей формулой:

(3.17)

Значимость модели проверяется по критерию Фишера:

(3.18)

где - табличное значение критерия; - степень свободы факторной дисперсии ; - степень свободы остаточной дисперсии

Выдвигается нулевая гипотеза о равенстве дисперсий - и конкурирующая гипотеза о их неравенстве. Определяется расчетное значение критерия Фишера по формуле (3.18 - левая часть) и это значение сравнивается с табличным. Если F>FT, то нулевая гипотеза не принимается и модель считается значимой. Не может быть модель значима при равенстве дисперсий; остаточная должна быть значительно меньше факторной [7].

Степень свободы для факторной дисперсии равна f1 = K - число факторов; для остаточной дисперсии: f2 =n - K - 1 = n - 2.

После определения значимости модели рассчитываются ошибка аппроксимации или стандартная ошибка.

Ошибка аппроксимации рассчитывается по формуле:

(3.19)

где - исходное значение показателя;

- расчетное (прогнозное) значение показателя.

Стандартная ошибка определяется по формуле:

. (3.20)

В практических исследованиях, если ошибка аппроксимации имеет величину до 5%, то модель можно использовать для решения поставленных задач; если Е до 10%, то применение модели зависит от исследователя и если Е>10%, то модель нецелесообразно применять в эконометрических исследованиях [8].

3.2 Практическая часть

Задача 3.1. Построить нелинейную обратную модель связи себестоимости единицы продукции (у) со стоимостью основных фондов (х). Определить характеристики модели.

Каждое значение (у) увеличить на свой номер классного журнала.

Исходные данные:

у: 21; 16; 15; 14; 13; 12,5; 11; 11,5; 10; 8

х: 1; 2; 3; 4; 5; 6; 7; 8; 9; 10

Характеристики модели:

1) модель (коэффициенты до 4-х знаков);

2) индекс детерминации (до 2-х знаков);

3) стандартную ошибку (до 4-х знаков);

4) расчетное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели;

5) вывод о значимости коэффициентов модели;

6) доверительные интервалы коэффициентов модели (до 4-х знаков).

Таблица 12 - Решение:

y

28

23

22

21

20

19,5

18

18,5

17,5

15

x

1

2

3

4

5

6

7

8

9

10

1)Заменяем = Х

Таблица 13

1

28

1

1

28

1

28,8273

2

23

2

0,5

11,5

0,25

22,7268

3

22

3

0,3333

7,3333

0,1109

20,6893

4

21

4

0,25

5,25

0,0625

19,6766

5

20

5

0,2

4

0,04

19,0665

6

19,5

6

0,1667

3,25

0,0279

18,6639

7

18

7

0,1429

2,5714

0,0204

18,3711

8

18,5

8

0,125

2,3125

0,0156

18,1515

9

17

9

0,1111

1,9444

0,0123

17,9807

10

15

10

0,1

1,5

0,01

17,8464

итого

202

55

2,929

67,6617

1,5497

202

Ср. знач.

20,2

5,5

0,2929

6,7662

0,155

а1 = =12,2009 (3.9)

а0 = а1 ==16,6264

=16,7153+

Таблица 14

1

28

1

28,82725

60,84

0,6843478

2

23

2

22,72681

7,84

0,0746353

3

22

3

20,68926

3,24

1,7180501

4

21

4

19,67658

0,64

1,7514363

5

20

5

19,06654

0,04

0,8713535

6

19,5

6

18,66391

0,49

0,6990511

7

18

7

18,37109

4,84

0,1377047

8

18,5

8

18,15147

2,89

0,1214734

9

17

9

17,98066

10,24

0,9616884

10

15

10

17,84645

27,04

8,1022621

Итого

202

55

202

118,1

15,122003

Ср.знач.

20,2

5,5

20,2

11,81

2) RІ = = 0,87

R= 0,93.

Вариация результата у (себестоимость единицы продукции) на 87% объясняется вариацией фактора х (стоимостью основных фондов). Остальные 13% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).

3) Sy = = 1,3749 (3.20)

4) F== 53,54 (3.18)

Fтабл. = 5,32

Уравнение регрессии с вероятностью 0,95 статистически значимое, так как F Fтаб.

5)

(3.16)

(3.17)

Фактические значения t - статистики для параметров , превышают табличные:

Вывод: поэтому параметры и а1 статистически значимы, нулевая гипотеза отвергается.

6)

Доверительные интервалы:

16,6264 - a0 <16,6264+1,5005

15,1258 a0 < 18,126

12,2009-12,2009+

Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью 95% параметры и будут находиться в указанных границах интервалов.

Задача 3.2. Построить полулогарифмическую модель вида: y=a0+a1lnx по данным:

Таблица 15

x

1

2

3

4

5

6

y

10

13,4

15,4

16,5

18,6

19,1

Определить характеристики модели.

Каждое значение (y) увеличить на свой номер классного журнала.

Характеристики модели:

модель (коэффициенты до 2-х знаков);

индекс детерминации (до 2-х знаков);

стандартную ошибку ( до 4-х знаков);

4) Расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели.

Таблица 16

1) По данной таблице определим а0 и а1, необходимые значения для построения нашей модели:

а1 = = = 5,14 (3.9)

а0 = = = 16,86

Найдя коэффициенты, можем построить модель: = 16,86 + 5,14lnx

Таблица 17

1

17

1

16,8615

30,25

0,0192

2

20,4

2

20,4091

4,41

0,0001

3

22,4

3

22,5171

0,01

0,0137

4

23,5

4

24,0082

1

0,2582

5

25,6

5

25,1393

9,61

0,2123

6

26,1

6

26,0647

12,96

0,0012

Итого

135

21

135

58,24

0,5047

Ср. знач.

22,5

3,5

2)

Связь между признаком Y и фактором X весьма высокая и прямая.

3) (3.20)

4) (3.18)

Fтабл.= 7,71

Вывод: так как , следовательно, с вероятностью 0,95 уравнение регрессии признается статистически значимым.

Задача 3.3. Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 3.1.

Таблица 18

Год

1

2

3

4

5

6

Коэффициент рождаемости

7,5

7,5

8,0

8,4

8,6

8,4

Год

7

8

9

10

11

12

Коэффициент рождаемости

8,6

9,7

10,2

10,3

10,2

10,1

Год

13

14

15

17

18

Коэффициент рождаемости

10,8

10,6

10,8

10,7

10,2

Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017 году. В электронную таблицу вместо года ставить 1,2,…

Решение:

1) Построим линейную модель У(t) = а0 + аit, параметры которой оценим МНК

Промежуточные расчеты представим в таблице

Таблица 19

Год

t

у

t-t?

(t-tЇ)І

у-у?

(t-t?)(y-y?)

ур

у-у?

(у-у?)І

(y-yЇ)І

2000

1

7,5

-8

64

-1,947

15,576

7,692

-0,192

0,03694

2,56

3,791

2001

2

7,5

-7

49

-1,947

13,629

7,912

-0,412

0,16933

5,49

3,791

2002

3

8

-6

36

-1,447

8,6824

8,131

-0,131

0,01713

1,64

2,094

2003

4

8,4

-5

25

-1,047

5,2353

8,350

0,050

0,00248

0,59

1,096

2004

5

8,6

-4

16

-0,847

3,3882

8,570

0,030

0,00092

0,35

0,718

2005

6

8,4

-3

9

-1,047

3,1412

8,789

-0,389

0,15132

4,63

1,096

2006

7

8,6

-2

4

-0,847

1,6941

9,008

-0,408

0,16671

4,75

0,718

2007

8

9,7

-1

1

0,2529

-0,253

9,228

0,472

0,22307

4,87

0,064

2008

9

10,2

0

0

0,7529

0

9,447

0,753

0,56686

7,38

0,567

2009

10

10,3

1

1

0,8529

0,8529

9,666

0,634

0,40145

6,15

0,728

2010

11

10,2

2

4

0,7529

1,5059

9,886

0,314

0,09872

3,08

0,567

2011

12

10,1

3

9

0,6529

1,9588

10,105

-0,005

0,00003

0,05

0,426

2012

13

10,8

4

16

1,3529

5,4118

10,325

0,476

0,22610

4,40

1,83

2013

14

10,6

5

25

1,1529

5,7647

10,544

0,056

0,00315

0,53

1,329

2014

15

10,8

6

36

1,3529

8,1176

10,763

0,037

0,00135

0,34

1,83

2015

16

10,7

7

49

1,2529

8,7706

10,983

-0,283

0,07986

2,64

1,57

2016

17

10,2

8

64

0,7529

6,0235

11,202

-1,002

1,00400

9,82

0,567

У

153

160,6

0

408

0

89,5

160,6

0

3,14943

59,281

22,78

Ср. знач.

9

9,4471

Отсюда уравнение линейного тренда имеет вид:

Положительное значение коэффициента при t указывает на то, что имеется тенденция роста, причем величина роста ежегодно составляет в среднем 0,219 единиц.

2) 0,8617 = 86,17%

Точность подбора уравнения регрессии - высокая. Остальные 13.83% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).

3)

4) .

Табличное значение критерия со степенями свободы k1=1 и k2=15, Fтабл = 4,54

Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим.

5) .

В среднем, расчетные значения отклоняются от фактических на 3,5%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

6) Коэффициент рождаемости в 2017 :

.

Задача 3.4. Реальные статистические данные о курсе валют приведены в таблице 3.2. Построить линейную и нелинейные регрессионные модели вида: у = ао + а1t; lnу = ао + а1t; у = 1/(ао + а1t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. В электронную таблицу вместо года записывать 1,2,… По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.

Таблица 20 - Курс рубля к доллару

Месяц и год

январь

2017

февраль

март

апрель

май

июнь

июль

август

2017

Цена одного доллара

59,6

58,5

58,0

56,4

57,0

57,9

59,7

59,6

1) Построим уравнение линейного тренда вида : , где и найдем из системы нормальных уравнений (МНК) :

Таблица 21 - Промежуточные расчеты к линейной модели регрессии

t

Цена (y)

t-t?

у-у?

(t-t?)(у-у?)

(t-tЇ)І

у?

у-у?

(у-у?)І

(у-у?)І

1

59,6

-3,5

1,2625

-4,41875

12,25

58,075

1,525

2,325625

2,5587

1,5939

2

58,5

-2,5

0,1625

-0,40625

6,25

...

Подобные документы

  • Анализ основных технико-экономических показателей ОАО "Газпром". Изучение сущности средних величин, видов и способов их вычисления. Рассмотрение применения средних величин при анализе хозяйственной деятельности работы ОАО "Газпром" за 2009-2012 гг.

    курсовая работа [177,4 K], добавлен 29.10.2015

  • Понятие средних величин и их значение в экономике. Классификация видов средних величин и их краткая характеристика. Средняя гармоническая и арифметическая, способы их расчета. Примеры применения средних величин в практической работе экономистов.

    курсовая работа [205,4 K], добавлен 17.09.2014

  • Основные понятия корреляционно-регрессионного анализа. Вычисление показателей силы и тесноты связи между явлениями и процессами, специфика их интерпретации. Оценка результатов линейного регрессионного анализа. Коэффициент множественной детерминации.

    контрольная работа [228,2 K], добавлен 02.04.2013

  • Роль корреляцонно-регрессионного анализа в обработке экономических данных. Корреляционно-регрессионный анализ и его возможности. Предпосылки корреляционного и регрессионного анализа. Пакет анализа Microsoft Excel.

    курсовая работа [68,4 K], добавлен 11.06.2002

  • Рассмотрение понятийного аппарата науки эконометрики. Изучение корреляционно-регрессионного анализа. Представление статистических данных для выявления зависимости уровня преступности от возраста. Проведение эконометрического анализа и оценка результатов.

    контрольная работа [159,3 K], добавлен 14.09.2015

  • Определение показателей, описывающих динамику изменения грузооборота. Формулы расчета дисперсии и средних отклонений от начальных показателей. Нахождение индивидуальных и сводных индексов себестоимости единицы продукции и общих затрат по предприятиям.

    контрольная работа [510,4 K], добавлен 15.03.2011

  • Расчет средних показателей при составлении любого экономического отчета. Исследование метода средних величин. Отражение средней величиной того общего, что характерно для всех единиц изучаемой совокупности. Деление средних величин на два класса.

    курсовая работа [91,7 K], добавлен 14.12.2008

  • Группы средних величин: степенные, структурные. Особенности применения средних величин, виды. Рассмотрение основных свойств средней арифметической. Характеристика структурных средних величин. Анализ примеров на основе реальных статистических данных.

    курсовая работа [230,6 K], добавлен 24.09.2012

  • Понятие и свойства средних величин. Характеристика и расчет их видов (средних арифметической, гармонической, геометрической, квадратической, кубической и структурных). Сфера их применения в экономическом анализе хозяйственной деятельности отраслей.

    курсовая работа [56,8 K], добавлен 21.05.2014

  • Проведение расчета абсолютных, относительных, средних величин, коэффициентов регрессии и эластичности, показателей вариации, дисперсии, построение и анализ рядов распределения. Характеристика аналитического выравнивания цепных и базисных рядов динамики.

    курсовая работа [351,2 K], добавлен 20.05.2010

  • Сущность статистического изучения браков. Система статистических показателей, используемых в изучении браков в Амурской области. Анализ браков с помощью расчета средних величин и показателей вариации. Корреляционно–регрессионный анализ структуры браков.

    курсовая работа [895,1 K], добавлен 20.03.2015

  • Понятие и сущность цен и инфляции, их значение. Задачи статистики цен. Характеристика системы показателей статистики цен. Принципы и методы регистрации цен. Особенности методов расчета и анализа их индексов. Методы оценки уровня и динамики инфляции.

    курсовая работа [70,9 K], добавлен 01.12.2010

  • Задачи статистики и основыне принципы ее организации в рыночной экономике. Федеральная служба государственной статистики, ее функции и основные публикации. Система показателей (порядок расчета) демографической статистики рождаемости, смертности, миграция.

    реферат [29,1 K], добавлен 17.12.2009

  • Организационно-экономическая характеристика ОАО "Новгородхлеб". Статистический анализ прибыли и рентабельности предприятия: выявление их зависимости с помощью корреляционно-регресионного расчета. Прогнозные значения; обоснование результатов анализа.

    дипломная работа [1,4 M], добавлен 09.12.2012

  • Расчет зависимости показателей работы от определенных факторов методом статистической группировки. Определение показателя координации производственных затрат. Алгоритм расчета средних показателей производства, использование агрегатной формы индексов.

    контрольная работа [327,2 K], добавлен 07.02.2011

  • Определение среднего значения показателя в совокупности. Вариационный анализ статистической совокупности по показателю. Проведение выборочного наблюдения и корреляционно-регрессионного анализа. Построение уравнения парной регрессии, ряды динамики.

    курсовая работа [290,2 K], добавлен 29.11.2011

  • Основные черты, задачи и предпосылки применения корреляционно-регрессионного метода. Методы корреляционного и регрессионного анализа. Коэффициент ранговой корреляции Кендалла, Спирмена, Фехнера. Определение тесноты взаимосвязи между показателями.

    контрольная работа [558,5 K], добавлен 08.04.2013

  • Проведение статистического анализа безработицы, экономической активности и занятости в Амурской области с помощью показателей динамики и расчета средних величин. История становления системы защиты населения от потери рабочих мест в современной России.

    курсовая работа [79,6 K], добавлен 26.03.2011

  • Понятие статистики как науки, предмет и методы ее изучения, основные цели и задачи. Категории статистики и ее показатели, способы представления результатов. Сущность и классификация относительных и средних величин. Понятие ряда динамики и его анализ.

    реферат [192,6 K], добавлен 15.05.2009

  • Определение термина "статистика" и история ее возникновения. Взаимосвязь статистики с другими науками. Виды статистических исследований. Предназначение корреляционно-регрессионного анализа и выборочного метода. Методика анализа сезонных колебаний.

    реферат [33,1 K], добавлен 10.01.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.