Предмет и метод статистической науки

Сводка и группировка статистических данных. Функции статистических служб. Сводка и группировка статистических данных. Графическое отображение вариационных рядов. Абсолютные и относительные статистические показатели. Выборочное наблюдение в статистике.

Рубрика Экономика и экономическая теория
Вид дипломная работа
Язык русский
Дата добавления 17.06.2013
Размер файла 482,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

4.1 Закон больших чисел и предельные теоремы

Под законом больших чисел в широком смысле понимается общий принцип, согласно которому, по формулировке академика Колмогорова, совокупное действие большого числа случайных факторов приводит к результату, почти не зависящему от случая. Или иначе: При большом числе случайных величин их средней результат перестает быть случайным и может быть предсказан с большой степенью определенности.

Под законом больших чисел в узком смысле понимается ряд математических теорем, в каждой из которых для тех или иных условий устанавливается факт приближения средних характеристик большого числа испытаний к некоторым определенным постоянным.

Неравенство Чебышева: для любой случайной величины, имеющей математическое ожидание M(X) и дисперсию D(X) справедливо:

, (4.1)

или

, (4.2)

Если формула (6.1) устанавливает верхнюю границу рассматриваемого события, то (4.2) - нижнюю границу вероятности события, состоящего в том, что отклонения значения случайной величины от математического ожидания не превысит (не будет менее) величины, где - достаточно малая величина.

В приложении к выборочному методу неравенство Чебышева может быть сформулировано так: при неограниченном увеличении числа наблюдений () в генеральной совокупности с ограниченной дисперсией с вероятностью близкой к единице можно ожидать, что отклонение выборочной средней () от генеральной средней будет сколь угодно мало: при . Эту вероятность в теореме А.М. Ляпунова (1901г.) используют для определения ошибки наблюдений.

, (4.3)

где - нормированная формула Лапласса.

- средняя квадратическая или стандартная ошибка выборки.

. (4.4)

Пусть надо измерить некоторою величину, истинное значение которой равно a. Пусть результат каждого измерения - случайная величина Xi (i=1,2,…,n). Если при измерениях отсутствует систематические погрешности, то M(Xi)=a при любом i. Тогда средняя арифметическая результатов и измерений сходится по вероятности к истинному значению a.

(4.5)

Дисперсия средней случайной величины Xi равна

(4.6)

Среднее квадратическое отклонение ошибок выборки

, (4.7)

. (4.8).

Зная выборочную среднюю и предельную ошибку выборки можно определить границы, в которых размещена генеральная средняя .

Величина средней квадратической ошибки простой случайной повторной выборки может быть определена по формуле:

, (4.9)

т.е. чем больше вариация признака в генеральной совокупности, тем больше ошибка выборки.

Величину называют предельной ошибкой для определения значения вероятности. Если требуется оценить среднюю генеральной совокупности с вероятностью 0,9545, то надо получить значение выборочной средней из соотношения (функция Лапласа).

Для выборки объема предельная ошибка может быть определена из соотношения .

t

1,00

1,96

2,00

2,58

3,00

F(t)

0,683

0,9500

0,9545

0,9901

0,9973

- это предел возможной ошибки (правило «трех сигм»).

Формула предельной ошибки выборки используется не только для оценки пределов, в которых находится изучаемый признак в генеральной совокупности, но и для определения необходимого объема выборки при заданной ее ошибке. Третий тип задач, которые могут быть решены с использованием предельной ошибки выборки, - это определение вероятности, с которой можно гарантировать, что ошибка выборки не выйдет за заданные пределы.

Величина дисперсии генеральной совокупности принципиально не известна и можно говорить лишь о ее оценке по результатам одной выборки.

-для простой случайной выборки.

При , поправка становится 3,5% (30/(30-1)), поэтому ею можно пренебречь.

Выборочное наблюдение

Наименование показателя

Вид выборки

повторная

бесповторная

Случайная выборка

Средняя (стандартная) ошибка

Средняя ошибка доли признака

Объем выборки

Типическая выборка

Средняя ошибка

Объем выборки

Серийная выборка

Средняя ошибка

Объем выборки

Величина ошибки зависит от колеблемости признака в генеральной совокупности и от объема выборки. Т.е. чем больше вариация тем больше ошибка, чем больше выборка, тем меньше ошибка. Величину называют предельной ошибкой выборки. Следовательно, предельная ошибка выборки , т.е. предельная ошибка равна t-кратному числу средних ошибок выборки.

t - коэффициент доверия

n - объем выборки;

N - объем генеральной совокупности;

s - число отобранных серий;

S - общее число серий;

- средняя из групповых дисперсий;

- межгрупповая дисперсия.

4.2 Ошибка выборки для альтернативного признака

Теорема Бернулли утверждает, что при достаточно большом объеме выборки вероятность P расхождения между долей признака в выборочной совокупности р и долей в генеральной совокупности Pг будет стремиться к 1.

, (4.10)

Для альтернативного признака среднее квадратическое отклонение равно, где . Тогда средняя ошибки выборки для альтернативного признака равна

, (4.11)

, (4.12)

Доля в генеральной совокупности Pг неизвестна и может быть только оценена при выборочном наблюдении

, (4.13)

При простой случайной выборке средняя квадратическая ошибки определяется по формулам:

Средняя квадратическая ошибка

Повторная выборка

Бесповторная выборка

При определении среднего размера признака

, (4.14)

, (4.16)

При определении доли признака

,(4.15)

. (4.17)

4.3 Определение необходимой численности выборки

Численность стандартной и предельной ошибки выборки связано с увеличением объема выборки n. При проектировании выборочного наблюдения заранее задается величина допустимой ошибки и доверительная вероятность для определения предельной ошибки .

Если P=0,954, то (2у)

Если P=0,997, то (3у)

, (4.18)

. (6.19)

Для определения дисперсии признака в генеральной совокупности используются приближенные методы.

Можно провести несколько пробных обследований и по ним выбирать наибольшее значение дисперсии

,

где достаточно пробных наблюдений.

Можно использовать данные прошлых или аналогичных обследований.

Можно использовать размах вариации , если распределение нормальное, то , т.е. .

Объем выборки N

Повторный отбор

Бесповторный отбор

При определении среднего размера признака

, (4.20)

, (4.22)

При определении доли признака

, (4.21)

. (4.23)

4.4 Формы организации выборочного наблюдения

Типическая (стратифицированная) выборка: общий список разбивается на отдельные списки (однородной группы). Общий объем выборки n разбивается пропорционально между списками:

1-й вариант

, (4.24)

где n - объем выборки

N - объем генеральной совокупности

ni - число наблюдений из i-ой типической группы

Ni - объем i-ой типической группы в генеральной совокупности.

2-й вариант - равномерный (из каждой группы поровну)

, (4.25)

где k - число групп.

3-й вариант - оптимальный (для групп с большей вариацией признака объем наблюдений увеличивается)

. (4.26)

Серийная (гнездовая) выборка - в случайном порядке отбираются серии сплошного контроля. Тогда в сериях определяется без случайной ошибки. При равновеликих сериях стандартная ошибка выборки определяется

, (4.27)

где s - число серий;

д - межгрупповая дисперсия.

При бесповторном отборе

, (4.28)

где S - общее число серий в генеральной совокупности.

Механическая выборка - при ранжировании генеральной совокупности устанавливается шаг отбора в зависимости от предполагаемого % отбора. Если совокупность не ранжирована, то это случайный отбор, т.е. по известным формулам.

, (4.29)

Механический отбор удобен, прост и широко применяется, так при 2%-й выборке отбирается каждая 500-я единица (1:0,02), при 5%-й - каждая 20-я.

Пример

Исходя требований ГОСТа необходимо установить оптимальный размер выборки из партии изделий 2000 штук, чтобы с вероятностью 0,997 предельная ошибка не превысила 3% от веса 500 гр. Изделия (батона).

Решение.

гр для средней количественного признака

шт.

5. Статистические методы изучения взаимосвязи социально-экономических явлений

Корреляционная связь (частный случай стохастической) - связь, проявляющаяся при достаточно большом числе наблюдений в виде определенной зависимости между средним значением результативного признака и признаками-факторами.

Задача корреляционного анализа - измерение тесноты связи между варьируемыми признаками и оценка факторов, оказывающих наибольшее влияние.

Задача регрессионного анализа - выбор типа модели (формы связи), устанавливающих степени влияния независимых переменных.

Связь признаков проявляется в их согласованной вариации, при этом одни признаки выступают как факторные, а другие - как результативные. Причинно-следственная связь факторных и результативных признаков характеризуется по степени:

· тесноты;

· направлению;

· аналитическому выражению.

5.1 Регрессионный анализ

Для оценки параметров уравнений регрессии наиболее часто используется метод наименьших квадратов (МНК), суть которого заключается в следующем требовании: искомые теоретические значения результативного признака должны быть такими, при которых бы обеспечивалась минимальная сумма квадратов их отклонений от эмпирических (фактических) значений, т.е.

.(5.1)

При изучении связей показателей применяются различного вида уравнения прямолинейной и криволинейной связи. Так, при анализе прямолинейной зависимости применяется уравнение:

(5.2)

Это наиболее часто используемая форма связи между коррелируемыми признаками, при парной корреляции она выражается уравнением (6.2), где а0 - среднее значение в точке x=0, поэтому экономической интерпретации коэффициента нет; а1 - коэффициент регрессии, показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.

При криволинейной зависимости применяется ряд математических функций:

полулогарифмическая (5.3)

показательная (5.4)

степенная (5.5)

параболическая (5.6)

гиперболическая (5.7)

Система нормальных уравнений МНК для линейной парной регрессии имеет следующий вид:

(5.8)

Отсюда можно выразить коэффициенты регрессии:

;

. (5.9)

При численности объектов анализа до 30 единиц возникает необходимость проверить, насколько вычисленные параметры типичны для отображаемого комплекса условий, не являются ли полученные значения параметров результатом действия случайных причин. Значимость коэффициентов регрессии применительно к совокупности n<30 определяется с помощью t-критерия Стьюдента. При этом вычисляются фактические значения t-критерия:

для параметра а0: , (5.10)

для параметра а1: .(5.11)

В формулах (6.10) и (6.11):

- среднее квадратическое отклонение результативного признака от выровненных значений .(5.12)

- среднее квадратическое отклонение факторного признака от общей средней .(5.13)

Полученные по формулам (5.10) и (5.11) фактические значения и сравниваются с критическим , который получают по таблице Стьюдента с учетом принятого уровня значимости и числа степеней свободы н (н=n-k-1, где n - число наблюдений, k - число факторов, включенных в уравнение регрессии). Рассчитанные параметры а0 и а1 уравнения регрессии признаются типичными, если t фактическое больше t критического.

На практике часто приходится исследовать зависимость результативного признака от нескольких факторных признаков. Аналитическая форма связи результативного признака от ряда факторных признаков выражается и называется многофакторным (множественным) уравнением регрессии.

Линейное уравнение множественной регрессии

.(5.14)

Система нормальных линейных уравнений МНК для оценки коэффициентов двухфакторной регрессии имеет вид:

(5.15)

5.2 Корреляционный анализ

Различают:

· парную корреляцию - это зависимость между результативным и факторным признаком;

· частную корреляцию - это зависимость между результативным и одним факторным признаком при фиксированном значении других факторных признаков;

· множественную - многофакторное влияние в статической модели .

Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции, который рассчитывается по одной из формул:

(5.16)

. (5.17)

Оценка линейного коэффициента корреляции

Значение r

Характер связи

Интерпретация связи

r = 0

Отсутствует

Изменение x не влияет на изменения y

0 < r < 1

Прямая

С увеличением x увеличивается y

-1 > r > 0

Обратная

С увеличением x уменьшается y и наоборот

r = 1

Функциональная

Каждому значению факторного признака строго соответствует одно значение результативного

Значимость линейного коэффициента корреляции проверяется на основе t-критерия Стьюдента. Для этого определяется фактическое значение критерия :

, (5.18)

Вычисленное по формуле (6.18) значение сравнивается с критическим , который получают по таблице Стьюдента с учетом принятого уровня значимости и числа степеней свободы н. Коэффициент корреляции считается статистически значимым, если tрасч превышает : tрасч > .

Универсальным показателем тесноты связи является теоретическое корреляционное отношение:

,(5.19)

где - общая дисперсия эмпирических значений y, характеризует вариацию результативного признака за счет всех факторов, включая х;

- факторная дисперсия теоретических значений результативного признака, отражает влияние фактора х на вариацию у;

- остаточная дисперсия эмпирических значений результативного признака, отражает влияние на вариацию у всех остальных факторов кроме х.

По правилу сложения дисперсий:

, т.е. . (5.19)

Оценка связи на основе теоретического корреляционного отношения (шкала Чеддока)

Значение

Характер связи

Значение

Характер связи

з = 0

Отсутствует

0,5 ? з < 0,7

Заметная

0 < з < 0,2

Очень слабая

0,7 ? з < 0,9

Сильная

0,2 ? з < 0,3

Слабая

0,9 ? з < 1

Весьма сильная

0,3 ? з < 0,5

Умеренная

з = 1

Функциональная

Для линейной зависимости теоретическое корреляционное отношение тождественно линейному коэффициенту корреляции, т.е. з = |r|.

Множественный коэффициент корреляции в случае зависимости результативного признака от двух факторов вычисляется по формуле:

,(5.20)

статистический данные вариационный группировка

где - парные коэффициенты корреляции между признаками.

Множественный коэффициент корреляции изменяется в пределах от 0 до 1 и по определению положителен: .

Условие включения факторных признаков в регрессионную модель - наличие тесной связи между результативным и факторными признаками и как можно менее существенная связь между факторными признаками.

Значимость коэффициента множественной детерминации, а соответственно и адекватность всей модели и правильность выбора формы связи можно проверить с помощью критерия Фишера:

, (5.21)

где R2 - коэффициент множественной детерминации (R2 );

k - число факторных признаков, включенных в уравнение регрессии.

Связь считается существенной, если Fрасч > Fтабл - табличного значения F-критерия для заданного уровня значимости б и числе степеней свободы н1 = k, н2 = n - k - 1.

Частные коэффициенты корреляции характеризуют степень тесноты связи результативного признака и фактора, при элиминировании его взаимосвязи с остальными факторами, включенными в анализ. Расчет частных коэффициентов корреляции в случае двухфакторной регрессии (в первом случае исключено влияние факторного признака х2, во втором - х1):

; ,(5.22)

где r - парные коэффициенты корреляции между указанными в индексе переменными.

Для оценки сравнительной силы влияния факторов, по каждому фактору рассчитывают частные коэффициенты эластичности:

, (5.23)

где - среднее значение соответствующего факторного признака;

- среднее значение результативного признака;

- коэффициент регрессии при i-м факторном признаке.

Данный коэффициент показывает, на сколько процентов следует ожидать изменения результативного показателя при изменении фактора на 1% и неизменном значении других факторов.

Частный коэффициент детерминации показывает, на сколько процентов вариация результативного признака объясняется вариацией i-го признака, входящего в множественное уравнение регрессии, рассчитывается по формуле:

, (5.24)

где - парный коэффициент корреляции между результативным и i-м факторным признаком;

- соответствующий стандартизованный коэффициент уравнения множественной регрессии:

. (5.25)

Пример

По данным о стоимости основных производственных фондов (СОПФ) и объеме валовой продукции (ВП) определить линейное уравнение связи.

Номер предприятия

СОПФ (), млн. руб.

ВП (y),

млн. руб.

2

2

1

1

20

20

1

400

19,4

0,36

20,25

2

2

25

50

4

625

25

0

12,25

3

3

31

93

9

961

30,6

0,16

6,25

4

4

31

124

16

961

36,2

27,04

2,25

5

5

40

200

25

1600

41,8

3,24

0,25

6

6

56

336

36

3136

47,4

73,96

0,25

7

7

52

364

49

2704

53

1

2,25

8

8

60

480

64

3600

58,6

1,96

6,25

9

9

60

540

81

3600

64,2

17,64

12,25

10

10

70

700

100

4900

69,8

0,04

20,25

Сумма

55

445

2907

385

22487

445

125,4

82,5

Среднее

5,5

44,5

290,7

38,5

2248,7

44,5

;

.

Уравнение регрессии имеет вид:

.

Следовательно, с увеличением стоимости основных фондов на 1 млн.руб. объем валовой продукции увеличивается в среднем на 5,6 млн. руб.

Проверим значимость полученных коэффициентов регрессии. Рассчитаем и :

для параметра а0:

для параметра а1: .

По таблице Стьюдента с учетом уровня значимости =5% и числа степеней свободы н =10-1-1=8 получаем =2,306.

Фактические значения и превышают табличное критическое значение . Это позволяет признать вычисленные коэффициенты корреляции типичными.

Пример По данным предыдущего примера оценить тесноту связи между признаками, оценить значимость найденного коэффициента корреляции.

, или .

Значение коэффициента корреляции свидетельствует о сильной прямой связи между рассматриваемыми признаками.

Значение tрасч превышает найденное по таблице значение =2.306, что позволяет сделать вывод о значимости рассчитанного коэффициента корреляции.

Пример Имеются некоторые данные о среднегодовой стоимости ОПФ (СОПФ), уровне затрат на реализацию продукции (ЗРП) и стоимости реализованной продукции (РП). Считая зависимость между этими показателями линейной, определить уравнение связи; вычислить множественный и частные коэффициенты корреляции, оценить значимость модели.

СОПФ (х1), млн.руб.

ЗРП (х2),

в % к РП

РП (y), млн.руб.

х1 х2

х1 y

х2 y

3

4

20

9

16

12

60

80

20,36

3

3

25

9

9

9

75

75

20,05

5

3

20

25

9

15

100

60

24,21

6

5

30

36

25

30

180

150

26,91

7

10

32

49

100

70

224

320

30,54

6

12

25

36

144

72

150

300

29,08

8

12

29

64

144

96

232

348

33,24

9

11

37

81

121

99

333

407

35,01

9

15

36

81

225

135

324

540

36,25

10

15

40

100

225

150

400

600

38,33

= 66

= 90

= 294

= 490

= 1018

= 688

= 2078

= 2880

= 294

=6,6

=9,0

=29,4

-

-

=68,8

=207,8

=288,0

-

Решение. Составим систему нормальных уравнений МНК:

Выразим из 1-го уравнения системы a0 = 29,4 - 6,6·a1 - 9·a2.

Подставив во 2-е уравнение это выражение, получим:

.

Далее подставляем в 3-е уравнение вместо a0 и a1 полученные выражения и решаем его относительно a2 с точностью не менее 3-х знаков после запятой. Итак:

a0 = 12,508; a1 = 2,672; a2 = - 0,082; = 12,508 + 2,672·х1 - 0,082·х2.

= = 0,884;

= = 0,777;

= = 0,893;

=0,893

Проверим значимость r (б = 0,01 и н = 7):

= 5,00; = 3,27.

=5,00 > tтабл=3,50 - коэффициент корреляции x1 значим;

=3,27 < tтабл=3,50 - коэффициент корреляции x2 не значим.

Произведенные расчеты подтверждают условие включения факторных признаков в регрессионную модель - между результативным и факторными признаками существует тесная связь (= 0,884; = 0,777), однако между факторными признаками достаточно существенная связь (= 0,893). Включение в модель фактора x2 незначительно увеличивает коэффициент корреляции (= 0,884; =0,893), поэтому включение в модель фактора x2 нецелесообразно.

Вычислим стандартизованные коэффициенты уравнения множественной регрессии:

Отсюда вычислим частные коэффициенты детерминации:

т.е. вариация результативного признака объясняется главным образом вариацией фактора x1.

Вычислим частные коэффициенты эластичности:

Проверим адекватность модели на основе критерия Фишера:

Найдем значение табличного значения F-критерия для уровня значимости б=0,05 и числе степеней свободы н1 = 2, н2 = 10 -2 - 1 : Fтабл=4,74. Превышение значения Fрасч над значением Fтабл позволяет считать коэффициент множественной детерминации значимым, а соответственно и модель - адекватной, а выбор формы связи - правильным.

6. Ряды динамики

6.1 Анализ динамических рядов

Динамический ряд представляет собой хронологическую последовательность числовых значений статистических показателей.

Виды рядов динамики (РД):

1) моментные (моментальные) РД;

2) интервальные РД;

3) РД с нарастающими итогами;

4) производные РД.

Моментные ряды динамики отображают состояние изучаемых явлений на определенные даты (моменты) времени. Особенностью моментного ряда динамики является то, что в его уровни могут входить одни и те же единицы изучаемой совокупности. Пример моментного ряда динамики:

Дата

1.01.2001

1.04.2001

1.07.2001

1.10.2001

1.01.2002

Число работников, чел.

192

190

195

198

200

Интервальные ряды динамики отображают итоги развития (функционирования) изучаемых явлений за отдельные периоды (интервалы) времени. Каждый уровень интервального ряда складывается из данных за более короткие интервалы. Пример интервального ряда динамики:

Год

1997

1998

1999

2000

2001

Объем розничного товарооборота, тыс. руб.

885,7

932,6

980,1

1028,7

1088,4

Статистическое отображение развития изучаемого явления во времени может быть представлено рядами динамики с нарастающими итогами. Их применение обусловлено потребностями в результатах развития изучаемых показателей не только за данный отчетный период, но и с учетом предшествующих периодов. При составлении таких рядов производится последовательное суммирование смежных уровней. Этим достигается суммарное обобщение результата развития изучаемого показателя с начала отчетного периода (месяца, квартала, года и т.д.).

Производные ряды - ряды, уровни которых представляют собой не непосредственно наблюдаемые значения, а производные величины: средние или относительные.

Основные направления изучения закономерностей развития социально-экономических явлений с помощью рядов динамики:

- характеристика уровней развития изучаемых явлений во времени;

- измерение динамики изучаемых явлений посредством системы статистических показателей;

- выявление и количественная оценка основной тенденции развития (тренда);

- изучение периодических колебаний;

- экстраполяция и прогнозирование.

Таблица 8.1 Уровни (показатели) ряда динамики

Показатель

Формула

Базисные

Абсолютный прирост

Д = yi - у0 (6.1)

Темп роста

(6.2)

Темп прироста

(6.3)

Цепные

Абсолютный прирост

Д = yi - yi-1 (6.4)

Темп роста

(6.5)

Темп прироста

(6.6)

Темп наращивания

(6.7)

Абсолютное значение 1% прироста

(6.8)

Средние

Абсолютный прирост

= (6.9)

Темп роста

(6.10)

Темп прироста

(6.11)

Средний уровень ряда динамики характеризует типическую величину абсолютных уровней.

Средний уровень интервального ряда определяется по формуле средней арифметической простой:

,(6.12)

где n - число уровней.

В моментном ряду динамики с равностоящими датами средний уровень определяется по формуле средней хронологической простой:

.(6.13)

В моментном ряду динамики с неравноотстоящими датами средний уровень определяется по формуле средней хронологической взвешенной:

,(6.14)

где уi - уровни ряда динамики, сохранившиеся без изменения в течение промежутка времени ti.

Между базисными и цепными темпами роста имеется взаимосвязь: произведение последовательных цепных темпов роста равно базисному темпу роста, а частное от деления последующего базисного темпа роста на предыдущий равно соответствующему цепному темпу роста.

; .(6.15)

6.2 Методы анализа тенденций рядов динамики

Одной из важнейших задач статистики является определение в рядах динамики общей тенденции развития явления. На развитие явления во времени оказывают влияние факторы, различные по характеру и силе воздействия. Одни из них оказывают практически постоянное воздействие и формируют в рядах динамики определенную тенденцию развития. Воздействие же других факторов может быть кратковременным или носить случайный характер.

Основная тенденция (тренд) - изменение, определяющее общее направление развития, это систематическая составляющая долговременного действия.

Задача - выявить общую тенденцию в изменении уровней ряда, освобожденную от действия различных случайных факторов. Методы выявления тренда:

1) Метод укрупнения интервалов основан на укрупнении периодов времени, к которым относятся уровни ряда динамики (одновременно уменьшается количество интервалов). Средняя, исчисленная по укрупненным интервалам, позволяет выявить направление и характер (ускорение или замедление роста) основной тенденции развития, в то время как слишком малые интервалы между наблюдениями приводят к появлению ненужных деталей в динамике процесса, засоряющих общую тенденцию.

Месяц

Объем выпуска, млн.руб.

Месяц

Объем выпуска, млн.руб.

Январь

5,1

Июль

5,6

Февраль

5,4

Август

5,9

Март

5,2

Сентябрь

6,1

Апрель

5,3

Октябрь

6,0

Май

5,6

Ноябрь

5,9

Июнь

5,8

Декабрь

6,2

Различные направления изменений уровней ряда по отдельным месяцам затрудняют выводы об основной тенденции производства. Если соответствующие месячные уровни объединить в квартальные и вычислить среднемесячный выпуск продукции по кварталам, т.е. укрупнить интервалы, то решение задачи упрощается.

Квартал

Объем производства, млн.руб.

в квартал

в среднем в месяц

1

15,7

5,23

2

16,7

5,57

3

17,6

5,87

4

18,1

6,03

После укрупнения интервалов основная тенденция роста производства стала очевидной: 5,23<5,57<5,87<6,03 млн.руб.

2) Метод скользящей средней заключается в том, что исчисляется средней уровень из определенного числа (обычно нечетного) первых по счету уровней ряда, затем - из такого же числа уровней, но начиная со второго по счету, далее - начиная с третьего и т.д. Таким образом, средняя как бы “скользит” по ряду динамики, передвигаясь на один срок.

Недостатком сглаживания ряда является укорачивание сглаженного ряда по сравнению с фактическим, а, следовательно, потеря информации.

Год

Урожайность, ц/га

Скользящая средняя

трехлетняя

пятилетняя

1991

15,4

-

-

1992

14,0

15,7 = 15,4+14,0+ +17,6)/3

-

1993

17,6

15,7 = 14,0+17,6+ +15,4)/3

14,7

1994

15,4

14,6

15,1

1995

10,9

14,6

15,3

1996

17,5

14,5

15,5

1997

15,0

17,0

15,2

1998

18,5

15,9

16,0

1999

14,2

15,9

-

2000

14,9

-

-

Итого

153,4

Сглаженный ряд урожайности по трехлетиям короче фактического на один член ряда в начале и в конце, по пятилетиям - на два члена в начале и в конце ряда. Он меньше, чем фактический, подвержен колебаниям из-за случайных причин, и четче выражает основную тенденцию роста урожайности за изучаемый период, связанную с действием долговременно существующих причин и условий развития.

Укрупнение интервалов и метод скользящей средней дают возможность определить лишь общую тенденцию развития явления, более или менее освобожденную от случайных или волнообразных колебаний. Получить обобщенную статистическую модель тренда посредством этих методов нельзя.

Рис. 8.2. Эмпирические и сглаженные уровни ряда динамики

3) Аналитическое выравнивание ряда динамики используется для того, чтобы дать количественную модель, выражающую основную тенденцию изменения уровней ряда динамики во времени.

Общая тенденция развития рассчитывается как функция времени:

yt = f(t), (6.16)

где yt - уровни динамического ряда, вычисленные по соответствующему аналитическому уравнению на момент времени t.

Определение теоретических (расчетных) уровней yt производится на основе так называемой адекватной математической модели, которая наилучшим образом отображает (аппроксимирует) основную тенденцию ряда динамики.

Простейшими моделями, выражающими тенденцию развития, являются (где a0, a1 - параметры уравнения; t - время):

Линейная функция (прямая) yt = a0 + a1·t.(6.17)

Показательная функция .(6.18)

Степенная функция (парабола) yt = a0 + a1·t + a2·t2. (6.19)

Расчет параметров функции обычно производится методом наименьших квадратов. Выравнивание ряда динамики заключается в замене фактических уровней yi плавно изменяющимися уровнями yt, наилучшим образом аппроксимирующими статистические данные.

Выравнивание по прямой используется в тех случаях, когда абсолютные приросты практически постоянны, т.е. когда уровни изменяются в арифметической прогрессии.

Выравнивание по показательной функции используется в тех случаях, когда ряд отражает развитие в геометрической прогрессии, т.е. когда цепные коэффициенты роста практически постоянны.

Выравнивание ряда динамики по прямой yt = a0 + a1·t. Параметры a0, a1 согласно МНК находятся решением следующей системы нормальных уравнений:

(6.20)

где y - фактические (эмпирические) уровни ряда;

t - время (порядковый номер периода или момента времени).

t = 0, так что система нормальных уравнений (8.20) принимает вид:

(6.21)

Отсюда можно выразить коэффициенты регрессии:

; (6.22)

. (8.23)

Если расчеты выполнены правильно, то y = yt.

Пример

Для выравнивания ряда из примера 8.3 используем линейную трендовую модель - уравнение прямой yt = a0 + a1·t. n = 10. Расчет уравнения регрессии выполним в табличной форме.

Таким образом,

y =153,4; y·t = 6,8; t2 = 330.

Вычислим параметры a0, a1 по формулам (8.22, 8.23):

= 15,34; = 0,021.

Расчет уравнения регрессии

Год

y

t

t2

y·t

yt

yi - yt

(yi- yt)2

1

2

3

4

5

6

7

8

1991

15,4

-9

81

-138,6

15,15

0,25

0,0625

1992

14,0

-7

49

-98,0

15,19

-1,19

1,4161

1993

17,6

-5

25

-88,0

15,23

2,37

5,6169

1994

15,4

-3

9

-46,2

15,28

0,12

0,0144

1995

10,9

-1

1

-10,9

15,32

-4,42

19,5364

1996

17,5

1

1

17,5

15,36

2,14

4,5796

1997

15,0

3

9

45,0

15,40

-0,40

0,0160

1998

18,5

5

25

92,5

15,45

3,05

9,3025

1999

14,2

7

49

99,4

15,49

-1,29

1,6641

2000

14,9

9

81

134,1

15,53

-0,63

0,3969

Итого

153,4

0

330

6,8

153,4

0

42,6050

Уравнение прямой будет иметь вид:

yt = 15,34+0,021·t.

Подставляя в данное уравнение последовательно значения, находим выравненные уровни yt (гр. 6 табл. 7.3).

Проверим расчеты:

y = yt = 153,4.

Следовательно, значения уровней выравненного ряда найдены верно.

Полученное уравнение показывает, что, несмотря на значительные колебания в отдельные годы, наблюдается тенденция увеличения урожайности: с 1991 по 2000 г. урожайность зерновых культур в среднем возрастала на 0,021 ц/га в год.

Тенденция роста урожайности зерновых культур в изучаемом периоде отчетливо проявляется в результате построения выравненной прямой.

6.3 Сезонные колебания

Уровни ряда динамики формируются под влиянием различных взаимодействующих факторов, одни из которых определяют тенденцию развития, а другие -колеблемость (вариацию)

Колебания уровней ряда носят различный характер. Наряду с трендом выделяют циклические (долгопериодические), сезонные (обнаруживаемые в рядах, где данные приведены за кварталы или месяцы) и случайные колебания.

Размещено на http://www.allbest.ru/

- линия тренда

- средний уровень

уi - фактические уровни

Колебания фактических уровней yi относительно среднего уровня и линии тренда

Периодические колебания являются результатом влияния природно-климатических условий, общих экономических факторов, а также многочисленных и разнообразных факторов, которые часто являются регулируемыми.

В широком понимании к сезонным относят все явления, которые обнаруживают в своем развитии четко выраженную закономерность периодических изменений, т.е. более или менее устойчиво повторяющиеся колебания уровней.

Динамический ряд в этом случае называют сезонным рядом динамики.

Метод изучения и измерения сезонности заключается в построении специальных показателей, которые называются индексами сезонности.

Индексами сезонности являются процентные отношения фактических внутригрупповых уровней к теоретическим уровням, выступающим в качестве базы сравнения. Порядок определения индекс сезонности:

1) Для каждого месяца рассчитывается средняя величина уровня

2) Затем вычисляется среднемесячный уровень для всего ряда

3) Определяется показатель сезонной волны - индекс сезонности Is:

, (6.24)

где - средний уровень для каждого месяца;

- среднемесячный уровень для всего ряда.

Когда уровень проявляет тенденцию к росту или к снижению, то отклонения от постоянного среднего уровня могут исказить сезонные колебания.

Пример

Месяц

Объем пассажирских авиаперевозок

Is, %

1997

1998

1999

Средний

1

94,0

89,3

92,6

92,0

91,1

2

98,0

93,1

96,6

95,9

95,0

3

107,6

102,2

106,2

105,3

104,2

4

112,8

107,1

111,4

110,4

109,3

5

121,2

115,2

119,8

118,7

117,6

6

112,0

106,4

110,6

109,7

108,6

7

110,0

104,5

108,6

107,7

106,6

8

102,5

97,4

101,1

100,3

99,3

9

97,0

92,2

95,6

94,9

94,0

10

94,0

89,3

92,6

92,0

91,1

11

96,4

91,6

95,0

94,3

93,4

12

92,5

87,9

91,1

90,5

89,6

Итого

1237,9

1176,0

1221,1

1211,7

1199,7

В среднем

103,2

98,0

101,8

101,0

100,0

Средний индекс сезонности для 12 месяцев должен быть равен 100%, тогда сумма индексов должна составлять 1200%. У нас - 1199,7% (погрешность - следствие округлений). Значит, расчеты верны.

Выводы:

1) объем пассажирских авиаперевозок характеризуется ярко выраженной сезонностью;

2) объем пассажирских авиаперевозок по отдельным месяцам года значительно отклоняется от среднемесячного;

3) наибольший объем характерен для мая, наименьший - для декабря.

Для наглядного изображения сезонной волны индексы сезонности изображают в виде графика.

Индекс сезонности авиаперевозок пассажиров

6.4 Статистические методы прогнозирования экономических показателей

Прогнозирование - процесс определения возможных в будущем значений экономических показателей на основании уже известных.

Различают прогнозы по периоду упреждения: оперативные (до 1 мес.); краткосрочные (до 1 года); среднесрочные (1 - 5 лет); долгосрочные (более 5 лет).

Различают методы прогнозирования:

Экстраполяция тенденций:

- упрощенные приемы, основанные на средних показателях динамики (средние темпы роста, прироста);

- аналитические методы (метод наименьших квадратов, тренды, т.е. математические функции);

- адаптивные методы, учитывающие степень устаревания данных (методы скользящих и экспоненциальных средних, методы авторегрессии).

Методы статистического моделирования:

- статические (методы парной и множественной регрессии);

- динамические (анализ динамических рядов):

- методы агрегатного моделирования (разложение ряда на тенденции, сезонность, случайные составляющие);

- методы регрессии по взаимосвязанным рядам динамики (включаются в модель не только факторы, но и лаговые переменные);

- методы регрессии по пространственно-временной информации (для каждого ряда строится регрессионная модель по совокупности объектов).

6.4.1 Прогнозирование на основе экстраполяции тренда

Тренд - основная тенденция развития. Методы выявления тренда называются методами выравнивания временного ряда (метод наименьших квадратов, скользящей средней, конечных разностей).

При наличии тенденции в ряду динамики модель уровня динамического ряда:

, (6.25)

где - средний уровень динамического ряда;

- теоретический (расчетный, трендовый) уровень;

- эффект тенденции;

- случайная составляющая (остаточные колебания) е.

Чем меньше остаточные колебания , тем выше адекватность (практическая значимость) модели. Следовательно, результаты прогноза зависят от типа кривой тренда y(t).

1. Линейный тренд yt = a0 + a1·t означает, что уровни динамики ряда изменяются с одинаковой скоростью.

a0 - начальный уровень тренда (t = 0);

a1·- средний абсолютный прирост в единицу времени.

В линейном тренде уровни динамики ряда изменяются в арифметической прогрессии, а темпы роста уровня - падающие.

2. Параболический тренд yt = a0 + a1·t + a2·t2 применяется, если ряд характеризуется относительным абсолютным ускорением, т.е. постоянными являются вторые разности (производные) - приросты абсолютных приростов.

a0 - начальный уровень тренда (t = 0);

a1·- средний абсолютный прирост за период;

a2·- половина абсолютного ускорения динамического ряда.

Парабола означает смену тенденций (рост сменяется падением или наоборот). Это, как правило, связано с новым этапом в развитии явления по времени. Применяется для краткосрочного прогноза.

3. Парабола кубическая характеризует три этапа развития: рост, падение и опять рост. Число наблюдений должно быть около 6-7 временных единиц на один шаг прогноза. Следовательно, чтобы применить полином третьей степени надо иметь ряд за 20 лет, и корректно это только в стабильной экономике.

4. Показательная кривая , применяется при стабильном темпе роста динамического ряда. Рост по экспоненте означает геометрическую прогрессию уровней ряда. Это возможно в экономике в сравнительно небольшой период времени, когда ограничены ресурсы, меняются условия рынка.

a0 - начальный уровень тренда (t = 0);

a1·- средний абсолютный прирост за период;

4. Логистическая кривая (кривая Перла-Рида) (кривые Гомперца), имеющая асимптоту, применяется, когда существует ограничение на рост показателя (уровней динамического ряда).

Если изучается динамика детской смертность, то нижняя асимптота - уровень жизни, верхняя - демографический состав населения.

8.4.2 Выбор наилучшего тренда при прогнозировании

При выборе уравнения тренда можно руководствоваться средней ошибкой аппроксимации

, %. (6.26)

5ч7% - хорошая аппроксимация.

Доверительные интервалы прогноза определяются по дисперсии уточненного тренда

, %. (6.27)

Где yt - фактические уровни ряда;

- расчетные (трендовые) значения;

n - длина ряда;

m - число параметров в уравнении тренда (без свободного члена).

Доверительный интервал с учетом табличного значения критерия Стьюдента , равен

. (6.28)

Если распространить этот интервал на следующий отрезок времени, то надо ввести поправочный коэффициент q, зависящий от длины ряда и периода l упреждения

, (6.29)

где n - длина ряда;

tl - порядковый номер прогнозируемого периода (tl = n + l);

- порядковый номер середины ряда.

Тогда ошибка прогноза

. (6.30)

. (6.31)

7. Экономические индексы

Индексом в статистике называется относительный показатель, характеризующий изменение величины какого-либо явления по сравнению с эталоном.

Таблица - Классификация индексов

Классификационный

признак

Вид индексов

1. Содержание изучаемых объектов

Количественные (объемные) индексы (физического объема, товарооборота национального дохода)

Качественные индексы (интенсивности) (курса валют, цен, себестоимости, производительности труда)

2. Степень охвата элементов совокупности

Индивидуальные (изменение одного показателя однотоварного)

общие (групповые или субидексы (по отраслям))

3. Метод расчета

Агрегатные

Средние

4. База сравнения

Динамические

Территориальные (например, индекс цен на товары в РФ и ФРГ)

5. Вид весов

С постоянными весами

С переменными весами

6. Состав явления

Постоянного состава

Переменного состава

Структурных сдвигов

7. Период исчисления

Годовые

Квартальные

Помесячные и т.д.

Таблица - Обозначения индексируемых величин

Обозначение

Индексир...


Подобные документы

  • Систематизация материалов статистического наблюдения. Понятие статистической сводки как сводной характеристики объекта исследования. Статистические группировки, их виды. Принципы выбора группированного признака. Статистические таблицы и ряд распределения.

    реферат [196,8 K], добавлен 04.10.2016

  • Понятие сводки и группировки статистических данных, их содержание, виды и основные элементы. Цели и задачи сводки и группировки данных, решаемые задачи и правила проведения. Этапы составления и назначение, виды и характеристика статистических таблиц.

    контрольная работа [22,6 K], добавлен 20.04.2009

  • Предмет и метод статистики. Сводка и группировка статистических данных. Функции статистических показателей. Статистические ряды, вариация и дисперсия. Преимущества выборочного наблюдения. Методы анализа корреляционных связей, экономические индексы.

    методичка [371,4 K], добавлен 15.01.2010

  • Основные понятия статистики. Организация статистического наблюдения. Ряды распределения, табличный метод представления данных. Статистическая сводка и группировка. Объекты уголовно-правовой, гражданско-правовой и административно-правовой статистики.

    реферат [24,7 K], добавлен 29.03.2013

  • Задачи сводки и её основное содержание. Сведение воедино материалов статистического наблюдения и получение обобщающих статистических показателей как цель сводки. Разновидности группировок, задачи группировок и их значение в статистическом исследовании.

    реферат [15,1 K], добавлен 04.06.2010

  • Статистическое наблюдение; классификация признаков явлений; сводка и группировка. Ряды распределения и их графическое изображение; уровневые и интегральные графики. Динамические ряды, статистические таблицы, абсолютные, относительные и средние величины.

    учебное пособие [217,1 K], добавлен 23.12.2009

  • Предмет и метод статистики, сводка и группировка, абсолютные и относительные величины. Определение показателей вариации и дисперсии. Понятие о выборочном наблюдении и его задачи. Классификация экономических индексов. Основы корреляционного анализа.

    контрольная работа [80,0 K], добавлен 05.06.2012

  • Предмет и метод статистической науки. Методология наблюдения, статистическая сводка, группировка, таблицы и графики, показатели и средние величины. Показатели вариации, выборочное наблюдение. Корреляционно-регрессионный анализ. Экономические индексы.

    лекция [1,2 M], добавлен 02.01.2014

  • Статистическое наблюдение. Понятие и содержание статистической сводки. Группировка – основа статистической сводки. Статистические ряды распределения. Осуществление конкретной аналитической группировки. Табличное представление статистических данных.

    курсовая работа [172,8 K], добавлен 22.12.2010

  • Основные категории статистики. Группировка - основа научной обработки данных статистики. Содержание сводки и статистическая совокупность. Построение вариационного, ранжированного и дискретного рядов распределения. Группировка предприятий по числу рабочих.

    контрольная работа [23,3 K], добавлен 17.03.2015

  • Рассмотрение процесса ревизии в бухгалтерии предприятия налоговыми органами с точки зрения статистического наблюдения. Выбор из исходных данных абсолютной статистической величины. Представление статистических данных. Средние величины. Показатели вариации.

    контрольная работа [139,5 K], добавлен 28.05.2015

  • Сводка и группировка материалов статистического наблюдения. Абсолютные, относительные и средние величины, показатели вариации. Ряды динамики, индексный анализ. Проведение корреляционно-регрессионного анализа таблиц о сборе урожая и внесении удобрений.

    курсовая работа [667,1 K], добавлен 14.05.2013

  • Группировка организаций по степени износа основных фондов в виде интервалов. Расчет среднего значения, модального и медианного значения ряда. Форма распределения на основе показателей асимметрии и эксцесса. Определение степени однородности распределения.

    контрольная работа [341,6 K], добавлен 07.12.2016

  • Статистические ряды распределения, их значение в статистике. Подразделение вариационных рядов на дискретные и интервальные, особенности их применения. Практическое задание: использование статистических рядов для оценки состояния предприятия и отрасли.

    контрольная работа [134,2 K], добавлен 17.11.2009

  • Сущность понятия "статистика". Абсолютные и относительные величины, характеризующие рождаемость, динамику численности населения города за отчетный год. Исчисление абсолютных и относительных показателей ряда динамики по цепной и базисной системе.

    контрольная работа [776,1 K], добавлен 28.09.2011

  • Предмет и метод статистики. Группировка и ряд распределения. Абсолютные, относительные, средние величины, показатели вариации. Выборочное наблюдение, ряды динамики. Основы корреляционного и регрессионного анализа. Статистика населения и рынка труда.

    методичка [2,2 M], добавлен 16.02.2011

  • Понятие о статистической сводке и группировке. Группировка предприятий по объему реализованной продукции, по численности и фонду заработной платы, товарной продукции в фиксированных оптовых ценах. Проведение экономической интерпретации сделанному анализу.

    курсовая работа [33,6 K], добавлен 14.06.2014

  • Статистика занятости и безработицы. Определение численности и состава занятых лиц. Выборочное наблюдение, сводка и группировка, ряд распределения. Характеристика статистических показателей. Расчет средних величин и показателей вариации, ошибок выборки.

    курсовая работа [180,5 K], добавлен 10.08.2009

  • Простая сводка данных по показателю "Внешняя торговля по субъектам РФ". Вариационный анализ статистической совокупности. Выборочное наблюдение и генеральная совокупность на основе выборочной. Анализ рядов динамики и корреляционный анализ показателей.

    курсовая работа [1,6 M], добавлен 26.02.2012

  • Проведение статистических наблюдений в биологии. Методы изучения массовых явлений. Графическое изображение рядов распределения. Показатели вариации признаков. Ошибки и надежность статистических показателей. Основные характеристики интервальных рядов.

    отчет по практике [199,4 K], добавлен 23.12.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.