Оценка рядов данных. Эконометрические уравнения

Статистические характеристики рядов данных и их оценка. Определение оценки среднего, дисперсии, моды и медианы. Парная и множественная регрессия и корреляция. Система эконометрических уравнений. Модель тенденции временного ряда. Система метода Крамера.

Рубрика Экономика и экономическая теория
Вид контрольная работа
Язык русский
Дата добавления 17.04.2013
Размер файла 333,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

1. Ряды данных, статистические характеристики рядов данных и их оценка

уравнение корреляция эконометрический регрессия

Задача 1

Дана выборка 55 наблюдений времени обслуживания автомобиля на автомойке (мин.):

20,3 15,4 17,2 19,2 23,3 18,1 21,9 15,3 16,8 13,2

20,4 16,5 19,7 20,5 14,3 20,1 16,8 14,7 20,8 19,5

15,3 19,3 17,8 16,2 15,7 22,8 21,9 12,5 10,1 21,1

18,3 14,7 14,5 18,1 18,4 13,9 19,1 18,5 20,2 23,8

16,7 20,4 19,5 17,2 19,6 17,8 21,3 17,5 19,4 17,8

13,5 17,8 11,8 18,6 19,1.

Требуется: представить выборку в виде группированного статистического ряда, используя 7 интервалов группировки.

Решение

Размах выборки w=23,8-10,1=13,7. Длина интервала группировки b = 13,7/7 2. В качестве первого интервала удобно взять интервал 10 - 12. Результаты группировки сведены в табл. 1.1.

Таблица 1.1

Номер интервала i

Границы интервала

Середина интервала zi

Частота ni

Накопленная частота nj j=1

Относительная частота nj/n

Накопленная относительная частота

i

nj/n

j=1

1

2

3

4

5

6

7

10 - 12

12 - 14

14 - 16

16 - 18

18 - 20

20 - 22

22 - 24

11

13

15

17

19

21

23

2

4

8

12

16

10

3

2

6

14

26

42

52

55

0,0364

0,0727

0,1455

0,2182

0,2909

0,1818

0,0545

0,0364

0,1091

0,2546

0,4728

0,7637

0,9455

1,0000

Задача 2

Требуется: построить гистограмму, полигон и кумуляту частот по данным, приведенным в задаче 1.

Решение

Гистограмма представляет собой ряд прямоугольников; основание каждого из них - интервал группировки а высота равна частоте, соответствующей этому интервалу. На рис. 1.1 представлена искомая гистограмма. Соединяя отрезками середины верхних оснований прямоугольников гистограммы, получаем соответствующий полигон частот (рис.1.2). Соединив отрезками точки, абсциссы которых равны верхним границам интервалов группировки, а ординаты - соответствующим накопленным частотам, получим кумуляту (рис.1.3).

Рис. 1.1. Гистограмма частот
Рис. 1.2. Полигон частот
Рис. 1.3. Кумулята частот
Задача 3
Требуется: определить оценки среднего, дисперсии, моды и медианы для выборки 5, 6, 8, 2, 3, 1, 1, 4.
Решение
Представим данные в виде вариационного ряда: 1, 1, 2, 3, 4, 5, 6, 8. Выборочное среднее и исправленная выборочная дисперсия S2 равны
, ,
где n - объем выборки; xi - элементы выборки
Тогда ;
Все элементы входят в выборку по одному разу, кроме 1 (два раза), следовательно, мода (наиболее частый элемент выборки). Так как n = 8 (четное), то медиана равна полусумме средних элементов выборки:
Задача 4
Требуется: на основании данных задачи 3 найти на уровне значимости =0,95 доверительные интервалы для математического ожидания и дисперсии.
Решение
Оценки математического ожидания и дисперсии соответственно равны . Объем выборки . По таблицам значений t-критерия Стьюдента и распределения 2 Пирсона находим , Получаем доверительный интервал для математического ожидания или .
Доверительный интервал для дисперсии или
2. Парная регрессия и корреляция
Задача 1
Дано: некоторая фирма, производящая товар, хочет проверить эффективность рекламы этого товара. Для этого в 10 регионах, до этого имеющих одинаковые средние количества продаж, стала проводиться разная рекламная политика с выделением на рекламу xi денежных средств. При этом фиксировалось число продаж yi. Полученные результаты представлены в таблице 2.1. Предполагается, что для данного случая количество продаж Х пропорционально расходам на рекламу Y.
Таблица 2.1

Расходы на рекламу хi, млн. р.

0

0,5

1

1,5

2

2,5

3

3,5

4

4,5

Количества продаж yi, тыс. ед.

14,2

16,3

16,6

18,9

19,4

20,4

23,3

24,2

27,1

27,4

Требуется:
1. Вычислить точечные оценки для математического ожидания, дисперсии и среднеквадратического отклонения показателей Х и Y.
2. В соответствии с методом наименьших квадратов найти уравнение линейной регрессии .
3. Найти парный коэффициент линейной корреляции и с доверительной вероятности проверить его значимость.
4. Сделать точечный и интервальный прогноз для случая расходов на рекламу, равных 5 млн. руб.
5. Построить график линии регрессии с нанесением на него опытных данных.
Решение
1. Точечными оценками математического ожидания и дисперсии служат соответственно выборочная средняя и «исправленная» выборочная дисперсия. Точечной оценкой среднего квадратического отклонения служит корень квадратный из «исправленной» выборочной дисперсии. Для вычисления точечных оценок математического ожидания, дисперсии, и среднего квадратического отклонения показателей X и Y составим вспомогательную таблицу 2.2.
Таблица 2.2

1

0,0

14,2

-2,25

5,0625

-6,58

43,2964

2

0,5

16,3

-1,75

3,0625

-4,48

20,0704

3

1,0

16,6

-1,25

1,5625

-4,18

17,4724

4

1,5

18,8

-0,75

0,5625

-1,88

3,5344

5

2,0

19,4

-0,25

0,0625

-1,38

1,9044

6

2,5

20,4

0,25

0,0625

-0,38

0,1444

7

3,0

23,3

0,75

0,5625

2,52

6,3504

8

3,5

24,2

1,25

1,5625

3,42

11,6964

9

4,0

27,1

1,75

3,0625

6,32

39,9424

10

4,5

27,4

2,25

5,0625

6,62

43,8244

Сумма

22,5

207,8

0

20,625

0

188,236

Сред-нее зна-чение

2,25

20,78

Выборочное среднее величины X определяется по формуле
=2,25 (млн. руб.)
Выборочная дисперсия величины X определяется по формуле
«Исправленная» выборочная дисперсия величины X определяется по формуле
«Исправленное» среднее квадратическое отклонение величины X определяется по формуле
(млн. руб.).
Выборочное среднее величины Y определяется по формуле
==20,78 (тыс. ед.)
Выборочная дисперсия величины Y определяется по формуле
«Исправленная» выборочная дисперсия величины Y определяется по формуле
«Исправленное» среднее квадратическое отклонение величины Y определяется по формуле
.
2. В соответствии с методом наименьших квадратов (MHK) параметры a и b линейного уравнения регрессии определяются из системы нормальных уравнений:
Вычислим с помощью расчетной таблицы 2.3 необходимые вспомогательные суммы:
Таблица 2.3

1

0,0

14,2

0

0

201,64

14,055

0,145

0,021

2

0,5

16,3

8,15

0,25

265,69

15,5495

0,7505

0,5633

3

1,0

16,6

16,6

1

275,56

17,044

-0,444

0,1971

4

1,5

18,8

28,35

2,25

357,21

18,5385

0,3615

0,1307

5

2,0

19,4

38,8

4

376,36

20,033

-0,633

0,4007

6

2,5

20,4

51

6,25

416,16

21,5275

-1,1275

1,2713

7

3,0

23,3

69,9

9

542,89

23,022

0,278

0,0773

8

3,5

24,2

84,7

12,25

585,64

24,5165

-0,3165

0,1002

9

4,0

27,1

108,4

16

734,41

26,011

1,089

1,1859

10

4,5

27,4

123,3

20,25

750,76

27,5055

-0,1055

0,0111

Итого

22,5

207,8

529,2

71,25

4506,32

3,9585

В таблице 2.3 приведены также колонки для , , , которые будут использованы для вычисления линейного коэффициента парной корреляции и средней стандартной ошибки прогноза.
Используя данные таблицы 3 система нормальных уравнений имеет вид:
Эта система имеет решения и . Линейное уравнение парной регрессии будет определяться по формуле
.
3. Линейный коэффициент парной корреляции определяется по формуле
.
С помощью таблицы 3 получаем
Так как коэффициент корреляции положителен и близок к единице, то между показателями X и Y существует очень тесная прямая связь.
Значимость коэффициента корреляции проверим с помощью критерия Стьюдента с доверительной вероятностью р=0,95, т.е. на уровне значимости .
Наблюдаемое значение критерия Стьюдента находится по формуле
.
Для уровня значимости и числа степеней свободы находим по таблице критических точек распределения Стьюдента: . Так как , то коэффициент корреляции значимо отличается от нуля, т.е. является значимым.
4. Прогнозное значение количества продаж определим по регрессионному уравнению , подставив в него планируемую величину расходов на рекламу 5 млн. руб.:
(тыс. ед.)
Определим доверительный интервал прогноза для уровня значимости .
Средняя квадратическая ошибка прогноза находится по формуле
,
где - дисперсия отклонений фактических наблюдений от расчетных и
.
Здесь m - число нормальных уравнений, связывающих независимые наблюдения случайной величины. В нашем случае m =2.
Предельная ошибка прогноза определяется по формуле
0,911 (тыс.ед.).
Доверительный интервал прогноза будет определяться выражением
.
Таким образом, с вероятностью, равной 0,95, можно утверждать, что если расходы на рекламу составят 5 млн. руб., то количество продаж будет заключено в пределах от 29-2,104=26,896 до 29+2,104=31,104 (тыс. ед.)
5. Ниже представлен график линии регрессии с нанесением на него опытных данных.
Рис. 2.1. График линии регрессии ;
опытные данные, ___ линейная модель регрессии;---- границы 95% доверительного коридора (трубки).
Задача 2
Дано: имеются данные о доли расходов на товары длительного пользования уi от среднемесячного дохода семьи xi (табл. 2.4). Предполагается, что эта зависимость носит нелинейный характер
Таблица 2.4

Доход семьи xi, тыс.р. на 1 чел.

2

2,5

3

3,5

4

4,5

5

5,5

6

6,5

Процент расходов на товары длительного пользования уi

27,0

23,4

22,1

20,5

19,3

18,9

17,3

16,7

17,7

16,1

Требуется:
1. Найти уравнение нелинейной гиперболической регрессии .
2. Найти парный коэффициент корреляции и с доверительной вероятностью проверить его значимость.
Решение
1. Уравнение равносторонней гиперболы имеет вид: . Произведем линеаризацию модели путем замены X = 1 / х. В результате получим линейное уравнение . Рассчитаем его параметры по данным таблицы 2.5.
Таблица 2.5

i

xi

yi

Xi=1/xi

Xi2

Xiyi

1

2

27

0.50

0.25

13.50

26.88

0.1200

0.0144

7.100

50.41

2

2.5

23.4

0.40

0.16

9.36

23.85

-0.4536

0.2058

3.500

12.25

3

3

22.1

0.33

0.11

7.37

21.84

0.2639

0.0697

2.200

4.840

4

3.5

20.5

0.29

0.08

5.86

20.39

0.1050

0.0110

0.600

0.360

5

4

19.3

0.25

0.06

4.83

19.31

-0.0141

0.0002

-0.60

0.360

6

4.5

18.9

0.22

0.05

4.20

18.47

0.4265

0.1819

-1.00

1.000

7

5

17.3

0.20

0.04

3.46

17.80

-0.5010

0.2510

-2.60

6.760

8

5.5

16.7

0.18

0.03

3.04

17.25

-0.5507

0.3033

-3.20

10.24

9

6

17.7

0.17

0.03

2.95

16.79

0.9078

0.8241

-2.2

4.840

10

6.5

16.1

0.15

0.02

2.48

16.40

-0.3042

0.0925

-3.8

14.44

42.5

199

2.69

0.84

57.03

1.9539

105.5

Ср.

4.25

19.9

Применяя МНК к уравнению , получим систему нормальных уравнений:
эта система имеет решения
Уравнение нелинейной регрессии имеет вид:
2. Определим индекс корреляции по формуле:
Связь между показателем у и фактором х очень тесная.
Проверим значимость индекса корреляции с помощью F-критерия Фишера. Наблюдаемое значение статистики определяется по формуле:
По таблице критических точек F-распределения Фишера-Снедекора находим табличное значение FТабл.
для , ,
Индекс корреляции значим, т.к. F > FТабл.
Нанесем на график фактические данные и построенную модель регрессии (рис. 2.2 и рис. 2.3).
Рис. 2.2 График линейной регрессии . (X=X1)
- опытные данные, __ линеаризованная модель регрессии; --- границы 95% доверительного коридора (трубки)
Рис.2.3. График нелинейной гиперболической регрессии y- опытные данные, y1= - гиперболическая модель регрессии.
Задача 3
Дано: выборка зависимости среднего числа автомобилей y в очереди от числа работников ГИБДД x, проводящих технический осмотр автомобилей (табл. 2.6). Предполагается, что зависимость между факторами имеет вид .
Таблица 2.6

2

3

4

5

6

7

8

45

42

37

31

23

12

3

Требуется:
1. найти уравнение параболической регрессии;
2. определить индекс корреляции и на уровне значимости проверить его значимость.
Решение
1. В соответствии с формулой для вычисления коэффициентов полиномиальной регрессии, в случае многочлена третьего порядка система уравнений для вычисления неизвестных коэффициентов уравнения регрессии имеет вид:
Находим коэффициенты системы уравнений
откуда получаем систему
Решаем систему методом Крамера и получаем
, ,
, .
Откуда
Уравнение регрессии имеет вид
.
2. Найдем индекс корреляции. Вычисляем . Заполним следующую таблицу:
Таблица 2.7

2

3

4

5

6

7

8

45

42

37

31

23

12

3

45.19

41.86

37.00

30.62

22.71

13.28

2.33

0.036

0.020

0

0.144

0.084

0.518

0.449

303.8

208.2

88.9

11.8

20.9

242.4

603.7

Откуда
Индекс корреляции
.
Оценка значимости индекса корреляции проводится с помощью t-критерия Стьюдента:
, или , откуда следует вывод о значимости индекса корреляции.
Задача 4
Дано: по группе предприятий, производящих однородную продукцию, известно, как зависит себестоимость единицы продукции у от факторов, приведенных в таблице 2.8.
Таблица 2.8

Признак-фактор

Уравнение парной регрессии

Среднее значение фактора

Объем производства, млн. руб., х1

Трудоемкость единицы продукции, чел.-час, х2

Оптовая цена за 1 т. энергоносителя, млн. руб., х3

Доля прибыли, изымаемой государством, %, х4

Требуется:
1. определить с помощью коэффициентов эластичности силу влияния каждого фактора на результат;
2. ранжировать факторы по силе влияния.
Решение:
1. Для уравнения равносторонней гиперболы средний коэффициент эластичности:
Для уравнения прямой :
Для уравнения степенной зависимости :
Для уравнения показательной зависимости ;
2. Сравнивая значения коэффициентов эластичности , ранжируем по силе их влияния на себестоимость единицы продукции:
а) ; в)
б) г)
Как следует из результатов анализа, для формирования уровня себестоимости продукции группы предприятий первоочередное значение имеют цены на энергоносители; далее, в гораздо меньшей степени влияют трудоемкость продукции и отчисляемая часть прибыли. Фактором снижения себестоимости выступает размер производства: с ростом его на 1% себестоимость единицы продукции снижается на 0,97%.
Задача 5
Дано: зависимость потребления некоторого продукта от среднедушевого дохода по данным 20 семей характеризуется следующим образом:
уравнение регрессии;
индекс корреляции;
остаточная дисперсия .
Требуется: провести дисперсионный анализ полученных результатов.
Результаты дисперсионного анализа приведены в таблице 2.9.
Таблица 2.9

Вариация результата у

Число степеней свободы

Сумма квадратов отклонений, S

Дисперсия на одну степень свободы, D

a=0,05, к1=1, к2 =18

Общая

6,316

-

-

-

Факторная

к1=m=1

5,116

5,116

76,7

4,41

Остаточная

к2=n-m-1=18

1,200

0,0667

-

-

;
;
;

Поскольку, гипотеза о случайности различий факторной и остаточной дисперсий отклоняется. Эти различия существенны, статистически значимы, поэтому уравнение регрессии значимо, показатель тесноты связи надежен и отражает устойчивую зависимость потребления продукта от среднедушевого дохода.

3. Множественная регрессия и корреляция

Задача 1

Дано: по четырем предприятиям региона изучается зависимость выработки продукции на одного работника y (тыс. руб.) от ввода в действие новых основных фондов (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих (%). Данные представлены в таблице 3.1.

Таблица 3.1

Номер предприятия

1

2

3

4

, (%)

1

2

3

5

, (%)

0

1

3

4

, (тыс. руб.)

6

11

19

28

Требуется:

1. найти уравнение множественной регрессии;

2. определить оценки дисперсий переменных и парные коэффициенты корреляции;

3. вычислить индекс множественной корреляции и сравнить его с парными индексами корреляции;

4. вычислить значение F-критерия Фишера и определить статистическую значимость уравнения

Решение

1. Предположим, что зависимость выработки продукции на одного работника характеризуется следующим уравнением:

.

На основании исходных данных составляем систему уравнений для определения коэффициентов и .

;

; ;

;

;

; ;

.

Решим эту систему по методу Крамера. Вычисляем определитель системы:

Аналогично вычисляем частные определители, заменяя соответствующий столбец столбцом свободных членов:

; ; .

Коэффициенты уравнения определяются по формулам:

Таким образом, уравнение принимает вид:

.

2. Оценки дисперсии переменных можно определить по формулам

где ; .

По условию задачи i = 1, 2. Подставляя значения переменных из табл. 3.1, найдем

и тогда оценки дисперсий равны:

Парные коэффициенты корреляции определяются по формулам:

, ,

где , .

По условию задачи i, j = 1, 2. Подставляя значения переменных из табл. 3.1, найдем

Тогда парные коэффициенты корреляции равны

;

;

.

3. Вычислим индекс множественной корреляции по формуле

,

где - остаточная дисперсия.

Подставим ранее полученные значения, рассчитаем , используя уравнение регрессии. В итоге получим .

Сравниваем индекс множественной корреляции с парными индексами корреляции:

.

Следовательно, включение обоих факторов в уравнение множественной регрессии является обоснованным.

4. Вычислим значение F-критерия Фишера по формуле

.

Определим статистическую значимость уравнения. По таблице определяем . Очевидно, , а значит, полученное уравнение корреляции является статистически значимым.

Задача 2

Дано: по 20 территориям России изучают данные (табл. 3.2): зависимость среднегодового душевого дохода у (тыс. руб.) от доли занятых тяжелым физическим трудом в общей численности занятых х1 (%) и от доли экономически активного населения в численности всего населения х2 (%).

Таблица 3.2

Признак

Среднее значение

Среднее квадратичное значение

Характеристика тесноты связи

Уравнение связи

у

112,76

31,58

х1

5,40

3,34

х2

50,88

1,74

Требуется:

1. Составить таблицу дисперсионного анализа для проверки при уровне значимости =0,05 статистической значимости уравнения множественной регрессии и его показателя тесноты связи.

2. С помощью частных F-критериев Фишера оценить, насколько целесообразно включение в уравнение множественной регрессии фактора х1 после фактора х2 и насколько целесообразно включение х2 после х1.

3. Оценить с помощью t-критерия Стьюдента статистическую значимость коэффициентов при переменных х1 и х2 множественного уравнения регрессии.

Решение

1. Задача дисперсионного анализа состоит в проверке нулевой гипотезы Н0 о статистической незначимости уравнения регрессии в целом и показателя тесноты связи.

Анализ выполняется при сравнении фактического и табличного (критического) значений F-критерия Фишера и . определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы:

где n - число единиц совокупности;

m - число факторов в уравнении линейной регрессии;

- фактическое значение результативного признака;

- расчетное значение результативного признака.

Результаты дисперсионного анализа представлены в табл. 3.3.

Таблица 3.3

Вариация результата, y

Число степеней свободы

Сумма квадратов отклонений, S

Дисперсии на одну степень свободы, s2

a=0,05,

k1=2,

k2=17

Общая

df=n-1=19

19945,9

-

-

-

Факторная

k1=m=2

11918,3

5959,15

12,62

3,59

Остаточная

k2=n-m-1=17

8027,6

472,21

-

-

Поскольку Fфакт>Fтабл, приходим к выводу о необходимости отклонить гипотезу H0 и сделать вывод о статистической значимости уравнения регрессии в целом и значения, так как они статистически надежны. Вероятность ошибки при отклонении нулевой гипотезы не превышает 5%, и это является достаточно малой величиной.

2. Частный F-критерий Фишера оценивает статистическую целесообразность включения фактора х1 в модель после того, как в нее включен фактор х2. Частный F-критерий Фишера строится как отношение прироста факторной дисперсии за счет дополнительно включенного фактора (на одну степень свободы) к остаточной дисперсии (на одну степень свободы), подсчитанной по модели с включенными факторами х1 и х2:

Результаты дисперсионного анализа представлены в табл. 3.4.

Таблица 3.4

Вариация результата, у

Число степеней свободы

Сумма квадратов отклонений, S

Дисперсия на одну степень свободы,

a=0,05,

k1=2, k2=17

Общая

df=n-1=19

19945,9

-

-

-

Факторная

В том числе:

· за счет х2

· за счет дополнитель

ного х1

к1=m=2

1

1

11918,3

5127,1

6791,2

5959,15

5127,1

6791,2

10,86

14,38

3,59

4,45

4,45

Остаточная

к2=n-m-1=17

8027,6

472,21

-

-

Включение фактора х1 после фактора х2 оказалось статистически значимым и оправданным: прирост факторной дисперсии (в расчете на одну степень свободы) оказался существенным, т.е. следствием дополнительного включения в модель систематически действующего фактора х1, так как

Аналогично проверим целесообразность включения в модель дополнительного фактора х2 после включенного ранее фактора х1. Расчет выполним с использованием показателей тесноты связи и :

Поскольку , то включение х2 после включенного ранее фактора х1 оказалось бесполезным: прирост факторной дисперсии в расчете на одну степень свободы был несуществен, статистически незначим, т.е. влияние х2 не является устойчивым, систематическим. Возможно было ограничиться построением линейного уравнения парной регрессии у от х1.

3. Оценка с помощью t-критерия Стьюдента значимости коэффициентов и связана с сопоставлением их значений с величиной их случайных ошибок: и . Расчет значений случайных ошибок достаточно сложен и трудоёмок. Более прост способ: расчета значения t-критерия Стьюдента для коэффициентов регрессии линейного уравнения как квадратного корня из соответствующего частного F-критерия Фишера:

,

Табличные (критические) значения t-критерия Стьюдента зависят от принятого уровня значимости «а» (обычно это 0,1; 0,05 или 0,01) и от числа степеней свободы (n - m - 1), где n - число единиц совокупности, m - число факторов в уравнении.

При =0,05 (уровень значимости); df=20-3=17 (число степеней свободы) . Сравнивая и , приходим к выводу, что так как , приходим к заключению, что величина является статистически незначимой, ненадежной в силу того, что она формируется преимущественно под воздействием случайных факторов. Еще раз подтверждается статистическая значимость влияния х1 на у (среднедушевой доход) и ненадежность, незначимости влияния на у х2 (доли экономически активного населения в численности всего населения.

Задача 3

Дано: организация продает облицовочную плитку в трех городах: Воронеже, Липецке и Курске. Маркетинговая служба хочет определить влияние отчислений на рекламу Y (тыс. р.) на количество проданной продукции Х (млн. шт.). При этом предполагается, что зависимость фактора Х на функцию Y линейная и степень влияния факторов друг на друга (коэффициент а уравнения регрессии) во всех городах примерно одинаков, но различен спрос на продукцию (свободный член уравнения). Статистические данные представлены в табл. 3.5:

Таблица 3.5 г. Воронеж

X

25

14

19

27

33

31

12

16

28

Y

37

24

25

39

42

43

22

27

27

г. Липецк

X

13

18

19

24

21

17

31

29

16

27

22

21

Y

30

33

33

41

35

31

45

45

30

40

33

32

г. Курск

X

16

15

11

19

27

31

29

22

19

26

Y

22

20

18

25

28

35

32

27

26

31

Требуется: включить в регрессионную модель такой фактор как «город».

Решение:

Введем фиктивные переменные:

В результате получаем регрессионную функцию трех переменных , а результаты наблюдений можно записать как (табл. 3.6):

Таблица 3.6

Y

37

24

25

39

42

43

22

27

27

30

33

33

41

35

31

45

X

25

14

19

27

33

31

12

16

28

13

18

19

24

21

17

31

Z1

1

1

1

1

1

1

1

1

1

0

0

0

0

0

0

0

Z2

0

0

0

0

0

0

0

0

0

1

1

1

1

1

1

1

Y

45

30

40

33

32

22

20

18

25

28

35

32

27

26

31

X

29

16

27

22

21

16

15

11

19

27

31

29

22

19

26

Z1

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

Z2

1

1

1

1

1

0

0

0

0

0

0

0

0

0

0

4. Система эконометрических уравнений

Задача 1

Дано: исследуется модель вида

,

где у - валовой национальный доход;

у-1 - валовой национальный доход предшествующего года;

С - личное потребление;

D - конечный спрос (помимо личного потребления);

1 и 2 - случайные составляющие.

Информация за 9 лет о приростах всех показателей дана в табл. 4.1:

Таблица 4.1

Год

D

у-1

у

С

Год

D

у-1

у

С

1

-6,8

46,7

3,1

7,4

6

44,7

17,8

37,2

8,6

2

22,4

3,1

22,8

30,4

7

23,1

37,2

35,7

30,0

3

-17,3

22,8

7,8

1,3

8

51,2

35,7

46,6

31,4

4

12,0

7,8

21,4

8,7

9

32,3

46,6

56,0

39,1

5

5,9

21,4

17,8

25,8

167,5

239,1

248,4

182,7

Для этой модели была получена система приведенных уравнений:

Требуется:

1. провести идентификацию модели;

2. рассчитать параметры первого уравнения структурной модели

Решение:

1. В данной модели есть две эндогенные переменные (у и С) и две экзогенные (D и у-1). Второе уравнение точно идентифицировано, поскольку содержит две эндогенные переменные и не содержит одну экзогенную переменную, по счетному правилу идентификации имеем равенство 2=1+1.

Первое уравнение сверхидентифицировано, так как в нем на параметры при С и D наложено ограничение их равенства. В этом уравнении содержится одна эндогенная переменная у. Переменная С в данном уравнении не рассматривается как эндогенная, так как она участвует в уравнении не самостоятельно, а вместе с переменной D. В данном уравнении отсутствует одна экзогенная переменная, имеющаяся в системе. По счетному правилу идентификации получаем: 1+1=2: D+1>Н, что больше чем число эндогенных переменных в данном уравнении, поэтому система сверхидентифицирована.

2. Для определения параметров сверхидентифицированой модели используется двухшаговый метод наименьших квадратов.

Шаг 1. На основе системы приведенных уравнений по точно идентифицированному второму уравнению определим теоретические значения эндогенной переменной С. Для этого в приведенное уравнение

подставим значения D и у-1 из условия задачи. Получили:

Шаг 2. По сверхидентифицированому уравнению структурной формы модели заменяем фактические значения С на теоретические и рассчитываем новую переменную (табл. 4.2).

Таблица 4.2

Год

D

Год

D

у-1

у

1

-6,8

15,8

9,0

6

44,7

27,4

72,1

2

22,4

16,8

39,2

7

23,1

24,0

47,1

3

-17,3

7,4

-9,9

8

51,2

33,2

84,4

4

12,0

14,3

26,3

9

32,3

29,0

61,3

5

5,9

15,0

20,9

167,5

182,9

350,4

Далее к сверхидентифицированому уравнению применяется метод наименьших квадратов. Заменим переменной Z. Решаем уравнение

Система нормальных уравнений имеет вид:

,

а1=7б678; b1=0,512.

В итоге первое уравнение структурной модели будет иметь вид:

Задача 2

Дано: данные за 1990-1994 гг. (табл. 4.3):

Таблица 4.3

Год

Годовое потребление свинины на душу населения, фунтов, у1

Оптовая цена за фунт, долл., у2

Доход на душу населения, долл., х1

Расходы по обработке мяса, % к цене, х2

1990

60

5,0

1300

60

1991

62

4,0

1300

56

1992

65

4,2

1500

56

1993

62

5,0

1600

63

1994

66

3,8

1800

50

Требуется: построить модель вида определив соответствующие структурные коэффициенты

Решение:

Система одновременных уравнений с двумя эндогенными и двумя экзогенными переменными имеет вид

В каждом уравнении две эндогенные и одна отсутствующая экзогенная переменная из имеющихся в системе. Для каждого уравнения системы действует счетное правило 2=1+1, что означает идентифицированность уравнений и системы в целом. Для определения параметров такой системы применяется косвенный метод наименьших квадратов. С этой целью структурная форма модели преобразуется в приведенную форму:

,

в которой коэффициенты при х определяется методом наименьших квадратов.

Для нахождения значений запишем систему нормальных уравнений:

.

При ее решении предполагается, что х и у выражены через отклонения от средних уровней, т. е. матрица исходных данных составит (табл. 4.4):

Таблица 4.4

у1

у2

х1

х2

1990

-3

0,6

-200

3

1991

-1

-0,4

-200

-1

1992

2

-0,2

0

-1

1993

-1

0,6

100

6

1994

3

-0,6

300

7

0

0,0

0

0

Применительно к ней необходимые суммы равны:

;;;;.

Система нормальных уравнений примет вид:

.

Решив ее, получим .

Аналогично строим систему нормальных уравнений для определения коэффициентов :

,

где суммы равны: ; .

Получили систему

,

из которой определим искомые .

В итоге приведенная форма модели принимает вид:

.

Отсюда определяем коэффициенты структурной модели:

,

,

,

.

В итоге структурная форма модели принимает вид:

5. Временные ряды

Задача 1

Дано: условные данные о средних расходах на конечное потребление (yt денежных единиц) за 8 лет (табл. 5.1):

Таблица 5.1

t

1

7

-

-

-

-

-

-

2

8

7

-3,39

-3

9,87

10,8241

9

3

8

8

-3,29

-2

6,58

10,8241

4

4

10

8

-1,29

-2

2,58

1,6641

4

5

11

10

-0,29

0

0,00

0,0841

0

6

12

11

0,71

1

0,71

0,5041

1

7

14

12

2,71

2

5,42

7,3441

4

8

16

14

4,71

4

18,84

22,1841

16

86

70

-0,03

0

44,0

53,4287

38

Требуется: найти коэффициент автокорреляции со смещением на 1 год.

Решение:

По формулам:

вычисляем

,

.

Далее, заполняем таблицу и, используя формулу для вычисления линейного коэффициента автокорреляции, получаем

.

Полученное значение свидетельствует об очень тесной зависимостью между расходами на конечное потребление текущего непосредственно предшествующего годов и, следовательно, о наличии во временном ряде расходов на конечное потребление сильной линейной тенденции.

Задача 2

Дано: выборка курса биржевой стоимости акции некоторого предприятия за 12 месяцев (табл. 4.1):

Таблица 4.1

Месяц

1

2

3

4

5

6

7

8

9

10

11

12

Стоимость акции, руб.

37,4

35,9

35,4

40,4

38,3

38,6

42,6

40,3

40,3

45,1

43,2

42,2

Требуется: построить модель линейной тенденции временного ряда.

Решение:

Линейная модель тенденции временного ряда имеет вид . Согласно методу наименьших квадратов параметры модели определяются из системы нормальных уравнений:

.

Вычислим в табл. 4.2 необходимые суммы:

Таблица 4.2

t

yt

t2

tyt

1

37,4

1

37,4

36,208

2

35,9

4

71,8

36,893

3

35,4

9

106,2

37,578

4

40,4

16

161,6

38,263

5

38,3

25

191,5

38,948

6

38,6

36

231,6

39,633

7

42,6

49

298,2

40,317

8

40,3

64

322,4

41,002

9

40,3

81

362,7

41,687

10

45,1

100

451

42,372

11

43,2

121

475,2


Подобные документы

  • Временной ряд и его основные элементы. Автокорреляция уровней временного ряда и выявление структуры. Моделирование тенденции временного ряда. Метод наименьших квадратов. Приведение уравнения тренда к линейному виду. Оценка параметров уравнения регрессии.

    контрольная работа [95,7 K], добавлен 25.02.2010

  • Порядок построения линейного уравнения парной регрессии, расчет коэффициентов и оценка статической значимости параметров регрессии и корреляции. Точность прогноза. Множественная регрессия и корреляция. Системы эконометрических уравнений. Временные ряды.

    контрольная работа [1,3 M], добавлен 24.09.2013

  • Определение для вариационного ряда: средней арифметической, дисперсии, моды, медианы, относительных показателей вариации. Проведение смыкания рядов динамики c использованием коэффициента сопоставимости. Вычисление агрегатных индексов цен и стоимости.

    контрольная работа [23,0 K], добавлен 29.01.2011

  • Парная регрессия и корреляция в эконометрических исследованиях, методика и основные этапы ее построения, анализ полученных результатов и их интерпретация. Проверка структурной формы модели на идентификацию, исходя из заданной гипотетической модели.

    контрольная работа [33,8 K], добавлен 19.03.2012

  • Применение различных способов представления и обработки статистических данных. Пространственные статистические выборки. Парная регрессия и корреляция. Временные ряды. Построение тренда. Практические примеры и методика их решения, формулы и их значение.

    курс лекций [6,9 M], добавлен 26.02.2009

  • Анализ динамических рядов и выбор исходных данных. Графическое представление динамического ряда, расчет показателей изменения уровней динамических рядов и средних показателей. Периодизация динамических рядов и анализ основной тенденции динамики ряда.

    курсовая работа [2,8 M], добавлен 16.09.2010

  • Виды и способы статистического наблюдения. Построение и анализ вариационных рядов распределения. Оценка параметров генеральной совокупности банков на основе выборочных данных. Расчет парного коэффициента корреляции и уравнения однофакторной регрессии.

    контрольная работа [712,1 K], добавлен 30.03.2014

  • Формулы определения средних величин интервального ряда - моды, медианы, дисперсии. Расчет аналитических показателей рядов динамики по цепной и базисной схемам, темпов роста и прироста. Понятие сводного индекса себестоимости, цен, затрат и товарооборота.

    курсовая работа [218,5 K], добавлен 27.02.2011

  • Экономико-статистический анализ временных рядов развития строительства Тюменской области. Выявление и измерение сезонных колебаний. Корреляция рядов динамики и проведение регрессионного анализа показателей. Экстраполяция по мультипликативной схеме.

    курсовая работа [521,5 K], добавлен 20.01.2016

  • Методика проведения анализа динамических рядов социально-экономических явлений. Компоненты, формирующие уровни при анализе рядов динамики. Порядок составления модели экспорта и импорта Нидерландов. Уровни автокорреляции. Корреляция рядов динамики.

    курсовая работа [583,6 K], добавлен 13.05.2010

  • Понятие статистических рядов распределения и их виды: атрибутивные и вариационные. Графическое изображение статистических данных: расчет показателей вариации, моды и медианы. Анализ группы предприятий по признакам Товарооборот и Средние товарные запасы.

    курсовая работа [498,5 K], добавлен 09.01.2011

  • Эконометрика - совокупность методов анализа связей между экономическими показателями на основании статистических данных. Требования к уровню освоения содержания дисциплины. Методологические основы курса, парная и множественная регрессия и корреляция.

    методичка [219,8 K], добавлен 15.11.2010

  • Понятие временного ряда, компоненты. Сглаживание, анализ периодических колебаний. Сезонность, аддитивная и мультипликативная модели. Понятие белого шума в моделях динамики рядов. Оператор лагового сдвига. Оценка и вывод автокорреляционной функции.

    курсовая работа [659,4 K], добавлен 13.09.2015

  • Расчет среднего балла успеваемости по данным результатов сессии, определение показателя вариаций уровня знаний и структуры численности студентов по успеваемости. Построение интервального ряда распределения предприятий. Оценка коэффициентов корреляции.

    контрольная работа [76,0 K], добавлен 21.08.2009

  • Способы анализа ряда динамики: приведение параллельных данных, смыкание рядов динамики, аналитическое выравнивание. Расчет средних цен на товар; определение дисперсии, среднего квадратического отклонения, коэффициента вариации, индивидуальных индексов.

    контрольная работа [65,5 K], добавлен 12.04.2012

  • Результаты вычисления интервальных оценок для математического ожидания и дисперсии. Вычисление выборочных характеристик по заданной выборке. Результаты ранжирования выборочных данных и вычисление моды и медианы. Оценка функции плотности распределения.

    курсовая работа [215,7 K], добавлен 07.02.2016

  • Понятие и значение временного ряда в статистике, его структура и основные элементы, значение. Классификация и разновидности временных рядов, особенности сферы их применения, отличительные характеристики и порядок определения в них динамики, стадии, ряды.

    контрольная работа [30,9 K], добавлен 13.03.2010

  • Проведение расчета абсолютных, относительных, средних величин, коэффициентов регрессии и эластичности, показателей вариации, дисперсии, построение и анализ рядов распределения. Характеристика аналитического выравнивания цепных и базисных рядов динамики.

    курсовая работа [351,2 K], добавлен 20.05.2010

  • Абсолютные и относительные величины. Статистические распределения и их основные характеристики. Нижняя граница медианного интервала. Определение среднего линейного отклонения, дисперсии, среднего квадратичного отклонения. Уровни динамического ряда.

    контрольная работа [226,6 K], добавлен 04.09.2014

  • Машинное обучение и статистические методы анализа данных. Оценка точности прогнозирования. Предварительная обработка данных. Методы классификации, регрессии и анализа временных рядов. Методы ближайших соседей, опорных векторов, спрямляющего пространства.

    контрольная работа [833,1 K], добавлен 04.09.2016

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.