Расчет основных экономических показателей

Расчет уравнения основной тенденции динамики потребления основных продуктов питания и индексов цен на эти продукты. Оценка статистической значимости уравнений регрессии и его основных параметров с помощью F критерия Фишера и t критерия Стьюдента.

Рубрика Экономико-математическое моделирование
Вид контрольная работа
Язык русский
Дата добавления 29.11.2013
Размер файла 42,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

1 .Выявите и рассчитайте уравнение основной тенденции динамики потребления основных продуктов питания и индексов цен на эти продукты. Рассчитайте параметры уравнения, оцените тесноту связи

статистический индекс регрессия критерий

В доктрине продовольственной безопасности для оценки состояния продовольственной безопасности разработана система показателей и критерии их оценки. В сфере потребления одним из важнейших показателей является потребление продуктов питания в расчете на душу населения. Несмотря на успешную реализацию приоритетного национального проекта «Развитие АПК» и осуществление госпрограммы развития сельского хозяйства импорт продовольственных товаров продолжает увеличиваться. В настоящее время доля продукции российского производства в формировании продовольственных ресурсов страны недостаточно высока, это характерно и для Республики Башкортостан по мясу и мясопродуктам, овощам и фруктам.

Только по молоку за последние годы удалось повысить уровень самообеспеченности региона. В этих условиях актуальным является анализ данных о потреблении основных продуктов питания на душу населения в Республике Башкортостан. Для статистического исследования использованы данные за 1997-2012 гг., чтобы выявить основные закономерности уровня потребления и цен на продукты за период становления рыночной экономики. Анализ данных за 2012г. по сравнению с 1997 г. показал, что потребление хлеба и хлебных продуктов уменьшилось на 6,9%. По остальным видам продукции произошло повышение уровня потребления. Потребление овощей увеличилось на 78,5%, картофеля на 42,1%, молока и молокопро- дуктов на 19,5%, яиц на 10,9%, мяса и мясопродуктов на 17,3%. За этот период уровень потребления отдельных продуктов колебался по годам. Анализ динамики уровня потребления и изменения цепных индексов цен был проведен также по средним показателям динамики за 1997-2012 гг. (таблица 1). Средний уровень потребления за весь рассматриваемый период достиг рациональных норм по яйцу, превысил рациональные нормы по хлебным продуктам на 22,4%, по молоку и молокопродуктам на 16,5%, по картофелю на 60%. Не достигнуты рациональные нормы потребления по мясу и мясопродуктам (88,3% от нормы), по овощам - 61,3%, хотя средний темп роста по овощам был самым высоким и составил 106%.

Таблица 1 Потребление продуктов питания на душу населения в Республике Башкортостан за 1995-2009 гг.

Продукты

Средний

уровень,

кг

Средний абсолютный прирост, кг

Средний темп роста, %

Средний уровень цепных индексов цен, %

Средний абсолютный прирост цепных индексов цен, %

Средний темп роста цепных индексов цен, %

Хлеб и хлебные продукты

126,2

-1,97

99,7

134,6

-17

95,9

Молоко

343

5,3

111,3

148,7

-19

102,9

Мясо

67

1,9

113,7

129,6

-9,8

103,7

Картофель

150,3

3,8

111,5

127,1

-5,9

104,8

Овощи

74,9

3,6

114,0

125,7

-2,8

99,5

Яйца, шт.

260

2,1

110,7

136,1

-8,6

101,4

В целом, за 1997-2012 гг. средний уровень цепных индексов цен составил 135-139% по хлебу и молоку, изменялся от 134 до 141% по овощам, яйцам, картофелю, мясу. Цепные индексы цен по всем рассматриваемым продуктам имели за весь период в среднем тенденцию к снижению, однако тенденция не была устойчивой. Резкое колебание индексов цен наблюдалось по картофелю, овощам и яйцам, хлебным изделиям и молоку при относительной устойчивости индексов цен по мясу. Что касается изменения цен на продовольственные товары, цены на них повышались в среднем за 1997-2012 гг. на 22,7%. Цены на мясопродукты повышались в среднем на 28,3%, молокопродукты на 25,6%, хлебопродукты на 23,5%, яйца на 19,2%, овощи - 20, 6%. В связи с изменчивостью показателей уровня потребления продуктов и цепных индексов цен были построены их тренды за 1997-2012 гг. (таблица 2).

Таблица 2 Уравнения основной тенденции уровня потребления и индексов цен за 1997-2012 гг.

Продукты

Уравнения трендов, t=0 в 2012 г.

Уровня потребления, кг

Индексов цен, %

Хлеб и хлебные продукты

37 = 121,2 - 0,589t

qy~) = 8,82 Vy (t) =7,3%

~ = 131,64 - 5,597t q = 39,6% Vy (t) = 30%

Молоко и молокопродукты

j= 336,66 + 5,107t

qyit) = 22,9 Vy (t) =6,8%

3) = 131,7 - 5,858t

qy it )=38,8% Vy (t) = 29,5%

Мясо

37 = 63,73 + 0,65t

qy~) = 4,87 Vy (t) =7,6%

3 = 129,6 - 4,7t

qy it ( = 31,8% Vy (t) = 25%

Картофель

37 = 150,26 + 2,05t

qy it)= 21,05 Vy (t) = 14%

37 = 125,7 - 3,263t q it )= 60,4% Vy (t) = 48,1%

Овощи

= 64,87 + 2,25t

qy(t) = 5,35 Vy (t) =8,2%

37 = 127,06 - 3,27t q it )= 64,84% Vy (t) = 51,0%

Яйца

37 = 250,47 + 3,593t

qyit) = 20,7 Vy (t) =8,2%

37 = 126,08 - 5,446t °y it )= 45,4% Vy (t) = 35,9%

Анализ параметров уравнений показывает, что за рассматриваемый период происходило устойчивое повышение потребления основных продуктов питания, кроме хлеба и хлебных продуктов. Ежегодно в среднем потребление молока и молокопродуктов увеличивалось на 1 человека на 5,1 кг, мяса - на 0, 65кг, картофеля на 2,25кг, овощей на 2,05 кг, яиц на 3,6 шт.

Коэффициент корреляции между уровнем потребления продуктов и индексом цен был наиболее сильным по молоку г=0,868, незначительным по хлебу г=0,422, т.е. несмотря на рост цен, потребление этих продуктов имело тенденцию к повышению. Об этом свидетельствуют также коэффициенты автокорреляции уровня потребления этих продуктов первого и второго порядков, исчисленные по первой и второй разностям для молока rt = 0,758, rn = 0,495 , для хлеба rn = 0,905 , для мяса rt = 0,823 и rц = 0,610 для яиц - rt = 0,690 .

Результаты анализа могут использоваться органами государственной статистики для мониторинга состояния процесса ценообразования на продукты питания, а также органами государственного управления для выработки научно-обоснованной политики, обеспечивающей продовольственную безопасность региона.

Продуктовое благополучие населения сильно зависит от сложившейся экономической ситуации в сельском хозяйстве и хода реализации Государственной программы. Для достижения целей необходимо создать условия для устойчивого развития сельского хозяйства на основе государственной поддержки запланированных мероприятий по каждому из ее направлений. Приоритетными отраслями сельского хозяйства в Республике Башкортостан являются мясное и молочное скотоводство, свиноводство, овцеводство, овощеводство, а также зерновое производство и кормопроизводство.

2. Оцените статистическую значимость уравнений регрессии и его параметров с помощью F критерии Фишера и t критерия Стьюдента

2.1 Корреляционный анализ. Уравнение парной регрессии. Использование графического метода

Этот метод применяют для наглядного изображения формы связи между изучаемыми экономическими показателями. Для этого в прямоугольной системе координат строят график, по оси ординат откладывают индивидуальные значения результативного признака Y, а по оси абсцисс - индивидуальные значения факторного признака X.

Совокупность точек результативного и факторного признаков называется полем корреляции.

На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.

Линейное уравнение регрессии имеет вид y = bx + a + е

Здесь е - случайная ошибка (отклонение, возмущение).

Причины существования случайной ошибки:

1. Невключение в регрессионную модель значимых объясняющих переменных;

2. Агрегирование переменных. Например, функция суммарного потребления - это попытка общего выражения совокупности решений отдельных индивидов о расходах. Это лишь аппроксимация отдельных соотношений, которые имеют разные параметры.

3. Неправильное описание структуры модели;

4. Неправильная функциональная спецификация;

5. Ошибки измерения.

Так как отклонения еi для каждого конкретного наблюдения i - случайны и их значения в выборке неизвестны, то:

1) по наблюдениям xi и yi можно получить только оценки параметров б и в

2) Оценками параметров б и в регрессионной модели являются соответственно величины а и b, которые носят случайный характер, т.к. соответствуют случайной выборке;

Тогда оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = bx + a + е, где ei - наблюдаемые значения (оценки) ошибок еi, а и b соответственно оценки параметров б и в регрессионной модели, которые следует найти.

Для оценки параметров б и в - используют МНК (метод наименьших квадратов). Метод наименьших квадратов дает наилучшие (состоятельные, эффективные и несмещенные) оценки параметров уравнения регрессии.

Но только в том случае, если выполняются определенные предпосылки относительно случайного члена (е) и независимой переменной (x).

Формально критерий МНК можно записать так:

S = ?(yi - y*i)2 > min

Система нормальных уравнений.

a*n + b?x = ?y

a?x + b?x2 = ?y*x

Для наших данных система уравнений имеет вид

17a + 2066 b = 2193.4

2066 a + 252214 b = 268984.2

Из первого уравнения выражаем а и подставим во второе уравнение:

Получаем эмпирические коэффициенты регрессии: b = 2.135, a = -130.4413

Уравнение регрессии (эмпирическое уравнение регрессии):

y = 2.135 x - 130.4413

Эмпирические коэффициенты регрессии a и b являются лишь оценками теоретических коэффициентов вi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных.

Для расчета параметров регрессии построим расчетную таблицу (табл. 1)

x

y

x2

y2

x * y

138

281.4

19044

79185.96

38833.2

134

148.4

17956

22022.56

19885.6

137

108.1

18769

11685.61

14809.7

110

118.9

12100

14137.21

13079

112

173.4

12544

30067.56

19420.8

113

124.7

12769

15550.09

14091.1

114

110.3

12996

12166.09

12574.2

114

101.9

12996

10383.61

11616.6

116

117.4

13456

13782.76

13618.4

121

129.3

14641

16718.49

15645.3

121

103.2

14641

10650.24

12487.2

123

110.3

15129

12166.09

13566.9

120

121.3

14400

14713.69

14556

122

126.2

14884

15926.44

15396.4

123

99.8

15129

9960.04

12275.4

126

108.7

15876

11815.69

13696.2

122

110.1

14884

12122.01

13432.2

2066

2193.4

252214

313054.14

268984.2

2.2 Параметры уравнения регрессии

Выборочные средние.

Выборочные дисперсии:

Среднеквадратическое отклонение

Коэффициент корреляции

Ковариация.

Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:

Линейный коэффициент корреляции принимает значения от -1 до +1.

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:

0.1 < rxy < 0.3: слабая;

0.3 < rxy < 0.5: умеренная;

0.5 < rxy < 0.7: заметная;

0.7 < rxy < 0.9: высокая;

0.9 < rxy < 1: весьма высокая;

В нашем примере связь между признаком Y фактором X умеренная и прямая.

Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b:

2.3 Уравнение регрессии (оценка уравнения регрессии)

Линейное уравнение регрессии имеет вид y = 2.13 x -130.44

Коэффициентам уравнения линейной регрессии можно придать экономический смысл.

Коэффициент регрессии b = 2.13 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 2.13.

Коэффициент a = -130.44 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями.

Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.

Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.

Связь между у и х определяет знак коэффициента регрессии b (если > 0 - прямая связь, иначе - обратная). В нашем примере связь прямая.

2.4 Коэффициент эластичности

Коэффициенты регрессии (в примере b) нежелательно использовать для непосредственной оценки влияния факторов на результативный признак в том случае, если существует различие единиц измерения результативного показателя у и факторного признака х.

Для этих целей вычисляются коэффициенты эластичности и бета - коэффициенты.

Средний коэффициент эластичности E показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора x на 1% от своего среднего значения.

Коэффициент эластичности находится по формуле:

В нашем примере коэффициент эластичности больше 1. Следовательно, при изменении Х на 1%, Y изменится более чем на 1%. Другими словами - Х существенно влияет на Y.

2.5 Бета - коэффициент

Бета - коэффициент показывает, на какую часть величины своего среднего квадратичного отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину его среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных:

Т.е. увеличение x на величину среднеквадратического отклонения Sx приведет к увеличению среднего значения Y на 0.41 среднеквадратичного отклонения Sy.

2.6 Ошибка аппроксимации

Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:

Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.

Поскольку ошибка больше 7%, то данное уравнение не желательно использовать в качестве регрессии.

2.7 Эмпирическое корреляционное отношение

Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит для измерение тесноты зависимости. Изменяется в пределах [0;1].

Где

Индекс корреляции.

Для линейной регрессии индекс корреляции равен коэфииценту корреляции rxy = 0.41.

Полученная величина свидетельствует о том, что фактор x умеренно влияет на y

Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:

Данный коэффициент является универсальным, так как отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. При построении однофакторной корреляционной модели коэффициент множественной корреляции равен коэффициенту парной корреляции rxy.

В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах [0;1].

Теоретическое корреляционное отношение для линейной связи равно коэффициенту корреляции rxy.

2.8 Коэффициент детерминации

Квадрат (множественного) коэффициента корреляции называется коэффициентом детерминации, который показывает долю вариации результативного признака, объясненную вариацией факторного признака.

Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.

R2= 0.412 = 0.172

т.е. в 17.2 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - низкая. Остальные 82.8 % изменения Y объясняются факторами, не учтенными в модели.

Для оценки качества параметров регрессии построим расчетную таблицу (табл. 2)

x

y

y(x)

(yi-ycp)2

(y-y(x))2

(xi-xcp)2

|y - yx|:y

138

281.4

164.19

23218.59

13738.61

271.28

0.42

134

148.4

155.65

375.45

52.54

155.52

0.0488

137

108.1

162.05

437.79

2910.95

239.34

0.5

110

118.9

104.41

102.49

210.01

132.93

0.12

112

173.4

108.68

1969.27

4188.9

90.81

0.37

113

124.7

110.81

18.69

192.84

72.75

0.11

114

110.3

112.95

350.57

7.01

56.69

0.024

114

101.9

112.95

735.69

122.06

56.69

0.11

116

117.4

117.22

135.11

0.033

30.57

0.00155

121

129.3

127.89

0.0764

1.98

0.28

0.0109

121

103.2

127.89

666.85

609.76

0.28

0.24

123

110.3

132.16

350.57

478

2.16

0.2

120

121.3

125.76

59.65

19.88

2.34

0.0368

122

126.2

130.03

7.97

14.66

0.22

0.0303

123

99.8

132.16

854.01

1047.38

2.16

0.32

126

108.7

138.57

413.05

892.11

19.99

0.27

122

110.1

130.03

358.1

397.13

0.22

0.18

2066

2193.4

2193.4

30053.93

24883.85

1134.24

3

3. Оценка параметров уравнения регрессии

3.1 Значимость коэффициента корреляции

Для того чтобы при уровне значимости б проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1 ? 0, надо вычислить наблюдаемое значение критерия

и по таблице критических точек распределения Стьюдента, по заданному уровню значимости б и числу степеней свободы k = n - 2 найти критическую точку tкрит двусторонней критической области. Если tнабл < tкрит оснований отвергнуть нулевую гипотезу. Если |tнабл| > tкрит -- нулевую гипотезу отвергают.

По таблице Стьюдента с уровнем значимости б=0.05 и степенями свободы k=15 находим tкрит:

tкрит (n-m-1;б/2) = (15;0.025) = 2.131

где m = 1 - количество объясняющих переменных.

Если tнабл > tкритич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).

Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим

В парной линейной регрессии t2r = t2b и тогда проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного уравнения регрессии.

3.2 Интервальная оценка для коэффициента корреляции (доверительный интервал)

Доверительный интервал для коэффициента корреляции

r(-0.0132;0.84)

3.3 Анализ точности определения оценок коэффициентов регрессии

Несмещенной оценкой дисперсии возмущений является величина:

S2y = 1658.92 - необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).

Sy = 40.73 - стандартная ошибка оценки (стандартная ошибка регрессии).

Sa - стандартное отклонение случайной величины a.

Sb - стандартное отклонение случайной величины b.

3.4 Доверительные интервалы для зависимой переменной

Экономическое прогнозирование на основе построенной модели предполагает, что сохраняются ранее существовавшие взаимосвязи переменных и на период упреждения. Для прогнозирования зависимой переменной результативного признака необходимо знать прогнозные значения всех входящих в модель факторов.

Прогнозные значения факторов подставляют в модель и получают точечные прогнозные оценки изучаемого показателя.

(a + bxp ± е)

Где

Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и Xp = 134

(-130.44 + 2.13*134 ± 38.42)

(117.23;194.07)

С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.

Индивидуальные доверительные интервалы для Y при данном значении X.

(a + bxi ± е)

Где

tкрит (n-m-1;б/2) = (15;0.025) = 2.131

xi

y = -130.44 + 2.13xi

еi

ymin = y - еi

ymax = y + еi

138

164.19

98.89

65.3

263.07

134

155.65

94.92

60.73

250.57

137

162.05

97.81

64.25

259.86

110

104.41

94.12

10.28

198.53

112

108.68

92.63

16.05

201.31

113

110.81

91.98

18.84

202.79

114

112.95

91.4

21.55

204.34

114

112.95

91.4

21.55

204.34

116

117.22

90.44

26.78

207.66

121

127.89

89.32

38.57

217.22

121

127.89

89.32

38.57

217.22

123

132.16

89.39

42.77

221.56

120

125.76

89.4

36.36

215.16

122

130.03

89.32

40.71

219.35

123

132.16

89.39

42.77

221.56

126

138.57

90.05

48.52

228.62

С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.

3.5 Проверка гипотез относительно коэффициентов линейного уравнения регрессии

1) t-статистика. Критерий Стьюдента.

С помощью МНК мы получили лишь оценки параметров уравнения регрессии, которые характерны для конкретного статистического наблюдения (конкретного набора значений x и y).

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля.

Чтобы проверить, значимы ли параметры, т.е. значимо ли они отличаются от нуля для генеральной совокупности используют статистические методы проверки гипотез.

В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности.

Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости б=0.05.

В случае если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется t-критерий Стьюдента.

Найденное по данным наблюдений значение t-критерия (его еще называют наблюдаемым или фактическим) сравнивается с табличным (критическим) значением, определяемым по таблицам распределения Стьюдента (которые обычно приводятся в конце учебников и практикумов по статистике или эконометрике).

Табличное значение определяется в зависимости от уровня значимости (б) и числа степеней свободы, которое в случае линейной парной регрессии равно (n-2), n-число наблюдений.

Если фактическое значение t-критерия больше табличного (по модулю), то основную гипотезу отвергают и считают, что с вероятностью (1-б) параметр или статистическая характеристика в генеральной совокупности значимо отличается от нуля.

Если фактическое значение t-критерия меньше табличного (по модулю), то нет оснований отвергать основную гипотезу, т.е. параметр или статистическая характеристика в генеральной совокупности незначимо отличается от нуля при уровне значимости б.

tкрит (n-m-1;б/2) = (15;0.025) = 2.131

Поскольку 1.77 < 2.131, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом b можно пренебречь.

Поскольку 0.89 < 2.131, то статистическая значимость коэффициента регрессии a не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом a можно пренебречь.

Доверительный интервал для коэффициентов уравнения регрессии.

Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:

(b - tкрит Sb; b + tкрит Sb)

(2.13 - 2.131 * 1.21; 2.13 + 2.131 * 1.21)

(-0.44;4.71)

С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.

Так как точка 0 (ноль) лежит внутри доверительного интервала, то интервальная оценка коэффициента b статистически незначима.

(a - tкрит Sa; a + tкрит Sa)

(-130.44 - 2.131 * 147.31; -130.44 + 2.131 * 147.31)

(-444.35;183.47)

С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.

2) F-статистика. Критерий Фишера.

Коэффициент детерминации R2 используется для проверки существенности уравнения линейной регрессии в целом.

Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.

Если расчетное значение с k1=(m) и k2=(n-m-1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой.

где m - число факторов в модели.

Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму:

1. Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо: H0: R2=0 на уровне значимости б.

2. Далее определяют фактическое значение F-критерия:

где m=1 для парной регрессии.

3. Табличное значение определяется по таблицам распределения Фишера для заданного уровня значимости, принимая во внимание, что число степеней свободы для общей суммы квадратов (большей дисперсии) равно 1 и число степеней свободы остаточной суммы квадратов (меньшей дисперсии) при линейной регрессии равно n-2.

Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости б. Уровень значимости б - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно б принимается равной 0,05 или 0,01.

4. Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу.

В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-б) принимается альтернативная гипотеза о статистической значимости уравнения в целом.

Табличное значение критерия со степенями свободы k1=1 и k2=15, Fтабл = 4.54

Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

Связь между F-критерием Фишера и t-статистикой Стьюдента выражается равенством:

Дисперсионный анализ.

При анализе качества модели регрессии используется теорема о разложении дисперсии, согласно которой общая дисперсия результативного признака может быть разложена на две составляющие - объясненную и необъясненную уравнением регрессии дисперсии.

Задача дисперсионного анализа состоит в анализе дисперсии зависимой переменной:

?(yi - ycp)2 = ?(y(x) - ycp)2 + ?(y - y(x))2

где

?(yi - ycp)2 - общая сумма квадратов отклонений;

?(y(x) - ycp)2 - сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная»);

?(y - y(x))2 - остаточная сумма квадратов отклонений.

Источник вариации

Сумма квадратов

Число степеней свободы

Дисперсия на 1 степень свободы

F-критерий

Модель

5170.08

1

5170.08

3.12

Остаточная

24883.85

15

1658.92

1

Общая

30053.93

17-1

Показатели качества уравнения регрессии.

Показатель

Значение

Коэффициент детерминации

0.17

Средний коэффициент эластичности

2.01

Средняя ошибка аппроксимации

17.65

Проверка на наличие автокорреляции остатков.

Важной предпосылкой построения качественной регрессионной модели по МНК является независимость значений случайных отклонений от значений отклонений во всех других наблюдениях. Это гарантирует отсутствие коррелированности между любыми отклонениями и, в частности, между соседними отклонениями.

Автокорреляция (последовательная корреляция) определяется как корреляция между наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в пространстве (перекрестные ряды). Автокорреляция остатков (отклонений) обычно встречается в регрессионном анализе при использовании данных временных рядов и очень редко при использовании перекрестных данных.

В экономических задачах значительно чаще встречается положительная автокорреляция, нежели отрицательная автокорреляция. В большинстве случаев положительная автокорреляция вызывается направленным постоянным воздействием некоторых неучтенных в модели факторов.

Отрицательная автокорреляция фактически означает, что за положительным отклонением следует отрицательное и наоборот. Такая ситуация может иметь место, если ту же зависимость между спросом на прохладительные напитки и доходами рассматривать по сезонным данным (зима-лето).

Среди основных причин, вызывающих автокорреляцию, можно выделить следующие:

1. Ошибки спецификации. Неучет в модели какой-либо важной объясняющей переменной либо неправильный выбор формы зависимости обычно приводят к системным отклонениям точек наблюдения от линии регрессии, что может обусловить автокорреляцию.

2. Инерция. Многие экономические показатели (инфляция, безработица, ВНП и т.д.) обладают определенной цикличностью, связанной с волнообразностью деловой активности. Поэтому изменение показателей происходит не мгновенно, а обладает определенной инертностью.

3. Эффект паутины. Во многих производственных и других сферах экономические показатели реагируют на изменение экономических условий с запаздыванием (временным лагом).

4. Сглаживание данных. Зачастую данные по некоторому продолжительному временному периоду получают усреднением данных по составляющим его интервалам. Это может привести к определенному сглаживанию колебаний, которые имелись внутри рассматриваемого периода, что в свою очередь может служить причиной автокорреляции.

Последствия автокорреляции схожи с последствиями гетероскедастичности: выводы по t- и F-статистикам, определяющие значимость коэффициента регрессии и коэффициента детерминации, возможно, будут неверными.

Обнаружение автокорреляции

1. Графический метод

Есть ряд вариантов графического определения автокорреляции. Один из них увязывает отклонения еi с моментами их получения i. При этом по оси абсцисс откладывают либо время получения статистических данных, либо порядковый номер наблюдения, а по оси ординат - отклонения еi (либо оценки отклонений).

Естественно предположить, что если имеется определенная связь между отклонениями, то автокорреляция имеет место. Отсутствие зависимости скорее всего будет свидетельствовать об отсутствии автокорреляции.

Автокорреляция становится более наглядной, если построить график зависимости еi от еi-1

2. Коэффициент автокорреляции.

Если коэффициент автокорреляции rei < 0.5, то есть основания утверждать, что автокорреляция отсутствует.

3. Критерий Дарбина-Уотсона.

Этот критерий является наиболее известным для обнаружения автокорреляции.

При статистическом анализе уравнения регрессии на начальном этапе часто проверяют выполнимость одной предпосылки: условия статистической независимости отклонений между собой. При этом проверяется некоррелированность соседних величин ei.

y

y(x)

ei = y-y(x)

e2

(ei - ei-1)2

281.4

164.19

117.21

13738.61

0

148.4

155.65

-7.25

52.54

15490.3

108.1

162.05

-53.95

2910.95

2181.36

118.9

104.41

14.49

210.01

4684.7

173.4

108.68

64.72

4188.9

2523.05

124.7

110.81

13.89

192.84

2584.2

110.3

112.95

-2.65

7.01

273.41

101.9

112.95

-11.05

122.06

70.56

117.4

117.22

0.18

0.033

126.11

129.3

127.89

1.41

1.98

1.5

103.2

127.89

-24.69

609.76

681.21

110.3

132.16

-21.86

478

8.01

121.3

125.76

-4.46

19.88

302.93

126.2

130.03

-3.83

14.66

0.4

99.8

132.16

-32.36

1047.38

814.25

108.7

138.57

-29.87

892.11

6.23

110.1

130.03

-19.93

397.13

98.8

24883.85

29847.01

Для анализа коррелированности отклонений используют статистику Дарбина-Уотсона:

Критические значения d1 и d2 определяются на основе специальных таблиц для требуемого уровня значимости б, числа наблюдений n = 17 и количества объясняющих переменных m=1.

Автокорреляция отсутствует, если выполняется следующее условие:

d1 < DW и d2 < DW < 4 - d2.

Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что автокорреляция остатков отсутствует, если 1.5 < DW < 2.5. Поскольку 1.5 > 1.2 < 2.5, то автокорреляция остатков присутствует.

Для более надежного вывода целесообразно обращаться к табличным значениям.

По таблице Дарбина-Уотсона для n=17 и k=1 (уровень значимости 5%) находим: d1 = 1.13; d2 = 1.38.

Поскольку 1.13 < 1.2 и 1.38 < 1.2 < 4 - 1.38, то автокорреляция остатков присутствует.

Проверка наличия гетероскедастичности.

1) Методом графического анализа остатков.

В этом случае по оси абсцисс откладываются значения объясняющей переменной X, а по оси ординат либо отклонения ei, либо их квадраты e2i.

Если имеется определенная связь между отклонениями, то гетероскедастичность имеет место. Отсутствие зависимости скорее всего будет свидетельствовать об отсутствии гетероскедастичности.

2) При помощи теста ранговой корреляции Спирмена.

Коэффициент ранговой корреляции Спирмена.

Присвоим ранги признаку ei и фактору X. Найдем сумму разности квадратов d2.

По формуле вычислим коэффициент ранговой корреляции Спирмена.

Если среди значений признаков х и у встречается несколько одинаковых, образуются связанные ранги, т. е. одинаковые средние номера; например, вместо одинаковых по порядку третьего и четвертого значений признака будут два ранга по 3,5. В таком случае коэффициент Спирмена вычисляется как:

Где

j - номера связок по порядку для признака х;

Аj - число одинаковых рангов в j-й связке по х;

k - номера связок по порядку для признака у;

Вk - число одинаковых рангов в k-й связке по у.

X

ei

ранг X, dx

ранг ei, dy

(dx - dy)2

138

117.21

17

17

0

134

7.25

15

6

81

137

53.95

16

15

1

110

14.49

1

9

64

112

64.72

2

16

196

113

13.89

3

8

25

114

2.65

4.5

3

2.25

114

11.05

4.5

7

6.25

116

0.18

6

1

25

121

1.41

8.5

2

42.25

121

24.69

8.5

12

12.25

123

21.86

12.5

11

2.25

120

4.46

7

5

4

122

3.83

10.5

4

42.25

123

32.36

12.5

14

2.25

126

29.87

14

13

1

122

19.93

10.5

10

0.25

507

A = 24/12 = 2

B = 0/12 = 0

Связь между признаком ei и фактором X слабая и прямая

Оценка коэффициента ранговой корреляции Спирмена.

Значимость коэффициента ранговой корреляции Спирмена

Для того чтобы при уровне значимости б проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции Спирмена при конкурирующей гипотезе Hi. p ? 0, надо вычислить критическую точку:

где n - объем выборки; p - выборочный коэффициент ранговой корреляции Спирмена: t(б, к) - критическая точка двусторонней критической области, которую находят по таблице критических точек распределения Стьюдента, по уровню значимости б и числу степеней свободы k = n-2.

Если |p| < Тkp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| > Tkp - нулевую гипотезу отвергают. Между качественными признаками существует значимая ранговая корреляционная связь.

По таблице Стьюдента находим t(б, k):

t(б, k) = (15;0.05) = 1.753

Поскольку Tkp > p, то принимаем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - не значим и ранговая корреляционная связь между оценками по двум тестам незначимая.

Проверим гипотезу H0: гетероскедастичность отсутсвует.

Поскольку 2.131 > 0.42, то гипотеза об отсутствии гетероскедастичности принимается.

3. Тест Голдфелда-Квандта.

В данном случае предполагается, что стандартное отклонение уi = у(еi) пропорционально значению xi переменной X в этом наблюдении, т.е. у2i = у2x2i , i = 1,2,…,n.

Тест Голдфелда-Квандта состоит в следующем:

1. Все n наблюдений упорядочиваются по величине X.

2. Вся упорядоченная выборка после этого разбивается на три подвыборки размерностей k,(n-2k),k.

3. Оцениваются отдельные регрессии для первой подвыборки (k первых наблюдений) и для третьей подвыборки (k последних наблюдений).

4. Для сравнения соответствующих дисперсий строится соответствующая F-статистика:

F = S3/S1

Построенная F-статистика имеет распределение Фишера с числом степеней свободы v1 = v2 = n - m - 1.

5. Если F > Fkp, то гипотеза об отсутствии гетероскедастичности отклоняется.

Этот же тест может использоваться при предположении об обратной пропорциональности между уi и значениями объясняющей переменной. При этом статистика Фишера имеет вид:

F = S1/S3

1. Упорядочим все значения по величине X.

2. Находим размер подвыборки k = 17/3 = 6.

3. Оценим регрессию для первой подвыборки.

Находим параметры уравнения методом наименьших квадратов.

Система уравнений МНК:

a0n + a1?x = ?y

a0?x + a1?x2 = ?y*x

Для наших данных система уравнений имеет вид:

6a0 + 679a1 = 746.6

679a0 + 76861a1 = 84400.1

Из первого уравнения выражаем а0 и подставим во второе уравнение

Получаем a0 = -4.33, a1 = 614.04

x

y

x2

y2

x * y

y(x)

(y-y(x))2

110

118.9

12100

14137.21

13079

138.13

369.93

112

173.4

12544

30067.56

19420.8

129.48

1928.9

113

124.7

12769

15550.09

14091.1

125.15

0.21

114

110.3

12996

12166.09

12574.2

120.83

110.84

114

101.9

12996

10383.61

11616.6

120.83

358.27

116

117.4

13456

13782.76

13618.4

112.18

27.3

679

746.6

76861

96087.32

84400.1

746.6

2795.44

Здесь S1 = 2795.44

Оценим регрессию для третьей подвыборки.

Находим параметры уравнения методом наименьших квадратов.

Система уравнений МНК:

a0n + a1?x = ?y

a0?x + a1?x2 = ?y*x

Для наших данных система уравнений имеет вид:

6a0 + 781a1 = 856.7

781a0 + 101903a1 = 113067

Из первого уравнения выражаем а0 и подставим во второе уравнение

Получаем a0 = 6.4, a1 = -689.79

x

y

x2

y2

x * y

y(x)

(y-y(x))2

123

110.3

15129

12166.09

13566.9

96.94

178.39

123

99.8

15129

9960.04

12275.4

96.94

8.16

126

108.7

15876

11815.69

13696.2

116.13

55.24

134

148.4

17956

22022.56

19885.6

167.3

357.29

137

108.1

18769

11685.61

14809.7

186.49

6145.13

138

281.4

19044

79185.96

38833.2

192.89

7834.53

781

856.7

101903

146835.95

113067

856.7

14578.74

Здесь S3 = 14578.74

Число степеней свободы v1 = v2 = n - m - 1 = 17 - 1 - 1 = 15

Fkp(1,15) = 4.54

Строим F-статистику:

F = 14578.74/2795.44 = 5.22

Поскольку F > Fkp = 4.54, то гипотеза об отсутствии гетероскедастичности отклоняется.

Библиографический список

1. Айвазян С.А., Мхитарян B.C. Прикладная статистика и основы эконометрики. - М.: ЮНИТИ, 1998.

2. Дорохина Е.Ю., Преснякова Л.Ф., Тихомиров Н.П. Сборник задач по эконометрике. -М.: Экзамен, 2003.

3. Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 1999.

4. Замков О.О., Толстопятенко A.B., Черемных Ю.Н. Математические методы в экономике. - М.: Дис, 1997.

5. Катышев П.К., Пересецкий A.A. Сборник задач к начальному курсу эконометрики. -М.: Дело, 1999.

6. Кремер Н.Ш., Путко Б.А. Эконометрика. - М.: ЮНИТИ, 2002.

7. Магнус Я.Р., Катышев П.К., Пересецкий A.A. Эконометрика: начальный курс. - М.: Дело, 1998.

8. Практикум по эконометрике / Под ред. И. И. Елисеева. - М.: Финансы и статистика, 2001.

9. Федосеев В.В. и др. Экономико-математические методы и прикладные модели. - М.: ЮНИТИ, 1999.

10. Эконометрика: Учебник / Под ред. И.И. Елисеева. - М.: Финансы и статистика, 2001.

Размещено на Allbest.ru

...

Подобные документы

  • Расчет параметров уравнения линейной регрессии, оценка тесноты связи с помощью показателей корреляции и детерминации. Определение средней ошибки аппроксимации. Статистическая надежность моделирования с помощью F-критерия Фишера и t-критерия Стьюдента.

    контрольная работа [58,3 K], добавлен 17.10.2009

  • Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.

    контрольная работа [1,6 M], добавлен 14.05.2008

  • Построение модели множественной линейной регрессии по заданным параметрам. Оценка качества модели по коэффициентам детерминации и множественной корреляции. Определение значимости уравнения регрессии на основе F-критерия Фишера и t-критерия Стьюдента.

    контрольная работа [914,4 K], добавлен 01.12.2013

  • Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.

    контрольная работа [248,4 K], добавлен 26.12.2010

  • Экономическая интерпретация коэффициента регрессии. Нахождение статочной суммы квадратов и оценка дисперсии остатков. Проверка значимости параметров уравнения регрессии с помощью t-критерия Стьюдента. Расчет средней относительной ошибки аппроксимации.

    контрольная работа [261,1 K], добавлен 23.03.2010

  • Расчет матрицы парных коэффициентов корреляции и статистической значимости коэффициентов регрессии. Оценка статистической значимости параметров регрессионной модели с помощью t-критерия. Уравнение множественной регрессии со статистически факторами.

    лабораторная работа [30,9 K], добавлен 05.12.2010

  • Методика расчета линейной регрессии и корреляции, оценка их значимости. Порядок построения нелинейных регрессионных моделей в MS Exсel. Оценка надежности результатов множественной регрессии и корреляции с помощью F-критерия Фишера и t-критерия Стьюдента.

    контрольная работа [3,6 M], добавлен 29.05.2010

  • Построение уравнения множественной регрессии в линейной форме с полным набором факторов, отбор информативных факторов. Проверка значимости уравнения регрессии по критерию Фишера и статистической значимости параметров регрессии по критерию Стьюдента.

    лабораторная работа [217,9 K], добавлен 17.10.2009

  • Построение поля корреляции. Расчет параметров уравнений парной регрессии. Зависимость средней ожидаемой продолжительности жизни от некоторых факторов. Изучение "критерия Фишера". Оценка тесноты связи с помощью показателей корреляции и детерминации.

    контрольная работа [173,8 K], добавлен 22.11.2010

  • Определение количественной зависимости массы пушного зверька от его возраста. Построение уравнения парной регрессии, расчет его параметров и проверка адекватности. Оценка статистической значимости параметров регрессии, расчет их доверительного интервала.

    лабораторная работа [100,5 K], добавлен 02.06.2014

  • Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.

    контрольная работа [681,9 K], добавлен 03.08.2010

  • Расчет параметров уравнения линейной регрессии, оценка тесноты связи с помощью показателей корреляции и детерминации; определение средней ошибки аппроксимации. Статистическая надежность регрессионного моделирования с помощью критериев Фишера и Стьюдента.

    контрольная работа [34,7 K], добавлен 14.11.2010

  • Особенности расчета параметров уравнений линейной, степенной, полулогарифмической, обратной, гиперболической парной и экспоненциальной регрессии. Методика определения значимости уравнений регрессии. Идентификация и оценка параметров системы уравнений.

    контрольная работа [200,1 K], добавлен 21.08.2010

  • Методика нахождения основных числовых характеристик с помощью эконометрического анализа. Вычисление среднего значения, дисперсии. Построение корреляционного поля (диаграммы рассеивания), расчет общего разброса данных. Нахождение значения критерия Фишера.

    контрольная работа [38,2 K], добавлен 16.07.2009

  • Приведение логарифмированием уравнения к линейному виду. Расчет средних значений арифметических переменных и коэффициентов регрессии. Определение средних квадратичных отклонений. Корреляционный анализ экспериментальных данных с помощью критерия Стьюдента.

    контрольная работа [312,7 K], добавлен 10.03.2015

  • Построение доверительного интервала для коэффициента регрессии. Определение ошибки аппроксимации, индекса корреляции и F-критерия Фишера. Оценка эластичности изменения материалоемкости продукции. Построение линейного уравнения множественной регрессии.

    контрольная работа [250,5 K], добавлен 11.04.2015

  • Расчет коэффициентов уравнения регрессии и оценка их значимости. Определение среднеквадратичного отклонения и среднеквадратичной ошибки, вычисление коэффициентов регрессии. Определение критериев Стьюдента. Расчет статистических характеристик модели.

    контрольная работа [137,2 K], добавлен 14.09.2009

  • Выполнение кластерного анализа предприятий с помощью программы Statgraphics Plus. Построение линейного уравнения регрессии. Расчет коэффициентов эластичности по регрессионным моделям. Оценка статистической значимости уравнения и коэффициента детерминации.

    задача [1,7 M], добавлен 16.03.2014

  • Построение модели для зависимой переменной, используя пошаговую множественную регрессию. Рассчет индекса корреляции, оценка качества полученного уравнения регрессии с помощью коэффициента детерминации. Оценка статистической значимости уравнения регрессии.

    лабораторная работа [2,1 M], добавлен 25.05.2009

  • Основные методы анализа линейной модели парной регрессии. Оценки неизвестных параметров для записанных уравнений парной регрессии по методу наименьших квадратов. Проверка значимости всех параметров модели (уравнения регрессии) по критерию Стьюдента.

    лабораторная работа [67,8 K], добавлен 26.12.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.