Расчет уровня заработной платы
Прогноз заработной платы при значении среднедушевого прожиточного минимума. Изучение зависимости выработки продукции на одного работника от ввода в действие новых основных фондов и удельного веса рабочих высокой квалификации в общей численности рабочих.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 22.04.2020 |
Размер файла | 1,2 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Содержание
Задание 1
Задание 2
Задание 3
Список литературы
Задание 1
По территориям региона приводятся данные за 199X г.
Требуется:
Построить линейное уравнение парной регрессии от .
Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
Оценить статистическую значимость параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента.
Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня.
Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
На одном графике построить исходные данные и теоретическую прямую.
Номер региона |
Среднедушевой прожиточный минимум в день одного трудоспособного, руб., |
Среднедневная заработная плата, руб., |
|
1 |
81 |
124 |
|
2 |
77 |
131 |
|
3 |
85 |
146 |
|
4 |
79 |
139 |
|
5 |
93 |
143 |
|
6 |
100 |
159 |
|
7 |
72 |
135 |
|
8 |
90 |
152 |
|
9 |
71 |
127 |
|
10 |
89 |
154 |
|
11 |
82 |
127 |
|
12 |
111 |
162 |
Решение
На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.
y = bx + a
Для оценки параметров б и в - используют МНК (метод наименьших квадратов).
a·n + b·?x = ?y
a·?x + b·?x2 = ?y·x
x |
y |
x2 |
y2 |
x*y |
|
81 |
124 |
6561 |
15376 |
10044 |
|
77 |
131 |
5929 |
17161 |
10087 |
|
85 |
146 |
7225 |
21316 |
12410 |
|
79 |
139 |
6241 |
19321 |
10981 |
|
93 |
143 |
8649 |
20449 |
13299 |
|
100 |
159 |
10000 |
25281 |
15900 |
|
72 |
135 |
5184 |
18225 |
9720 |
|
90 |
152 |
8100 |
23104 |
13680 |
|
71 |
127 |
5041 |
16129 |
9017 |
|
89 |
154 |
7921 |
23716 |
13706 |
|
82 |
127 |
6724 |
16129 |
10414 |
|
111 |
162 |
12321 |
26244 |
17982 |
|
1030 |
1699 |
89896 |
242451 |
147240 |
12a + 1030·b = 1699
1030·a + 89896·b = 147240
b = 0.9472, a =60.2792
Уравнение регрессии - y = 0.9472 x + 60.2792
Параметры уравнения регрессии.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
Коэффициент корреляции b можно находить по формуле, не решая систему непосредственно:
Линейный коэффициент корреляции принимает значения от -1 до +1. Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 < rxy < 0.3: слабая;
0.3 < rxy < 0.5: умеренная;
0.5 < rxy < 0.7: заметная;
0.7 < rxy < 0.9: высокая;
0.9 < rxy < 1: весьма высокая;
В нашем примере связь между признаком Y и фактором X высокая и прямая.
Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b:
Значимость коэффициента корреляции.
Выдвигаем гипотезы:
H0: rxy = 0, нет линейной взаимосвязи между переменными;
H1: rxy ? 0, есть линейная взаимосвязь между переменными;
Для того чтобы при уровне значимости б проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1 ? 0, надо вычислить наблюдаемое значение критерия (величина случайной ошибки)
и по таблице критических точек распределения Стьюдента, по заданному уровню значимости б и числу степеней свободы k = n - 2 найти критическую точку tкрит двусторонней критической области. Если tнабл < tкрит оснований отвергнуть нулевую гипотезу. Если |tнабл| > tкрит -- нулевую гипотезу отвергают.
По таблице Стьюдента с уровнем значимости б=0.05 и степенями свободы k=10 находим tкрит:
tкрит(n-m-1;б/2) = tкрит(10;0.025) = 2.228
где m = 1 - количество объясняющих переменных.
Если |tнабл| > tкритич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).
Поскольку |tнабл| > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим
В парной линейной регрессии t2r = t2b и тогда проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного уравнения регрессии.
Интервальная оценка для коэффициента корреляции (доверительный интервал).
Доверительный интервал для коэффициента корреляции.
r?(0.453;1)
Линейное уравнение регрессии имеет вид y = 0.947 x + 60.279 Коэффициентам уравнения линейной регрессии можно придать экономический смысл.
Коэффициент регрессии b = 0.947 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 0.947.
Коэффициент a = 60.279 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями.
Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.
Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.
Связь между у и х определяет знак коэффициента регрессии b (если > 0 - прямая связь, иначе - обратная). В нашем примере связь прямая.
Ошибка аппроксимации.
В среднем, расчетные значения отклоняются от фактических на 4.26%.
Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Коэффициент детерминации.
R2= 0.8382 = 0.7022
т.е. в 70.22% случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 29.78% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
x |
y |
y(x) |
(yi-ycp)2 |
(y-y(x))2 |
(xi-xcp)2 |
|y - yx|:y |
|
81 |
124 |
137.005 |
309.174 |
169.131 |
23.361 |
0.105 |
|
77 |
131 |
133.216 |
112.007 |
4.911 |
78.028 |
0.0169 |
|
85 |
146 |
140.794 |
19.507 |
27.103 |
0.694 |
0.0357 |
|
79 |
139 |
135.111 |
6.674 |
15.128 |
46.694 |
0.028 |
|
93 |
143 |
148.372 |
2.007 |
28.857 |
51.361 |
0.0376 |
|
100 |
159 |
155.002 |
303.34 |
15.98 |
200.694 |
0.0251 |
|
72 |
135 |
128.48 |
43.34 |
42.511 |
191.361 |
0.0483 |
|
90 |
152 |
145.53 |
108.507 |
41.859 |
17.361 |
0.0426 |
|
71 |
127 |
127.533 |
212.674 |
0.284 |
220.028 |
0.00419 |
|
89 |
154 |
144.583 |
154.174 |
88.682 |
10.028 |
0.0611 |
|
82 |
127 |
137.952 |
212.674 |
119.952 |
14.694 |
0.0862 |
|
111 |
162 |
165.422 |
416.84 |
11.71 |
633.361 |
0.0211 |
|
1030 |
1699 |
1699 |
1900.917 |
566.108 |
1487.667 |
0.512 |
Несмещенной оценкой дисперсии возмущений является величина:
S2 = 56.611 - необъясненная дисперсия или дисперсия ошибки регрессии (мера разброса зависимой переменной вокруг линии регрессии).
S = 7.52 - стандартная ошибка оценки.
Стандартная ошибка регрессии рассматривается в качестве меры разброса данных наблюдений от смоделированных значений. Чем меньше значение стандартной ошибки регрессии, тем качество модели выше.
Sa - стандартное отклонение случайной величины a.
Sb - стандартное отклонение случайной величины b.
Доверительные интервалы для зависимой переменной.
Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и Xp = 107
tкрит(n-m-1;б/2) = tкрит(10;0.025) = 2.228
y(107) = 0.947*107 + 60.279 = 161.633
Вычислим ошибку прогноза для уравнения y = bx + a
или
161.633 ± 10.395
(151.24;172.03)
С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.
Вычислим ошибку прогноза для уравнения y = bx + a + е
161.633 ± 19.72
(141.91;181.36)
Проверка гипотез относительно коэффициентов линейного уравнения регрессии.
t-статистика. Критерий Стьюдента.
tкрит(n-m-1;б/2) = tкрит(10;0.025) = 2.228
Поскольку 4.86 > 2.228, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Поскольку 3.57 > 2.228, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Доверительный интервал для коэффициентов уравнения регрессии.
Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:
(b - tкрит Sb; b + tкрит Sb)
(0.95 - 2.228*0.195; 0.95 + 2.228*0.195)
(0.513;1.382)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
(a - tкрит Sa; a + tкрит Sa)
(60.279 - 2.228*16.884; 60.279 + 2.228*16.884)
(22.662;97.897)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
F-статистика. Критерий Фишера.
Табличное значение критерия со степенями свободы k1=1 и k2=10, Fтабл = 4.96
Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
Показатель |
Значение |
|
Коэффициент детерминации |
0.7022 |
|
Средний коэффициент эластичности |
не был рассчитан |
|
Средняя ошибка аппроксимации |
4.26 |
Таким образом, изучена среднедневной зарплаты (Y) от среднедушевого прожиточного минимума в день одного трудоспособного (X). На этапе спецификации была выбрана парная линейная регрессия. Оценены её параметры методом наименьших квадратов. Статистическая значимость уравнения проверена с помощью коэффициента детерминации и критерия Фишера. Установлено, что в исследуемой ситуации 70.22% общей вариабельности среднедневной зарплаты объясняется изменением среднедушевого прожиточного минимума в день одного трудоспособного. Установлено также, что параметры модели статистически значимы. Возможна экономическая интерпретация параметров модели - увеличение среднедушевого прожиточного минимума в день одного трудоспособного на 1 ед.изм. приводит к увеличению среднедневной зарплаты в среднем на 0.947 ед.изм. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. При среднедушевом прожиточном минимуме в день одного трудоспособного 107%, среднедневная зарплата будет находиться в пределах от 141.91 до 181.36 ед.изм. и с вероятностью 95% не выйдет за эти пределы.
Задание 2
плата заработный прогноз
По 20 предприятиям региона изучается зависимость выработки продукции на одного работника (тыс. руб.) от ввода в действие новых основных фондов (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих (%) (смотри таблицу своего варианта).
Требуется:
Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.
Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.
Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.
С помощью -критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации .
С помощью частных -критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора после и фактора после .
Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор.
Номер предприятия |
||||
1 |
6 |
3,6 |
9 |
|
2 |
6 |
3,6 |
12 |
|
3 |
6 |
3,9 |
14 |
|
4 |
7 |
4,1 |
17 |
|
5 |
7 |
3,9 |
18 |
|
6 |
7 |
4,5 |
19 |
|
7 |
8 |
5,3 |
19 |
|
8 |
8 |
5,3 |
19 |
|
9 |
9 |
5,6 |
20 |
|
10 |
10 |
6,8 |
21 |
|
11 |
9 |
6,3 |
21 |
|
12 |
11 |
6,4 |
22 |
|
13 |
11 |
7 |
24 |
|
14 |
12 |
7,5 |
25 |
|
15 |
12 |
7,9 |
28 |
|
16 |
13 |
8,2 |
30 |
|
17 |
13 |
8 |
30 |
|
18 |
13 |
8,6 |
31 |
|
19 |
14 |
9,5 |
33 |
|
20 |
14 |
9 |
36 |
Решение.
Оценка уравнения регрессии.
Определим вектор оценок коэффициентов регрессии. Согласно методу наименьших квадратов, вектор s получается из выражения: s = (XTX)-1XTY
Матрица XT
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
|
3.6 |
3.6 |
3.9 |
4.1 |
3.9 |
4.5 |
5.3 |
5.3 |
5.6 |
6.8 |
6.3 |
6.4 |
7 |
7.5 |
7.9 |
8.2 |
8 |
8.6 |
9.5 |
9 |
|
9 |
12 |
14 |
17 |
18 |
19 |
19 |
19 |
20 |
21 |
21 |
22 |
24 |
25 |
28 |
30 |
30 |
31 |
33 |
36 |
Умножаем матрицы, (XTX)
XT X = |
20 125 448 125 851,94 3051,7 448 3051,7 11014 |
В матрице, (XTX) число 20, лежащее на пересечении 1-й строки и 1-го столбца, получено как сумма произведений элементов 1-й строки матрицы XT и 1-го столбца матрицы X Умножаем матрицы, (XTY)
XT Y = |
196 1327,6 4762 |
Находим обратную матрицу (XTX)-1
(XT X) -1 = |
0,603 -0,0821 -0,00177 -0,0821 0,168 -0,0431 -0,00177 -0,0431 0,0121 |
Вектор оценок коэффициентов регрессии равен
Y(X) = |
0,603 -0,0821 -0,00177 -0,0821 0,168 -0,0431 -0,00177 -0,0431 0,0121 |
* |
196 1327,6 4762 |
= |
0,718 1,181 0,076 |
Уравнение регрессии (оценка уравнения регрессии)
Y = 0.7176 + 1.1806X1 + 0.07604X2
Число наблюдений n = 20. Число независимых переменных в модели равно 2, а число регрессоров с учетом единичного вектора равно числу неизвестных коэффициентов. С учетом признака Y, размерность матрицы становится равным 4. Матрица, независимых переменных Х имеет размерность (20 х 4). Матрица A, составленная из Y и X
1 |
6 |
3.6 |
9 |
|
1 |
6 |
3.6 |
12 |
|
1 |
6 |
3.9 |
14 |
|
1 |
7 |
4.1 |
17 |
|
1 |
7 |
3.9 |
18 |
|
1 |
7 |
4.5 |
19 |
|
1 |
8 |
5.3 |
19 |
|
1 |
8 |
5.3 |
19 |
|
1 |
9 |
5.6 |
20 |
|
1 |
10 |
6.8 |
21 |
|
1 |
9 |
6.3 |
21 |
|
1 |
11 |
6.4 |
22 |
|
1 |
11 |
7 |
24 |
|
1 |
12 |
7.5 |
25 |
|
1 |
12 |
7.9 |
28 |
|
1 |
13 |
8.2 |
30 |
|
1 |
13 |
8 |
30 |
|
1 |
13 |
8.6 |
31 |
|
1 |
14 |
9.5 |
33 |
|
1 |
14 |
9 |
36 |
Транспонированная матрица
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
|
6 |
6 |
6 |
7 |
7 |
7 |
8 |
8 |
9 |
10 |
9 |
11 |
11 |
12 |
12 |
13 |
13 |
13 |
14 |
14 |
|
3.6 |
3.6 |
3.9 |
4.1 |
3.9 |
4.5 |
5.3 |
5.3 |
5.6 |
6.8 |
6.3 |
6.4 |
7 |
7.5 |
7.9 |
8.2 |
8 |
8.6 |
9.5 |
9 |
|
9 |
12 |
14 |
17 |
18 |
19 |
19 |
19 |
20 |
21 |
21 |
22 |
24 |
25 |
28 |
30 |
30 |
31 |
33 |
36 |
Матрица XTX.
20 |
196 |
125 |
448 |
|
196 |
2074 |
1327.6 |
4762 |
|
125 |
1327.6 |
851.94 |
3051.7 |
|
448 |
4762 |
3051.7 |
11014 |
Полученная матрица имеет следующее соответствие:
?n |
?y |
?x1 |
?x2 |
|
?y |
?y2 |
?x1 y |
?x2 y |
|
?x1 |
?yx1 |
?x1 2 |
?x2 x1 |
|
?x2 |
?yx2 |
?x1 x2 |
?x2 2 |
Найдем парные коэффициенты корреляции
Признаки x и y |
?xi |
?yi |
?xi*yi |
||||
Для y и x1 |
125 |
6.25 |
196 |
9.8 |
1327.6 |
66.38 |
|
Для y и x2 |
448 |
22.4 |
196 |
9.8 |
4762 |
238.1 |
|
Для x1 и x2 |
448 |
22.4 |
125 |
6.25 |
3051.7 |
152.585 |
Дисперсии и среднеквадратические отклонения
Признаки x и y |
|||||
Для y и x1 |
3.535 |
7.66 |
1.88 |
2.768 |
|
Для y и x2 |
48.94 |
7.66 |
6.996 |
2.768 |
|
Для x1 и x2 |
48.94 |
3.535 |
6.996 |
1.88 |
Матрица парных коэффициентов корреляции R:
- |
y |
x1 |
x2 |
|
y |
1 |
0.9859 |
0.9596 |
|
x1 |
0.9859 |
1 |
0.9569 |
|
x2 |
0.9596 |
0.9569 |
1 |
Рассчитаем наблюдаемые значения t-статистики для ryx1 по формуле:
где m = 1 - количество факторов в уравнении регрессии. По таблице Стьюдента находим Tтабл tкрит(n-m-1;б/2) = (18;0.025) = 2.101 Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим Рассчитаем наблюдаемые значения t-статистики для ryx2 по формуле: Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим Частные коэффициенты корреляции. Теснота связи сильная Определим значимость коэффициента корреляции ryx1/x2. Для этого рассчитаем наблюдаемые значения t-статистики по формуле: где k = 1 - число фиксируемых факторов. По таблице Стьюдента находим Tтабл tкрит(n-k-2;б/2) = (17;0.025) = 2.11 Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим Как видим, связь y и x1 при условии, что x2 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x1 остается нецелесообразным. Теснота связи не сильная Определим значимость коэффициента корреляции ryx2/x1. Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Как видим, связь y и x2 при условии, что x1 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x2 остается нецелесообразным. Теснота связи низкая. Межфакторная связь слабая. Определим значимость коэффициента корреляции ryx2/y. Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Как видим, связь y и x2 при условии, что y войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x2 остается нецелесообразным.
Модель регрессии в стандартном масштабе. Модель регрессии в стандартном масштабе предполагает, что все значения исследуемых признаков переводятся в стандарты (стандартизованные значения) по формулам: где хji - значение переменной хji в i-ом наблюдении. Таким образом, начало отсчета каждой стандартизованной переменной совмещается с ее средним значением, а в качестве единицы изменения принимается ее среднее квадратическое отклонение S. Если связь между переменными в естественном масштабе линейная, то изменение начала отсчета и единицы измерения этого свойства не нарушат, так что и стандартизованные переменные будут связаны линейным соотношением: ty = ?вjtxj Для оценки в-коэффициентов применим МНК. При этом система нормальных уравнений будет иметь вид: rx1y=в1+rx1x2*в2 + ... + rx1xm*вm rx2y=rx2x1*в1 + в2 + ... + rx2xm*вm ... rxmy=rxmx1*в1 + rxmx2*в2 + ... + вm Для наших данных (берем из матрицы парных коэффициентов корреляции): 0.986 = в1 + 0.957в2 0.96 = 0.957в1 + в2 Данную систему линейных уравнений решаем методом Гаусса: в1 = 0.802; в2 = 0.192; Искомое уравнение в стандартизованном масштабе: ty=в1tx1+в2tx2 Расчет в-коэффициентов можно выполнить и по формулам: Стандартизированная форма уравнения регрессии имеет вид: ty = 0.802x1 + 0.192x2 Найденные из данной системы в-коэффициенты позволяют определить значения коэффициентов в регрессии в естественном масштабе по формулам: Анализ параметров уравнения регрессии. Перейдем к статистическому анализу полученного уравнения регрессии: проверке значимости уравнения и его коэффициентов, исследованию абсолютных и относительных ошибок аппроксимации Для несмещенной оценки дисперсии проделаем следующие вычисления: Несмещенная ошибка е = Y - Y(x) = Y - X*s (абсолютная ошибка аппроксимации)
Y |
Y(x) |
е = Y - Y(x) |
е2 |
(Y-Yср)2 |
|е : Y| |
|
6 |
5.652 |
0.348 |
0.121 |
14.44 |
0.0579 |
|
6 |
5.88 |
0.12 |
0.0143 |
14.44 |
0.0199 |
|
6 |
6.387 |
-0.387 |
0.15 |
14.44 |
0.0645 |
|
7 |
6.851 |
0.149 |
0.0222 |
7.84 |
0.0213 |
|
7 |
6.691 |
0.309 |
0.0955 |
7.84 |
0.0442 |
|
7 |
7.475 |
-0.475 |
0.226 |
7.84 |
0.0679 |
|
8 |
8.42 |
-0.42 |
0.176 |
3.24 |
0.0525 |
|
8 |
8.42 |
-0.42 |
0.176 |
3.24 |
0.0525 |
|
9 |
8.85 |
0.15 |
0.0225 |
0.64 |
0.0167 |
|
10 |
10.343 |
-0.343 |
0.118 |
0.04 |
0.0343 |
|
9 |
9.753 |
-0.753 |
0.566 |
0.64 |
0.0836 |
|
11 |
9.947 |
1.053 |
1.109 |
1.44 |
0.0958 |
|
11 |
10.807 |
0.193 |
0.0372 |
1.44 |
0.0175 |
|
12 |
11.474 |
0.526 |
0.277 |
4.84 |
0.0439 |
|
12 |
12.174 |
-0.174 |
0.0302 |
4.84 |
0.0145 |
|
13 |
12.68 |
0.32 |
0.102 |
10.24 |
0.0246 |
|
13 |
12.444 |
0.556 |
0.309 |
10.24 |
0.0428 |
|
13 |
13.228 |
-0.228 |
0.0522 |
10.24 |
0.0176 |
|
14 |
14.443 |
-0.443 |
0.196 |
17.64 |
0.0317 |
|
14 |
14.081 |
-0.081 |
0.00656 |
17.64 |
0.00578 |
|
3.808 |
153.2 |
0.809 |
Средняя ошибка аппроксимации Оценка дисперсии равна: se2=(Y-Y(X))T(Y-Y(X))=3.808 Несмещенная оценка дисперсии равна: Оценка среднеквадратичного отклонения (стандартная ошибка для оценки Y): Найдем оценку ковариационной матрицы вектора k = S2 * (XTX)-1
k(x) = 0.22 |
0,603 -0,0821 -0,00177 -0,0821 0,168 -0,0431 -0,00177 -0,0431 0,0121 |
= |
0,135 -0,0184 -0,000396 -0,0184 0,0376 -0,00966 -0,000396 -0,00966 0,00271 |
Дисперсии параметров модели определяются соотношением S2i = Kii, т.е. это элементы, лежащие на главной диагонали
Множественный коэффициент корреляции (Индекс множественной корреляции). Коэффициент множественной корреляции можно определить через матрицу парных коэффициентов корреляции:
где Дr - определитель матрицы парных коэффициентов корреляции; Дr11 - определитель матрицы межфакторной корреляции.
Дr = |
1 0,986 0,96 0,986 1 0,957 0,96 0,957 1 |
= 0.0021 |
Дr11 = |
1 0,957 0,957 1 |
= 0.0844 |
Коэффициент множественной корреляции
Аналогичный результат получим при использовании других формул:
Связь между признаком Y и факторами Xi сильная
Расчёт коэффициента корреляции выполним, используя известные значения линейных коэффициентов парной корреляции и в-коэффициентов.
Коэффициент детерминации
R2 = 0.975
Коэффициент детерминации.
R2= 0.98752 = 0.9751
Более объективной оценкой является скорректированный коэффициент детерминации:
Чем ближе этот коэффициент к единице, тем больше уравнение регрессии объясняет поведение Y.
Добавление в модель новых объясняющих переменных осуществляется до тех пор, пока растет скорректированный коэффициент детерминации.
F-статистика. Критерий Фишера.
Проверим гипотезу об общей значимости - гипотезу об одновременном равенстве нулю всех коэффициентов регрессии при объясняющих переменных:
H0: R2 = 0; в1 = в2 = ... = вm = 0.
H1: R2 ? 0.
Проверка этой гипотезы осуществляется с помощью F-статистики распределения Фишера (правосторонняя проверка).
Если F < Fkp = Fб ; n-m-1, то нет оснований для отклонения гипотезы H0.
Табличное значение при степенях свободы k1 = 2 и k2 = n-m-1 = 20 - 2 - 1 = 17, Fkp(2;17) = 3.59
Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим и уравнение регрессии статистически надежно (т.е. коэффициенты bi совместно значимы).
Необходимость такой оценки связана с тем, что не каждый фактор, вошедший в модель, может существенно увеличить долю объясненной вариации результативного признака. Это может быть связано с последовательностью вводимых факторов (т. к. существует корреляция между самими факторами).
Мерой оценки значимости улучшения качества модели, после включения в нее фактора хj, служит частный F-критерий - Fxj:
где m - число оцениваемых параметров.
В числителе - прирост доли вариации у за счет дополнительно включенного в модель фактора хj.
Если наблюдаемое значение Fxj больше Fkp, то дополнительное введение фактора xj в модель статистически оправдано.
Частный F-критерий оценивает значимость коэффициентов «чистой» регрессии (bj).
Существует взаимосвязь между частным F-критерием - Fxj и t-критерием, используемым для оценки значимости коэффициента регрессии при j-м факторе:
Оценим с помощью частного F-критерия:
целесообразность включения в модель регрессии факторов х1 после введения хj (Fx1).
Определим наблюдаемое значение частного F-критерия:
R2(x2,xn) = r2(x2) = 0.95962 = 0.921
Fkp(k1=1;k2=17) = 4.45
Сравним наблюдаемое значение частного F-критерия с критическим:
Fx1>4.45, следовательно, фактор х1 целесообразно включать в модель после введения фактора х2.
2) целесообразность включения в модель регрессии факторов х2 после введения хj (Fx2).
Определим наблюдаемое значение частного F-критерия:
R2(x1,xn) = r2(x1) = 0.98592 = 0.972
Сравним наблюдаемое значение частного F-критерия с критическим:
Fx2<4.45, следовательно, фактор х2 не целесообразно включать в модель после введения фактора х1.
Таким образом, в результате расчетов было получено уравнение множественной регрессии: Y = 0.7176 + 1.1806X1 + 0.07604X2. Возможна экономическая интерпретация параметров модели: увеличение X1 на 1 ед.изм. приводит к увеличению Y в среднем на 1.181 ед.изм.; увеличение X2 на 1 ед.изм. приводит к увеличению Y в среднем на 0.076 ед.изм. По максимальному коэффициенту в1=0.802 делаем вывод, что наибольшее влияние на результат Y оказывает фактор X1. Статистическая значимость уравнения проверена с помощью коэффициента детерминации и критерия Фишера. Установлено, что в исследуемой ситуации 97.51% общей вариабельности Y объясняется изменением факторов Xj.
Задание 3
Имеются условные данные об объемах потребления электроэнергии () жителями региона за 16 кварталов.
Требуется:
Построить автокорреляционную функцию и сделать вывод о наличии сезонных колебаний.
Построить аддитивную модель временного ряда (для нечетных вариантов) или мультипликативную модель временного ряда (для четных вариантов).
Сделать прогноз на 2 квартала вперед.
1 |
5,8 |
|
2 |
4,5 |
|
3 |
5,1 |
|
4 |
9,1 |
|
5 |
7,0 |
|
6 |
5,0 |
|
7 |
6,0 |
|
8 |
10,1 |
|
9 |
7,9 |
|
10 |
5,5 |
|
11 |
6,3 |
|
12 |
10,8 |
|
13 |
9,0 |
|
14 |
6,5 |
|
15 |
7,0 |
|
16 |
11,1 |
Решение.
Общий вид аддитивной модели следующий:
Y = T + S + E
Эта модель предполагает, что каждый уровень временного ряда может быть представлен как сумма трендовой (T), сезонной (S) и случайной (E) компонент.
Рассчитаем компоненты аддитивной модели временного ряда.
Построение аддитивной модели начнем с выделения сезонной компоненты временного ряда.
Показатели |
1 |
2 |
3 |
4 |
|
1 |
5.8 |
4.5 |
5.1 |
9.1 |
|
2 |
7 |
5 |
6 |
10.1 |
|
3 |
7.9 |
5.5 |
6.3 |
10.8 |
|
4 |
9 |
6.5 |
7 |
11.1 |
|
Всего за период |
29.7 |
21.5 |
24.4 |
41.1 |
|
Средняя оценка сезонной компоненты |
7.425 |
5.375 |
6.1 |
10.275 |
|
Скорректированная сезонная компонента, Si |
0.131 |
-1.919 |
-1.194 |
2.981 |
Для данной модели имеем:
7.425 + 5.375 + 6.1 + 10.275 = 29.175
Корректирующий коэффициент: k=29.175/4 = 7.294
Рассчитываем скорректированные значения сезонной компоненты Si и заносим полученные данные в таблицу.
Исключим влияние сезонной компоненты, вычитая ее значение из каждого уровня исходного временного ряда. Получим величины T + E = Y - S (гр. 4 табл.). Эти значения рассчитываются за каждый момент времени и содержат только тенденцию и случайную компоненту.
Находим параметры уравнения методом наименьших квадратов.
Система уравнений МНК:
a0n + a1?t = ?y
a0?t + a1?t2 = ?y*t
Для наших данных система уравнений имеет вид:
16a0 + 136a1 = 116.7
136a0 + 1496a1 = 1051.35
Из первого уравнения выражаем а0 и подставим во второе уравнение
Получаем a1 = 0.0397, a0 = 6.956
Среднее значение
t |
y |
t2 |
y2 |
t*y |
y(t) |
(y-y(t))2 |
||
1 |
5.669 |
1 |
32.135 |
5.669 |
6.996 |
2.641 |
1.761 |
|
2 |
6.419 |
4 |
41.2 |
12.838 |
7.036 |
0.766 |
0.381 |
|
3 |
6.294 |
9 |
39.611 |
18.881 |
7.075 |
1 |
0.611 |
|
4 |
6.119 |
16 |
37.439 |
24.475 |
7.115 |
1.381 |
0.993 |
|
5 |
6.869 |
25 |
47.18 |
34.344 |
7.155 |
0.181 |
0.0818 |
|
6 |
6.919 |
36 |
47.869 |
41.513 |
7.194 |
0.141 |
0.076 |
|
7 |
7.194 |
49 |
51.75 |
50.356 |
7.234 |
0.01 |
0.00164 |
|
8 |
7.119 |
64 |
50.677 |
56.95 |
7.274 |
0.0306 |
0.0241 |
|
9 |
7.769 |
81 |
60.353 |
69.919 |
7.314 |
0.226 |
0.207 |
|
10 |
7.419 |
100 |
55.038 |
74.188 |
7.353 |
0.0156 |
0.00428 |
|
11 |
7.494 |
121 |
56.156 |
82.431 |
7.393 |
0.04 |
0.0101 |
|
12 |
7.819 |
144 |
61.133 |
93.825 |
7.433 |
0.276 |
0.149 |
|
13 |
8.869 |
169 |
78.655 |
115.294 |
7.472 |
2.481 |
1.95 |
|
14 |
8.419 |
196 |
70.875 |
117.863 |
7.512 |
1.266 |
0.822 |
|
15 |
8.194 |
225 |
67.138 |
122.906 |
7.552 |
0.81 |
0.412 |
|
16 |
8.119 |
256 |
65.914 |
129.9 |
7.592 |
0.681 |
0.278 |
|
Итого |
116.7 |
1496 |
863.123 |
1051.35 |
116.7 |
11.943 |
7.761 |
Определим компоненту T данной модели. Для этого проведем аналитическое выравнивание ряда (T + E) с помощью линейного тренда. Результаты аналитического выравнивания следующие:
T = 6.956 + 0.0397t
Подставляя в это уравнение значения t = 1,...,16, найдем уровни T для каждого момента времени (гр. 5 табл.).
t |
yt |
Si |
yt - Si |
T |
T + Si |
E = yt - (T + Si) |
E2 |
E/yt |
|E|/yt |
|
1 |
5.8 |
0.131 |
5.669 |
6.996 |
7.127 |
-1.327 |
1.761 |
-0.229 |
0.229 |
|
2 |
4.5 |
-1.919 |
6.419 |
7.036 |
5.117 |
-0.617 |
0.381 |
-0.137 |
0.137 |
|
3 |
5.1 |
-1.194 |
6.294 |
7.075 |
5.882 |
-0.782 |
0.611 |
-0.153 |
0.153 |
|
4 |
9.1 |
2.981 |
6.119 |
7.115 |
10.096 |
-0.996 |
0.993 |
-0.109 |
0.109 |
|
5 |
7 |
0.131 |
6.869 |
7.155 |
7.286 |
-0.286 |
0.0818 |
-0.0409 |
0.0409 |
|
6 |
5 |
-1.919 |
6.919 |
7.194 |
5.276 |
-0.276 |
0.076 |
-0.0551 |
0.0551 |
|
7 |
6 |
-1.194 |
7.194 |
7.234 |
6.04 |
-0.0404 |
0.00164 |
-0.00674 |
0.00674 |
|
8 |
10.1 |
2.981 |
7.119 |
7.274 |
10.255 |
-0.155 |
0.0241 |
-0.0154 |
0.0154 |
|
9 |
7.9 |
0.131 |
7.769 |
7.314 |
7.445 |
0.455 |
0.207 |
0.0576 |
0.0576 |
|
10 |
5.5 |
-1.919 |
7.419 |
7.353 |
5.435 |
0.0654 |
0.00428 |
0.0119 |
0.0119 |
|
11 |
6.3 |
-1.194 |
7.494 |
7.393 |
6.199 |
0.101 |
0.0101 |
0.016 |
0.016 |
|
12 |
10.8 |
2.981 |
7.819 |
7.433 |
10.414 |
0.386 |
0.149 |
0.0357 |
0.0357 |
|
13 |
9 |
0.131 |
8.869 |
7.472 |
7.604 |
1.396 |
1.95 |
0.155 |
0.155 |
|
14 |
6.5 |
-1.919 |
8.419 |
7.512 |
5.593 |
0.907 |
0.822 |
0.139 |
0.139 |
|
15 |
7 |
-1.194 |
8.194 |
Подобные документы
Оценка линейной, степенной и показательной моделей по F-критерию Фишера. Прогноз заработной платы у при известном значении среднедушевого прожиточного минимума х. Построение уравнения множественной регрессии в стандартизованной и естественной формах.
контрольная работа [239,7 K], добавлен 17.01.2012Оценка моделей, описывающих зависимость между среднедневной заработной платой работающего и долей расходов на покупку продовольственных товаров через среднюю ошибку аппроксимации и F-критерий Фишера. Прогноз заработной платы и оценка его точности.
контрольная работа [1,6 M], добавлен 19.05.2011Основные виды и формы заработной платы. Характеристика соотношения между ростом заработной платы и производительностью труда. Анализ политики оплаты труда и управления персоналом на примере промышленного предприятия ОАО "Алтайский завод агрегатов".
курсовая работа [152,0 K], добавлен 09.08.2015Группировка рабочих по годам работы с целью изучения зависимости между их стажем и выработкой. Вычисление среднемесячной заработной платы персонала по двум организациям. Определение общего индекса структурных сдвигов и товарооборот в фактических ценах.
контрольная работа [30,8 K], добавлен 02.05.2009Изучение зависимости между среднегодовой стоимостью основных производственных фондов и фондоотдачей. Расчет средней численности рабочих бригады в промышленности и строительстве, товарных запасов торговой организации. Динамика производства молока.
контрольная работа [342,6 K], добавлен 26.10.2013Определение средней заработной платы рабочих. Средний процент выполнения плана по выпуску продукции. Среднее время горения электролампы. Абсолютное значение 1% темпа прироста, среднегодовой прирост. Изменение себестоимости на производство продукции.
контрольная работа [132,7 K], добавлен 03.08.2010Виды статистических методов анализа данных. Применение выборочного наблюдения в правовой статистике. Исследование стажа работы, тарифных разрядов и заработной платы рабочих цеха. Построение рядов распределения и расчет абсолютных показателей вариации.
курсовая работа [295,5 K], добавлен 14.04.2014Расчет прогнозного значения величины прожиточного минимума на заданный период и сравнение полученного результата с реальной ситуацией на основании данных Федеральной службы государственной статистики (в среднем на душу населения, рублей в месяц).
контрольная работа [53,1 K], добавлен 21.06.2010Основные понятия марковских процессов и цепей. Модель прогноза тенденций финансирования штатного состава фирмы. Прогноз возможности сохранения структуры через уравнения политикой фирмы. Распределение сотрудников и суммарной заработной платы по классам.
курсовая работа [132,5 K], добавлен 24.12.2012Изучение зависимости прибыли банков от вложений в уставные капиталы предприятий графическим методом подбора вида уравнения регрессии. Построение модели объема выпуска продукции по данным численности рабочих, элекровооруженности и потери рабочего времени.
контрольная работа [166,2 K], добавлен 22.11.2010Параметры уравнений линейной парной регрессии. Показатели корреляции и детерминации. Изменение средней заработной платы и выплат социального характера. Средняя ошибка аппроксимации. Коэффициент эластичности и стоимость активных производственных фондов.
контрольная работа [1,1 M], добавлен 23.06.2011Расчет валового выпуска и промежуточного потребления продукции, численности безработных, уровня экономической активности и занятости населения, индекса концентрации доходов, баланса основных фондов, эффективности кредитных вложений по рентабельности.
контрольная работа [209,1 K], добавлен 29.01.2010Определение коэффициента механического прироста, рождаемости и выбытия населения. Вычисление удельного веса общественных фондов потребления и льгот в расчете на душу населения. Способы расчета индекса производительности труда постоянного состава.
контрольная работа [26,5 K], добавлен 11.04.2009Тенденции изменения масштаба бедности населения в Российской Федерации. Статистический анализ динамики численности населения с денежными доходами ниже величины прожиточного минимума и дефицит денежного дохода. Методы и направление преодоления бедности.
курсовая работа [1,7 M], добавлен 06.04.2011Системы независимых, рекурсивных, взаимозависимых уравнений. Модель производительности труда и фондоотдачи, динамики цены и заработной платы вида. Эндогенные и экзогенные переменные. Проблема идентификации. Двухшаговый метод наименьших квадратов.
презентация [171,3 K], добавлен 13.07.2015Определение доминирующей стратегии в игре; равновесия в смешанных, осторожных и чистых стратегиях; совершенного подыгрового равновесия методом обратной индукции. Платежная матрица игры. Равновесный уровень заработной платы и занятости в статической игре.
контрольная работа [60,6 K], добавлен 04.02.2011Численность руководителей и других категорий работников, предполагаемый уровень заработной платы. Процентное соотношение входящих и исходящих звонков. Составление таблицы значений на заданном интервале для функции. Аппроксимация статистических данных.
контрольная работа [170,1 K], добавлен 08.04.2010Стоимость затрат на производство, обслуживание и тестирование программного обеспечения. Определение планового задания; калькуляция и коммерческая себестоимость разработки. Расчёт заработной платы и отчислений, оптовой цены ПО. Балансовая прибыль компании.
курсовая работа [22,2 K], добавлен 24.02.2014Понятие основных фондов и задачи их статистического изучения. Анализ выполнения плана, динамики и структуры основных фондов, их состояния, индексный анализ использования. Корреляционный анализ влияния фондоотдачи на прибыль от реализации продукции.
курсовая работа [1,2 M], добавлен 09.12.2013Построение и анализ различных моделей производственных функций с целью прогноза уровня валовой стоимости продукции по сельскохозяйственной отрасли Украины с использованием экономических факторов (капитальных затрат и расходов по заработной плате).
курсовая работа [529,8 K], добавлен 09.01.2011