Эконометрические методы прогнозирования
Характеристика значимости коэффициентов простой линейной регрессии. Определение t-критерия Стьюдента при заданных параметрах парной регрессии, среднем квадратическом отклонении факторного признака, общей и остаточной дисперсии, количестве узловых точек.
Рубрика | Математика |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 18.12.2014 |
Размер файла | 581,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Задача 5.2. Рассчитайте t-критерий Стьюдента для параметра а 0 уравнения парной регрессии, равного 15,4, если известно, что число узловых точек равно 10, среднее квадратическое отклонение факторного признака - 3,16, остаточная дисперсия результативного признака - 5,7, общая дисперсия - 12,4
Решение. Значимость коэффициентов простой линейной регрессии (применительно к совокупностям, у которых n < 30) осуществляют с помощью t-критерия Стьюдента.
Для этого вычисляют расчетные (фактические) значения t-критерия.
Для параметра а 0:
.
Ответ: 18,24.
Задача 5.3. Рассчитайте t-критерий Стьюдента для параметра а 1 уравнения парной регрессии, равного 0,4, если известно, что число узловых точек равно 12, среднее квадратическое отклонение факторного признака - 2,76, остаточная дисперсия результативного признака - 6,2, общая дисперсия - 1,8
Решение. Значимость коэффициентов простой линейной регрессии (применительно к совокупностям, у которых n < 30) осуществляют с помощью t-критерия Стьюдента.
Для этого вычисляют расчетные (фактические) значения t-критерия.
Для параметра а 1:
.
Ответ: 1,402.
Задача 5.5. Рассчитайте t-критерий Стьюдента для параметра а 1 уравнения парной регрессии равного 1,4, если известно, что число наблюдений равно 12, среднее квадратическое отклонение факторного признака - 4,6; общая дисперсия результативного признака - 5,7, остаточная дисперсия - 1,4. Дайте характеристику значимости параметра
Решение. Значимость коэффициентов простой линейной регрессии (применительно к совокупностям, у которых n < 30) осуществляют с помощью t-критерия Стьюдента.
Для этого вычисляют расчетные (фактические) значения t-критерия.
Для параметра а 1:
.
По таблице распределения Стьюдента находим критическое значение t-критерия для н = 12-2 = 10, вероятность б принимаем 0,05:
tтабл(0,05; 10) = 2,23.
Так как, значение ta1 больше tтабл, то параметр а 1 признается статистически значимым и отклоняется гипотеза о том, что он равен 0.
Ответ: 17,21, а 1 статистически значим.
Задача 5.6. Рассчитайте t-критерий Стьюдента для параметра а 0 уравнения парной регрессии, равного 16,4, если известно, что число узловых точек равно 14, среднее квадратическое отклонение факторного признака - 2,6, общая дисперсия результативного признака - 3,9, остаточная дисперсия - 1,2. Дайте характеристику значимости параметра
Решение. Значимость коэффициентов простой линейной регрессии (применительно к совокупностям, у которых n < 30) осуществляют с помощью t-критерия Стьюдента.
Для этого вычисляют расчетные (фактические) значения t-критерия.
Для параметра а 0:
.
По таблице распределения Стьюдента находим критическое значение t-критерия для н = 14-2 = 12, вероятность б принимаем 0,05:
tтабл(0,05; 10) = 2,18.
Так как, значение ta0 больше tтабл, то параметр а 0 признается статистически значимым и отклоняется гипотеза о том, что он равен 0.
Ответ: 51,86, а 0 статистически значим.
Задача 5.7. Рассчитайте коэффициент корреляции для парной прямолинейной зависимости при двенадцати узловых точках, если известно, что: Ух = 15, Ух 2 = 85, Уух = 95, Уу = 58, Уу 2 = 320, Уух 2 = 95, Уу 2х 2 = 95. Дайте характеристику силе связи
Решение. Рассчитаем коэффициент корреляции по формуле:
.
Значение коэффициента корреляции говорит о том, что связь между х и у прямая и умеренная.
Ответ: 0,439.
Задача 5.8. Рассчитайте коэффициент детерминации для парной прямолинейной зависимости при двенадцати узловых точках, если известно, что: Ух = 15, Ух 2 = 85, Уух = 95, Уу = 58, Уу 2 = 320, Уух 2 = 95, Уу 2х 2 = 95. Сделайте вывод относительно полученного результата
Решение. Коэффициент корреляции рассчитан в задании выше:
.
Коэффициент детерминации:
.
Значение коэффициента детерминации говорит о том, что вариация результативного признака у на 19,3 % объясняется вариацией факторного признака х, а необъяснённые факторы составляют 80,7 %.
Ответ: 0,193.
Задача 5.9. Рассчитайте коэффициент корреляции для парной криволинейной зависимости при двенадцати узловых точках, если известно, что: Ух = 15, Ух 2 = 85, Уух = 95, Уу = 58, Уу 2 = 320, остаточная дисперсия результативного признака равна 7,6, а общая дисперсия - 15,2. Дайте характеристику силе связи
Решение. Для криволинейной зависимости рассчитаем корреляционное отношение по формуле:
.
Значение корреляционного отношения говорит о том, что криволинейная зависимость между х и у довольно тесная.
Ответ: 0,707.
Задача 5.10. Рассчитайте коэффициент детерминации для парной криволинейной зависимости при двенадцати узловых точках, если известно, что: Ух = 15, Ух 2 = 85, Уух = 95, Уу = 58, Уу 2 = 320, остаточная дисперсия результативного признака равна 7,6, а общая дисперсия - 15,2. Сделайте вывод относительно полученного результата
Решение. Для криволинейной зависимости рассчитаем коэффициент детерминации по формуле:
.
Значение коэффициента детерминации говорит о том, что построенная криволинейная зависимость между х и у объясняет 50 % вариации результативного признака у, а необъясненные факторы составляют 50 %.
Ответ: 0,5.
Задача 5.11. Рассчитайте t-критерий Стьюдента для коэффициента корреляции уравнения парной регрессии равного 0,4, если известно, что число узловых точек равно 12, среднее квадратическое отклонение факторного признака - 4,6; общая дисперсия результативного признака - 5,7, остаточная дисперсия - 1,4. Дайте характеристику значимости показателя
Решение. Рассчитаем коэффициент корреляции:
.
Значение коэффициента корреляции говорит о том, что связь между х и у очень тесная.
Вычислим расчетное (фактическое) значение t-критерия Стьюдента для коэффициента корреляции парной регрессии по формуле:
.
По таблице распределения Стьюдента находим критическое значение t-критерия для н = 12-2 = 10, вероятность б принимаем 0,05:
tтабл(0,05; 10) = 2,23.
Так как, значение tr больше tтабл, то коэффициент корреляции rxy признается статистически значимым и отклоняется гипотеза о том, что он равен 0. Связь между х и у существенная.
Ответ: 5,55.
Задача 5.12. Рассчитайте t-критерий Стьюдента для коэффициента корреляции уравнения парной регрессии равного 0,8, если известно, что число узловых точек равно 14, среднее квадратическое отклонение факторного признака - 3,6; общая дисперсия результативного признака - 8,7, остаточная дисперсия - 2,4. Дайте характеристику значимости показателя
Решение. Рассчитаем коэффициент корреляции:
.
Значение коэффициента корреляции говорит о том, что связь между х и у очень тесная.
Вычислим расчетное (фактическое) значение t-критерия Стьюдента для коэффициента корреляции парной регрессии по формуле:
.
По таблице распределения Стьюдента находим критическое значение t-критерия для н = 14-2 = 12, вероятность б принимаем 0,05:
tтабл(0,05; 12) = 2,18.
Так как, значение tr больше tтабл, то коэффициент корреляции rxy признается статистически значимым и отклоняется гипотеза о том, что он равен 0. Связь между х и у существенная.
Ответ: 5,61.
Задача 5.13. Оцените значимость индекса детерминации на основе F-критерия Фишера, если известно, что парный коэффициент корреляции равен 0,7, индекс детерминации - 0,49, число узловых точек - 14, относительная ошибка аппроксимации - 8,7 %, факторная дисперсия результативного признака - 3,6
Решение. Оценим значимость индекса детерминации с помощью F-критерию Фишера. Для этого сравним его фактическое значение Fфакт с табличным (критическим) значением Fтабл.
Фактическое значение Fфакт рассчитаем по формуле:
.
Из таблицы критических значений для критерия Фишера по уровню значимости б = 0,05 и числу степеней свободы k1 = m = 1 и k2 = n - m - 1 = 14-1 - 1 = 12 находим Fтa6л = 4,75 (m - число параметров при переменной х).
Фактическое значение критерия больше табличного, что свидетельствует о статистической значимости уравнения регрессии в целом и индекса детерминации R2.
Ответ: 11,53.
Задача 5.14. Оцените значимость индекса детерминации на основе F-критерия Фишера, если известно, что парный коэффициент корреляции равен 0,6, индекс детерминации - 0,36, число узловых точек - 12, относительная ошибка аппроксимации - 9,7 %, факторная дисперсия результативного признака - 5,6
Решение. Оценим значимость индекса детерминации с помощью F-критерию Фишера. Для этого сравним его фактическое значение Fфакт с табличным (критическим) значением Fтабл.
Фактическое значение Fфакт рассчитаем по формуле:
.
Из таблицы критических значений для критерия Фишера по уровню значимости б = 0,05 и числу степеней свободы k1 = m = 1 и k2 = n - m - 1 = 12-1 - 1 = 10 находим Fтa6л = 4,96.
Фактическое значение критерия больше табличного, что свидетельствует о статистической значимости уравнения регрессии в целом и индекса детерминации R2.
Ответ: 5,63.
Задача 5.15. Рассчитайте среднюю ошибку аппроксимации для уравнения регрессии построенного по 12 наблюдениям, если известно, что сумма абсолютных ошибок аппроксимации равна 125,3, а относительных - 72,3 %
Решение. Рассчитаем среднюю ошибку аппроксимации по формуле:
.
В среднем расчетные значения у отклоняются от фактических на 6,03 %. Качество уравнения регрессии можно оценить как очень хорошее, так как средняя ошибка аппроксимации не превышает допустимый предел (8-10 %).
Задача 5.16. Рассчитайте среднюю ошибку аппроксимации для уравнения регрессии построенного по 12 наблюдениям, если известно, что сумма абсолютных ошибок аппроксимации равна 325,3, а относительных - 86,3 %
Решение. Рассчитаем среднюю ошибку аппроксимации по формуле:
.
В среднем расчетные значения у отклоняются от фактических на 7,19 %. Качество уравнения регрессии можно оценить как очень хорошее, так как средняя ошибка аппроксимации не превышает допустимый предел (8-10 %).
Задача 5.17. По нижеприведенным данным осуществите идентификацию представленных уравнений парной регрессии. В соответствии с величиной средней ошибки аппроксимации сделайте вывод о наиболее приемлемой форме модели для описания исходной зависимости изменения индекса физического объема инвестиций (Y) и среднесложившихся цен на зерно (Х). Для выбранной формы модели оцените доверительные интервалы теоретических значений результативной переменной с вероятностью 95 %
Решение. Построим поле корреляции.
Таблица. Данные об индексе физического объема инвестиций и среднесложившиеся цены на зерно в 2006 г. в разрезе районов Ставропольского края
№ района |
Индекс физического объема инвестиций в % к предыдущему году |
Среднесложившиеся цены на зерно, реализованное по всем каналам, руб./ц |
|
Y |
Х |
||
1 |
141,9 |
320,7 |
|
2 |
64,1 |
282,1 |
|
3 |
89,3 |
318,5 |
|
4 |
49,6 |
268,5 |
|
5 |
116,3 |
282,8 |
|
6 |
110,0 |
295,6 |
|
7 |
66,9 |
339,9 |
|
8 |
138,6 |
262,8 |
|
9 |
159,5 |
276,6 |
|
10 |
131,0 |
321,5 |
|
11 |
129,0 |
290 |
|
12 |
87,5 |
313,3 |
|
13 |
84,3 |
259,4 |
|
14 |
116,1 |
282,6 |
Анализируя поле корреляции, видим, что между индексом физического объема инвестиций (у) и среднесложившимися ценами на зерно (х) наблюдается слабая зависимость.
Для анализа связи построим линейную, степенную, экспоненциальную и полулогарифмическую модели зависимости.
Построение линейной модели парной регрессии.
Уравнение линейной парной регрессии имеет вид:
.
С помощью Excel находим:
a1 |
a0 |
|||
-0,061 |
123,86 |
|||
Sa^1 |
0,3814 |
112,47 |
Sa^0 |
|
R2 |
0,0021 |
34,302 |
Sе |
|
F |
0,0254 |
12 |
V |
|
29,85 |
14119 |
|||
RSS |
ESS |
В итоге получаем линейное уравнение парной регрессии (зависимости индекса физического объема инвестиций от среднесложившихся цен на зерно):
.
Коэффициент регрессии а 1 = -0,061 показывает, что при увеличении цен на зерно на 1 руб./ц индекс физического объема инвестиций в % к предыдущему году в среднем снижается на 0,061 п.п.
Рассчитаем коэффициент корреляции:
.
Значение коэффициента корреляции говорит о том, что связь между изучаемыми показателями практически отсутствует.
Коэффициент детерминации:
R2 = rху 2 = 0,04592 = 0,0021.
Значит, полученное линейное уравнение регрессии объясняет 0,21 % вариации признака индекс физического объема инвестиций, а необъясненные факторы составляют 99,79 %.
Проверим значимость уравнения регрессии по F-критерию Фишера. Для этого вычислим вначале фактическое значение критерия:
.
Из таблицы критических значений для критерия Фишера по уровню значимости б = 0,05 и числу степеней свободы k1 = k = 1 и k2 = n - k - 1 = = 14-1 - 1 = 12 находим Fma6 = 4,75. В силу того, что F < Fma6 делаем вывод, что уравнение регрессии не значимо и исследуемая зависимая переменная у не достаточно хорошо описывается включенной в регрессионную модель переменной х.
Построим вспомогательную таблицу:
№ |
х |
у |
ух |
||
1 |
320,7 |
141,9 |
104,38 |
26,4 |
|
2 |
282,1 |
64,1 |
106,72 |
66,5 |
|
3 |
318,5 |
89,3 |
104,51 |
17,0 |
|
4 |
268,5 |
49,6 |
107,55 |
116,8 |
|
5 |
282,8 |
116,3 |
106,68 |
8,3 |
|
6 |
295,6 |
110 |
105,90 |
3,7 |
|
7 |
339,9 |
66,9 |
103,21 |
54,3 |
|
8 |
262,8 |
138,6 |
107,90 |
22,2 |
|
№ |
х |
у |
ух |
||
9 |
276,6 |
159,5 |
107,06 |
32,9 |
|
10 |
321,5 |
131 |
104,33 |
20,4 |
|
11 |
290 |
129 |
106,24 |
17,6 |
|
12 |
313,3 |
87,5 |
104,83 |
19,8 |
|
13 |
259,4 |
84,3 |
108,10 |
28,2 |
|
14 |
282,6 |
116,1 |
106,69 |
8,1 |
|
Итого: |
442,3 |
Чтобы иметь общее представление о качестве модели из относительных отклонений по каждому наблюдению, определяют среднюю ошибку аппроксимации по формуле:
.
Таким образом, средняя ошибка аппроксимации составляет 31,6 %.
Построение степенной модели парной регрессии.
Уравнение степенной модели имеет вид:
.
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:
lg = lg a0 + а 1 lg x.
Обозначим:
Y = lg , X = lg x, A0 = lg a0.
Тогда уравнение примет вид:
Y = A0 + а 1X
- линейное уравнение регрессии. Рассчитаем его параметры, используя Excel:
a1 |
А 0 |
|||
0,0283 |
1,9333 |
|||
Sa^1 |
1,1841 |
2,9211 |
Sa^0 |
|
R2 |
5E-05 |
0,156 |
Sе |
|
F |
0,0006 |
12 |
V |
|
1E-05 |
0,2922 |
|||
RSS |
ESS |
Уравнение регрессии будет иметь вид:
Y = 1,933 + 0,0283Х.
Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения.
y = 101,933 * х 0,0283
Получим уравнение степенной модели регрессии:
Построим вспомогательную таблицу:
№ |
х |
у |
Х |
Y |
ух |
А, % |
|||
1 |
320,7 |
141,9 |
2,51 |
2,15 |
100,96 |
28,9 |
1288,3 |
1675,9 |
|
2 |
282,1 |
64,1 |
2,45 |
1,81 |
100,60 |
56,9 |
1756,2 |
1332,0 |
|
3 |
318,5 |
89,3 |
2,50 |
1,95 |
100,94 |
13,0 |
279,1 |
135,5 |
|
4 |
268,5 |
49,6 |
2,43 |
1,70 |
100,46 |
102,5 |
3181,8 |
2586,4 |
|
5 |
282,8 |
116,3 |
2,45 |
2,07 |
100,60 |
13,5 |
105,9 |
246,4 |
|
6 |
295,6 |
110 |
2,47 |
2,04 |
100,73 |
8,4 |
15,9 |
85,9 |
|
7 |
339,9 |
66,9 |
2,53 |
1,83 |
101,13 |
51,2 |
1529,4 |
1171,5 |
|
8 |
262,8 |
138,6 |
2,42 |
2,14 |
100,40 |
27,6 |
1062,3 |
1459,6 |
|
9 |
276,6 |
159,5 |
2,44 |
2,20 |
100,54 |
37,0 |
2861,5 |
3476,2 |
|
10 |
321,5 |
131 |
2,51 |
2,12 |
100,97 |
22,9 |
624,6 |
901,9 |
|
11 |
290 |
129 |
2,46 |
2,11 |
100,68 |
22,0 |
528,7 |
802,3 |
|
12 |
313,3 |
87,5 |
2,50 |
1,94 |
100,90 |
15,3 |
342,5 |
179,4 |
|
13 |
259,4 |
84,3 |
2,41 |
1,93 |
100,36 |
19,0 |
471,2 |
257,9 |
|
14 |
282,6 |
116,1 |
2,45 |
2,06 |
100,60 |
13,3 |
101,9 |
240,2 |
|
Ср.знач. |
106,0 |
Итого: |
431,6 |
14149,3 |
14551,2 |
Коэффициент детерминации:
.
Определим индекс парной корреляции:
.
Средняя ошибка аппроксимации:
.
Таким образом, средняя ошибка аппроксимации составляет 30,8 %.
Построение экспоненциальной модели.
Уравнение показательной кривой:
.
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого осуществим логарифмирование обеих частей уравнения:
.
.
Получим линейное уравнение регрессии:
Y = A0 + А 1x.
Рассчитаем его параметры, используя Excel:
А 1 |
А 0 |
|||
-2,71E-05 |
2,011004 |
|||
Sa^1 |
0,001735 |
0,511595 |
Sa^0 |
|
R2 |
2,031E-05 |
0,156035 |
Sе |
|
F |
0,0002437 |
12 |
V |
|
5,933E-06 |
0,292163 |
|||
RSS |
ESS |
Уравнение регрессии будет иметь вид:
Y = 2,011-0,000027х.
Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения:
y = 102,011 * (100,000027)х = 102,57•0,999938х.
Построим вспомогательную таблицу:
№ |
х |
у |
Y |
ух |
А, % |
|||
1 |
320,7 |
141,9 |
2,15 |
100,54 |
29,2 |
1288,3 |
1711,0 |
|
2 |
282,1 |
64,1 |
1,81 |
100,78 |
57,2 |
1756,2 |
1345,2 |
|
3 |
318,5 |
89,3 |
1,95 |
100,55 |
12,6 |
279,1 |
126,5 |
|
4 |
268,5 |
49,6 |
1,70 |
100,86 |
103,4 |
3181,8 |
2627,9 |
|
5 |
282,8 |
116,3 |
2,07 |
100,77 |
13,4 |
105,9 |
241,1 |
|
6 |
295,6 |
110 |
2,04 |
100,69 |
8,5 |
15,9 |
86,6 |
|
7 |
339,9 |
66,9 |
1,83 |
100,41 |
50,1 |
1529,4 |
1123,2 |
|
8 |
262,8 |
138,6 |
2,14 |
100,90 |
27,2 |
1062,3 |
1421,4 |
|
9 |
276,6 |
159,5 |
2,20 |
100,81 |
36,8 |
2861,5 |
3444,3 |
|
10 |
321,5 |
131 |
2,12 |
100,53 |
23,3 |
624,6 |
928,4 |
|
11 |
290 |
129 |
2,11 |
100,73 |
21,9 |
528,7 |
799,3 |
|
12 |
313,3 |
87,5 |
1,94 |
100,58 |
15,0 |
342,5 |
171,1 |
|
13 |
259,4 |
84,3 |
1,93 |
100,92 |
19,7 |
471,2 |
276,2 |
|
14 |
282,6 |
116,1 |
2,06 |
100,77 |
13,2 |
101,9 |
234,9 |
|
Ср.знач. |
106,0 |
Итого: |
431,3 |
14149,3 |
14537,3 |
Коэффициент детерминации:
.
Определим индекс парной корреляции:
.
Средняя ошибка аппроксимации:
%.
Таким образом, средняя ошибка аппроксимации составляет 30,8 % %.
Построение полулогарифмической функции.
Уравнение полулогарифмической кривой:
.
Для построения этой модели обозначим:
.
Получим линейное уравнение регрессии:
у = а 0 + а 1Х.
Рассчитаем его параметры, используя Excel:
а 1 |
а 0 |
|||
-31,94904 |
184,8169 |
|||
Sa^1 |
260,41707 |
642,4446 |
Sa^0 |
|
R2 |
0,0012527 |
34,31667 |
Sе |
|
F |
0,0150514 |
12 |
V |
|
17,725032 |
14131,6 |
|||
RSS |
ESS |
Полулогарифмическое уравнение будет иметь вид:
у = 184,817-31,949•lg x.
Построим вспомогательную таблицу:
№ |
х |
у |
Х |
ух |
А, % |
|||
1 |
320,7 |
141,9 |
2,51 |
104,75 |
26,2 |
1288,3 |
1380,2 |
|
2 |
282,1 |
64,1 |
2,45 |
106,53 |
66,2 |
1756,2 |
1800,2 |
|
3 |
318,5 |
89,3 |
2,50 |
104,84 |
17,4 |
279,1 |
241,6 |
|
4 |
268,5 |
49,6 |
2,43 |
107,21 |
116,2 |
3181,8 |
3319,4 |
|
5 |
282,8 |
116,3 |
2,45 |
106,49 |
8,4 |
105,9 |
96,1 |
|
6 |
295,6 |
110 |
2,47 |
105,88 |
3,7 |
15,9 |
17,0 |
|
7 |
339,9 |
66,9 |
2,53 |
103,94 |
55,4 |
1529,4 |
1372,2 |
|
8 |
262,8 |
138,6 |
2,42 |
107,51 |
22,4 |
1062,3 |
966,5 |
|
9 |
276,6 |
159,5 |
2,44 |
106,80 |
33,0 |
2861,5 |
2777,1 |
|
10 |
321,5 |
131 |
2,51 |
104,71 |
20,1 |
624,6 |
690,9 |
|
11 |
290 |
129 |
2,46 |
106,15 |
17,7 |
528,7 |
522,3 |
|
12 |
313,3 |
87,5 |
2,50 |
105,07 |
20,1 |
342,5 |
308,8 |
|
13 |
259,4 |
84,3 |
2,41 |
107,69 |
27,7 |
471,2 |
547,2 |
|
14 |
282,6 |
116,1 |
2,45 |
106,50 |
8,3 |
101,9 |
92,1 |
|
Ср.знач. |
106,0 |
Итого: |
442,8 |
14149,3 |
14131,6 |
Рассчитаем коэффициент детерминации:
.
Определим индекс парной корреляции:
.
Качество модели определяет средняя относительная ошибка аппроксимации:
(%).
Таким образом, средняя ошибка аппроксимации составляет 30,8 % %.
Анализируя полученные модели по коэффициенту детерминации и по средней ошибке аппроксимации, видим, что практически все модели одинаково плохо описывают зависимость индекса физического объема инвестиций от среднесложившихся цен на зерно.
Для линейной формы модели оценим доверительные интервалы теоретических значений результативной переменной с вероятностью 95 %.
Для этого используем формулы.
Стандартная ошибка прогноза найдется по формуле:
Предельная ошибка прогноза, которая в 95 % случаев не будет превышена, составит:
Получаем:
№ |
х |
у |
ух |
my |
ymin |
ymax |
|
1 |
320,7 |
141,9 |
104,38 |
37,0 |
23,87 |
184,89 |
|
2 |
282,1 |
64,1 |
106,72 |
35,8 |
28,75 |
184,70 |
|
3 |
318,5 |
89,3 |
104,51 |
36,7 |
24,49 |
184,53 |
|
4 |
268,5 |
49,6 |
107,55 |
36,8 |
27,36 |
187,73 |
|
5 |
282,8 |
116,3 |
106,68 |
35,8 |
28,77 |
184,59 |
|
6 |
295,6 |
110 |
105,90 |
35,5 |
28,53 |
183,28 |
|
7 |
339,9 |
66,9 |
103,21 |
39,6 |
16,91 |
189,51 |
|
8 |
262,8 |
138,6 |
107,90 |
37,4 |
26,34 |
189,45 |
|
9 |
276,6 |
159,5 |
107,06 |
36,1 |
28,37 |
185,74 |
|
10 |
321,5 |
131 |
104,33 |
37,0 |
23,63 |
185,02 |
|
11 |
290 |
129 |
106,24 |
35,5 |
28,81 |
183,67 |
|
12 |
313,3 |
87,5 |
104,83 |
36,3 |
25,80 |
183,85 |
|
13 |
259,4 |
84,3 |
108,10 |
37,9 |
25,61 |
190,60 |
|
14 |
282,6 |
116,1 |
106,69 |
35,8 |
28,77 |
184,62 |
Изобразим на графике:
Задача 5.18. По нижеприведенным данным осуществите идентификацию представленных уравнений парной регрессии. В соответствии с величиной средней ошибки аппроксимации сделайте вывод о наиболее приемлемой форме модели для описания исходной зависимости изменения прибыли сельхозпредприятий (Y) и соотношения производственной себестоимости зерна к средней по краю (Х). Для выбранной формы модели оцените доверительные интервалы теоретических значений результативной переменной с вероятностью 99 %
Решение. Построим поле корреляции.
Данные о соотношении производственной себестоимости зерна к средней по краю и прибыли (убытка) сельхозпредприятий в 2006 г. в разрезе районов Ставропольского края
№ района |
Соотношение производственной себестоимости 1 ц зерна к средней по краю, % |
Прибыль (убыток) сельхозпредприятий, млрд. руб. |
|
Х |
Y |
||
1 |
116,38 |
-12,6 |
|
2 |
181,36 |
-9,9 |
|
3 |
108,19 |
-14,8 |
|
4 |
117,23 |
85,7 |
|
5 |
92,09 |
95,6 |
|
6 |
107,06 |
14,6 |
|
7 |
125,99 |
15,5 |
|
8 |
100,00 |
32,2 |
|
9 |
100,85 |
13,5 |
|
10 |
148,31 |
66,4 |
|
11 |
94,35 |
8,8 |
|
12 |
94,92 |
32,2 |
Анализируя поле корреляции, видим, что между y и х наблюдается слабая обратная зависимость. Для анализа связи построим линейную, степенную, экспоненциальную и полулогарифмическую модели зависимости.
Построение линейной модели парной регрессии.
Уравнение линейной парной регрессии имеет вид:
.
С помощью Excel находим:
a1 |
a0 |
|||
-0,26471025 |
57,856804 |
|||
Sa^1 |
0,442042573 |
52,268599 |
Sa^0 |
|
R2 |
0,034618811 |
38,348888 |
Sе |
|
F |
0,358602506 |
10 |
V |
|
527,3742015 |
14706,372 |
|||
RSS |
ESS |
В итоге получаем линейное уравнение парной регрессии (зависимости индекса физического объема инвестиций от среднесложившихся цен на зерно):
.
Коэффициент регрессии а 1 = -0,265 показывает, что при увеличении соотношения производственной себестоимости 1 ц зерна к средней по краю на 1 п.п. прибыль сельхозпредприятий в среднем снижается на 0,265 млрд. руб.
Рассчитаем коэффициент корреляции:
.
Значение коэффициента корреляции говорит о том, что связь между изучаемыми показателями очень слабая.
Коэффициент детерминации:
R2 = rху 2 = 0,0346.
Значит, полученное линейное уравнение регрессии объясняет 3,46 % вариации результативного признака, а необъясненные факторы составляют 96,54 %.
Проверим значимость уравнения регрессии по F-критерию Фишера. Для этого вычислим вначале фактическое значение критерия:
.
Из таблицы критических значений для критерия Фишера по уровню значимости б = 0,05 и числу степеней свободы k1 = k = 1 и k2 = n - k - 1 = = 12-1 - 1 = 10 находим Fma6 = 4,96. В силу того, что F < Fma6 делаем вывод, что уравнение регрессии не значимо и исследуемая зависимая переменная у не достаточно хорошо описывается включенной в регрессионную модель переменной х.
Построим вспомогательную таблицу:
№ |
х |
у |
ух |
||
1 |
116,38 |
-12,6 |
27,05 |
314,7 |
|
2 |
181,36 |
-9,9 |
9,85 |
199,5 |
|
3 |
108,19 |
-14,8 |
29,22 |
297,4 |
|
4 |
117,23 |
85,7 |
26,82 |
68,7 |
|
5 |
92,09 |
95,6 |
33,48 |
65,0 |
|
6 |
107,06 |
14,6 |
29,52 |
102,2 |
|
7 |
125,99 |
15,5 |
24,51 |
58,1 |
|
8 |
100 |
32,2 |
31,39 |
2,5 |
|
9 |
100,85 |
13,5 |
31,16 |
130,8 |
|
10 |
148,31 |
66,4 |
18,60 |
72,0 |
|
11 |
94,35 |
8,8 |
32,88 |
273,7 |
|
12 |
94,92 |
32,2 |
32,73 |
1,6 |
|
Итого: |
1586,2 |
Чтобы иметь общее представление о качестве модели из относительных отклонений по каждому наблюдению, определяют среднюю ошибку аппроксимации по формуле:
.
Таким образом, средняя ошибка аппроксимации составляет 132,2 %.
Построение полулогарифмической функции.
Уравнение полулогарифмической кривой:
.
Для построения этой модели обозначим:
.
Получим линейное уравнение регрессии:
у = а 0 + а 1Х.
Рассчитаем его параметры, используя Excel:
а 1 |
а 0 |
|||
-78,34281 |
188,1878 |
|||
Sa^1 |
131,77532 |
270,9013 |
Sa^0 |
|
R2 |
0,0341385 |
38,35843 |
Sе |
|
F |
0,3534518 |
10 |
V |
|
520,05794 |
14713,69 |
|||
RSS |
ESS |
Полулогарифмическое уравнение будет иметь вид:
у = 188,188-78,343•lg x.
Построим вспомогательную таблицу:
№ |
х |
у |
Х |
ух |
А, % |
|||
1 |
116,38 |
-12,6 |
2,07 |
26,34 |
309,1 |
1589,4 |
1516,4 |
|
2 |
181,36 |
-9,9 |
2,26 |
11,25 |
213,6 |
1381,4 |
447,2 |
|
3 |
108,19 |
-14,8 |
2,03 |
28,82 |
294,8 |
1769,6 |
1903,0 |
|
4 |
117,23 |
85,7 |
2,07 |
26,09 |
69,6 |
3414,5 |
3552,9 |
|
5 |
92,09 |
95,6 |
1,96 |
34,31 |
64,1 |
4669,4 |
3757,0 |
|
6 |
107,06 |
14,6 |
2,03 |
29,18 |
99,9 |
160,4 |
212,6 |
|
7 |
125,99 |
15,5 |
2,10 |
23,64 |
52,5 |
138,5 |
66,3 |
|
№ |
х |
у |
Х |
ух |
А, % |
|||
8 |
100 |
32,2 |
2,00 |
31,50 |
2,2 |
24,3 |
0,5 |
|
9 |
100,85 |
13,5 |
2,00 |
31,21 |
131,2 |
189,5 |
313,8 |
|
10 |
148,31 |
66,4 |
2,17 |
18,09 |
72,8 |
1531,4 |
2333,6 |
|
11 |
94,35 |
8,8 |
1,97 |
33,48 |
280,5 |
341,0 |
609,2 |
|
12 |
94,92 |
32,2 |
1,98 |
33,28 |
3,3 |
24,3 |
1,2 |
|
Ср.знач. |
27,3 |
Итого: |
1593,4 |
15233,7 |
14713,7 |
Рассчитаем коэффициент детерминации:
.
Определим индекс парной корреляции:
.
Качество модели определяет средняя относительная ошибка аппроксимации:
(%).
Таким образом, средняя ошибка аппроксимации составляет 132,8 %.
Анализируя полученные модели по коэффициенту детерминации и по средней ошибке аппроксимации, видим, что практически все модели одинаково плохо описывают зависимость у от х.
Для линейной формы модели оценим доверительные интервалы теоретических значений результативной переменной с вероятностью 99 %.
Для этого используем формулы.
Стандартная ошибка прогноза найдется по формуле:
Предельная ошибка прогноза, которая в 99 % случаев не будет превышена, составит:
Получаем:
№ |
х |
у |
ух |
my |
ymin |
ymax |
|
1 |
116,38 |
-12,6 |
27,05 |
39,9 |
-99,46 |
153,56 |
|
2 |
181,36 |
-9,9 |
9,85 |
49,4 |
-146,68 |
166,37 |
|
3 |
108,19 |
-14,8 |
29,22 |
40,0 |
-97,70 |
156,14 |
|
4 |
117,23 |
85,7 |
26,82 |
39,9 |
-99,70 |
153,35 |
|
5 |
92,09 |
95,6 |
33,48 |
41,2 |
-97,22 |
164,18 |
|
6 |
107,06 |
14,6 |
29,52 |
40,1 |
-97,54 |
156,58 |
|
7 |
125,99 |
15,5 |
24,51 |
40,2 |
-102,84 |
151,85 |
|
8 |
100 |
32,2 |
31,39 |
40,5 |
-96,98 |
159,75 |
|
9 |
100,85 |
13,5 |
31,16 |
40,4 |
-97,01 |
159,33 |
|
10 |
148,31 |
66,4 |
18,60 |
42,5 |
-115,97 |
153,16 |
|
11 |
94,35 |
8,8 |
32,88 |
41,0 |
-97,06 |
162,83 |
|
12 |
94,92 |
32,2 |
32,73 |
40,9 |
-97,03 |
162,49 |
Изобразим на графике:
Задача 5.19. По нижеприведенным данным осуществите идентификацию представленных уравнений парной регрессии. В соответствии с величиной средней ошибки аппроксимации сделайте вывод о наиболее приемлемой форме модели для описания исходной зависимости изменения стоимости сельскохозяйственной продукции (Y) и среднегодовой стоимости основных фондов (Х). Для выбранной формы модели оцените доверительные интервалы теоретических значений результативной переменной с вероятностью 90 %
Решение. Построим поле корреляции.
Данные о среднегодовой стоимости основных фондов и стоимости сельскохозяйственной продукции в 2006 г. в разрезе районов Ставропольского края
№ района |
Среднегодовая стоимость основных фондов, млн. руб. |
Объем сельскохозяйственной продукции, млн. руб. |
|
Х |
Y |
||
1 |
141,9 |
320,7 |
|
2 |
64,1 |
282,1 |
|
3 |
89,3 |
318,5 |
|
4 |
49,6 |
268,5 |
|
5 |
116,3 |
282,8 |
|
6 |
110,0 |
295,6 |
|
7 |
66,9 |
339,9 |
|
8 |
138,6 |
262,8 |
|
9 |
159,5 |
276,6 |
|
10 |
131,0 |
321,5 |
|
11 |
129,0 |
290 |
|
12 |
87,5 |
313,3 |
|
13 |
84,3 |
259,4 |
|
14 |
116,1 |
282,6 |
Анализируя поле корреляции, видим, что между у и х наблюдается довольно тесная прямая зависимость.
Для анализа связи построим линейную, степенную, экспоненциальную и полулогарифмическую модели зависимости.
Построение линейной модели парной регрессии.
Уравнение линейной парной регрессии имеет вид:
.
С помощью Excel находим:
a1 |
a0 |
|||
-0,03472517 |
297,55969 |
|||
Sa^1 |
0,218019033 |
24,128493 |
Sa^0 |
|
R2 |
0,002109607 |
25,933572 |
Подобные документы
Знакомство с уравнениями линейной регрессии, рассмотрение распространенных способов решения. Общая характеристика метода наименьших квадратов. Особенности оценки статистической значимости парной линейной регрессии. Анализ транспонированной матрицы.
контрольная работа [380,9 K], добавлен 05.04.2015Построение уравнения регрессии. Оценка параметров линейной парной регрессии. F-критерий Фишера и t-критерий Стьюдента. Точечный и интервальный прогноз по уравнению линейной регрессии. Расчет и оценка ошибки прогноза и его доверительного интервала.
презентация [387,8 K], добавлен 25.05.2015Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.
задача [409,0 K], добавлен 17.10.2012Значения коэффициента регрессии (b) и сводного члена уравнения регрессии (а). Определение стандартной ошибки предсказания являющейся мерой качества зависимости величин Y и х с помощью уравнения линейной регрессии. Значимость коэффициента регрессии.
задача [133,0 K], добавлен 21.12.2008Методика и основные этапы расчета параметров линейного уравнения парной регрессии с помощью программы Excel. Анализ качества построенной модели, с использованием коэффициента парной корреляции, коэффициента детерминации и средней ошибки аппроксимации.
лабораторная работа [22,3 K], добавлен 15.04.2014Цели линейной модели множественной регрессии (прогноз, имитация, сценарий развития, управление). Анализ эконометрической сущности изучаемого явления на априорном этапе. Параметризация и сбор необходимой статистической информации, значимость коэффициентов.
контрольная работа [68,7 K], добавлен 21.09.2009Построение линейной множественной регрессии для моделирования потребления продукта в разных географических районах. Расчет оценки дисперсии случайной составляющей. Вычисление и корректировка коэффициентов детерминации. Расчет доверительного интервала.
контрольная работа [814,0 K], добавлен 19.12.2013Основные задачи регрессионного анализа в математической статистике. Вычисление дисперсии параметров уравнения регрессии и дисперсии прогнозирования эндогенной переменной. Установление зависимости между переменными. Применение метода наименьших квадратов.
презентация [100,3 K], добавлен 16.12.2014Методы составления закона распределения случайной величины. Вычисление средней арифметической и дисперсии распределения. Расчет средней квадратической ошибки бесповторной выборки. Построение эмпирических линий регрессии, поиск уравнения прямых регрессий.
контрольная работа [77,6 K], добавлен 20.07.2010Определение частных производных первого и второго порядков заданной функции, эластичности спроса, основываясь на свойствах функции спроса. Выравнивание данных по прямой методом наименьших квадратов. Расчет параметров уравнения линейной парной регрессии.
контрольная работа [99,4 K], добавлен 22.07.2009Построение модели множественной регрессии теоретических значений динамики ВВП, определение средней ошибки аппроксимации. Выбор фактора, оказывающего большее влияние. Построение парных моделей регрессии. Определение лучшей модели. Проверка предпосылок МНК.
курсовая работа [352,9 K], добавлен 26.01.2010Прямолинейные, обратные и криволинейные связи. Статистическое моделирование связи методом корреляционного и регрессионного анализа. Метод наименьших квадратов. Оценка значимости коэффициентов регрессии. Проверка адекватности модели по критерию Фишера.
курсовая работа [232,7 K], добавлен 21.05.2015Методы планирования многофакторных экспериментов и преимущества их использования. Математическое планирование эксперимента и его основные направления. Пример применения метода дробного факторного эксперимента. Расчет коэффициентов уравнения регрессии.
курсовая работа [26,7 K], добавлен 13.05.2014Построение математической модели технологического процесса напыления резисторов методами полного и дробного факторного эксперимента. Составление матрицы планирования. Рандомизация и проверка воспроизводимости. Оценка коэффициентов уравнения регрессии.
курсовая работа [694,5 K], добавлен 27.12.2021Обработка случайных выборок с нормальным законом распределения. Оценка коэффициентов регрессии и доверительных интервалов. Оценка значимости факторов по доверительным интервалам и корреляционного момента. Построение эмпирической интегральной функции.
курсовая работа [135,7 K], добавлен 03.05.2011Cтатистический анализ зависимости давления. Построение диаграммы рассеивания и корреляционной таблицы. Вычисление параметров для уравнений линейной и параболической регрессии, выборочных параметров. Проверка гипотезы о нормальном распределении признака.
курсовая работа [613,3 K], добавлен 24.10.2012Основные методы измерения деревьев. Наука о математических методах систематизации. Определение дисперсии случайной величины. Выборочное исправленное среднее квадратическое отклонение. Метод наименьших квадратов. Свойства параболической регрессии.
курсовая работа [840,1 K], добавлен 15.06.2011Определение среднего квадратичного отклонения. Расчет значения критерия Стьюдента, значения доверительных границ с его учетом. Обоснование выбора математической модели прогнозирования. Параметры по методу наименьших квадратов, наработка до отказа.
контрольная работа [394,1 K], добавлен 18.06.2014Статистическое описание и выборочные характеристики двумерного случайного вектора. Оценка параметров линейной регрессии, полученных по методу наименьших квадратов. Проверка гипотезы о равенстве средних нормальных совокупностей при неизвестных дисперсиях.
контрольная работа [242,1 K], добавлен 05.11.2011Характеристика экзогенных и эндогенных переменных. Теорема Гаусса-Маркова. Построение двухфакторного и однофакторных уравнения регрессии. Прогнозирование значения результативного признака. Оценка тесноты связи между результативным признаком и факторами.
курсовая работа [575,5 K], добавлен 19.05.2015