Расчет средних величин, показателей вариации, проведение корреляционно-регрессионного анализа
Теоретическое обоснование сущности, общих понятий и методов расчета средних величин. Исследование системы показателей и информационной базы корреляционно-регрессионного анализа. Расчет линейного уравнения тренда, коэффициента корреляции и детерминации.
Рубрика | Экономика и экономическая теория |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 20.02.2019 |
Размер файла | 1,7 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Введение
На сегодняшний день можно сказать, что ни одна современная экономика не способна благополучно существовать и развиваться, если она не имеет за собой приличную статистическую базу, ведь статистика как наука способна довольно успешно регулировать экономику, особым образов в нее не внедряясь и не возбуждая какие - либо негативные реакции. Независимо от уровня и стадии экономического развития, характера политической системы, статистика на протяжении сотен лет своего существования всегда выступала как необходимый и эффективный инструмент государственного управления и одновременно как наука, исследующая количественную сторону массовых явлений.
Однако статистика значительно отличается от огромного числа прикладных наук, как технических, так и гуманитарных, прежде всего статистика говорит языком цифр, описывает количественные изменения и побуждает человека преобразовать такие изменения в качественные. Развитие общественного производства, внутренней и внешней торговли, торговых и международных экономических отношений увеличило потребность в статистической информации. Данный повод позволил расширить сферу деятельности статистики, вело к совершенствованию ее приемов и методов, явилось стимулом для дальнейшего формирования учета и статистики.
Основные задачи статистики:
1. доведение обработанной информации до органов управления всех уровней;
2. сбор, обработка, анализ и хранение информации;
3. ознакомление широкой общественности и населения с динамикой и дислокацией социально-экономических явлений в стране путем издания статистических сборников, справочников, обзоров, публикаций в печатных и электронных СМИ;
4. международное сопоставление уровня социально-экономического развития разных стран.
Таким образом, статистика играет важную роль в жизни общества. Проблема статистического анализа является актуальной, общественно значимой, потому что статистика имеет прямую связь с экономической теорией и другими социальными и математическими науками. Экономическая теория служит для определения основных экономических законов и категорий, а статистика, в свою очередь, является их доказательным инструментом. Статистика обладает некоторыми функциями: аналитическая, учетная, распределительная, стимулирующая, контрольная, функция сравнения, оценочная и функция прогнозная.
Данная курсовая работа состоит из трех частей - средние величины и показатели вариации, корреляционный анализ, регрессионный анализ. В каждой из этих частей будет подробно рассмотрена теория, необходимые расчеты, и сделан грамотный, обоснованный вывод.
Целью написания работы является расчет средних величин, показателей вариации, а также проведение корреляционно-регрессионного анализа. Основными задачами исследования в работе являются:
1. Теоретическое обоснование сущности, общих понятий и методов расчета средних величин;
2. Исследование системы показателей и информационной базы корреляционно-регрессионного анализа;
3. Выполнение расчетов.
1. СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
Задание 1.1
По статистическим данным необходимо определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации. Каждое из данных значений было увеличено на номер классного журнала (5). Дисперсия до одного знака после запятой; среднеквадратическое - до двух; коэффициент вариации - до одного в процентах.
Дано (х): |
8; |
10; |
7; |
9; |
12; |
8; |
13; |
8; |
15. |
Определим среднее значение:
Моду рассчитываем как наиболее часто встречающееся значение ряда.
Для расчета медианы необходимо расположить ряд в порядке возрастания: 7; 8; 8; 8; 9; 10; 12; 13; 15.
Так как нам даны 9 чисел, что есть нечетное количество, медианой будет являться число 9, так как оно занимает центральное положение среди совокупности упорядоченных по возрастанию чисел.
Далее вычисляем дисперсию:
= 7,(6)
Вычислим среднеквадратическое отклонение:
Следовательно коэффициент вариации составит:
Задание 1.2
По данным статистики в отчетном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 24%, стоимость основных фондов увеличилась на 13%. Определить изменение фондоотдачи.
Фондоотдача - это тип финансового коэффициента, который характеризует эффективность использования основных средств компании. Фондоотдача показывает какой объем выручки приходится на единицу стоимости основных средств.
вариация корреляционный регрессионный анализ
,
соответственно изменение фондоотдачи:
= 9,73%
Фондоотдача увеличилась на 9,73%
Задание 1.3
Объем оборота (У) и число работников (m) приведены в таблице 1. Необходимо определить среднее значение, моду и медиану.
Исходные данные
У |
80-100 |
100-120 |
120-140 |
140-160 |
160-180 |
180-200 |
|
m |
6 |
17 |
25 |
28 |
14 |
10 |
Далее мы должны определить среднее значение моду и медиану. Результаты промежуточных вычислений приведены в таблице 1.1
Промежуточные вычисления
У |
80-100 |
100-120 |
120-140 |
140-160 |
160-180 |
180-200 |
|
m |
6 |
17 |
25 |
28 |
14 |
10 |
|
У? |
90 |
110 |
130 |
150 |
170 |
190 |
|
m*У? |
540 |
1870 |
3250 |
4200 |
2380 |
1900 |
|
У?/2 |
45 |
55 |
65 |
75 |
85 |
95 |
|
Накопл. частота |
6 |
23 |
48 |
76 |
90 |
100 |
Общее число работников составляет человек
Среднее значение:
x?=
Далее определим моду и медиану, для этого необходимо определить медианный интервал. Медианным интервалом будет являться интервал 140-160, так как накопленная частота на этом промежутке превысит значение
. (76>50)
Вычислим моду:
Вычислим медиану:
Задание 1.4
По данным таблицы требуется определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации. В таблице: Х-объем оборота предприятий, млн. руб., mг - число государственных предприятий; mч - частных; mо - общее число (таблица 2). Каждое значение Хi было увеличено на номер классного журнала (5).
Исходные данные по объему оборота предприятий
Хi |
mгi |
mчi |
moi |
|
6,0-6,2 |
3 |
3 |
||
6,2-6,4 |
4 |
4 |
||
6,4-6,6 |
17 |
17 |
||
6,6-6,8 |
11 |
15 |
26 |
|
6,8-7,0 |
13 |
6 |
19 |
|
7,0-7,2 |
18 |
5 |
23 |
|
7,2-7,4 |
6 |
6 |
||
7,4-7,6 |
2 |
2 |
||
Сумма |
50 |
50 |
100 |
Результат в 84% говорит нам о том, что значимость модели довольно высока, так как линейная зависимость между его составляющими находится на высоком уровне.
Задание 1.5
Необходимо определить среднюю внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из трех групп (таблица 3).
Исходные данные
1 - группа
Хi |
1 |
2 |
8 |
|
mi |
30 |
15 |
5 |
2 - группа
Хi |
1 |
6 |
|
mi |
10 |
15 |
3 - группа
Хi |
3 |
8 |
|
mi |
20 |
5 |
6
2. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
Задание 2.1
Определить коэффициент корреляции между У и Х.
Х: 3,5; 4,6; 5,8; 4,2; 5,2;
УХ: 28,35; 43,24; 65,54; 28,98; 50,44.
Оценить значимость коэффициента корреляции при уровне 0,05.
Расчеты и ответы до двух знаков. Сперва определить У, затем У и Х увеличить на свой номер классного журнала (5).
Результаты:
1) коэффициент корреляции;
2) расчетное и табличное значения критерия Стьюдента и вывод.
Решение:
Определим У, увеличим Х и У на номер журнала.
Результаты вычислений
У |
13,1 |
14,4 |
16,3 |
11,9 |
14,7 |
|
Х |
8,5 |
9,6 |
10,8 |
9,2 |
10,2 |
|
ХУ |
111,35 |
138,24 |
176,04 |
109,48 |
149,94 |
|
(Хi-Х?)І |
1,3456 |
0,0036 |
1,2996 |
0,2116 |
0,2916 |
|
(Уi-У?)І |
0,9604 |
0,1024 |
4,9284 |
4,7524 |
0,3844 |
1)
Табличное значение t-критерия для числа степеней свободы и уровня значимости составляет .
Поскольку , что говорит нам о том, что коэффициент корреляции статистически значим.
Задание 2.2
Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость. Увеличить значения х; y согласно своему номеру в классовом журнале (5).
Исходные данные:
Х: 18 22 13 20 15 14
У: 17 20 11 18 14 10
Аналогично предыдущему заданию, рассчитаем коэффициент корреляции и расчетное значение критерия Стьюдента, а так же его значимость. Результаты промежуточных вычислений приведены в таблице 4.2
Результаты промежуточных вычислений
Сумма |
||||||||
Х |
21 |
25 |
16 |
23 |
18 |
17 |
120 |
|
У |
20 |
23 |
14 |
21 |
17 |
13 |
108 |
|
ХУ |
420 |
575 |
224 |
483 |
306 |
221 |
2229 |
|
(Хi-Х?)І |
1 |
25 |
16 |
9 |
4 |
9 |
64 |
|
(Уi-У?)І |
4 |
25 |
16 |
9 |
1 |
25 |
80 |
1. Поиск среднего значения
X?=
У?=
371,5
2. Определить дисперсии
уІХ =
уІУ=
3. Рассчитать коэффициент корреляции
rxy =
4. Определить расчетное значение критерия Стьюдента (t-критерия).
Табличное значение t-критерия для числа степеней свободы и уровня значимости составляет .
Поскольку , то коэффициент корреляции статистически значим.
Задание 2.3
В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистики по сто балльной системе:
Теория вероятностей: 65 90 42 47 84 58 50
Статистика: 51 85 36 63 72 80 40.
Определить коэффициент ранговой корреляции Спирмена и его значимость. Это нулевой вариант. Каждое значение (балл) увеличить на свой номер классного журнала (5). Расчеты и результат до двух знаков.
Результаты:
1.Коэффициент ранговой корреляции.
2.Расчетное и табличное значения критерия Стьюдента при уровне значимости равным 0,05 и выводы.
Решение:
Для вычисления рангового коэффициента корреляции Спирмена ранжируем полученные студентами баллы по двум предметам. Затем определим квадрат разницы рангов по двум дисциплинам для каждого студента. После изменения значения баллов в соответствии с номером в классовом журнале приведу результаты вычислений в таблице 4.3.
Расчет коэффициента ранговой корреляции Спирмена
№ студента |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
Теория вероятностей |
68 |
93 |
45 |
50 |
87 |
61 |
53 |
|
Статистика |
54 |
88 |
39 |
66 |
75 |
83 |
43 |
|
Ранг (Rтв) |
5 |
7 |
1 |
2 |
6 |
4 |
3 |
|
Ранг (Rст) |
3 |
7 |
1 |
4 |
5 |
6 |
2 |
|
dІ |
4 |
0 |
0 |
4 |
1 |
4 |
1 |
Степень свободы f = 7 - 2 =5 ; n = 7
- ранги студентов по количеству набранных баллов по теории вероятностей и статистике соответственно
Величина коэффициента Спирмена указывает на высокую тесноту связи между баллами, набранными по теории вероятностей и по статистике.
Табличное значение t-критерия для числа степеней свободы и уровня значимости составляет .
Далее рассчитаем значение коэффициента Стьюдента. Для его расчета необходимы дополнительные расчеты, представленные в таблице 4.4
Расчет коэффициента корреляции Стьюдента
№ студента |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
Сумма |
|
Теория вероятностей (x) |
70 |
95 |
47 |
52 |
89 |
63 |
55 |
471 |
|
Статистика (y) |
56 |
90 |
41 |
68 |
77 |
85 |
45 |
462 |
|
хi-x? |
2,27 |
27,7 |
-20,3 |
-15,3 |
21,7 |
-4,3 |
-12,3 |
||
yi-y? |
-10,00 |
24,00 |
-25,00 |
2,00 |
11,00 |
19,00 |
-21,00 |
||
(хi-x?)(yi-y?) |
-27,14 |
665,14 |
507,14 |
-30,571 |
238,86 |
-81,43 |
258 |
1530 |
|
(хi-x?)І |
7,36 |
768,08 |
411,51 |
233,65 |
471,5 |
18,36 |
150,93 |
2061,4 |
|
(yi-yЇ)І |
100 |
576 |
625 |
4 |
121 |
361 |
441 |
2228 |
х? =
Кху =
уІх =
уІy =
Коэффициент корреляции:
Определим расчетное значение критерия Стьюдента:
Табличным значением такого результата является
Полученный результат меньше табличного, соответственно коэффициент корреляции не имеет значимости.
3. РЕГРЕССИОННЫЙ АНАЛИЗ
Задание 3.1
Построить нелинейную обратную модель связи себестоимости единицы продукции (у) со стоимостью основных фондов (х). Определить характеристики модели. Каждое значение (у) увеличить на свой номер классного журнала (5). Исходные данные:
у: 21; 16; 15; 14; 13; 12,5; 11; 11,5; 10; 8
х: 1; 2; 3; 4; 5; 6; 7; 8; 9; 10
Характеристики модели:
1) модель (коэффициенты до 4-х знаков);
2) индекс детерминации (до 2-х знаков);
3) стандартную ошибку (до 4-х знаков);
4) расчетное значение критерия Фишера (до 2-х знаков) и вывод о значимости модели;
5) вывод о значимости коэффициентов модели;
6) доверительные интервалы коэффициентов модели (до 4-х знаков).
Решение:
Первым делом имеющиеся у нас данные увеличим на номер своего классного журнала (5).
Затем построим таблицу с промежуточным вычислением. Произведем замену . В результате получим линейное уравнение .
Промежуточные расчеты коэффициентов модели
№ |
y |
x |
X |
yX |
|||||
1 |
26 |
1 |
1 |
26 |
1 |
28,32 |
1,74 |
60,84 |
|
2 |
21 |
2 |
0,5 |
10,5 |
0,25 |
21,87 |
0,02 |
7,84 |
|
3 |
20 |
3 |
0,33 |
6,6 |
0,11 |
19,68 |
1,74 |
3,24 |
|
4 |
19 |
4 |
0,25 |
4,75 |
0,06 |
18,65 |
1,82 |
0,64 |
|
5 |
18 |
5 |
0,2 |
3,6 |
0,04 |
18 |
1 |
0,04 |
|
6 |
17,5 |
6 |
0,17 |
2,975 |
0,03 |
17,61 |
0,79 |
0,49 |
|
7 |
16 |
7 |
0,14 |
2,24 |
0,02 |
17,23 |
0,05 |
4,84 |
|
8 |
16,5 |
8 |
0,13 |
2,145 |
0,02 |
17,1 |
0,16 |
2,89 |
|
9 |
15 |
9 |
0,11 |
1,65 |
0,01 |
16,84 |
0,7 |
10,24 |
|
10 |
13 |
10 |
0,1 |
1,3 |
0,01 |
16,71 |
7,34 |
27,04 |
|
Итого |
182 |
55 |
2,93 |
61,76 |
1,55 |
192,01 |
15,36 |
118,1 |
|
Среднее |
18,2 |
5,5 |
0,293 |
6,17 |
0,155 |
19,2 |
1,536 |
11,81 |
1) Зная данные значения, можно вычислить коэффициент a0 и коэффициент а1, для модели, которую необходимо поcтроить:
b = = = 12,4323
показывает среднее изменение результативного показателя с повышением или понижением величины фактора х на единицу его измерения.
а = а1 =18,3-12,43230,293 = 14,6573 - формально показывает прогнозируемый уровень у, но только в том случае, если х0 находится близко с выборочными значениями.
Но если х0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.
По имеющимся данным можно построить модель. Она будет иметь следующий вид:
= 14,6573 +
Определим коэффициент детерминации:
Данный коэффициент показывает долю вариации результативного признака, объясненную вариацией факторного признака.
2) Используя эти данные можно вычислить индекс детерминации (R):
R= = 0,94.
Рассчитаем стандартную ошибку модели (2)), а также расчетное значение критерия Фишера(3),4))
2)
3) Sy= = = 1,3393
4) Критерий Фишера (F) :
= = 58,67
По таблице Фишера определим критическое значение F-критерия при уровне значимости и числе степеней свободы . .
Уравнение регрессии с вероятностью 0,95 статистически значимое, так как .
5) Оценку статистической значимости параметров регрессии и корреляции проведем с помощью критерия - t Стьюдента, а также с помощью расчетов доверительного интервала каждого из параметров.
Табличное значение t-критерия для числа степеней свободы: и уровня значимости составляет .
Задание 3.2
Построить полулогарифмическую модель вида: y=a0+a1lnx по данным:
У: 10; 13,4; 15,4; 16,5; 18,6; 19,1
Х: 1; 2; 3; 4; 5; 6.
Определить характеристики модели.
Каждое значение (у) увеличить на свой номер классного журнала (5).
Характеристики модели:
1) модель (коэффициенты до 2-х знаков);
2) индекс детерминации (до 2-х знаков);
3) стандартную ошибку (до 4-х знаков);
4) расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели.
Решение:
Построим таблицу с промежуточными решениями, для того, чтобы облегчить нахождение необходимых коэффициентов, увеличив все значения yна номер классного журнала (5)
Промежуточные решения
№ |
y |
x |
X |
yX |
|||||
1 |
15 |
1 |
0 |
0 |
0 |
14,97 |
0,0009 |
30,25 |
|
2 |
18,4 |
2 |
0,69 |
12,69 |
0,48 |
18,44 |
0,0016 |
4,41 |
|
3 |
20,4 |
3 |
1,1 |
22,44 |
1,21 |
20,5 |
0,01 |
0,01 |
|
4 |
21,5 |
4 |
1,39 |
29,88 |
1,93 |
21,96 |
0,21 |
1 |
|
5 |
23,6 |
5 |
1,61 |
37,99 |
2,59 |
23,07 |
0,28 |
9,61 |
|
6 |
24,1 |
6 |
1,79 |
43,14 |
3,2 |
23,97 |
0,02 |
12,96 |
|
Сумма |
123 |
21 |
6,58 |
146,14 |
9,41 |
122,91 |
0,52 |
58,24 |
|
Средн |
20,5 |
3,5 |
1,1 |
24,35 |
1,57 |
20,49 |
0,09 |
9,7 |
1)
Произведем замену . В результате получим линейное уравнение
.
Используя данную таблицу определим а0 и а1, а также выразим необходимые значения для построения модели:
Получим следующее уравнение обратной модели:
2) По уже рассчитанным значениям приступаем к определению индекса детерминации:
99% показывает высокую и прямую связь между индексами x и y, также то, что вариация Y на 99% обусловлена вариацией показателя X и на 1% - влиянием прочих факторов, не учтенных в модели.
2) Определим стандартную ошибку:
3) Проведем оценку значимости уравнения регрессии с помощью F-критерия Фишера:
По таблице Фишера определяем критическое значение F-критерия при уровне значимости и числе степеней свободы . .
Так как наблюдаемое значение критерия больше табличного , а значит, с вероятностью 0,95 уравнение регрессии будет признаваться статистически значимым.
Задача 3.3
Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 3.1.
Динамика коэффициента рождаемости в Пензенской области
Год |
2000 |
2001 |
2002 |
2003 |
2004 |
2005 |
|
Коэффициент рождаемости |
7,5 |
7,5 |
8,0 |
8,4 |
8,6 |
8,4 |
|
Год |
2006 |
2007 |
2008 |
2009 |
2010 |
2011 |
|
Коэффициент рождаемости |
8,6 |
9,7 |
10,2 |
10,3 |
10,2 |
10,1 |
|
Год |
2012 |
2013 |
2014 |
2015 |
2016 |
||
Коэффициент рождаемости |
10,8 |
10,6 |
10,8 |
10,7 |
10,2 |
Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г. В электронную таблицу вместо года ставить 1,2,...
Решение:
1) Построим линейную модель У(t) = а0 + аit, параметры которой оценим МНК
Промежуточные расчеты
Год |
t |
у |
t-t? |
(t-t?)І |
у-у? |
(t-t?)(y-y?) |
ур |
у-у? |
(у-у?)І |
(y-yЇ)І |
||
2000 |
1 |
7,5 |
-8 |
64 |
-1,947 |
15,576 |
7,692 |
-0,192 |
0,03694 |
2,56 |
3,791 |
|
2001 |
2 |
7,5 |
-7 |
49 |
-1,947 |
13,629 |
7,912 |
-0,412 |
0,16933 |
5,49 |
3,791 |
|
2002 |
3 |
8 |
-6 |
36 |
-1,447 |
8,6824 |
8,131 |
-0,131 |
0,01713 |
1,64 |
2,094 |
|
2003 |
4 |
8,4 |
-5 |
25 |
-1,047 |
5,2353 |
8,350 |
0,050 |
0,00248 |
0,59 |
1,096 |
|
2004 |
5 |
8,6 |
-4 |
16 |
-0,847 |
3,3882 |
8,570 |
0,030 |
0,00092 |
0,35 |
0,718 |
|
2005 |
6 |
8,4 |
-3 |
9 |
-1,047 |
3,1412 |
8,789 |
-0,389 |
0,15132 |
4,63 |
1,096 |
|
2006 |
7 |
8,6 |
-2 |
4 |
-0,847 |
1,6941 |
9,008 |
-0,408 |
0,16671 |
4,75 |
0,718 |
|
2007 |
8 |
9,7 |
-1 |
1 |
0,2529 |
-0,253 |
9,228 |
0,472 |
0,22307 |
4,87 |
0,064 |
|
2008 |
9 |
10,2 |
0 |
0 |
0,7529 |
0 |
9,447 |
0,753 |
0,56686 |
7,38 |
0,567 |
|
2009 |
10 |
10,3 |
1 |
1 |
0,8529 |
0,8529 |
9,666 |
0,634 |
0,40145 |
6,15 |
0,728 |
|
2010 |
11 |
10,2 |
2 |
4 |
0,7529 |
1,5059 |
9,886 |
0,314 |
0,09872 |
3,08 |
0,567 |
|
2011 |
12 |
10,1 |
3 |
9 |
0,6529 |
1,9588 |
10,105 |
-0,005 |
0,00003 |
0,05 |
0,426 |
|
2012 |
13 |
10,8 |
4 |
16 |
1,3529 |
5,4118 |
10,325 |
0,476 |
0,22610 |
4,40 |
1,83 |
|
2013 |
14 |
10,6 |
5 |
25 |
1,1529 |
5,7647 |
10,544 |
0,056 |
0,00315 |
0,53 |
1,329 |
|
2014 |
15 |
10,8 |
6 |
36 |
1,3529 |
8,1176 |
10,763 |
0,037 |
0,00135 |
0,34 |
1,83 |
|
2015 |
16 |
10,7 |
7 |
49 |
1,2529 |
8,7706 |
10,983 |
-0,283 |
0,07986 |
2,64 |
1,57 |
|
2016 |
17 |
10,2 |
8 |
64 |
0,7529 |
6,0235 |
11,202 |
-1,002 |
1,00400 |
9,82 |
0,567 |
|
У |
153 |
161 |
0 |
408 |
0 |
89,5 |
160,6 |
0 |
3,14943 |
59,281 |
22,78 |
|
Ср. знач |
9 |
9,4471 |
, соответственно
Отсюда уравнение линейного тренда принимает окончательный вид:
Положительное значение коэффициента при t указывает на то, что имеется тенденция роста, причем величина роста ежегодно составляет в среднем 0,219 единиц.
2) Определим коэффициент детерминации:
0,8617
т.е. в 86,17 % случаев изменения х приводят к изменению y
Другими словами - точность подбора уравнения регрессии - высокая. Остальные 13.83% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
3) Определим стандартную ошибку:
4) Оценим значимость модели с помощью критерия Фишера:
.
Табличное значение критерия со степенями свободы k1=1 и k2=15, Fтабл = 4.54
Поскольку фактическое значение F>Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
4) Ошибка аппроксимации:
.
В среднем, расчетные значения отклоняются от фактических на 3.49%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
6) Спрогнозируем коэффициент рождаемости в 2017 :
.
Задача 3.4
Реальные статистические данные о курсе валют приведены в таблице 3.2. Построить линейную и нелинейные регрессионные модели вида: у = ао + а1t; lnу = ао + а1t; у = 1/(ао + а1t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. В электронную таблицу вместо года записывать 1,2,… По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.
Курс рубля к доллару
Месяц и год |
январь 2017 |
февраль |
март |
апрель |
май |
июнь |
июль |
август 2017 |
|
Цена одного доллара |
59,6 |
58,5 |
58,0 |
56,4 |
57,0 |
57,9 |
59,7 |
59,6 |
Построим линейную модель , параметры которой оценим МНК
Данные для расчета линейного уравнения тренда
месяц |
t |
Курс доллара,руб |
|||||||||
Январь |
1 |
59,6 |
-3,5 |
1,3 |
-4,55 |
12,25 |
58,08 |
1,52 |
2,3 |
2,55 |
|
Февраль |
2 |
58,5 |
-2,5 |
0,2 |
-0,5 |
6,25 |
58,15 |
0,35 |
0,12 |
0,6 |
|
Март |
3 |
58 |
-1,5 |
-0,3 |
0,45 |
2,25 |
58,23 |
-0,23 |
0,05 |
0,4 |
|
Апрель |
4 |
56,4 |
-0,5 |
-1,9 |
0,95 |
0,25 |
58,3 |
-1,9 |
3,61 |
3,37 |
|
Май |
5 |
57 |
0,5 |
-1,3 |
-0,65 |
0,25 |
58,38 |
-1,38 |
1,9 |
2,42 |
|
Июнь |
6 |
57,9 |
1,5 |
-0,4 |
-0,6 |
2,25 |
58,45 |
-0,55 |
0,3 |
0,95 |
|
Июль |
7 |
59,7 |
2,5 |
1,4 |
3,5 |
6,25 |
58,53 |
1,17 |
1,37 |
1,96 |
|
Август |
8 |
59,6 |
3,5 |
1,3 |
4,55 |
12,25 |
58,6 |
1 |
1 |
1,68 |
|
Итого |
36 |
466,7 |
0 |
0,3 |
3,15 |
42 |
466,7 |
-0,02 |
10,65 |
13,93 |
|
Сред.знач |
4,5 |
58,3 |
Линейная модель имеет вид
Положительное значение коэффициента при t указывает на то, что имеется тенденция роста курса доллара, причем величина прироста ежегодно составляет в среднем 0,075 руб.
Определим
В среднем, расчетные значения отклоняются от фактических на 1,74%. Поскольку ошибка меньше 5%, то данное уравнение качественно описывает тенденцию изменения коэффициент рождаемости.
1) Определим стандартную ошибку модели по формуле
.
Определим коэффициент детерминации
Расчеты для коэффициента детерминации
t |
Курс доллара,руб |
||||||
1 |
59,6 |
58,08 |
1,52 |
2,3 |
1,3 |
1,69 |
|
2 |
58,5 |
58,15 |
0,35 |
0,12 |
0,2 |
0,04 |
|
3 |
58 |
58,23 |
-0,23 |
0,05 |
-0,3 |
0,09 |
|
4 |
56,4 |
58,3 |
-1,9 |
3,61 |
-1,9 |
3,61 |
|
5 |
57 |
58,38 |
-1,38 |
1,9 |
-1,3 |
1,69 |
|
6 |
57,9 |
58,45 |
-0,55 |
0,3 |
-0,4 |
0,16 |
|
7 |
59,7 |
58,53 |
1,17 |
1,37 |
1,4 |
1,96 |
|
8 |
59,6 |
58,6 |
1 |
1 |
1,3 |
1,69 |
|
Итого |
466,7 |
466,7 |
-0,02 |
10,65 |
0,3 |
10,93 |
|
Ср. знач. |
58,3 |
Таким образом на 2,6% вариация курса доллара обусловлена зависимостью от времени, на 97,4% - влиянием прочих факторов, не включенных в данную модель.
Оценим статистическую значимость уравнения регрессии в целом с помощью F-критерия Фишера. Фактическое значение F-критерия рассчитаем по формуле:
При уровне значимости и степенях свободы табличное значение критерия составляет .[10]
Так как , то делается вывод о наличии статистически значимых различий частоты исхода в зависимости от воздействия фактора риска
Построим уравнение нелинейного тренда курса доллара, которое имеет вид:
Введем замену . В результате получим линейное уравнение .
Данные для расчета уравнения тренда
месяц |
t |
Курс доллара,руб. |
t2 |
|||||||
Январь |
1 |
59,6 |
4,09 |
1 |
4,09 |
58,62 |
0,97 |
1,59 |
0,02 |
|
Февраль |
2 |
58,5 |
4,07 |
4 |
8,14 |
59,26 |
0,58 |
0,03 |
0,01 |
|
Март |
3 |
58 |
4,06 |
9 |
12,18 |
59,92 |
3,68 |
0,11 |
0,03 |
|
Апрель |
4 |
56,4 |
4,03 |
16 |
16,13 |
60,58 |
17,49 |
3,75 |
0,07 |
|
Май |
5 |
57 |
4,04 |
25 |
20,22 |
61,25 |
18,08 |
1,79 |
0,07 |
|
Июнь |
6 |
57,9 |
4,06 |
36 |
24,35 |
61,93 |
16,24 |
0,19 |
0,07 |
|
Июль |
7 |
59,7 |
4,09 |
49 |
28,63 |
62,61 |
8,50 |
1,86 |
0,05 |
|
Август |
8 |
59,6 |
4,09 |
64 |
32,70 |
63,31 |
13,74 |
1,59 |
0,06 |
|
Итого |
36 |
466,7 |
32,53 |
204 |
146,43 |
487,48 |
79,29 |
10,92 |
0,39 |
Отсюда уравнение линейного тренда принимает окончательный вид:
Качество модели определим с помощью средней ошибки аппроксимации:
В среднем, расчетные значения отклоняются от фактических на 4,88%. Поскольку ошибка меньше 5%, то данное уравнение качественно описывает тенденцию курса доллара.
Построим уравнение нелинейного тренда курса доллара, которое имеет вид:
Данные для расчета уравнения тренда
месяц |
t |
Курс доллара,руб |
X |
X2 |
|||||||
Январь |
1 |
59,6 |
0,02 |
1,00 |
1,00 |
0,02 |
59,21 |
0,15 |
1,59 |
0,01 |
|
Февраль |
2 |
58,5 |
0,02 |
0,50 |
0,25 |
0,01 |
60,57 |
4,28 |
0,03 |
0,04 |
|
Март |
3 |
58 |
0,02 |
0,33 |
0,11 |
0,01 |
62,00 |
15,97 |
0,11 |
0,07 |
|
Апрель |
4 |
56,4 |
0,02 |
0,25 |
0,06 |
0,00 |
63,49 |
50,30 |
3,75 |
0,13 |
|
Май |
5 |
57 |
0,02 |
0,20 |
0,04 |
0,00 |
65,06 |
64,99 |
1,79 |
0,14 |
|
Июнь |
6 |
57,9 |
0,02 |
0,17 |
0,03 |
0,00 |
66,71 |
77,64 |
0,19 |
0,15 |
|
Июль |
7 |
59,7 |
0,02 |
0,14 |
0,02 |
0,00 |
68,45 |
76,50 |
1,86 |
0,15 |
|
Август |
8 |
59,6 |
0,02 |
0,13 |
0,02 |
0,00 |
70,27 |
113,94 |
1,59 |
0,18 |
|
Итого |
36 |
466,7 |
0,14 |
2,72 |
1,53 |
0,05 |
515,76 |
403,77 |
10,92 |
0,86 |
Отсюда уравнение линейного тренда принимает окончательный вид:
Качество модели определим с помощью средней ошибки аппроксимации:
В среднем, расчетные значения отклоняются от фактических на 10,75%. Поскольку ошибка выше 10%, то данное уравнение некачественно описывает тенденцию курса доллара.
По величине средней ошибки наиболее качественно описывает зависимость линейная модель, используем ее для построения прогноза курса доллара на декабрь 2017 года:
Курс доллара в декабре 2017 года по прогнозу составит 58,9 рублей
Задача 3.5
По статистическим данным таблицы 3.3 определить средние величины, структурные средние и показатели вариации. Построить линейную модель связи показателя со временем и оценить ее качество.
Курсы иностранных валют по отношению к российскому рублю (на конец года; рублей за единицу иностранной валюты)
Страна |
Наименование валюты |
2010 |
2011 |
2012 |
2013 |
2014 |
2015 |
|
5.Беларусь |
Белорусский рубль |
10,16 |
38,56 |
35,34 |
34,31 |
38,80 |
38,95 |
Решение:
Так как данные представлены на конец каждого года, то средний курс определим по формуле средней хронологической простой:
- количество лет
В данном примере мода отсутствует, поскольку каждое значение встречается всего один раз.
Расставим ряд данных по возрастанию:
10,16; 34,31; 35,34; 38,56; 38,80; 38,95
Медиана равна:
Рассчитаем дисперсию по формуле:
Среднее квадратическое отклонение равно:
Коэффициент вариации рассчитаем по формуле:
Таким образом, среднегодовой курс белорусского рубля составил 34,31 руб. Дисперсия составила 644. Медиана показывает, что курс половины лет не превышал 36,95 руб., а другой половины - не менее того же курса. Коэффициент вариации, равный 73,94%, так как он больше 33,3%, то указывает на однородность совокупности.
Построим уравнение линейного тренда коэффициента изменения курса, которое имеет вид:
Данные для расчета линейного уравнения тренда
Год |
t |
Курс бел.руб,руб, |
||||||||
2000 |
1 |
10,16 |
-2,5 |
6,25 |
-22,52 |
56,3 |
20,68 |
-10,52 |
19,6 |
|
2001 |
2 |
38,56 |
-1,5 |
2,25 |
5,88 |
-13,23 |
24,68 |
13,88 |
2,86 |
|
2002 |
3 |
35,34 |
-0,5 |
0,25 |
2,66 |
1,33 |
28,68 |
6,66 |
20,6 |
|
2003 |
4 |
34,31 |
0,5 |
0,25 |
1,63 |
0,81 |
32,68 |
1,63 |
25,8 |
|
2004 |
5 |
38,80 |
1,5 |
2,25 |
6,12 |
9,18 |
36,68 |
2,12 |
5,43 |
|
2005 |
6 |
38,95 |
2,5 |
6,25 |
6,27 |
15,67 |
40,68 |
-1,73 |
8,8 |
|
Итого |
21 |
196,12 |
0 |
17,5 |
0,04 |
70,06 |
184,08 |
12,04 |
83,09 |
|
Cред.знач |
3,5 |
32,68 |
Отсюда уравнение линейного тренда принимает окончательный вид:
Определим
В среднем, расчетные значения отклоняются от фактических на 13,8%. Поскольку ошибка выше 10%, то данное уравнение качественно описывает тенденцию курса евро.
Определим коэффициент детерминации
Расчеты для коэффициента детерминации
t |
у |
еt2 |
|||||
1 |
10,16 |
20,68 |
-10,52 |
62,41 |
-22,52 |
507,15 |
|
2 |
38,56 |
24,68 |
13,88 |
1,42 |
5,88 |
34,57 |
|
3 |
35,34 |
28,68 |
6,66 |
68,89 |
2,66 |
7,07 |
|
4 |
34,31 |
32,68 |
1,63 |
134,79 |
1,63 |
2,65 |
|
5 |
38,80 |
36,68 |
2,12 |
13,76 |
6,12 |
37,45 |
|
6 |
38,95 |
40,68 |
-1,73 |
49,28 |
6,27 |
39,31 |
|
Итого |
196,12 |
184,08 |
12,04 |
330,55 |
0,04 |
628,2 |
|
Ср. знач. |
32,68 |
Таким образом на 48 % вариация курса белорусского рубля обусловлена зависимостью от времени, на 52% - влиянием прочих...
Подобные документы
Основные понятия корреляционно-регрессионного анализа. Вычисление показателей силы и тесноты связи между явлениями и процессами, специфика их интерпретации. Оценка результатов линейного регрессионного анализа. Коэффициент множественной детерминации.
контрольная работа [228,2 K], добавлен 02.04.2013Понятие, виды производственных средств. Расчет линейного коэффициента корреляции. Аналитическое выражение связи между факторным и результативным показателем на основе регрессионного анализа. Расчет параметров уравнения тренда методом наименьших квадратов.
курсовая работа [80,9 K], добавлен 07.03.2016- Использование корреляционно-регрессионного анализа для обработки экономических статистических данных
Роль корреляцонно-регрессионного анализа в обработке экономических данных. Корреляционно-регрессионный анализ и его возможности. Предпосылки корреляционного и регрессионного анализа. Пакет анализа Microsoft Excel.
курсовая работа [68,4 K], добавлен 11.06.2002 Расчет средних показателей при составлении любого экономического отчета. Исследование метода средних величин. Отражение средней величиной того общего, что характерно для всех единиц изучаемой совокупности. Деление средних величин на два класса.
курсовая работа [91,7 K], добавлен 14.12.2008Основные черты, задачи и предпосылки применения корреляционно-регрессионного метода. Методы корреляционного и регрессионного анализа. Коэффициент ранговой корреляции Кендалла, Спирмена, Фехнера. Определение тесноты взаимосвязи между показателями.
контрольная работа [558,5 K], добавлен 08.04.2013Изучение зависимости доли сельского населения от величины среднедушевых денежных доходов. Расчет параметров линейной функции на основании исходных данных по областям. Определение среднего коэффициента эластичности. Расчет коэффициента корреляции.
методичка [55,1 K], добавлен 02.06.2012Анализ основных технико-экономических показателей ОАО "Газпром". Изучение сущности средних величин, видов и способов их вычисления. Рассмотрение применения средних величин при анализе хозяйственной деятельности работы ОАО "Газпром" за 2009-2012 гг.
курсовая работа [177,4 K], добавлен 29.10.2015Сущность статистического изучения браков. Система статистических показателей, используемых в изучении браков в Амурской области. Анализ браков с помощью расчета средних величин и показателей вариации. Корреляционно–регрессионный анализ структуры браков.
курсовая работа [895,1 K], добавлен 20.03.2015Понятие средних величин и их значение в экономике. Классификация видов средних величин и их краткая характеристика. Средняя гармоническая и арифметическая, способы их расчета. Примеры применения средних величин в практической работе экономистов.
курсовая работа [205,4 K], добавлен 17.09.2014Этапы корреляционно-регрессионного анализа, построение корреляционной модели и определение функции, отражающей механизм связи между факторным и результативным признаками. Измерение тесноты корреляционной связи, расчет индекса корреляции и дисперсии.
лекция [38,1 K], добавлен 13.02.2011Понятие и свойства средних величин. Характеристика и расчет их видов (средних арифметической, гармонической, геометрической, квадратической, кубической и структурных). Сфера их применения в экономическом анализе хозяйственной деятельности отраслей.
курсовая работа [56,8 K], добавлен 21.05.2014Распределение клиентов, воспользовавшихся услугами данной туристской фирмы в течение летнего сезона, по возрастному составу. Определение однородности представленного признака путем расчета коэффициента вариации. Расчет моды, медианы, линейного отклонения.
контрольная работа [164,9 K], добавлен 31.03.2016Корреляционно-регрессионный анализ как объект статистического изучения, система статистических показателей, его характеризующих. Особенности и принципы применения метода корреляционно-регрессионного анализа. Построение статистического ряда распределения.
курсовая работа [453,1 K], добавлен 28.01.2014Группировка предприятий по факторному признаку, расчет размаха вариации и длины интервала. Виды и формулы расчета средних величин и дисперсии. Расчет абсолютного прироста, темпов роста и темпов прироста, среднегодовых показателей численности населения.
контрольная работа [219,7 K], добавлен 24.02.2011Виды и применение абсолютных и относительных статистических величин. Сущность средней в статистике, виды и формы средних величин. Формулы и техника расчетов средней арифметической, средней гармонической, структурной средней. Расчет показателей вариации.
лекция [985,6 K], добавлен 13.02.2011Статистика денежного обращения, инфляции и цен. Построение сводки и ряда распределения. Характеристика используемых статистических показателей. Расчет средних величин и показателей вариации, ошибок выборки. Корреляционный анализ количественных признаков.
контрольная работа [564,1 K], добавлен 13.09.2012Порядок группировки территорий с определенным уровнем фондовооруженности, расчет доли занятых. Расчёт средних значений каждого показателя с указанием вида и формы использованных средних гармонических, абсолютных и относительных показателей вариации.
контрольная работа [45,5 K], добавлен 10.11.2010Расчет показателей динамики стоимости имущества ОАО "Сургутнефтегаз". Построение линейного уравнения тренда роста балансовой стоимости имущества. Однофакторный дисперсионный анализ. Параметры уравнения регрессии. Значимость коэффициента корреляции.
дипломная работа [146,6 K], добавлен 29.11.2014Группы средних величин: степенные, структурные. Особенности применения средних величин, виды. Рассмотрение основных свойств средней арифметической. Характеристика структурных средних величин. Анализ примеров на основе реальных статистических данных.
курсовая работа [230,6 K], добавлен 24.09.2012Изучение сущности, видов, сферы применения средних величин. Характеристика степенных средних величин: средняя арифметическая; средняя гармоническая; средняя геометрическая; средняя квадратическая. Анализ структурных величин: медиана, мода, их расчет.
курсовая работа [157,3 K], добавлен 16.01.2010