Средние величины и показатели вариации Корреляционный и регрессионный анализ
Обоснование понятий и методов расчета средних величин, показателей вариации. Исследование информационной базы корреляционно-регрессионного анализа. Определение коэффициента ранговой корреляции Спирмена. Статистический анализ инвестиций в основной капитал.
Рубрика | Экономика и экономическая теория |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 21.02.2019 |
Размер файла | 1,5 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
ПЕНЗЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ФАКУЛЬТЕТ «ЭКОНОМИКА И УПРАВЛЕНИЕ»
КАФЕДРА «Бухгалтерский учет и аудит»
КУРСОВАЯ РАБОТА
Специальность: Экономика
по дисциплине: «Общая теория статистики»
Автор работы: Галоян Сумбат Камсарович
Пенза 2017
Содержание
1. Средние величины и показатели вариации
- 2. Корреляционный анализ
- 3. Регрессионный анализ
- Список используемых источников
- Введение
- В современном обществе важную роль в механизме управления экономикой выполняет статистика. Независимо от уровня и стадии экономического развития, характера политической системы, статистика на протяжении сотен лет своего существования всегда выступала как необходимый и эффективный инструмент государственного управления и одновременно как наука, исследующая количественную сторону массовых явлений. Особенность статистики заключается в том, что статистические данные сообщаются в количественной форме, т.е. статистика говорит языком цифр, отображающих общественную жизнь во всем многообразии ее проявлений. При этом статистику, прежде всего, интересуют те выводы, которые можно сделать на основе анализа надлежащим образом собранных и обработанных цифровых данных.
- Развитие общественного производства, внутренней и внешней торговли, торговых и международных товарно-денежных отношений увеличило потребность в статистической информации. Это расширило сферу деятельности статистики, вело к совершенствованию ее приемов и методов, явилось стимулом для дальнейшего формирования учета и статистики.
- Основными задачами статистики являются:
- 1. сбор, обработка, анализ и хранение информации;
- 2. ознакомление широкой общественности и населения с динамикой и дислокацией социально-экономических явлений в стране путем издания статистических сборников, справочников, обзоров, публикаций в печатных и электронных СМИ;
- 3.доведение обработанной информации до органов управления всех уровней;
- Статистика играет важную роль в жизни общества. Проблема статистического анализа является актуальной, общественно значимой, так как статистика имеет прямую связь с экономической теорией и другими науками. Экономическая теория служит для определения основных экономических законов и категорий, а статистика является их доказательным инструментом. Основными функциями статистики являются: аналитическая, учетная, распределительная, стимулирующая, контрольная, функция сравнения, оценочная и функция прогнозная.
- Данная курсовая работа состоит из трех частей - средние величины и показатели вариации, корреляционный анализ, регрессионный анализ. В каждой из этих частей будет подробно рассмотрена теория, необходимые расчеты, и сделан грамотный, обоснованный вывод.
- Целью написания работы является расчет средних величин, показателей вариации, а также проведение корреляционно-регрессионного анализа. Основными задачами исследования в работе являются:
1. Теоретическое обоснование сущности, общих понятий и методов расчета средних величин;
2. Исследование системы показателей и информационной базы корреляционно-регрессионного анализа;
3. Выполнение расчетов.
1. Средние величины и показатели вариации
В социально-экономических исследованиях одним из распространенных статистических показателей является средняя величина, которая обобщает количественную вариацию признака, т.е. в средних величинах погашаются индивидуальные различия единиц совокупности, обусловленные случайными обстоятельствами.
Средние величины бывают степенные и структурные. К степенным средним относятся средняя геометрическая, средняя арифметическая и средняя квадратическая. В качестве структурных средних рассматриваются мода и медиана.
Из степенных средних чаще всего используется простая или взвешенная средняя. Вопрос о выборе той или иной средней решается в зависимости от усредняемого признака. Если этот признак первичный, то используется простая средняя, если он вторичный, то осреднение производится по взвешенной средней [8, c.56].
Простая арифметическая средняя:
(1)
где, xi - итое значение максимальной величины
n - количество единиц совокупности
Взвешенная арифметическая средняя:
(2)
где, xi - итое значение максимальной величины
fi - частота повторения данного признака
Характеристиками вариационных рядов, наряду со средними, являются мода и медиана.
Мода - это величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности. Для дискретных рядов распределения модой будет значение варианта с наибольшей частотой.[2]
Для интервальных рядов распределения с равными интервалами мода определяется по формуле:
(3)
где xn - нижняя граница модального интервала и ширина интервала;
i - величина модального интервала;
m2 - частота модального интервала;
m1 - частота интервала, предшествующего модальному;
m3 - частота интервала, следующего за модальным.
Медиана- это варианта, расположенная в середине вариационного ряда. Если ряд распределения дискретный и имеет нечетное число членов, то медианой будет варианта, находящаяся в середине упорядоченного ряда. Если дискретный упорядоченный ряд состоит из чётного числа членов, то медианой будет средняя арифметическая из двух смежных вариант, стоящих в центре ряда.[4]
Медиана интервального вариационного ряда распределения определяется по формуле:
(4)
где, нижняя граница модального интервала и ширина интервала;
i - величина модального интервала;
n - объем выборки;
mme - частота медиального интервала
ms-1 - накопленная частота интервала предеств.
Основными обобщающими показателями вариации в статистике являются дисперсии и среднеквадратическое отклонение.[3]
Дисперсия - это средняя арифметическая квадратов отклонений каждого значения признака от общей средней.
(5)
(6)
Взвешенная дисперсия используется тогда, когда данные представлены в виде интервального ряда и вместо xi берётся среднее значение интервала и соответственно частота mi интервала.
Среднеквадратическое отклонение представляет собой корень квадратный из дисперсии.
(7)
(8)
А для изучения вариации по группам используются внутригрупповые дисперсии, а также средняя из внутригрупповых. Для изучения вариации между группами используется межгрупповая дисперсия.
Общая дисперсия равна сумме средней внутригрупповой дисперсии и межгрупповой дисперсии.
Данное выражение называется в статистике правилом сложения дисперсий. Согласно этому правилу, общая дисперсия, которая возникает под влиянием всех факторов, равна сумме дисперсий, которые появляются как под влиянием признака-фактора, положенного в основу группировки, так и под влиянием других факторов. Благодаря правилу сложения дисперсий можно определить, какая часть общей дисперсии находится под влиянием признака-фактора, положенного в основу группировки..
Коэффициент вариации
(9)
Коэффициент детерминации, который показывает какую часть общей вариации изучаемого признака составляет вариация межгрупповая, т.е. обусловленная группировочным признаком:
(10)
Учитывая, что среднеквадратическое отклонение дает обобщающую характеристику колеблемости всех вариантов совокупности, коэффициент вариации является наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин. При этом исходят из того, что если V больше 33 %, то это говорит о большой колеблемости признака в изучаемой совокупности.
Задача 1.1. По статистическим данным: 9; 11; 8; 10; 13; 9; 14; 9; 16 определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации. Дисперсия до одного знака после запятой; среднеквадратическое - до двух; коэффициент вариации - до одного в процентах.
Решение:
Мо=9 (наиболее часто встречающийся вариант ряда)
Ме=13
Коэффициент вариации меньше 33 %, что свидетельствует о однородности совокупности.
Задача 1.2. По данным статистики в отчетном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 27%, стоимость основных фондов увеличилась на 16%. Определить изменение фондоотдачи.
Решение:
Доход по сравнению с базисным годом вырос и составил 127%, стоимость основных фондов также выросла и составила 116%.
Так как в базисном году фондоотдача была равна 1, следовательно, или 9%.
Задача 1.3. Объем оборота (У) и число работников (m) приведены в таблице 1. Определить среднее значение, моду и медиану.
Таблица 1 - Исходные данные
y |
m |
|
80-100 |
6 |
|
100-120 |
17 |
|
120-140 |
25 |
|
140160 |
28 |
|
160-180 |
14 |
|
180-200 |
10 |
|
Итого: |
100 |
Задача 1.4. По данным таблицы определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации. В таблице: Х-объем оборота предприятий, млн. руб., mг - число государственных предприятий; mч - частных; mо - общее число (таб. 2).
Таблица 2 - Исходные данные по объему оборота предприятий
Хi |
mгi |
mчi |
moi |
|
7,0-7,2 |
3 |
3 |
||
7,2-7,4 |
4 |
4 |
||
7,4-7,6 |
17 |
17 |
||
7,6-7,8 |
11 |
15 |
26 |
|
7,8-8,0 |
13 |
6 |
19 |
|
8,0-8,2 |
18 |
5 |
23 |
|
8,2-8,4 |
6 |
6 |
||
8,4-8,6 |
2 |
2 |
||
Итого: |
50 |
50 |
100 |
Так как коэффициент детерминации составляет 44%, это указывает на низкую значимость модели, т.е линейная зависимость между составными частями очень низкая.
Задача 1.5. Определить среднюю внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из трех групп (таблица 3).
Таблица 3 - Исходные данные 1 - группа
Хi |
1 |
2 |
8 |
|
mi |
30 |
15 |
5 |
2 - группа
Хi |
1 |
6 |
|
mi |
10 |
15 |
3 - группа
Хi |
3 |
8 |
|
mi |
20 |
5 |
6
2. Корреляционный анализ
Задача статистики состоит не только в количественной оценке изучаемых показателей, но и в определении формы влияния факторных признаков на результативный. Для ее решения применятся метод корреляционного и регрессионного анализа.[7]
Корреляционная связь (которую также называют неполной, или статистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной.
Коэффициент корреляции - двумерная описательная статистика, количественная мера взаимосвязи (совместной изменчивости) двух переменных
Можно ввести три градации величин корреляции по силе связи:
r < 0,3 -- слабая связь (менее 10% от общей доли дисперсии);
0,3 < r < 0,7 -- умеренная связь (от 10 до 50% от общей доли дисперсии);
r > 0,7 -- сильная связь (50% и более от общей доли дисперсии).
Вычислить коэффициент корреляции можно по следующей формуле:
(11)
xy - средняя арифметическое значение произведения фактора на показатель;
x, y - среднеарифметическое значение фактора и показателя;
Gx, Gy - среднеквадратическое отклонение фактора и показателя.
Поскольку оценка коэффициента корреляции вычислена на конечной выборке, и поэтому может отклоняться от своего генерального значения, необходимо проверить значимость коэффициента корреляции. Проверка производится с помощью t-критерия. [8]
Случайная величина t следует t-распределению Стьюдента и по таблице t-распределения необходимо найти критическое значение критерия (tкр.б) при заданном уровне значимости б. Если вычисленное по формуле (2) t по модулю окажется меньше чем tкр.б, то зависимости между случайными величинами X и Y нет. В противном случае, экспериментальные данные не противоречат гипотезе о зависимости случайных величин.
Задача 2.1. Определить коэффициент корреляции между У и Х. Х: 3,5; 4,6; 5,8; 4,2; 5,2; УХ:28,35; 43,24; 65,54; 28,98; 50,44. Оценить значимость коэффициента корреляции при уровне 0,05. Расчеты и ответы до двух знаков. Вначале определить У, а затем У и Х увеличить на свой номер классного журнала. Результаты: 1) коэффициент корреляции; 2) расчетное и табличное значения критерия Стьюдента и вывод.
Решение:
Таблица 4 Рассчитаем значения Y, как отношениеYX к X:
Х: |
3,5 |
4,6 |
5,8 |
4,2 |
5,2 |
|
УХ: |
28,35 |
43,24 |
65,54 |
29,98 |
50,44 |
|
У: |
8,1 |
9,4 |
11,3 |
7,1 |
9,7 |
Таблица 5 Данные с учетом номера по журналу:
Х: |
9,5 |
10,6 |
11,8 |
10,2 |
11,2 |
|
У: |
14,1 |
15,4 |
17,3 |
13,1 |
15,7 |
|
YX: |
133,95 |
163,24 |
204,14 |
133,62 |
175,84 |
1)
Табличное значение t-критерия для числа степеней свободы и уровня значимости составляет .
Поскольку , то коэффициент корреляции статистически не значим.
Задача 2.2. Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость.
Исходные данные:
х 24 38 19 26 21 20
у 23 26 17 24 20 16
Результаты: 1. Коэффициент корреляции.
2. Расчетное и табличное значения критерия Стьюдента, вывод о значимости. Все результаты до 2-х знаков после запятой.
Таблица 6 Решение:
Х: |
24 |
28 |
19 |
26 |
21 |
20 |
|
У: |
23 |
26 |
17 |
24 |
20 |
16 |
|
YX: |
552 |
728 |
323 |
624 |
420 |
320 |
= 3,6
= 14,1
Табличное значение t-критерия для числа степеней свободы и уровня значимости составляет .
Поскольку , то коэффициент корреляции статистически значим.
Задача 2.3. В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистики по сто балльной системе:
Теория вероятностей: 71 96 48 53 90 64 56
Статистика: 57 91 42 69 78 86 46
Определить коэффициент ранговой корреляции Спирмена и его значимость. Расчеты и результат до двух знаков.
Результаты:
1. Коэффициент ранговой корреляции.
2. Расчетное и табличное значения критерия Стьюдента при уровне значимости равном 0,05 и выводы.
Решение: Для расчета составим вспомогательную таблицу
Таблица 7
№, п/п |
Баллы по ТВ |
Баллы по Стат |
R1 |
R2 |
d1 (R1-R2) |
||
1 |
71 |
57 |
5 |
3 |
2 |
4 |
|
2 |
96 |
91 |
7 |
7 |
0 |
0 |
|
3 |
48 |
42 |
1 |
1 |
0 |
0 |
|
4 |
53 |
69 |
2 |
4 |
-2 |
4 |
|
5 |
90 |
78 |
6 |
5 |
1 |
1 |
|
6 |
64 |
86 |
4 |
6 |
-2 |
4 |
|
7 |
56 |
46 |
3 |
2 |
1 |
1 |
|
? |
14 |
R1, R2 - ранги студентов по количеству набранных баллов по теории вероятностей и статистике соответственно
Величина коэффициента Спирмена указывает на высокую тесноту связи между баллами, набранными по теории вероятностей и по статистике.
Табличное значение t-критерия для числа степеней свободы и уровня значимости составляет .
Поскольку , то коэффициент ранговой корреляции Спирмена статистически значим.
3. Регрессионный анализ
Задача 3.1. Построить нелинейную обратную модель связи единицы продукции (у) со стоимостью основных фондов (х). Определить характеристики модели. Исходные данные: у: 27; 22 ; 21; 20; 19; 18,5; 17; 17,5; 16; 14 х: 1; 2; 3; 4; 5; 6; 7; 8; 9; 10 Характеристики модели: 1) модель (коэффициенты до 4-х знаков); 2) индекс детерминации (до 2-х знаков); 3) стандартную ошибку (до 4-х знаков); 4) расчетное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели; 5) вывод о значимости коэффициентов модели; 6) доверительные интервалы коэффициентов модели (до 4-х знаков).
Решение:
1) Уравнение обратной модели имеет вид:
Произведем замену . В результате получим линейное уравнение .
Таблица 3.1
№ |
y |
x |
X |
yX |
X2 |
||||
1 |
27 |
1 |
1 |
27 |
1 |
28,32 |
1,74 |
60,84 |
|
2 |
22 |
2 |
0,5 |
11 |
0,25 |
21,87 |
0,02 |
7,84 |
|
3 |
21 |
3 |
0,33 |
6,93 |
0,11 |
19,68 |
1,74 |
3,24 |
|
4 |
20 |
4 |
0,25 |
5 |
0,06 |
18,65 |
1,82 |
0,64 |
|
5 |
19 |
5 |
0,2 |
3,8 |
0,04 |
18 |
1 |
0,04 |
|
6 |
18,5 |
6 |
0,17 |
3,15 |
0,03 |
17,61 |
0,79 |
0,49 |
|
7 |
17 |
7 |
0,14 |
2,38 |
0,02 |
17,23 |
0,05 |
4,84 |
|
8 |
17,5 |
8 |
0,13 |
2,28 |
0,02 |
17,1 |
0,16 |
2,89 |
|
9 |
16 |
9 |
0,11 |
1,76 |
0,01 |
16,84 |
0,7 |
10,24 |
|
10 |
14 |
10 |
0,1 |
1,4 |
0,01 |
16,71 |
7,34 |
27,04 |
|
Итого |
192 |
55 |
2,93 |
64,7 |
1,55 |
192,01 |
15,36 |
118,1 |
|
Среднее |
19,2 |
5,5 |
0,293 |
6,47 |
0,155 |
19,2 |
1,536 |
11,81 |
Получим следующее уравнение гиперболической модели:
2) Определим индекс детерминации
Вариация результата у (себестоимость единицы продукции) на 87% объясняется вариацией фактора х (стоимостью основных фондов).
3) Определим стандартную ошибку модели:
4) Определим F - критерий Фишера
По таблице Фишера определим критическое значение F-критерия при уровне значимости и числе степеней свободы . .
Уравнение регрессии с вероятностью 0,95 статистически значимое, так как .
5) Оценку статистической значимости параметров регрессии и корреляции проведем с помощь t - статистики Стьюдента и путем расчета доверительного интервала каждого из параметров.
Табличное значение t-критерия для числа степеней свободы и уровня значимости составляет .
Рассчитаем остаточную дисперсию:
Определим стандартные ошибки:
Тогда:
Фактические значения t - статистики для параметров a, b превышают табличные:
поэтому параметр a, b статистически значимы.
6) Рассчитаем доверительные интервалы для параметов регрессии a и b. Определим предельную ошибку для каждого показателя:
Доверительные интервалы:
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью p=1-б= 1-0,05=0,95% параметры и будут находиться в указанных границах.
Задача 3.2. Построить полулогарифмическую модель вида: y=a0+a1lnx по данным: у 16; 19,4; 21,4; 22,5; 24,6; 25,1 х 1; 2; 3; 4; 5; 6. Определить характеристики модели. Характеристики модели: 1) модель (коэффициенты до 2-х знаков); 2) индекс детерминации (до 2-х знаков); 3) стандартную ошибку (до 4-х знаков); 4) расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели. Решение: 1) Построим уравнение полулогарифмической модели:
Произведем замену . В результате получим линейное уравнение .
Таблица 3.2
№ |
y |
x |
X |
yX |
X2 |
||||
1 |
16 |
1 |
0 |
0 |
0 |
15,97 |
0,0009 |
30,25 |
|
2 |
19,4 |
2 |
0,69 |
13,39 |
0,48 |
19,44 |
0,0016 |
4,41 |
|
3 |
21,4 |
3 |
1,1 |
23,54 |
1,21 |
21,5 |
0,01 |
0,01 |
|
4 |
22,5 |
4 |
1,39 |
31,28 |
1,93 |
22,96 |
0,21 |
1 |
|
5 |
24,6 |
5 |
1,61 |
39,6 |
2,59 |
24,07 |
0,28 |
9,61 |
|
6 |
25,1 |
6 |
1,79 |
44,93 |
3,2 |
24,97 |
0,02 |
12,96 |
|
Итого |
129 |
21 |
6,58 |
152,74 |
9,41 |
128,91 |
0,52 |
58,24 |
|
Среднее |
21,5 |
3,5 |
1,1 |
25,46 |
1,57 |
21,49 |
0,09 |
9,7 |
Получим следующее уравнение обратной модели:
1) Рассчитаем коэффициент детерминации:
Значение коэффициента детерминации указывает на то, что вариация Y на 99% обусловлена вариацией показателя X и на 1% - влиянием прочих факторов, не учтенных в модели.
2) Определим стандартную ошибку модели:
3) Проведем оценку значимости уравнения регрессии с помощью F-критерия Фишера:
По таблице Фишера определим критическое значение F-критерия при уровне значимости и числе степеней свободы . .
Так как наблюдаемое значение критерия больше табличного , следовательно, с вероятностью 0,95 уравнение регрессии признается статистически значимым.
Задача 3.3 Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 3.1.
Таблица 3.3 - Динамика коэффициента рождаемости в Пензенской области
Год |
2000 |
2001 |
2002 |
2003 |
2004 |
2005 |
|
Коэффициент рождаемости |
7,5 |
7,5 |
8,0 |
8,4 |
8,6 |
8,4 |
|
Год |
2006 |
2007 |
2008 |
2009 |
2010 |
2011 |
|
Коэффициент рождаемости |
8,6 |
9,7 |
10,2 |
10,3 |
10,2 |
10,1 |
|
Год |
2012 |
2013 |
2014 |
2015 |
2016 |
||
Коэффициент рождаемости |
10,8 |
10,6 |
10,8 |
10,7 |
10,2 |
Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г. В электронную таблицу вместо года ставить 1,2,…
Решение: 1) Построим линейную модель , параметры которой оценим МНК
Таблица 3.3.1 - Данные для расчета линейного уравнения тренда
Год |
t |
Коэффициент рождаемости, y |
||||||||
2000 |
1 |
7,5 |
-8 |
64 |
-1,98 |
15,84 |
7,72 |
-0,22 |
2,9 |
|
2001 |
2 |
7,5 |
-7 |
49 |
-1,98 |
13,86 |
7,94 |
-0,44 |
5,87 |
|
2002 |
3 |
8 |
-6 |
36 |
-1,48 |
8,88 |
8,16 |
-0,16 |
2 |
|
2003 |
4 |
8,4 |
-5 |
25 |
-1,08 |
5,4 |
8,38 |
0,04 |
0,48 |
|
2004 |
5 |
8,6 |
-4 |
16 |
-0,88 |
3,52 |
8,6 |
0 |
0 |
|
2005 |
6 |
8,4 |
-3 |
9 |
-1,08 |
3,24 |
8,82 |
-0,42 |
5 |
|
2006 |
7 |
8,6 |
-2 |
4 |
-0,88 |
1,76 |
9,04 |
-0,44 |
5,12 |
|
2007 |
8 |
9,7 |
-1 |
1 |
-0,22 |
0,22 |
9,26 |
0,44 |
4,5 |
|
2008 |
9 |
10,2 |
0 |
0 |
0,72 |
0 |
9,48 |
0,72 |
7,06 |
|
2009 |
10 |
10,3 |
1 |
1 |
0,82 |
0,82 |
9,7 |
0,6 |
5,83 |
|
2010 |
11 |
10,2 |
2 |
4 |
0,72 |
1,44 |
9,92 |
0,28 |
2,75 |
|
2011 |
12 |
10,1 |
3 |
9 |
0,62 |
1,86 |
10,14 |
-0,04 |
0,4 |
|
2012 |
13 |
10,8 |
4 |
16 |
1,32 |
5,28 |
10,36 |
0,44 |
4,07 |
|
2013 |
14 |
10,6 |
5 |
25 |
1,12 |
5,6 |
10,58 |
0,02 |
0,19 |
|
2014 |
15 |
10,8 |
6 |
36 |
1,32 |
7,92 |
10,8 |
0 |
0 |
|
2015 |
16 |
10,7 |
7 |
49 |
1,22 |
8,54 |
11,02 |
-0,32 |
2,99 |
|
2016 |
17 |
10,2 |
8 |
64 |
0,72 |
5,76 |
11,24 |
-1,04 |
10,2 |
|
Итого |
153 |
160,6 |
0 |
408 |
-1 |
89,94 |
161,16 |
-0,54 |
59,36 |
|
Cред.знач |
9 |
9,48 |
Линейная модель имеет вид
2) Определим
В среднем, расчетные значения отклоняются от фактических на 3,5%. Поскольку ошибка меньше 5%, то данное уравнение качественно описывает тенденцию изменения коэффициент рождаемости.
3) Определим стандартную ошибку модели по формуле [9]
.
4) Определим коэффициент детерминации
Таблица 3.3.2 - Расчеты для коэффициента детерминации
t |
у |
ур |
еt |
еt2 |
|||
1 |
7,5 |
7,72 |
-0,22 |
0,05 |
-1,98 |
3,92 |
|
2 |
7,5 |
7,94 |
-0,44 |
0,19 |
-1,98 |
3,92 |
|
3 |
8 |
8,16 |
-0,16 |
0,03 |
-1,48 |
2,19 |
|
4 |
8,4 |
8,38 |
0,04 |
0,0016 |
-1,08 |
1,17 |
|
5 |
8,6 |
8,6 |
0 |
0 |
-0,88 |
0,77 |
|
6 |
8,4 |
8,82 |
-0,42 |
0,18 |
-1,08 |
1,17 |
|
7 |
8,6 |
9,04 |
-0,44 |
0,19 |
-0,88 |
0,77 |
|
8 |
9,7 |
9,26 |
0,44 |
0,19 |
-0,22 |
0,05 |
|
9 |
10,2 |
9,48 |
0,72 |
0,52 |
0,72 |
0,52 |
|
10 |
10,3 |
9,7 |
0,6 |
0,36 |
0,82 |
0,67 |
|
11 |
10,2 |
9,92 |
0,28 |
0,08 |
0,72 |
0,52 |
|
12 |
10,1 |
10,14 |
-0,04 |
0,0016 |
0,62 |
0,38 |
|
13 |
10,8 |
10,36 |
0,44 |
0,19 |
1,32 |
1,74 |
|
14 |
10,6 |
10,58 |
0,02 |
0,0004 |
1,12 |
1,25 |
|
15 |
10,8 |
10,8 |
0 |
0 |
1,32 |
1,74 |
|
16 |
10,7 |
11,02 |
-0,32 |
0,10 |
1,22 |
1,49 |
|
17 |
10,2 |
11,24 |
-1,04 |
1,08 |
0,72 |
0,52 |
|
Итого |
160,6 |
161,16 |
-0,54 |
3,16 |
-1 |
22,79 |
|
Ср. знач. |
9,48 |
Таким образом на 86% вариация коэффициента рождаемости обусловлена зависимостью от времени, на 14% - влиянием прочих факторов, не включенных в данную модель.
Оценим статистическую значимость уравнения регрессии в целом с помощью F-критерия Фишера. Фактическое значение F-критерия рассчитаем по формуле:
При уровне значимости и степенях свободы табличное значение критерия составляет . Так как , то уравнение регрессии признается статистически значимым.
По уравнению тренда найдем прогноз величины коэффициента рождаемости на 2017 год:
Задача 3.4. Реальные статистические данные о курсе валют приведены в таблице 3.2. Построить линейную и нелинейные регрессионные модели вида: у = ао + а1t; lnу = ао + а1t; у = 1/(ао + а1t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. В электронную таблицу вместо года записывать 1,2,… По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.
Таблица 3.4 - Курс рубля к доллару в 2017 г.
Месяц и год |
январь |
февраль |
март |
апрель |
май |
июнь |
июль |
август |
|
Цена одного доллара |
59,6 |
58,5 |
58,0 |
56,4 |
57,0 |
57,9 |
59,7 |
59,6 |
Построим линейную модель , параметры которой оценим МНК
Таблица 3.4.1 - Данные для расчета линейного уравнения тренда
месяц |
t |
Курс доллара, руб y |
|||||||||
Январь |
1 |
59,6 |
-3,5 |
1,3 |
-4,55 |
12,25 |
58,08 |
1,52 |
2,3 |
2,55 |
|
Февраль |
2 |
58,5 |
-2,5 |
0,2 |
-0,5 |
6,25 |
58,15 |
0,35 |
0,12 |
0,6 |
|
Март |
3 |
58 |
-1,5 |
-0,3 |
0,45 |
2,25 |
58,23 |
-0,23 |
0,05 |
0,4 |
|
Апрель |
4 |
56,4 |
-0,5 |
-1,9 |
0,95 |
0,25 |
58,3 |
-1,9 |
3,61 |
3,37 |
|
Май |
5 |
57 |
0,5 |
-1,3 |
-0,65 |
0,25 |
58,38 |
-1,38 |
1,9 |
2,42 |
|
Июнь |
6 |
57,9 |
1,5 |
-0,4 |
-0,6 |
2,25 |
58,45 |
-0,55 |
0,3 |
0,95 |
|
Июль |
7 |
59,7 |
2,5 |
1,4 |
3,5 |
6,25 |
58,53 |
1,17 |
1,37 |
1,96 |
|
Август |
8 |
59,6 |
3,5 |
1,3 |
4,55 |
12,25 |
58,6 |
1 |
1 |
1,68 |
|
Итого |
36 |
466,7 |
0 |
0,3 |
3,15 |
42 |
466,7 |
-0,02 |
10,65 |
13,93 |
|
Сред. знач |
4,5 |
58,3 |
Линейная модель имеет вид
Положительное значение коэффициента при t указывает на то, что имеется тенденция роста курса доллара, причем величина прироста ежегодно составляет в среднем 0,075 руб.
Определим
В среднем, расчетные значения отклоняются от фактических на 1,74%. Поскольку ошибка меньше 5%, то данное уравнение качественно описывает тенденцию изменения коэффициент рождаемости.
1) Определим стандартную ошибку модели по формуле
.
Определим коэффициент детерминации
Таблица 3.4.2 - Расчеты для коэффициента детерминации
t |
Курс доллара, руб y |
||||||
1 |
59,6 |
58,08 |
1,52 |
2,3 |
1,3 |
1,69 |
|
2 |
58,5 |
58,15 |
0,35 |
0,12 |
0,2 |
0,04 |
|
3 |
58 |
58,23 |
-0,23 |
0,05 |
-0,3 |
0,09 |
|
4 |
56,4 |
58,3 |
-1,9 |
3,61 |
-1,9 |
3,61 |
|
5 |
57 |
58,38 |
-1,38 |
1,9 |
-1,3 |
1,69 |
|
6 |
57,9 |
58,45 |
-0,55 |
0,3 |
-0,4 |
0,16 |
|
7 |
59,7 |
58,53 |
1,17 |
1,37 |
1,4 |
1,96 |
|
8 |
59,6 |
58,6 |
1 |
1 |
1,3 |
1,69 |
|
Итого |
466,7 |
466,7 |
-0,02 |
10,65 |
0,3 |
10,93 |
|
Ср. знач. |
58,3 |
Таким образом на 2,6% вариация курса доллара обусловлена зависимостью от времени, на 97,4% - влиянием прочих факторов, не включенных в данную модель.
Оценим статистическую значимость уравнения регрессии в целом с помощью F-критерия Фишера. Фактическое значение F-критерия рассчитаем по формуле:
При уровне значимости и степенях свободы табличное значение критерия составляет .[10]
Так как , то делается вывод о наличии статистически значимых различий частоты исхода в зависимости от воздействия фактора риска
Построим уравнение нелинейного тренда курса доллара, которое имеет вид:
Введем замену . В результате получим линейное уравнение .
Таблица 3.4.3- Данные для расчета уравнения тренда
месяц |
t |
Курс доллара, руб. y |
Y |
t2 |
Yt |
|||||
Январь |
1 |
59,6 |
4,09 |
1 |
4,09 |
58,62 |
0,97 |
1,59 |
0,02 |
|
Февраль |
2 |
58,5 |
4,07 |
4 |
8,14 |
59,26 |
0,58 |
0,03 |
0,01 |
|
Март |
3 |
58 |
4,06 |
9 |
12,18 |
59,92 |
3,68 |
0,11 |
0,03 |
|
Апрель |
4 |
56,4 |
4,03 |
16 |
16,13 |
60,58 |
17,49 |
3,75 |
0,07 |
|
Май |
5 |
57 |
4,04 |
25 |
20,22 |
61,25 |
18,08 |
1,79 |
0,07 |
|
Июнь |
6 |
57,9 |
4,06 |
36 |
24,35 |
61,93 |
16,24 |
0,19 |
0,07 |
|
Июль |
7 |
59,7 |
4,09 |
49 |
28,63 |
62,61 |
8,50 |
1,86 |
0,05 |
|
Август |
8 |
59,6 |
4,09 |
64 |
32,70 |
63,31 |
13,74 |
1,59 |
0,06 |
|
Итого |
36 |
466,7 |
32,53 |
204 |
146,43 |
487,48 |
79,29 |
10,92 |
0,39 |
Отсюда уравнение линейного тренда принимает окончательный вид:
Качество модели определим с помощью средней ошибки аппроксимации:
В среднем, расчетные значения отклоняются от фактических на 4,88%. Поскольку ошибка меньше 5%, то данное уравнение качественно описывает тенденцию курса доллара.
Построим уравнение нелинейного тренда курса доллара, которое имеет вид:
Введем замену
Таблица 3.4.4 - Данные для расчета уравнения тренда
месяц |
t |
Курс доллара, руб y |
Y |
X |
X2 |
||||||
Январь |
1 |
59,6 |
0,02 |
1,00 |
1,00 |
0,02 |
59,21 |
0,15 |
1,59 |
0,01 |
|
Февраль |
2 |
58,5 |
0,02 |
0,50 |
0,25 |
0,01 |
60,57 |
4,28 |
0,03 |
0,04 |
|
Март |
3 |
58 |
0,02 |
0,33 |
0,11 |
0,01 |
62,00 |
15,97 |
0,11 |
0,07 |
|
Апрель |
4 |
56,4 |
0,02 |
0,25 |
0,06 |
0,00 |
63,49 |
50,30 |
3,75 |
0,13 |
|
Май |
5 |
57 |
0,02 |
0,20 |
0,04 |
0,00 |
65,06 |
64,99 |
1,79 |
0,14 |
|
Июнь |
6 |
57,9 |
0,02 |
0,17 |
0,03 |
0,00 |
66,71 |
77,64 |
0,19 |
0,15 |
|
Июль |
7 |
59,7 |
0,02 |
0,14 |
0,02 |
0,00 |
68,45 |
76,50 |
1,86 |
0,15 |
|
Август |
8 |
59,6 |
0,02 |
0,13 |
0,02 |
0,00 |
70,27 |
113,94 |
1,59 |
0,18 |
|
Итого |
36 |
466,7 |
0,14 |
2,72 |
1,53 |
0,05 |
515,76 |
403,77 |
10,92 |
0,86 |
Отсюда уравнение линейного тренда принимает окончательный вид:
Качество модели определим с помощью средней ошибки аппроксимации:
В среднем, расчетные значения отклоняются от фактических на 10,75%. Поскольку ошибка выше 10%, то данное уравнение некачественно описывает тенденцию курса доллара.
По величине средней ошибки наиболее качественно описывает зависимость линейная модель, используем ее для построения прогноза курса доллара на декабрь 2017 года:
Курс доллара в декабре 2017 года по прогнозу составит 58,9 рублей
Задача 3.5. По статистическим данным таблицы 3.3 определить средние величины, структурные средние и показатели вариации. Построить линейную модель связи показателя со временем и оценить ее качество.
Таблица 3.5 - Курсы иностранных валют по отношению к российскому рублю (на конец года; рублей за единицу иностранной валюты)
Страна |
Наименование валюты |
2010 |
2011 |
2012 |
2013 |
2014 |
2015 |
|
Италия |
евро |
40,33 |
41,67 |
40,23 |
44,97 |
68,34 |
79,70 |
Решение:
Поскольку данные представлены на конец каждого года, то средний курс определим по формуле средней хронологической простой:
- количество лет
В данном примере мода отсутствует, поскольку каждое значение встречается всего один раз.
Расставим ряд данных по возрастанию: 40,23; 40,33; 41,67; 44,97; 68,34; 79,70.
Медиана равна:
Рассчитаем дисперсию по формуле:
Среднеквадратическое отклонение равно:
Коэффициент вариации рассчитаем по формуле:
Таким образом, среднегодовой курс евро составил 51,05 руб. Дисперсия составила 398,25. Медиана показывает, что курс половины лет не превышал 43,32 руб., а другой половины - не менее 43,32. Коэффициент вариации, равный 39,1%, так как он больше 33,3%, то указывает на однородность совокупности.
Построим уравнение линейного тренда коэффициента рождаемости, которое имеет вид:
Таблица 3.5.1 - Данные для расчета линейного уравнения тренда
Год |
t |
Курс евро, руб, y |
||||||||
2000 |
1 |
40,33 |
-2,5 |
6,25 |
-12,21 |
30,53 |
32,43 |
7,9 |
19,6 |
|
2001 |
2 |
41,67 |
-1,5 |
2,25 |
-10,87 |
16,3 |
40,48 |
1,19 |
2,86 |
|
2002 |
3 |
40,23 |
-0,5 |
0,25 |
-12,31 |
6,16 |
48,53 |
-8,3 |
20,6 |
|
2003 |
4 |
44,97 |
0,5 |
0,25 |
-7,57 |
-3,79 |
56,58 |
-11,61 |
25,8 |
|
2004 |
5 |
68,34 |
1,5 |
2,25 |
15,8... |
Подобные документы
Сводка и группировка материалов статистического наблюдения. Абсолютные, относительные и средние величины, показатели вариации. Ряды динамики, индексный анализ. Проведение корреляционно-регрессионного анализа таблиц о сборе урожая и внесении удобрений.
курсовая работа [667,1 K], добавлен 14.05.2013Основные черты, задачи и предпосылки применения корреляционно-регрессионного метода. Методы корреляционного и регрессионного анализа. Коэффициент ранговой корреляции Кендалла, Спирмена, Фехнера. Определение тесноты взаимосвязи между показателями.
контрольная работа [558,5 K], добавлен 08.04.2013Предмет и метод статистической науки. Методология наблюдения, статистическая сводка, группировка, таблицы и графики, показатели и средние величины. Показатели вариации, выборочное наблюдение. Корреляционно-регрессионный анализ. Экономические индексы.
лекция [1,2 M], добавлен 02.01.2014Сущность и разновидности средних величин в статистике. Определение и особенности однородной статистической совокупности. Расчет показателей математической статистики. Что такое мода и медиана. Основные показатели вариации и их значение в статистике.
реферат [162,6 K], добавлен 04.06.2010Виды и применение абсолютных и относительных статистических величин. Сущность средней в статистике, виды и формы средних величин. Формулы и техника расчетов средней арифметической, средней гармонической, структурной средней. Расчет показателей вариации.
лекция [985,6 K], добавлен 13.02.2011Экономико-статистический анализ эффективности продаж облигаций. Сводка и группировка. Средние величины и показатели вариации. Дисперсионный и корреляционно-регрессионный анализ. Ряды динамики. Средняя балансовая прибыль по нескольким предприятиям.
курсовая работа [372,0 K], добавлен 29.04.2013Сущность статистического изучения браков. Система статистических показателей, используемых в изучении браков в Амурской области. Анализ браков с помощью расчета средних величин и показателей вариации. Корреляционно–регрессионный анализ структуры браков.
курсовая работа [895,1 K], добавлен 20.03.2015Корреляционно-регрессионный анализ как объект статистического изучения, система статистических показателей, его характеризующих. Особенности и принципы применения метода корреляционно-регрессионного анализа. Построение статистического ряда распределения.
курсовая работа [453,1 K], добавлен 28.01.2014- Использование корреляционно-регрессионного анализа для обработки экономических статистических данных
Роль корреляцонно-регрессионного анализа в обработке экономических данных. Корреляционно-регрессионный анализ и его возможности. Предпосылки корреляционного и регрессионного анализа. Пакет анализа Microsoft Excel.
курсовая работа [68,4 K], добавлен 11.06.2002 Этапы корреляционно-регрессионного анализа, построение корреляционной модели и определение функции, отражающей механизм связи между факторным и результативным признаками. Измерение тесноты корреляционной связи, расчет индекса корреляции и дисперсии.
лекция [38,1 K], добавлен 13.02.2011Абсолютные и относительные статистические величины. Понятие и принципы применения средних величин и показателей вариации. Правила применения средней арифметической и гармонической взвешенных. Коэффициенты вариации. Определение дисперсии методом моментов.
учебное пособие [276,4 K], добавлен 23.11.2010Организационно-экономическая характеристика ООО Торговый дом "Владимир". Особенности осуществления статистического, корреляционно-регрессионного анализа цен. Оценка динамических рядов объема продаж по показателям коэффициента роста и темпов наращивания.
курсовая работа [370,9 K], добавлен 23.01.2011Статистика денежного обращения, инфляции и цен. Построение сводки и ряда распределения. Характеристика используемых статистических показателей. Расчет средних величин и показателей вариации, ошибок выборки. Корреляционный анализ количественных признаков.
контрольная работа [564,1 K], добавлен 13.09.2012Краткая природно-экономическая характеристика хозяйства. Параметры линейной модели тренда. Расчет величин для определения показателей вариации. Корреляционно-регрессионный анализ связи между продуктивностью коров и себестоимостью одного центнера молока.
курсовая работа [199,9 K], добавлен 17.03.2015Теоретические основы статистического исследования показателей малых предприятий. Анализ и структура данных, средние величины и показатели вариации. Динамика количества малых предприятий РФ. Зависимость инвестиций в регион от числа малых предприятий.
курсовая работа [128,5 K], добавлен 21.12.2010Экстраполяция и прогнозирование, средние показатели в рядах динамики. Корреляционно-регрессионный анализ. Выявление основной тенденции изменения урожайности зерновых. Анализ влияния урожайности зерновых и размера посевной площади на валовой сбор зерна.
курсовая работа [715,8 K], добавлен 28.08.2012Экономическая характеристика хозяйства, анализ урожайности зерна: динамики и вариации урожайности, показателей валового сбора. Порядок проведения факторного и корреляционно-регрессионного анализа себестоимости и урожайности зерновых культур хозяйства.
курсовая работа [364,8 K], добавлен 24.11.2014Понятие абсолютной и относительной величины в статистике. Виды и взаимосвязи относительных величин. Средние величины и общие принципы их применения. Расчет средней через показатели структуры, по результатам группировки. Определение показателей вариации.
лекция [29,1 K], добавлен 25.09.2011Статистическое изучение инвестиционного климата Хабаровского края; влияние социально-экономических процессов на инвестиции. Моделирование и прогнозирование инвестирования в основной капитал на основе корреляционно-регрессионного и кластерного анализа.
курсовая работа [101,5 K], добавлен 24.06.2012Природно-экономическая характеристика СПК "Южно-Подольский". Индексный анализ динамики и анализ показателей вариации трудоемкости зерновых культур и прямых затрат труда на зерновые. Корреляционно-регрессионный анализ урожайности и трудоёмкости зерновых.
курсовая работа [557,0 K], добавлен 13.11.2010