Общая теория статистики
Изучение методики оценки средних величин и методов их вычисления, динамики показателей, их изменения под влиянием различных факторов, измерения величины этого влияния. Ознакомление с применением корреляционного и регрессивного анализа в статистике.
Рубрика | Экономика и экономическая теория |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 22.02.2019 |
Размер файла | 1,0 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ПЕНЗЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ФАКУЛЬТЕТ «ЭКОНОМИКА И УПРАВЛЕНИЕ»
КАФЕДРА «ЭКОНОМИКА И ФИНАНСЫ»
КУРСОВАЯ РАБОТА
по дисциплине:
«Общая теория статистики»
Автор работы: Курамшина Э.Д.
Специальность 38.03.01 финансы и кредит
Группа 16ЭЭ1
Руководитель работы В.Н. Деркаченко
Пенза 2017
Содержание
Введение
1. Средние величины и показатели вариации
2. Корреляционный анализ
3. Регрессионный анализ
Список использованных источников
Введение
корреляционный регрессивный статистика величина
Обработка статистических данных уже давно применяется ы самых различных видах человеческой деятельности. Вообще говоря, сложно назвать сферу, где бы она не использовалась. Но в экономике она играет огромную роль, в отличии от других. Ведь экономика имеет дело с обработкой и анализом огромных массивов информации о социально-экономических явлениях и процессах.
Цель - ознакомление с применением средних величин, показателей вариации, корреляционного и регрессивного анализа в статистике. В данной работе поставлены следующие задачи: изучить методику оценки средних величин и методы их вычисления, динамики показателей, их изменение под влиянием различных факторов, измерения величины этого влияния. Задача выявления факторов, определяющий уровень и динамику какого-либо процесса чаще всего решается методами корреляционного и регрессионного анализа.
1. Средние величины и показатели вариации
Задача 1.1.
По статистическим данным: 11, 13, 10, 12, 15, 11, 16, 11, 18 определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации. Каждое значение увеличить на свой номер классного журнала. Дисперсия до одного знака после запятой; среднеквадратическое - до двух; коэффициент вариации - до одного в процентах.
Решение:
Статистические данные: 11, 13, 10, 12, 15, 11, 16, 11, 18
Средняя арифметическая вычисляется по формуле .
- значения признака
- объем совокупности
Мода или модальный признак - это значение признака, которое наиболее часто встречается в данной совокупности.
Mo = 11
Медиана - это значение признака, который лежит в середине ранжированного ряда и делит этот ряд на два равных части.
№ Mе = = = 5
Me = 15
Дисперсия - представляет собой средний квадрат отклонений индивидуальных значений признака от их средней.
= = = = 6, 7
Средне квадратическое отклонение - представляет собой корень квадратический из дисперсии.
= = 2, 58
Коэффициент вариации - применяется не только для характеристики и оценки вариации, но и для характеристики однородности совокупности.
V = * 100% = * 100% = 20 %
Таким образом, вычисленная нами средняя арифметическая составило 13. Мода показывает размер признака, свойственный значительной части совокупности, который равен 11. Медиана показывает, что половина значений не больше 15, а другая половина - не меньше 15. Дисперсия составила 6, 7. Средне квадратическое отклонение получилось равно 2, 58. Коэффициент вариации 10 % < 20% < 25 %( 33, 3 %) указывает, что колеблемость умеренная.
Задача 1.2.
По данным статистики в отчетном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 29%, стоимость основных фондов увеличилась на 18%. Определить изменение фондоотдачи. Значения дохода и стоимости основных фондов увеличить на свой номер классного журнала.
Индекс дохода от реализации продукции составил:
Индекс стоимости основных фондов составил:
Рассчитаем индекс фондоотдачи по формуле:
Мы видим, что фондоотдача выросла на 9, 3%.
Задача 1.3
Объем оборота (У) и число работников (m) приведены в таблице 1. Определить среднее значение, моду и медиану.
Таблица 1 - Исходные данные
У |
80-100 |
100-120 |
120-140 |
140-160 |
160-180 |
180-200 |
|
m |
6 |
17 |
25 |
28 |
14 |
10 |
Решение:
Составим вспомогательную таблицу 2
Таблица 2 - Расчетные данные
y |
m |
Середина интервала, |
Накопленная частота |
|
80 - 100 |
6 |
90 |
6 |
|
100 - 120 |
17 |
110 |
23 |
|
120 - 140 |
25 |
130 |
48 |
|
140 - 160 |
28 |
150 |
76 |
|
160 - 180 |
14 |
170 |
90 |
|
180 - 200 |
10 |
190 |
100 |
|
Итого |
100 |
- |
- |
Средний оборот одного работника определим по формуле средней арифметической взвешенной:
= = = 141, 4
Мода - это величина, которой соответствует наибольшая частота или часто встречающаяся случайная величина.
Мода в интервальном ряду рассчитывается по формуле:
где - нижняя граница модального интервала;
- частоты соответственно, модального интервала, интервала предшествующего модальному, и интервала, последующего за модальным.
- ширина интервала
Берем интервал (140 - 160), так как на этот интервал приходится наибольшая частота, равная 28.
Таким образом, наиболее вероятный объем оборота каждого работника составляет 143, 53 ден. ед.
Медиана - это значение, которое делит ряд на две равные части.. Медиана (Ме) в интервальном ряду определяется по формуле:
где - нижняя граница медианного интервала;
n - объем выводки;
- накопленная частота интервала, предшествующего медианному;
- собственная частота медианного интервала
Медианным является первый интервал, имеющий накопленную частоту, превышающую половине объема выборки. В заданном распределении - это интервал (140 - 160) с накопленной частотой 76.
Таким образом, объем оборота половины работников не превышает 141, 43 ден. ед., а другой половины - не менее 141, 43 ден. ед.
Задача 1.4.
По данным таблицы определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации. В таблице: Х-объем оборота предприятий, млн. руб., mг - число государственных предприятий; mч - частных; mо - общее число (таблица 2). Каждое значение Хi увеличить на свой номер классного журнала.
Решение:
Составим расчетную таблицу 3
Таблица 3 - Расчетные данные
Хi |
Середина интервала, Хi |
mгi |
mчi |
moi |
|
9, 0-9, 2 |
9, 1 |
- |
3 |
3 |
|
9, 2-9, 4 |
9, 3 |
- |
4 |
4 |
|
9, 4-9, 6 |
9, 5 |
- |
17 |
17 |
|
9, 6-9, 8 |
9, 7 |
11 |
15 |
26 |
|
9, 8-10, 0 |
9, 9 |
13 |
6 |
19 |
|
100-10, 2 |
10, 1 |
18 |
5 |
23 |
|
10, 2-10, 4 |
10, 3 |
6 |
- |
6 |
|
10, 4-10, 6 |
10, 5 |
2 |
- |
2 |
|
Итого |
- |
50 |
50 |
100 |
Рассчитаем среднее значение и среднюю дисперсию для каждой группы.
Государственные предприятия:
=
+ = 0, 0468
Частные предприятия:
= = 0, 0636
Рассчитаем среднюю из внутригрупповых дисперсий:
Рассчитаем общий средний оборот:
Найдем межгрупповую дисперсию:
Общая дисперсия равна:
Правило сложения дисперсий:
Определим коэффициент детерминации:
Коэффициент детерминации показывает, что на 39% вариация оборота предприятия обусловлена формой собственности предприятия.
Задача 1.5.
Определить среднюю внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из трех групп (таблица 3).
Таблица 4 - Исходные данные
1 - группа |
||||
Хi |
1 |
2 |
8 |
|
mi |
30 |
15 |
5 |
|
2 - группа |
||||
Хi |
1 |
6 |
||
mi |
10 |
15 |
||
3 - группа |
||||
Хi |
3 |
8 |
||
mi |
20 |
5 |
Решение:
Найдем среднее значение и дисперсию по каждой группе:
=4, 2
Рассчитаем среднюю из внутригрупповых дисперсий:
Рассчитаем общее среднее и общую дисперсию.
Определим межгрупповую дисперсию:
Общая дисперсия равна:
Правило сложения дисперсий:
2. Корреляционный анализ
Задача 2. 1.
Определить коэффициент корреляции между У и Х.
Х: 3, 5; 4, 6; 5, 8; 4, 2; 5, 2;
УХ:28, 35; 43, 24; 65, 54; 28, 98; 50, 44.
Оценить значимость коэффициента корреляции при уровне 0, 05. Расчеты и ответы до двух знаков. Вначале определить У, а затем У и Х увеличить на свой номер классного журнала. Результаты:
1) коэффициент корреляции;
2) расчетное и табличное значения критерия Стьюдента и вывод.
Решение:
Рассчитаем значения Y, как отношение YX к X:
Таблица 5 - Отношение YX к X
Х: |
3, 5 |
4, 6 |
5, 8 |
4, 2 |
5, 2 |
|
УХ: |
28, 35 |
43, 24 |
65, 54 |
29, 98 |
50, 44 |
|
У: |
8, 1 |
9, 4 |
11, 3 |
7, 1 |
9, 7 |
Таблица 6 - Данные с учетом номера по журналу
Х: |
11, 5 |
12, 6 |
13, 8 |
12, 2 |
13, 2 |
|
У: |
16, 1 |
17, 4 |
19, 3 |
15, 1 |
17, 7 |
Таблица 7 - Для расчета коэффициента корреляции
№ п/п |
||||||
1 |
11, 5 |
16, 1 |
1, 35 |
1, 04 |
185, 15 |
|
2 |
12, 6 |
17, 4 |
0, 01 |
0, 08 |
219, 24 |
|
3 |
13, 8 |
19, 3 |
1, 29 |
4, 75 |
266, 34 |
|
4 |
12, 2 |
15, 1 |
0, 21 |
4, 08 |
184, 22 |
|
5 |
13, 2 |
17, 7 |
0, 29 |
0, 34 |
233, 64 |
|
Итого |
63, 3 |
85, 6 |
3, 15 |
10, 29 |
1088, 59 |
Рассчитаем необходимые показатели:
Рассчитаем коэффициент корреляции по формуле:
Величина коэффициента корреляции указывает на сильную тесноту связи между показателями X и Y, а его положительное значение характеризует зависимость показателей, т.е. при увеличении значения первого объекта, это приводит к увеличению второго объекта.
Определим расчетное значение критерия Стьюдента:
Табличное значение t-критерия для числа степеней свободы и уровня значимости составляет .
Поскольку , то можно сказать о несущественности связи на уровне значимости 0, 05, коэффициент корреляции статистически не значим.
Задача 2.2.
Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость.
Исходные данные:
х 18 22 13 20 15 14
у 17 20 11 18 14 10
Это нулевой вариант. Каждое значение х и у увеличить на свой номер классного журнала.
Результаты:
1.Коэффициент корреляции.
2.Расчетное и табличное значения критерия Стьюдента, вывод о значимости. ВСЕ РЕЗУЛЬТАТЫ до 2-х знаков после запятой.
Решение:
Таблица 8 - Для расчета коэффициента корреляции
№ п/п |
Стоимость изготовления, |
Количество деталей, |
||||
1 |
26 |
25 |
676 |
625 |
650 |
|
2 |
30 |
28 |
900 |
784 |
840 |
|
3 |
21 |
19 |
441 |
361 |
399 |
|
4 |
18 |
26 |
784 |
676 |
728 |
|
5 |
23 |
22 |
529 |
484 |
506 |
|
6 |
22 |
18 |
484 |
324 |
396 |
|
Итого |
150 |
138 |
3814 |
3254 |
3519 |
Рассчитаем показатели, которые нам понадобятся:
Рассчитаем коэффициент корреляции по формуле:
Величина коэффициента корреляции указывает на очень высокую тесноту связи между стоимостью изготовления деталей и их количеством, а его положительное значение характеризует прямую функциональную зависимость величин, т.е. при увеличении значения первого объекта, это приводит к увеличению второго объекта.
Определим расчетное значение критерия Стьюдента:
Табличное значение t-критерия для числа степеней свободы и уровня значимости составляет .
Поскольку , то различия между выборкой и известной величиной признаются статистически значимыми.
Задача 2.3.
В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистики по сто балльной системе:
Теория вероятностей: 65 90 42 47 84 58 50
Статистика: 51 85 36 63 72 80 40.
Определить коэффициент ранговой корреляции Спирмена и его значимость. Это нулевой вариант. Каждое значение (балл) увеличить на свой номер классного журнала. Расчеты и результат до двух знаков.
Результаты:
1.Коэффициент ранговой корреляции.
2.Расчетное и табличное значения критерия Стьюдента при уровне значимости равным 0, 05 и выводы.
Решение:
Коэффициент Спирмена рассчитывается по формуле:
где- разность между i-ми парами рангов;
n- число ранжируемых значений переменной, т.е. сопоставляемых пар рангов. Для расчета составим вспомогательную таблицу
Таблица 9 - Вспомогательная для расчетов
№, п/п |
Баллы по ТВ |
Баллы по Статистике |
) |
||||
1 |
73 |
59 |
5 |
3 |
2 |
4 |
|
2 |
98 |
93 |
7 |
7 |
0 |
0 |
|
3 |
50 |
44 |
1 |
1 |
0 |
0 |
|
4 |
55 |
71 |
2 |
4 |
-2 |
4 |
|
5 |
92 |
80 |
6 |
5 |
1 |
1 |
|
6 |
66 |
88 |
4 |
6 |
-2 |
4 |
|
7 |
58 |
48 |
3 |
2 |
1 |
1 |
|
? |
14 |
- ранги студентов по количеству набранных баллов по теории вероятностей и статистике соответственно
Величина коэффициента Спирмена указывает на высокую тесноту связи между баллами, набранными по теории вероятностей и по статистике, а его положительное значение характеризует прямую зависимость, т.е. с ростом одного показателя увеличивается и второй.
Значимость коэффициента ранговой корреляции определим с помощью критерия Стьюдента:
Табличное значение t-критерия для числа степеней свободы и уровня значимости составляет .
Поскольку , то коэффициент ранговой корреляции Спирмена статистически значим.
3. Регрессионный анализ
Задача 3.1.
Построить нелинейную обратную модель связи себестоимости единицы продукции (у) со стоимостью основных фондов (х). Определить характеристики модели.
Каждое значение (у) увеличить на свой номер классного журнала.
Исходные данные:
у: 21; 16; 15; 14; 13; 12, 5; 11; 11, 5; 10; 8
х: 1; 2; 3; 4; 5; 6; 7; 8; 9; 10
Характеристики модели: 1) модель (коэффициенты до 4-х знаков);
2) индекс детерминации (до 2-х знаков);
3) стандартную ошибку (до 4-х знаков);
4) расчетное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели;
5) вывод о значимости коэффициентов модели;
6) доверительные интервалы коэффициентов модели (до 4-х знаков).
Решение:
Уравнение обратной модели имеет вид:
Произведем линеаризацию модели путем замены . В результате получим линейное уравнение .
Таблица 10
№ |
y |
x |
X |
yX |
|||||
1 |
29 |
1 |
1 |
29 |
1, 00 |
29, 81 |
0, 66 |
60, 84 |
|
2 |
24 |
2 |
0, 5 |
12 |
0, 25 |
23, 72 |
0, 08 |
7, 84 |
|
3 |
23 |
3 |
0, 33 |
7, 59 |
0, 11 |
21, 69 |
1, 72 |
3, 24 |
|
4 |
22 |
4 |
0, 25 |
5, 5 |
0, 06 |
20, 68 |
1, 74 |
0, 64 |
|
5 |
21 |
5 |
0, 2 |
4, 2 |
0, 04 |
20, 07 |
0, 86 |
0, 04 |
|
6 |
20, 5 |
6 |
0, 17 |
3, 48 |
0, 03 |
19, 66 |
0, 7 |
0, 49 |
|
7 |
19 |
7 |
0, 14 |
2, 66 |
0, 02 |
19, 37 |
0, 14 |
4, 84 |
|
8 |
19, 5 |
8 |
0, 13 |
2, 53 |
0, 02 |
19, 15 |
0, 12 |
2, 89 |
|
9 |
18 |
9 |
0, 11 |
1, 98 |
0, 01 |
18, 98 |
0, 96 |
10, 24 |
|
10 |
16 |
10 |
0, 1 |
1, 6 |
0, 01 |
18, 85 |
8, 12 |
27, 04 |
|
Итого |
212 |
55 |
2, 93 |
70, 54 |
1, 55 |
211, 98 |
15, 1 |
118, 1 |
|
Среднее |
21, 2 |
5, 5 |
0, 293 |
7, 054 |
0, 155 |
21, 198 |
1, 51 |
11, 81 |
Получим следующее уравнение обратной модели:
Найдем индекс детерминации:
Уравнением регрессии объясняется 87 % дисперсии результативного признака, а на долю прочих приходится 13 % ее дисперсии.
Найдем стандартную ошибку в модели:
Найдем F-критерий Фишера:
По таблице Фишера определим критическое значение F-критерия при уровне значимости и числе степеней свободы . .
Мы видим, что значение критерия больше табличного , следовательно, уравнение регрессии признается статистически значимой с вероятностью 0, 95.
Оценку статистической значимости параметров регрессии и корреляции проведем с помощь t - статистики Стьюдента и путем расчета доверительного интервала каждого из параметров.
Табличное значение t-критерия для числа степеней свободы и уровня значимости составляет .
Рассчитаем остаточную дисперсию:
Определим стандартные ошибки:
Тогда:
Фактические значения t - статистики для параметров , превышают табличные:
поэтому параметры и b статистически значимы.
Рассчитаем доверительные интервалы для параметров регрессии a и b. Определим предельную ошибку для каждого показателя:
Доверительные интервалы:
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью p=1-0, 05=0, 95% параметры и будут находиться в указанных границах. Так как точка ноль лежит внутри доверительного интервала, то интервальная оценка коэффициентастатистически не значима, для коэффициента статистически значима.
Задача 3.2.
Построить полулогарифмическую модель вида: y=+lnx по данным:
у 10; 13, 4; 15, 4; 16, 5; 18, 6; 19, 1
х 1; 2; 3; 4; 5; 6.
Определить характеристики модели.
Каждое значение (у) увеличить на свой номер классного журнала.
Характеристики модели: 1) модель (коэффициенты до 2-х знаков);
2) индекс детерминации (до 2-х знаков);
3) стандартную ошибку (до 4-х знаков);
4) расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели.
Решение:
Построим уравнение полулогарифмической модели:
Произведем линеаризацию модели путем замены . В результате получим линейное уравнение .
Таблица 11
№ |
y |
x |
X |
yX |
|||||
1 |
18 |
1 |
0 |
0 |
0 |
17, 78 |
0, 04 |
30, 25 |
|
2 |
21, 4 |
2 |
0, 7 |
14, 98 |
0, 49 |
21, 42 |
0, 0004 |
4, 41 |
|
3 |
23, 4 |
3 |
1, 1 |
25, 74 |
1, 21 |
23, 5 |
0, 01 |
0, 01 |
|
4 |
24, 5 |
4 |
1, 4 |
34, 3 |
1, 96 |
25, 06 |
0, 31 |
1 |
|
5 |
26, 6 |
5 |
1, 6 |
42, 56 |
2, 56 |
26, 1 |
0, 25 |
9, 61 |
|
6 |
27, 1 |
6 |
1, 8 |
48, 78 |
3, 24 |
27, 14 |
0, 002 |
12, 96 |
|
Итого |
141 |
21 |
6, 6 |
166, 36 |
9, 46 |
141 |
0, 61 |
58, 24 |
|
Среднее |
23, 5 |
3, 5 |
1, 1 |
27, 73 |
1, 57 |
23, 5 |
0, 1 |
9, 71 |
Получим следующее уравнение обратной модели:
Рассчитаем индекс детерминации:
Значение коэффициента детерминации указывает на то, что вариация Y на 99% обусловлена вариацией показателя X и на 1% - влиянием прочих факторов, не учтенных в модели.
Рассчитаем стандартную ошибку по формуле:
Проведем оценку значимости уравнения регрессии с помощью F-критерия Фишера:
По таблице Фишера определим критическое значение F-критерия при уровне значимости и числе степеней свободы . .
Так как наблюдаемое значение критерия больше табличного , то гипотеза о случайной природу оцениваемых характеристик отклоняется и признается их значимость и надежность, с вероятностью 0, 95 уравнение регрессии признается статистически значимым.
Задача 3.3.
Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 12
Таблица 12 - Динамика коэффициента рождаемости в Пензенской области
Год |
2000 |
2001 |
2002 |
2003 |
2004 |
2005 |
|
Коэффициент рождаемости |
7, 5 |
7, 5 |
8, 0 |
8, 4 |
8, 6 |
8, 4 |
|
Год |
2006 |
2007 |
2008 |
2009 |
2010 |
2011 |
|
Коэффициент рождаемости |
8, 6 |
9, 7 |
10, 2 |
10, 3 |
10, 2 |
10, 1 |
|
Год |
2012 |
2013 |
2014 |
2015 |
2016 |
||
Коэффициент рождаемости |
10, 8 |
10, 6 |
10, 8 |
10, 7 |
10, 2 |
Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г. В электронную таблицу вместо года ставить 1, 2, …
Решение:
Построим уравнение линейного тренда коэффициента рождаемости, которое имеет вид:
где и найдем из системынормальных уравнений.
Таблица 13 - Данные для расчета линейного уравнения тренда
Год |
t |
Коэффициент рождаемости, |
t2 |
||||||
2000 |
1 |
7, 5 |
1 |
7, 5 |
7, 7 |
0, 04 |
3, 79 |
0, 03 |
|
2001 |
2 |
7, 5 |
4 |
15 |
7, 9 |
0, 17 |
3, 79 |
0, 05 |
|
2002 |
3 |
8 |
9 |
24 |
8, 1 |
0, 02 |
2, 09 |
0, 02 |
|
2003 |
4 |
8, 4 |
16 |
33, 6 |
8, 3 |
0, 00 |
1, 10 |
0, 01 |
|
2004 |
5 |
8, 6 |
25 |
43 |
8, 6 |
0, 00 |
0, 72 |
0, 00 |
|
2005 |
6 |
8, 4 |
36 |
50, 4 |
8, 8 |
0, 15 |
1, 10 |
0, 05 |
|
2006 |
7 |
8, 6 |
49 |
60, 2 |
9, 0 |
0, 16 |
0, 72 |
0, 05 |
|
2007 |
8 |
9, 7 |
64 |
77, 6 |
9, 2 |
0, 23 |
0, 06 |
0, 05 |
|
2008 |
9 |
10, 2 |
81 |
91, 8 |
9, 4 |
0, 57 |
0, 57 |
0, 07 |
|
2009 |
10 |
10, 3 |
100 |
103 |
9, 7 |
0, 41 |
0, 73 |
0, 06 |
|
2010 |
11 |
10, 2 |
121 |
112, 2 |
9, 9 |
0, 10 |
0, 57 |
0, 03 |
|
2011 |
12 |
10, 1 |
144 |
121, 2 |
10, 1 |
0, 00 |
0, 43 |
0, 00 |
|
2012 |
13 |
10, 8 |
169 |
140, 4 |
10, 3 |
0, 23 |
1, 83 |
0, 04 |
|
2013 |
14 |
10, 6 |
196 |
148, 4 |
10, 5 |
0, 00 |
1, 33 |
0, 01 |
|
2014 |
15 |
10, 8 |
225 |
162 |
10, 8 |
0, 00 |
1, 83 |
0, 00 |
|
2015 |
16 |
10, 7 |
256 |
171, 2 |
11, 0 |
0, 08 |
1, 57 |
0, 03 |
|
2016 |
17 |
10, 2 |
289 |
173, 4 |
11, 2 |
0, 99 |
0, 57 |
0, 10 |
|
Итого |
153 |
160, 6 |
1785 |
1534, 9 |
160, 5 |
3, 15 |
22, 78 |
0, 59 |
Отсюда уравнение линейного тренда принимает окончательный вид:
Положительное значение коэффициента при t указывает на то, что имеется тенденцию роста, причем величина роста ежегодно составляет в среднем 0, 219 единиц.
Рассчитаем коэффициент детерминации по формуле:
Таким образом на 86% вариация коэффициента рождаемости обусловлена зависимостью от времени, на 13, 8% - влиянием прочих факторов, не включенных в данную модель.
Стандартную ошибку рассчитаем по формуле:
Коэффициент аппроксимации определили по формуле:
Качество модели определим с помощью средней ошибки аппроксимации:
Допустимый предел значений - не более 10 %, это говорит о том, что уравнение регрессии точно аппроксимирует исходную зависимость.
В среднем, расчетные значения отклоняются от фактических на 3, 5%. Поскольку ошибка меньше 7%, то данное уравнение качественно описывает тенденцию изменения коэффициент рождаемости.
Оценим статистическую значимость уравнения регрессии в целом с помощью F-критерия Фишера. Фактическое значение F-критерия рассчитаем по формуле:
При уровне значимости и степенях свободы табличное значение критерия составляет . Так как , то гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их значимость и надежность и уравнение регрессии признается статистически значимым.
По уравнению тренда найдем прогноз величины коэффициента рождаемости на 2017 год:
Задача 3.4.
Реальные статистические данные о курсе валют приведены в таблице 3.2. Построить линейную и нелинейные регрессионные модели вида: у = ао + а1t; lnу = ао + а1t; у = 1/(ао + а1t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. В электронную таблицу вместо года записывать 1, 2, … По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.
Таблица 14 - Курс рубля к доллару
Месяц и год |
январь 2017 |
февраль |
март |
апрель |
май |
июнь |
июль |
август 2017 |
|
Цена одного доллара |
59, 6 |
58, 5 |
58, 0 |
56, 4 |
57, 0 |
57, 9 |
59, 7 |
59, 6 |
Решение:
Построим уравнение линейного тренда курса доллара, которое имеет вид:
где и найдем из системынормальных уравнений.
Таблица 15 - Данные для расчета линейного уравнения тренда
месяц |
t |
Курс доллара, руб. |
t2 |
||||||
Январь |
1 |
59, 6 |
1 |
59, 6 |
58, 075 |
2, 33 |
1, 59 |
0, 03 |
|
Февраль |
2 |
58, 5 |
4 |
117 |
58, 15 |
0, 12 |
0, 03 |
0, 01 |
|
Март |
3 |
58 |
9 |
174 |
58, 225 |
0, 05 |
0, 11 |
0, 00 |
|
Апрель |
4 |
56, 4 |
16 |
225, 6 |
58, 3 |
3, 61 |
3, 75 |
0, 03 |
|
Май |
5 |
57 |
25 |
285 |
58, 375 |
1, 89 |
1, 79 |
0, 02 |
|
Июнь |
6 |
57, 9 |
36 |
347, 4 |
58, 45 |
0, 30 |
0, 19 |
0, 01 |
|
Июль |
7 |
59, 7 |
49 |
417, 9 |
58, 525 |
1, 38 |
1, 86 |
0, 02 |
|
Август |
8 |
59, 6 |
64 |
476, 8 |
58, 6 |
1, 00 |
1, 59 |
0, 02 |
|
Итого |
36 |
466, 7 |
204 |
2103, 3 |
466, 7 |
10, 68 |
10, 92 |
0, 14 |
Отсюда уравнение линейного тренда принимает окончательный вид:
Положительное значение коэффициента при t указывает на то, что имеется тенденцию роста курса доллара, причем величина прироста ежегодно составляет в среднем 0, 075 руб.
Рассчитаем коэффициент детерминации по формуле:
Таким образом на 2% вариация курса доллара обусловлена зависимостью от времени, на 98% - влиянием прочих факторов, не включенных в данную модель.
Стандартную ошибку рассчитаем по формуле:
Коэффициент аппроксимации определили по формуле:
Качество модели определим с помощью средней ошибки аппроксимации:
Допустимый предел значений - не более 10 %, это говорит о том, что уравнение регрессии точно аппроксимирует исходную зависимость.
В среднем, расчетные значения отклоняются от фактических на 1, 75%. Поскольку ошибка меньше 7%, то данное уравнение качественно описывает тенденцию курса доллара.
Оценим статистическую значимость уравнения регрессии в целом с помощью F-критерия Фишера. Фактическое значение F-критерия рассчитаем по формуле:
При уровне значимости и степенях свободы табличное значение критерия составляет . Так как , то нет основания отклонять нулевую гипотезу.
Построим уравнение нелинейного тренда курса доллара, которое имеет вид:
Введем замену
Таблица 16- Данные для расчета уравнения тренда
месяц |
t |
Курс доллара, руб. |
t2 |
|||||||
Январь |
1 |
59, 6 |
4, 09 |
1 |
4, 09 |
58, 62 |
0, 97 |
1, 59 |
0, 02 |
|
Февраль |
2 |
58, 5 |
4, 07 |
4 |
8, 14 |
59, 26 |
0, 58 |
0, 03 |
0, 01 |
|
Март |
3 |
58 |
4, 06 |
9 |
12, 18 |
59, 92 |
3, 68 |
0, 11 |
0, 03 |
|
Апрель |
4 |
56, 4 |
4, 03 |
16 |
16, 13 |
60, 58 |
17, 49 |
3, 75 |
0, 07 |
|
Май |
5 |
57 |
4, 04 |
25 |
20, 22 |
61, 25 |
18, 08 |
1, 79 |
0, 07 |
|
Июнь |
6 |
57, 9 |
4, 06 |
36 |
24, 35 |
61, 93 |
16, 24 |
0, 19 |
0, 07 |
|
Июль |
7 |
59, 7 |
4, 09 |
49 |
28, 63 |
62, 61 |
8, 50 |
1, 86 |
0, 05 |
|
Август |
8 |
59, 6 |
4, 09 |
64 |
32, 70 |
63, 31 |
13, 74 |
1, 59 |
0, 06 |
|
Итого |
36 |
466, 7 |
32, 53 |
204 |
146, 43 |
487, 48 |
79, 29 |
10, 92 |
0, 39 |
Отсюда уравнение линейного тренда принимает окончательный вид:
Коэффициент аппроксимации определили по формуле:
Качество модели определим с помощью средней ошибки аппроксимации:
Допустимый предел значений - не более 10 %, это говорит о том, что уравнение регрессии точно аппроксимирует исходную зависимость.
В среднем, расчетные значения отклоняются от фактических на 4, 88%. Поскольку ошибка меньше 7 %, то данное уравнение качественно описывает тенденцию курса доллара.
Построим уравнение нелинейного тренда курса доллара, которое имеет вид:
Введем замену
Таблица 17 - Данные для расчета уравнения тренда
месяц |
t |
Курс доллара, руб. |
X |
X2 |
|||||||
Январь |
1 |
59, 6 |
0, 02 |
1, 00 |
1, 00 |
0, 02 |
59, 21 |
0, 15 |
1, 59 |
0, 01 |
|
Февраль |
2 |
58, 5 |
0, 02 |
0, 50 |
0, 25 |
0, 01 |
60, 57 |
4, 28 |
0, 03 |
0, 04 |
|
Март |
3 |
58 |
0, 02 |
0, 33 |
0, 11 |
0, 01 |
62, 00 |
15, 97 |
0, 11 |
0, 07 |
|
Апрель |
4 |
56, 4 |
0, 02 |
0, 25 |
0, 06 |
0, 00 |
63, 49 |
50, 30 |
3, 75 |
0, 13 |
|
Май |
5 |
57 |
0, 02 |
0, 20 |
0, 04 |
0, 00 |
65, 06 |
64, 99 |
1, 79 |
0, 14 |
|
Июнь |
6 |
57, 9 |
0, 02 |
0, 17 |
0, 03 |
0, 00 |
66, 71 |
77, 64 |
0, 19 |
0, 15 |
|
Июль |
7 |
59, 7 |
0, 02 |
0, 14 |
0, 02 |
0, 00 |
68, 45 |
76, 50 |
1, 86 |
0, 15 |
|
Август |
8 |
59, 6 |
0, 02 |
0, 13 |
0, 02 |
0, 00 |
70, 27 |
113, 94 |
1, 59 |
0, 18 |
|
Итого |
36 |
466, 7 |
0, 14 |
2, 72 |
1, 53 |
0, 05 |
515, 76 |
403, 77 |
10, 92 |
0, 86 |
Отсюда уравнение линейного тренда принимает окончательный вид:
Коэффициент аппроксимации определили по формуле:
Качество модели определим с помощью средней ошибки аппроксимации:
В среднем, расчетные значения отклоняются от фактических на10, 75%. Поскольку ошибка выше10%, то данное уравнение некачественно описывает тенденцию курса доллара.
По величине средней ошибки наиболее качественно описывает зависимость линейная модель, используем ее для построения прогноза курса доллара на декабрь 2017 года:
Курс доллара в декабре 2017 года по прогнозу составит 58, 9 рублей.
Задача 3.5.
По статистическим данным таблицы 3.3 определить средние величины, структурные средние и показатели вариации. Построить линейную модель связи показателя со временем и оценить ее качество. Номер страны соответствует номеру студента по классному журналу.
Таблица 18 - Курсы иностранных валют по отношению к российскому рублю
Страна |
Наименование валюты |
2010 |
2011 |
2012 |
2013 |
2014 |
2015 |
|
8.Дания |
датская крона |
5, 41 |
5, 606 |
5, 395 |
6, 031 |
9, 202 |
1, 068 |
Решение:
Поскольку данные представлены на конец каждого года, то средний курс определим по формуле средней хронологической простой:
- количество лет
Мода или модальный признак - это значение признака, которое наиболее часто встречается в данной совокупности. В данном случае мода отсутствует, поскольку каждое значение встречается всего один раз.
Медиана - это значение признака, который лежит в середине ранжированного ряда и делит этот ряд на два равных части. Медиана в четном ряду равна среднему из серединных значений. Ранжируем ряд данных: 1, 068; 5, 395;5, 41; 5, 606; 6, 031; 9, 202. Медиана равна:
Рассчитаем дисперсию по формуле:
Среднее квадратическое отклонение равно:
Коэффициент вариации рассчитаем по формуле:
Таким образом, среднегодовой курс датской кроны составил 5, 89 руб. со средним квадратическим отклонением 1, 38. Дисперсия составила 1, 92. Медиана показывает, что курс половины лет не превышал 5, 5 руб., а другой половины - не менее 5, 5. Коэффициент вариации 10 % < 23% < 25 %( 33, 3 %) указывает, что колеблемость умеренная.
Построим уравнение линейного тренда коэффициента рождаемости, которое имеет вид:
где и найдем из системынормальных уравнений.
Таблица 19 - Данные для расчета линейного уравнения тренда
Год |
t |
Курс датского крона, руб. |
t2 |
||||||
2010 |
1 |
5, 41 |
1 |
5, 41 |
6, 177 |
0, 59 |
0, 23 |
0, 14 |
|
2011 |
2 |
5, 606 |
4 |
11, 212 |
5, 887 |
0, 08 |
0, 08 |
0, 05 |
|
2012 |
3 |
5, 395 |
9 |
16, 185 |
5, 597 |
0, 04 |
0, 24 |
0, 04 |
|
2013 |
4 |
6, 031 |
16 |
24, 124 |
5, 307 |
0, 52 |
0, 02 |
0, 12 |
|
2014 |
5 |
9, 202 |
25 |
46, 01 |
5, 017 |
17, 51 |
10, 97 |
0, 45 |
|
2015 |
6 |
1, 068 |
36 |
6, 408 |
4, 727 |
13, 39 |
23, 25 |
3, 43 |
|
Итого |
21 |
32, 712 |
91 |
109, 349 |
32, 712 |
32, 13 |
34, 79 |
4, 23 |
Отсюда уравнение линейного тренда принимает окончательный вид:
Отрицательное значение коэффициента при t указывает на то, что имеется тенденция снижения, причем величина снижения ежегодно составляет в среднем 0, 29 руб.
Коэффициент аппроксимации определили по формуле:
Качество модели определим с помощью средней ошибки аппроксимации:
В среднем, расчетные значения отклоняются от фактических на 70, 5%. Поскольку ошибка выше10%, то данное уравнение качественно описывает тенденцию курса датского крона.
Рассчитаем коэффициент детерминации по формуле:
Таким образом на 92% вариация курса датского крона обусловлена зависимостью от времени, на 8% - влиянием прочих факторов, не включенных в данную модель.
Оценим статистическую значимость уравнения регрессии в целом с помощью F-критерия Фишера. Фактическое значение F-критерия рассчитаем по формуле:
При уровне значимости и степенях свободы табличное значение критерия составляет . Так как , то уравнение регрессии признается статистически значимым.
Задача 3.6.
По статистическим данным Росстата (таблица 20) выполнить комплексный статистический анализ инвестиций в основной капитал.
Таблица 20 - Инвестиции в основной капитал, млн. руб.
Регионы |
2012 |
2013 |
2014 |
|
Киpовская область |
50545 |
58655 |
56294 |
Этапы:
- графическое представление информации и ее анализ;
- определение средних величин и показателей вариации;
- определение коэффициента корреляции между инвестициями и выбранным автором фактором по данным Росстата; оценка значимости коэффициента корреляции;
- определение показателей динамики инвестиций и их анализ;
- построение регрессионной модели связи инвестиций со временем (годами) и ее статистический анализ.
Решение:
Изобразим динамику инвестиций в основной капитал по Кировской области в 2012 - 2014 гг. графически.
Рис. 1 - динамика инвестиций в основной капитал за период 2012 - 2014 гг.
Как показывает графическое изображение, величина инвестиций в основной капитал в Кировской области в 2013 году возросла по сравнению в 2012 годом, а в 2014 году не много снизилась, в сравнении с 2013 годом, но по сравнению с 2012 годом она возросла.
Рассчитаем средний объем инвестиций по формуле средней арифметической простой:
- количество лет
Рассчитаем дисперсию по формуле:
Среднее квадратическое отклонение равно:
Коэффициент вариации рассчитаем по формуле:
Среднегодовой объем инвестиций в основной капитал за период 2012 - 2014 гг. по Кировской области составил 55164, 67 млн. руб. со среднеквадратическим отклонением 3405, 83 млн. руб. Коэффициент вариации показывает, что динамика объема инвестиций однородна.
По данным Росстата получим величину валового регионального продукта за период 2012 - 2014 гг. в Кировской области.
Таблица 21 - Валовой региональный продукт, млн.руб.
Регион |
2012 |
2013 |
2014 |
|
Кировская область |
208505, 4 |
224152, 3 |
254089, 4 |
Для расчета коэффициента корреляции между величиной ВРП и объемом инвестиций в основной капитал составим таблицу 3.6.
Таблица 22 - Данные для расчета коэффициента корреляции
№ п/п |
ВРП, |
Объем инвестиций, |
||
1 |
208505, 4 |
50545 |
10538905443 |
|
2 |
224152, 3 |
58655 |
13147653156, 5 |
|
3 |
254089, 4 |
56294 |
14303708683, 6 |
|
Итого |
686747, 1 |
165494 |
37990267283, 1 |
Подобные документы
Сущность и разновидности средних величин в статистике. Определение и особенности однородной статистической совокупности. Расчет показателей математической статистики. Что такое мода и медиана. Основные показатели вариации и их значение в статистике.
реферат [162,6 K], добавлен 04.06.2010Группы средних величин: степенные, структурные. Особенности применения средних величин, виды. Рассмотрение основных свойств средней арифметической. Характеристика структурных средних величин. Анализ примеров на основе реальных статистических данных.
курсовая работа [230,6 K], добавлен 24.09.2012Расчет средних показателей при составлении любого экономического отчета. Исследование метода средних величин. Отражение средней величиной того общего, что характерно для всех единиц изучаемой совокупности. Деление средних величин на два класса.
курсовая работа [91,7 K], добавлен 14.12.2008Расчет средних уровней производительности труда и показателей вариации. Понятие моды и медианы признака, построение полигона и оценка характера асимметрии. Методика выравнивания ряда динамики по прямой линии. Индивидуальные и агрегатные индексы объема.
контрольная работа [682,4 K], добавлен 24.09.2012Виды и применение абсолютных и относительных статистических величин. Сущность средней в статистике, виды и формы средних величин. Формулы и техника расчетов средней арифметической, средней гармонической, структурной средней. Расчет показателей вариации.
лекция [985,6 K], добавлен 13.02.2011Понятие статистики как научного направления, предмет и методы ее изучения. Методы организации государственной статистики в РФ и международной практике, требования к данным. Сущность и порядок реализации корреляционно-регрессивного анализа и связей.
учебное пособие [6,2 M], добавлен 07.02.2010Предмет и метод статистики, сводка и группировка, абсолютные и относительные величины. Определение показателей вариации и дисперсии. Понятие о выборочном наблюдении и его задачи. Классификация экономических индексов. Основы корреляционного анализа.
контрольная работа [80,0 K], добавлен 05.06.2012Анализ основных технико-экономических показателей ОАО "Газпром". Изучение сущности средних величин, видов и способов их вычисления. Рассмотрение применения средних величин при анализе хозяйственной деятельности работы ОАО "Газпром" за 2009-2012 гг.
курсовая работа [177,4 K], добавлен 29.10.2015Предмет статистики. Метод статистики. Расчёт показателей вариации. Ряды динамики. Выборочное наблюдение. Для общеэкономических специальностей, статистика является основой для разработки и совершенствования методов экономического анализа.
курсовая работа [134,4 K], добавлен 21.10.2004Формулы определения средних величин интервального ряда - моды, медианы, дисперсии. Расчет аналитических показателей рядов динамики по цепной и базисной схемам, темпов роста и прироста. Понятие сводного индекса себестоимости, цен, затрат и товарооборота.
курсовая работа [218,5 K], добавлен 27.02.2011Предмет и метод статистики. Группировка и ряд распределения. Абсолютные, относительные, средние величины, показатели вариации. Выборочное наблюдение, ряды динамики. Основы корреляционного и регрессионного анализа. Статистика населения и рынка труда.
методичка [2,2 M], добавлен 16.02.2011Определение относительных величин динамики, планового задания и выполнения плана по стоимости товарооборота в различных товарных группах. Относительные величины структуры отчетного и базисного периодов. Проведение расчетов по критерию согласия Пирсона.
контрольная работа [277,4 K], добавлен 13.12.2013Основные закономерности изменения производительности труда и полных издержек производства в динамике. Анализ показателей рядов динамики. Факторный анализ показателей динамики. Проведение корреляционно-регрессивного анализа. Анализ показателей вариации.
курсовая работа [1,3 M], добавлен 15.05.2012Понятие абсолютной и относительной величины в статистике. Виды и взаимосвязи относительных величин. Средние величины и общие принципы их применения. Расчет средней через показатели структуры, по результатам группировки. Определение показателей вариации.
лекция [29,1 K], добавлен 25.09.2011Абсолютная величина как объем или размер изучаемого события. Виды абсолютных величин: абсолютная и суммарная. Группы величин: моментная и интервальная единицы измерения. Виды относительных величин. Виды средних величин: степенные и структурные.
презентация [173,3 K], добавлен 22.03.2012Понятие и сущность цен и инфляции, их значение. Задачи статистики цен. Характеристика системы показателей статистики цен. Принципы и методы регистрации цен. Особенности методов расчета и анализа их индексов. Методы оценки уровня и динамики инфляции.
курсовая работа [70,9 K], добавлен 01.12.2010Предмет и метод статистики, понятие статистического наблюдения: сводка, группировка, абсолютные и относительные величины, ряды динамики, индексы. Корреляционный анализ зависимости урожайности сельскохозяйственных культур от внесения минеральных удобрений.
дипломная работа [798,3 K], добавлен 13.05.2013Схемы решений практических заданий по разделам "Теория статистики" и "Статистика предприятия". Правила и требования к составлению статистических таблиц. Критерии оценки контрольной работы. Относительные величины плановой и фактической динамики.
методичка [417,0 K], добавлен 08.02.2011Изучение сущности, видов, сферы применения средних величин. Характеристика степенных средних величин: средняя арифметическая; средняя гармоническая; средняя геометрическая; средняя квадратическая. Анализ структурных величин: медиана, мода, их расчет.
курсовая работа [157,3 K], добавлен 16.01.2010Обработка данных лесной промышленности: получение распределения случайной величины, проверка гипотезы, проведение дисперсионного, корреляционного и регрессивного анализа. Сущность и содержание, особенности применения теории принятия решений, ее принципы.
контрольная работа [314,2 K], добавлен 12.02.2013