Расчет средних величин и показателей вариации
Сущность, общие понятия и методы статистического расчета средних величин. Исследование системы показателей и информационной базы корреляционно-регрессионного анализа. Исследование инвестиций в основной капитал и индексов промышленного производства.
Рубрика | Экономика и экономическая теория |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 22.02.2019 |
Размер файла | 629,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
ПЕНЗЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ФАКУЛЬТЕТ «ЭКОНОМИКА И УПРАВЛЕНИЕ»
КАФЕДРА «ЭКОНОМИКА И ФИНАНСЫ»
КУРСОВАЯ РАБОТА
по дисциплине: «Общая теория статистики»
Автор работы: Терехина И.С
Руководитель работы В.Н. Деркаченко
Пенза 2017
Введение
Статистика - одна из древнейших отраслей знаний, возникшая на базе хозяйственного учета.
Первые учетные операции проводились еще в глубокой древности. Вначале они были довольно примитивны, нерегулярны и направлены главным образом на получение данных о численности населения, его составе и имущественном положении. Эти данные использовались прежде всего при налогообложении и в военных нуждах.
По мере развития производительных сил в обществе возрастал интерес к различного рода знаниям, расширялся круг учитываемых явлений и собираемых о них сведений; усложнялись сами учетные операции, они стали более регулярными. Постепенно накапливался опыт, появлялись рекомендации о том, каким образом организовать отдельные учетные операции и обработать собранные сведения, чтобы обобщить их и выявить различные закономерности.
Так постепенно сформировалась отрасль знаний, названная впоследствии "статистикой". Ее возникновение связано с потребностями общества в различного рода сведениях, информации, без которых невозможно управлять государством, изучать отдельные явления и процессы, происходящие в различных областях жизни, сферах деятельности.
Есть основания полагать, что термин "статистика" произошло от латинских слов stato (государство) и status (положение вещей, политическое состояние). В середине 18 в. под статистикой подразумевалась совокупность сведений о государстве, о его достопримечательностях. В научный обиход этот термин ввел немецкий ученый Готфрид Ахенваль, представитель описательной школы государствоведения. В 1746 г. он предложил заменить название курса "Государствоведение" на "Статистику", положив тем самым начало развитию статистики как науки и учебной дисциплины.
Статистика изучает, как правило, массовые явления, т.е. такие явления, которые состоят из множества отдельных элементов или фактов.
Однако недостаточно только провести массовое наблюдение, чтобы выявить те или иные закономерности.
Результаты наблюдения подвергают обработке, сводке, что позволяет выделить во всей совокупности различные типы, группы единиц и затем для всей совокупности и отдельных ее частей рассчитать обобщающие показатели (характеристики).
Массовое наблюдение, группировка и сводка его результатов, вычисление и анализ обобщающих показателей - все это вместе составляет специфический метод статистики.
К какой бы области ни относился предмет статистики (население, промышленность, торговля и т.д.), метод ее везде одинаков, т.е. везде используется массовое наблюдение, группировка и обобщающие показатели, в которых, благодаря действию закона больших чисел, взаимопогошается влияние случайных причин и выявляется типичное и закономерное. Иначе говоря, метод статистики обусловлен спецификой ее предмета.
Чтобы пользоваться результатами обобщения или непосредственно исходной информацией, данные должны быть представлены в подходящей форме, компактно и наглядно. С этой целью строятся таблицы и графики.
Данная курсовая работа состоит из трех частей - средние величины и показатели вариации, корреляционный анализ, регрессионный анализ. В каждой из этих частей будет подробно рассмотрена теория, необходимые расчеты, и сделан грамотный, обоснованный вывод.
Целью написания работы является расчет средних величин, показателей вариации, а также проведение корреляционно-регрессионного анализа. Основными задачами исследования в работе являются:
1. Теоретическое обоснование сущности, общих понятий и методов расчета средних величин;
2. Исследование системы показателей и информационной базы корреляционно-регрессионного анализа;
3. Выполнение расчетов.
1. Средние величины и показатели вариации
Средняя величина - это обобщающая характеристика варьирующего признака единиц качественно однородной совокупности.
Средние величины используются в планировании, анализе выполнения планов, расчетах экономической эффективности общественного производства и т.д. Сравнивая изменение средних уровней во времени, статистика тем самым характеризует важнейшие закономерности развития явлений.
Существуют разные виды средних величин. Среднее хронологическое:
Она используется для моментных статистических рядов. Это когда на конкретную дату с различными интервалами показаны значения случайной величины.
Из средних велечин чаще всего используется среднее арифмитическое. Оно бывает двух видов. Среднее арифметическое простое:
где xi - i-тое значение случайной велечины, n -число, вариант. Среднее арифметическое взвешенное:
= ,
где mi - частота.
Бывают другие средние, их можно определить по общей формуле:
где k - степень, определяющая различные средние.
Средняя гармоническая используется тогда, когда неизвестна частота (mi), а известен, к примеру, объем реализации. Она высчитывается по формуле:
гм= ,
где Vi - i-тый объем реализации.
Модой называют то значение признака, которое наиболее часто встречается в данной совокупности.
Для интервальных вариационных рядов мода определяется по формуле:
М0 = хн + i ,
где
Хн - нижняя граница интервала, содержащего моду;
i - ширина интервала;
m2 - частота модального интервала;
m1- частота интервала, предшествующего модальному;
m3 - частота интервала, следующего за модальным.
Медианой называют значение признака, приходящееся на середину ранжированной совокупности. Она определяется по формуле:
Ме = Xн + i ), где
Хн - нижняя граница интервала;
i - ширина интервала;
n - объем выборки (число наблюдений)
- накопленная частота интервала, предшествующего медианному;
mме - частота медианного интервала;
Изменение значений признака в пределах изучаемой совокупности называется вариацией.
Для характеристики величины колебания признака в статистике вычисляют следующие показатели вариации:
· размах вариации;
· среднее линейное отклонение;
· средний квадрат отклонения (дисперсия);
· среднее квадратическое отклонение;
· коэффициент вариации.
Абсолютные и относительные показатели вариации, характеризующие изменчивость значений признака, позволяют оценить степень однородности совокупности, типичности и устойчивости средней.
Размах вариации (R) - наиболее простой измеритель вариации и представляет собой разность между наибольшим и наименьшим значениями признака
R = xmax - xmin,, где
xmax - наибольшее значение признака;
xmin - наименьшее значение признака.
Простое среднее линейное отклонение:
= ,
где - среднее значение показателя.
Взвешенное среднее линейное отклонение: вз =
Среднеквадратическое отклонение:
у = (1.2),
где - дисперсия.
Средний квадрат отклонения, или дисперсия - представляет собой среднюю арифметическую из квадратов отклонений вариант от общей средней.
Бывает нескольких видов: простой, взвешенной и выборочной.
Средняя дисперсия:
уІ(sІ) = .
Она так же может быть рассчитана как:
уІ(sІ) =
Взвешенная дисперсия:
уІвз =.
Она используется, когда данные представлены в виде интервального ряда и вместо xi берется среднее значение интервала и соответственно частота i- ого интервала (mi).
Также, можно выделить среднее квадратическое отклонение:
) =
Взвешенное среднеквадратическое отклонение:
=
Коэффициент вариации является относительным показателем вариации, выражается в %. Он представляет собой отношение среднего квардратического отклонения к средней величине признака:
V = 100%
Он показывает, какую долю среднего значения этой величины составляет её средний разброс. Исчисляется в процентах. Вычисляется только для количественных данных. В отличие от среднего квадратического или стандартного отклонения измеряет не абсолютную, а относительную меру разброса значений признака в статистической совокупности. По мнению автора рассматриваемого коэффициента К. Пирсона -- коэффициент вариации эффективнее абсолютного показателя вариации [1]. Чем больше коэффициент вариации, тем менее однородна совокупность и тем менее типична средняя величина, тем менее она характеризует изучаемое явление.
Задача 1.1
По статистическим данным: 18; 20; 17; 19; 22; 18; 23; 18; 25 определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации. Каждое значение увеличили на свой номер классного журнала. Дисперсия до одного знака после запятой; среднеквадратическое - до двух; коэффициент вариации - до одного в процентах.
Решение
Среднее значение определим по формуле средней арифметической простой: =(18+ 20+ 17+ 19+ 22+ 18+ 23+ 18+ 25)/9=20
Мода - это наиболее часто встречающийся признак в данной совокупности. Число 18 встречается 3 раза. Остальные значения встречаются 1 раз. Мо=18.
Медиана находится посередине ранжированного ряда. Запишем числа в порядке возрастания и определим число, которое находится посередине.
17; 18; 18; 18; 19; 20; 22; 23; 25
Ме=19.
Для несгруппированных данных дисперсия рассчитывается по формуле: =((18-20)2+ (20-20)2+ (17-20)2+ (19-20)2+ (22-20)2+ +(18-20)2+ (23-20)2+ (18-20)2+ (25-20)2)/9=60/9=6,7
среднеквадратическое отклонение
Среднее квадратическое отклонение показывает, на сколько в среднем отклоняются индивидуальные значения признака от среднего значения. Значит, индивидуальные значения отклоняются от среднего значения в среднем на ± 2,59.
Коэффициент вариации
Коэффициент вариации показывает относительное отклонение индивидуальных значений от среднего значения.
Коэффициент вариации менее 33%, значит, группа однородная, средняя величина надежна и типична для данных единиц совокупности.
Задача 1.2
По данным статистики в отчетном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 36%, стоимость основных фондов увеличилась на 25%. Определить изменение фондоотдачи. Значения дохода и стоимости основных фондов увеличили на свой номер классного журнала.
Решение
Фондоотдача = доход от реализации продукции предприятия / стоимость основных фондов
Индекс изменения дохода от реализации продукции предприятия равен 1,36. Индекс изменения стоимости основных фондов равен 1,25.
Индекс изменения фондоотдачи=1,36/1,25=1,088
Фондоотдача увеличилась на 8,8%.
Задача 1.3
Объем оборота (У) и число работников (m) приведены в таблице 1. Определить среднее значение, моду и медиану.
Таблица 1 - Исходные данные
У |
80-100 |
100-120 |
120-140 |
140-160 |
160-180 |
180-200 |
|
m |
6 |
17 |
25 |
28 |
14 |
10 |
Решение
Составим вспомогательную таблицу.
Таблица 1.1- Расчетные значения
У |
m |
уц |
уц m |
Кумулята (сумма накопленных частот) S |
|
80-100 |
6 |
90 |
540 |
6 |
|
100-120 |
17 |
110 |
1870 |
23 |
|
120-140 |
25 |
130 |
3250 |
48 |
|
140-160 |
28 |
150 |
4200 |
76 |
|
160-180 |
14 |
170 |
2380 |
90 |
|
180-200 |
10 |
190 |
1900 |
100 |
|
Сумма |
100 |
14140 |
Центр интервалов рассчитывается по формуле:
уц=, где
унг - нижняя граница интервала,
увг - верхняя граница интервала.
Определим среднее значение.
14140/100=141,40
Мода - это варианта, наиболее часто встречающаяся в ряду.
В интервальном ряду моду вычисляют по формуле:
Модальный интервал равен 140-160, так как он имеет наибольшую частоту.
Определим медиану. Медиана - это значение варианты признака, находящейся в середине упорядоченного ряда.
Значит, медианный интервал равен 140-160.
Задача 1.4
По данным таблицы определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации. В таблице: Х-объем оборота предприятий, млн. руб., mг - число государственных предприятий; mч - частных; mо - общее число (таблица 2). Каждое значение Хi увеличили на свой номер классного журнала.
Таблица 2 - Исходные данные по объему оборота предприятий
Хi |
mгi |
mчi |
moi |
|
16,0-16,2 |
3 |
3 |
||
16,2-16,4 |
4 |
4 |
||
16,4-16,6 |
17 |
17 |
||
16,6-16,8 |
11 |
15 |
26 |
|
16,8-17,0 |
13 |
6 |
19 |
|
17,0-17,2 |
18 |
5 |
23 |
|
17,2-17,4 |
6 |
6 |
||
17,4-17,6 |
2 |
2 |
||
50 |
50 |
100 |
Решение
Составим таблицу.
Таблица 2.2 - Расчетные значения
Хi |
Хi |
mгi |
Хimгi |
|
mчi |
Хimчi |
|
moi |
Хi moi |
||
16,0-16,2 |
16,1 |
3 |
48,3 |
0,836 |
3 |
48,3 |
1,5294 |
||||
16,2-16,4 |
16,3 |
4 |
65,2 |
0,43 |
4 |
65,2 |
1,0568 |
||||
16,4-16,6 |
16,5 |
17 |
280,5 |
0,279 |
17 |
280,5 |
1,6761 |
||||
16,6-16,8 |
16,7 |
11 |
183,7 |
0,99 |
15 |
250,5 |
0,078 |
26 |
434,2 |
0,3379 |
|
16,8-17,0 |
16,9 |
13 |
219,7 |
0,13 |
6 |
101,4 |
0,444 |
19 |
321,1 |
0,1405 |
|
17,0-17,2 |
17,1 |
18 |
307,8 |
0,18 |
5 |
85,5 |
1,114 |
23 |
393,3 |
1,8813 |
|
17,2-17,4 |
17,3 |
6 |
103,8 |
0,54 |
6 |
103,8 |
1,4172 |
||||
17,4-17,6 |
17,5 |
2 |
35 |
0,5 |
2 |
35 |
0,9412 |
||||
Сумма |
50 |
850 |
2,34 |
50 |
831,4 |
3,181 |
100 |
1681,4 |
8,98 |
Определим средние значения по группам по формуле средней арифметической взвешенной.
850/50=17
831,4/50=16,628
Среднее значение в целом:
1681,4/100=16,814
Рассчитаем дисперсии внутри групп:
=
Частная дисперсия в первой группе:
=2,34/50=0,0468
Частная дисперсия во второй группе:
=3,181/50=0,0636
Средняя внутригрупповая дисперсия:
(0,0468*50+0,0636*50)/100=0,0552
Межгрупповая дисперсия
((17-16,814)2*50+(16,628-16,814)2*50)/100=0,0346
Общая дисперсия:
=0,0552+0,0346=0,0898
Тот же результат получаем и по формуле
8,98/100=0,0898
Коэффициент детерминации:
=0,0346/0,0898=0,385 (38,5%)
Задача 1.5
Определить среднюю внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из трех групп (таблица 3).
Таблица 3 - Исходные данные
1 - группа
Хi |
1 |
2 |
8 |
|
mi |
30 |
15 |
5 |
2 - группа
Хi |
1 |
6 |
|
mi |
10 |
15 |
3 - группа
Хi |
3 |
8 |
|
mi |
20 |
5 |
Решение
Определим средние значения по группам по формуле средней арифметической взвешенной.
(1*30+2*15+8*5)/(30+15+5)=100/50=2
(1*10+6*15)/(10+15)=100/25=4
(3*20+8*5)/(20+5)=100/25=4
Среднее значение в целом:
=(2*50+4*25+4*25)/(50+25+25)=300/100=3
Рассчитаем дисперсии внутри групп:
=
Частная дисперсия в первой группе:
=
Частная дисперсия во второй группе:
=
Частная дисперсия в третьей группе:
=
Расчеты приведем в следующих таблицах.
Таблица 3.1 - Расчетная таблица по первой группе
Хi |
mi |
Хimi |
||
1 |
30 |
30 |
30 |
|
2 |
15 |
30 |
0 |
|
8 |
5 |
40 |
180 |
|
Сумма |
50 |
100 |
210 |
Таблица 3.2 - Расчетная таблица по второй группе
Хi |
mi |
Хimi |
||
1 |
10 |
10 |
90 |
|
6 |
15 |
90 |
60 |
|
Сумма |
25 |
100 |
150 |
Таблица 3.3 - Расчетная таблица по третьей группе
Хi |
mi |
Хimi |
||
3 |
20 |
60 |
20 |
|
8 |
5 |
40 |
80 |
|
Сумма |
25 |
100 |
100 |
Рассчитаем общую дисперсию по правилу сложения дисперсий.
Таблица 3.4 - Определение дисперсий по совокупности данных
№ группы |
частота в группе f |
Среднее значение внутри группы, |
*f |
Дисперсия внутри группы |
f |
||
1 |
50 |
2 |
100 |
4,2 |
210 |
50 |
|
2 |
25 |
4 |
100 |
6 |
150 |
25 |
|
3 |
25 |
4 |
100 |
4 |
100 |
25 |
|
Сумма |
100 |
300 |
460 |
100 |
Средняя из частных дисперсий:
460/100=4,6
Межгрупповая дисперсия
100/100=1
Общая дисперсия:
=4,6+1=5,6
2. Корреляционный анализ
В социально-экономических исследованиях используют вероятностные (статистические) связи. Для оценки тесноты связи между показателем и фактором или между двумя факторами, используют корреляционный момент или коэффициент корреляции. [2]
Корреляция может быть положительной и отрицательной (возможна также ситуация отсутствия статистической взаимосвязи -- например, для независимых случайных величин). Отрицательная корреляция -- корреляция, при которой увеличение одной переменной связано с уменьшением другой переменной, при этом коэффициент корреляции отрицателен. Положительная корреляция -- корреляция, при которой увеличение одной переменной связано с увеличением другой переменной, при этом коэффициент корреляции положителен.[3]
Задача 2.1
Определить коэффициент корреляции между У и Х.
Х: 3,5; 4,6; 5,8; 4,2; 5,2;
УХ:28,35; 43,24; 65,54; 28,98; 50,44.
Оценить значимость коэффициента корреляции при уровне 0,05. Расчеты и ответы до двух знаков. Вначале определить У, а затем У и Х увеличить на свой номер классного журнала. Результаты:
1) коэффициент корреляции;
2) расчетное и табличное значения критерия Стьюдента и вывод.
Решение
Определим У. У=УХ/Х
Х |
3,5 |
4,6 |
5,8 |
4,2 |
5,2 |
|
УХ |
28,35 |
43,24 |
65,54 |
28,98 |
50,44 |
|
У |
8,1 |
9,4 |
11,3 |
6,9 |
9,7 |
У и Х увеличим на свой номер классного журнала.
Х |
18,5 |
19,6 |
20,8 |
19,2 |
20,2 |
|
У |
23,1 |
24,4 |
26,3 |
21,9 |
24,7 |
Составим вспомогательную таблицу.
Таблица 4 - Расчетные значения для определения коэффициента корреляции
№ |
Х |
У |
xi yi |
xi2 |
yi2 |
|
1 |
18,5 |
23,1 |
427,35 |
342,25 |
533,61 |
|
2 |
19,6 |
24,4 |
478,24 |
384,16 |
595,36 |
|
3 |
20,8 |
26,3 |
547,04 |
432,64 |
691,69 |
|
4 |
19,2 |
21,9 |
420,48 |
368,64 |
479,61 |
|
5 |
20,2 |
24,7 |
498,94 |
408,04 |
610,09 |
|
? |
98,3 |
120,4 |
2372,05 |
1935,73 |
2910,36 |
Коэффициент корреляции:
=
=0,842
Имеется сильная линейная связь между y и x. Связь положительная, то есть с ростом х растет у.
Проверка существенности отличия коэффициента парной корреляции от нуля (его значимости) проводится по схеме:
если ,
то гипотеза о существенном отличии коэффициента парной корреляции от нуля принимается, в противном случае - отвергается.
- квантиль распределения Стьюдента, ? - требуемый уровень значимости, (n-2) - число степеней свободы.
уровень значимости 0,05%
В нашей задаче 5-2=3, tтабл= 3,18.
Для получаем расчетное значение:
.
Коэффициент корреляции существенно отличается от нуля, его можно считать значимым.
Задача 2.2
Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость.
Исходные данные:
х 18 22 13 20 15 14
у 17 20 11 18 14 10
Это нулевой вариант. Каждое значение х и у увеличить на свой номер классного журнала.
Результаты:
1.Коэффициент корреляции.
2.Расчетное и табличное значения критерия Стьюдента, вывод о значимости. ВСЕ РЕЗУЛЬТАТЫ до 2-х знаков после запятой.
Решение
У и Х увеличим на свой номер классного журнала.
Х |
33 |
37 |
28 |
35 |
30 |
29 |
|
У |
32 |
35 |
26 |
33 |
29 |
25 |
Составим вспомогательную таблицу.
Таблица 5 - Расчетные значения для определения коэффициента корреляции
№ |
Х |
У |
xi yi |
xi2 |
yi2 |
|
1 |
33 |
32 |
1056 |
1089 |
1024 |
|
2 |
37 |
35 |
1295 |
1369 |
1225 |
|
3 |
28 |
26 |
728 |
784 |
676 |
|
4 |
35 |
33 |
1155 |
1225 |
1089 |
|
5 |
30 |
29 |
870 |
900 |
841 |
|
6 |
29 |
25 |
725 |
841 |
625 |
|
? |
192 |
180 |
5829 |
6208 |
5480 |
Коэффициент корреляции:
==0,964
Сильная положительная линейная связь между y и x: с ростом х растет у.
Проверка существенности отличия коэффициента парной корреляции от нуля (его значимости) проводится по схеме:
если ,
то гипотеза о существенном отличии коэффициента парной корреляции от нуля принимается, в противном случае - отвергается.
- квантиль распределения Стьюдента, ? - требуемый уровень значимости, (n-2) - число степеней свободы.
уровень значимости 0,05%
В нашей задаче 6-2=4, tтабл= 2,78.
Для получаем расчетное значение:
.
Коэффициент корреляции существенно отличается от нуля, его можно считать значимым.
Задача 2.3
В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистике по сто балльной системе:
Теория вероятностей: 65 90 42 47 84 58 50
Статистика: 51 85 36 63 72 80 40.
Определить коэффициент ранговой корреляции Спирмена и его значимость. Это нулевой вариант. Каждое значение (балл) увеличить на свой номер классного журнала. Расчеты и результат до двух знаков.
Результаты:
1.Коэффициент ранговой корреляции.
2.Расчетное и табличное значения критерия Стьюдента при уровне значимости равным 0,05 и выводы.
Решение
У и Х увеличим на свой номер классного журнала.
Теория вероятностей |
80 |
105 |
57 |
62 |
99 |
73 |
65 |
|
Статистика |
66 |
100 |
51 |
78 |
87 |
95 |
55 |
Составим вспомогательную таблицу.
Таблица 6 - Расчетные значения для определения коэффициента ранговой корреляции Спирмена
№ |
Теория вероятностей х |
Статистика у |
||||
1 |
80 |
66 |
5 |
3 |
4 |
|
2 |
105 |
100 |
7 |
7 |
0 |
|
3 |
57 |
51 |
1 |
1 |
0 |
|
4 |
62 |
78 |
2 |
4 |
4 |
|
5 |
99 |
87 |
6 |
5 |
1 |
|
6 |
73 |
95 |
4 |
6 |
4 |
|
7 |
65 |
55 |
3 |
2 |
1 |
|
? |
28 |
28 |
14 |
Коэффициент Спирмена:
Коэффициент Спирмена:
а по формуле - значение t-статистики:
При ? = 0,05 и n -2= 7-2=5, tкрит=2,57
Так как t<tкрит, коэффициент несущественно отличается от нуля, является незначимым.
Поэтому на уровне значимости 0,05 можно считать, что связь между х и у незначимая.
3. Регрессионный анализ
Регрессиомнный анализ -- статистический метод исследования влияния одной или нескольких независимых переменных X1, X2,…,Xp на зависимую переменную Y. Независимые переменные иначе называют регрессорами или предикторами, а зависимые переменные -- критериальными. Терминология зависимых и независимых переменных отражает лишь математическую зависимость переменных, а не причинно-следственные отношения.[7]
Основными целями регрессионного анализа является:
- Определение степени детерминированности вариации критериальной (зависимой) переменной предикторами (независимыми переменными)
- Предсказание значения зависимой переменной с помощью независимой(-ых)
- Определение вклада отдельных независимых переменных в вариацию зависимой
Регрессионный анализ нельзя использовать для определения наличия связи между переменными, поскольку наличие такой связи и есть предпосылка для применения анализа
Задача 3.1
Построить нелинейную обратную модель связи себестоимости единицы продукции (у) со стоимостью основных фондов (х). Определить характеристики модели.
Каждое значение (у) увеличить на свой номер классного журнала.
Исходные данные:
у: 21; 16; 15; 14; 13; 12,5; 11; 11,5; 10; 8
х: 1; 2; 3; 4; 5; 6; 7; 8; 9; 10
Характеристики модели: 1) модель (коэффициенты до 4-х знаков);
2) индекс детерминации (до 2-х знаков);
3) стандартную ошибку (до 4-х знаков);
4) расчетное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели;
5) вывод о значимости коэффициентов модели;
6) доверительные интервалы коэффициентов модели (до 4-х знаков).
Решение
Имеем данные
Х |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
У |
36 |
31 |
30 |
29 |
28 |
27,5 |
26 |
26,5 |
25 |
23 |
Найдем оценки коэффициентов обратной (гиперболической) модели
.
Введем новую переменную . Тогда гиперболическая модель приводится к линейной:
.
12,2
24,6266
Гиперболическое уравнение регрессии имеет вид:
y = 12,2/ t + 24,6266.
Таблица 7 - Оценка коэффициентов гиперболической модели
х |
y |
yi |
yi? |
||||||
1 |
36 |
1 |
1 |
36 |
36,827 |
0,6833 |
74,418 |
0,5 |
|
2 |
31 |
0,5 |
0,25 |
15,5 |
30,727 |
0,0747 |
6,3837 |
0,0429 |
|
3 |
30 |
0,33333 |
0,11111 |
10 |
28,693 |
1,7076 |
0,2433 |
0,0016 |
|
4 |
29 |
0,25 |
0,0625 |
7,25 |
27,677 |
1,7514 |
0,2739 |
0,0018 |
|
5 |
28 |
0,2 |
0,04 |
5,6 |
27,067 |
0,8712 |
1,2846 |
0,0086 |
|
6 |
27,5 |
0,16667 |
0,02778 |
4,5833 |
26,66 |
0,7057 |
2,3718 |
0,0159 |
|
7 |
26 |
0,14286 |
0,02041 |
3,7143 |
26,369 |
0,1365 |
3,3509 |
0,0225 |
|
8 |
26,5 |
0,125 |
0,01563 |
3,3125 |
26,152 |
0,1214 |
4,1959 |
0,0282 |
|
9 |
25 |
0,11111 |
0,01235 |
2,7778 |
25,982 |
0,9646 |
4,9188 |
0,033 |
|
10 |
23 |
0,1 |
0,01 |
2,3 |
25,847 |
8,1031 |
5,5385 |
0,0372 |
|
55 |
282 |
2,929 |
1,5498 |
91,0379 |
282 |
15,1195 |
102,9798 |
0,6919 |
Рис.1. Обратная модель связи себестоимости единицы продукции со стоимостью основных фондов
индекс детерминации вычисляется по формуле
102,9798/(102,9798+15,1195)=0,87
Построенное уравнение на 87% объясняет вариацию результативного признака.
Для проверки статистической надежности результатов регрессионного анализа используется статистика Фишера:
F= (102,9798/1)/(15,1195/8)= 54,49
к1 =1, к2 = 10-1-1=8, на уровне значимости 0,05 табличное значение Fт = 5,32. Для зависимости y от x выполняется неравенство Fт < F, признается статистическая значимость уравнения регрессии. Уравнение можно рекомендовать для практического использования.
Оценим стандартную ошибку регрессии.
=15,1195/8=1,8899- остаточная дисперсия уравнения регрессии.
стандартная ошибка регрессии
Стандартные ошибки параметров регрессии рассчитываются по формулам:
=1,6528
=0,6506.
Уровень надежности 95%
2,306
t-статистики рассчитываются по формулам:
ta =a/COa,
ta =12,2/1,6528=7,38
tb=b/COb,
tb=24,6266/0,6506=37,85
С вероятностью 0,95 оценим статистическую значимость параметров уравнения регрессии с помощью t-критерия Стьюдента.
Значение t-статистики для параметра а по модулю больше табличного значения 2,306. Поэтому гипотеза H0 о равенстве нулю коэффициента a отвергается, a значимо, и его нужно включать в модель.
Выборочное значение t-статистики для коэффициента b по модулю также существенно превышает табличное значение 2,306. Поэтому гипотеза H0 о равенстве нулю коэффициента b отвергается, b значимо, и его нужно включать в модель.
Построение доверительных интервалов. Доверительные интервалы - это границы, в которые с большой вероятностью попадают неизвестные параметры. Построим интервалы, в которые неизвестные параметры будут попадать с вероятностью в 95%
-*?a? +*
12,2-2,306*1,6528?a?12,2+2,306*1,6528
8,3886?a?16,0114
С вероятностью 0,95 истинное значение параметра a находится в интервале [8,3886; 16,0114]. Любая гипотеза на равенство значению, лежащему внутри интервала, не будет отвергаться, и наоборот - гипотеза о значении, лежащем вне интервала, будет всегда отвергаться.
-*?b? +*
24,6266-2,306*0,6506?b? 24,6266+2,306*0,6506
23,1263?b? 26,1269
С вероятностью 0,95 истинное значение параметра b находится в интервале [23,1263; 26,1269]. Любая гипотеза на равенство значению, лежащему внутри интервала, не будет отвергаться, и наоборот - гипотеза о значении, лежащем вне интервала, будет всегда отвергаться.
Задача 3.2
Построить полулогарифмическую модель вида: y=a0+a1lnx по данным:
у 10; 13,4; 15,4; 16,5; 18,6; 19,1
х 1; 2; 3; 4; 5; 6.
Определить характеристики модели.
Каждое значение (у) увеличить на свой номер классного журнала.
Характеристики модели: 1) модель (коэффициенты до 2-х знаков);
2) индекс детерминации (до 2-х знаков);
3) стандартную ошибку (до 4-х знаков);
4) расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели.
Решение
Имеем данные
Х |
1 |
2 |
3 |
4 |
5 |
6 |
|
У |
25 |
28,4 |
30,4 |
31,5 |
33,6 |
34,1 |
Найдем оценки коэффициентов полулогарифмической модели
.
Введем новую переменную . Тогда логарифмическая модель приводится к линейной:
.
5,1289
24,876
Логарифмическое уравнение регрессии имеет вид:
y = 24,876+ 5,1289 ln х.
Таблица 8 - Оценка коэффициентов логарифмической модели
х |
y |
yi |
yi? |
|||||
1 |
25 |
0 |
0 |
0 |
24,876 |
0,01538 |
31,6294 |
|
2 |
28,4 |
0,69315 |
0,48045 |
19,68538 |
28,431 |
0,00097 |
4,28042 |
|
3 |
30,4 |
1,09861 |
1,20695 |
33,397814 |
30,511 |
0,01225 |
0,00011 |
|
4 |
31,5 |
1,38629 |
1,92181 |
43,668272 |
31,986 |
0,23636 |
2,20869 |
|
5 |
33,6 |
1,60944 |
2,59029 |
54,077114 |
33,131 |
0,22029 |
6,9203 |
|
6 |
34,1 |
1,79176 |
3,2104 |
61,098998 |
34,066 |
0,00117 |
12,7146 |
|
21 |
183 |
6,5793 |
9,4099 |
211,9276 |
183 |
0,4864 |
57,7535 |
индекс детерминации вычисляется по формуле
57,7535/(57,7535+0,4864)=0,99
Построенное уравнение на 99% объясняет вариацию результативного признака.
Для проверки статистической надежности результатов регрессионного анализа используется статистика Фишера:
F= (57,7535/1)/(0,4864/4)= 474,95
к1 =1, к2 = 6-1-1=4, на уровне значимости 0,05 табличное значение Fт = 7,71. Для зависимости y от x выполняется неравенство Fт < F, признается статистическая значимость уравнения регрессии. Уравнение можно рекомендовать для практического использования.
Оценим стандартную ошибку регрессии.
=0,4864/4=0,1216- остаточная дисперсия уравнения регрессии.
стандартная ошибка регрессии
Рис.2. Полулогарифмическая модель
Задача 3.3
Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 3.1.
Таблица 3.1 - Динамика коэффициента рождаемости в Пензенской области
Год |
2000 |
2001 |
2002 |
2003 |
2004 |
2005 |
|
Коэффициент рождаемости |
7,5 |
7,5 |
8,0 |
8,4 |
8,6 |
8,4 |
|
Год |
2006 |
2007 |
2008 |
2009 |
2010 |
2011 |
|
Коэффициент рождаемости |
8,6 |
9,7 |
10,2 |
10,3 |
10,2 |
10,1 |
|
Год |
2012 |
2013 |
2014 |
2015 |
2016 |
||
Коэффициент рождаемости |
10,8 |
10,6 |
10,8 |
10,7 |
10,2 |
Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г. В электронную таблицу вместо года ставить 1,2,…
Решение
Найдем точечные оценки параметров линейной регрессионной модели Y = at + b
Таблица 9 - Оценка параметров линейной модели
t |
y |
y t |
t2 |
|(yi- )/yi| |
||||
1 |
7,5 |
7,5 |
1 |
7,692 |
0,0256 |
0,03694 |
3,079529 |
|
2 |
7,5 |
15 |
4 |
7,912 |
0,0549 |
0,16941 |
2,357634 |
|
3 |
8 |
24 |
9 |
8,131 |
0,0164 |
0,01716 |
1,732011 |
|
4 |
8,4 |
33,6 |
16 |
8,35 |
0,0059 |
0,00246 |
1,202661 |
|
5 |
8,6 |
43 |
25 |
8,57 |
0,0035 |
0,00091 |
0,769583 |
|
6 |
8,4 |
50,4 |
36 |
8,789 |
0,0463 |
0,15148 |
0,432778 |
|
7 |
8,6 |
60,2 |
49 |
9,009 |
0,0475 |
0,16695 |
0,192246 |
|
8 |
9,7 |
77,6 |
64 |
9,228 |
0,0487 |
0,22278 |
0,047987 |
|
9 |
10,2 |
91,8 |
81 |
9,447 |
0,0738 |
0,56641 |
1,16E-07 |
|
10 |
10,3 |
103 |
100 |
9,667 |
0,0615 |
0,40094 |
0,048286 |
|
11 |
10,2 |
112,2 |
121 |
9,886 |
0,0308 |
0,09847 |
0,192845 |
|
12 |
10,1 |
121,2 |
144 |
10,11 |
0,0006 |
3,1E-05 |
0,433676 |
|
13 |
10,8 |
140,4 |
169 |
10,33 |
0,044 |
0,22563 |
0,770781 |
|
14 |
10,6 |
148,4 |
196 |
10,54 |
0,0052 |
0,00309 |
1,204158 |
|
15 |
10,8 |
162 |
225 |
10,76 |
0,0034 |
0,00131 |
1,733807 |
|
16 |
10,7 |
171,2 |
256 |
10,98 |
0,0265 |
0,0802 |
2,35973 |
|
17 |
10,2 |
173,4 |
289 |
11,2 |
0,0983 |
1,00521 |
3,081925 |
|
153 |
160,6 |
1534,9 |
1785 |
160,6 |
0,5927 |
3,1494 |
19,6396 |
=7,4728, =0,2194.
Уравнение тренда (регрессии) будет иметь вид:
=0,2194t+7,4728
Рис. 3. Линейная модель
коэффициент детерминации вычисляется по формуле
19,6396/(19,6396+3,1494)=0,86
Построенное уравнение на 86% объясняет вариацию результативного признака.
Для проверки статистической надежности результатов регрессионного анализа используется статистика Фишера:
F= (19,6396/1)/(3,1494/15)= 93,54
к1 =1, к2 = 17-1-1=15, на уровне значимости 0,05 табличное значение Fт = 4,54. Для зависимости y от x выполняется неравенство Fт < F, признается статистическая значимость уравнения регрессии. Уравнение можно рекомендовать для практического использования.
Оценим стандартную ошибку регрессии.
=3,1494/15=0,21- остаточная дисперсия уравнения регрессии.
стандартная ошибка регрессии
Вычислим среднюю относительную ошибку аппроксимации для моделей. Допустимый предел не более 8-10%.
|(yi- yi?)/yi|
0,5927/17=3,5% -указывает на качественное уравнение регрессии.
Спрогнозируем коэффициент рождаемости в 2017г. t=18.
y2017=0,2194*18+7,4728=11,4
Задача 3.4
Реальные статистические данные о курсе валют приведены в таблице 3.2. Построить линейную и нелинейные регрессионные модели вида: у = ао + а1t; lnу = ао + а1t; у = 1/(ао + а1t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. В электронную таблицу вместо года записывать 1,2,… По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.
Таблица 3.2 - Курс рубля к доллару
Месяц и год |
январь 2017 |
февраль |
март |
апрель |
май |
июнь |
июль |
август 2017 |
|
Цена одного доллара |
59,6 |
58,5 |
58,0 |
56,4 |
57,0 |
57,9 |
59,7 |
59,6 |
Решение
Найдем точечные оценки параметров линейной регрессионной модели Y = at + b
Таблица 10 - Оценка параметров линейной модели
t |
y |
y t |
t2 |
|(yi- )/yi| |
||||
1 |
59,6 |
59,6 |
1 |
58,075 |
0,02559 |
2,32563 |
0,06891 |
|
2 |
58,5 |
117 |
4 |
58,15 |
0,00598 |
0,1225 |
0,03516 |
|
3 |
58 |
174 |
9 |
58,225 |
0,00388 |
0,05063 |
0,01266 |
|
4 |
56,4 |
225,6 |
16 |
58,3 |
0,03369 |
3,61 |
0,00141 |
|
5 |
57 |
285 |
25 |
58,375 |
0,02412 |
1,89063 |
0,00141 |
|
6 |
57,9 |
347,4 |
36 |
58,45 |
0,0095 |
0,3025 |
0,01266 |
|
Подобные документы
Расчет средних показателей при составлении любого экономического отчета. Исследование метода средних величин. Отражение средней величиной того общего, что характерно для всех единиц изучаемой совокупности. Деление средних величин на два класса.
курсовая работа [91,7 K], добавлен 14.12.2008Сущность статистического изучения браков. Система статистических показателей, используемых в изучении браков в Амурской области. Анализ браков с помощью расчета средних величин и показателей вариации. Корреляционно–регрессионный анализ структуры браков.
курсовая работа [895,1 K], добавлен 20.03.2015Анализ основных технико-экономических показателей ОАО "Газпром". Изучение сущности средних величин, видов и способов их вычисления. Рассмотрение применения средних величин при анализе хозяйственной деятельности работы ОАО "Газпром" за 2009-2012 гг.
курсовая работа [177,4 K], добавлен 29.10.2015Понятие и свойства средних величин. Характеристика и расчет их видов (средних арифметической, гармонической, геометрической, квадратической, кубической и структурных). Сфера их применения в экономическом анализе хозяйственной деятельности отраслей.
курсовая работа [56,8 K], добавлен 21.05.2014Понятие средних величин и их значение в экономике. Классификация видов средних величин и их краткая характеристика. Средняя гармоническая и арифметическая, способы их расчета. Примеры применения средних величин в практической работе экономистов.
курсовая работа [205,4 K], добавлен 17.09.2014Статистика денежного обращения, инфляции и цен. Построение сводки и ряда распределения. Характеристика используемых статистических показателей. Расчет средних величин и показателей вариации, ошибок выборки. Корреляционный анализ количественных признаков.
контрольная работа [564,1 K], добавлен 13.09.2012Виды и применение абсолютных и относительных статистических величин. Сущность средней в статистике, виды и формы средних величин. Формулы и техника расчетов средней арифметической, средней гармонической, структурной средней. Расчет показателей вариации.
лекция [985,6 K], добавлен 13.02.2011Группы средних величин: степенные, структурные. Особенности применения средних величин, виды. Рассмотрение основных свойств средней арифметической. Характеристика структурных средних величин. Анализ примеров на основе реальных статистических данных.
курсовая работа [230,6 K], добавлен 24.09.2012Расчет средних величин и показателей вариации. Основные аналитические показатели ряда динамики. Расчет индексов выполнения плана по производительности труда. Выборочные наблюдения. Демография и статистика населения. Система национальных счетов.
курсовая работа [100,1 K], добавлен 10.04.2011Построение ряда распределения предприятий по стоимости основных производственных фондов методом статистической группировки. Нахождение средних величин и индексов. Понятие и вычисление относительных величин. Показатели вариации. Выборочное наблюдение.
контрольная работа [120,9 K], добавлен 01.03.2012Понятие статистического изучения рождаемости населения. Анализ рождаемости в Амурской области за 1999-2008 годы. Система показателей рождаемости. Показатели рождаемости для условного и реального поколения. Расчет средних величин и показателей вариации.
курсовая работа [240,1 K], добавлен 26.11.2009Сущность и разновидности средних величин в статистике. Определение и особенности однородной статистической совокупности. Расчет показателей математической статистики. Что такое мода и медиана. Основные показатели вариации и их значение в статистике.
реферат [162,6 K], добавлен 04.06.2010Порядок группировки территорий с определенным уровнем фондовооруженности, расчет доли занятых. Расчёт средних значений каждого показателя с указанием вида и формы использованных средних гармонических, абсолютных и относительных показателей вариации.
контрольная работа [45,5 K], добавлен 10.11.2010Абсолютные и относительные статистические величины. Понятие и принципы применения средних величин и показателей вариации. Правила применения средней арифметической и гармонической взвешенных. Коэффициенты вариации. Определение дисперсии методом моментов.
учебное пособие [276,4 K], добавлен 23.11.2010Проведение статистического анализа безработицы, экономической активности и занятости в Амурской области с помощью показателей динамики и расчета средних величин. История становления системы защиты населения от потери рабочих мест в современной России.
курсовая работа [79,6 K], добавлен 26.03.2011Статистика занятости и безработицы. Определение численности и состава занятых лиц. Выборочное наблюдение, сводка и группировка, ряд распределения. Характеристика статистических показателей. Расчет средних величин и показателей вариации, ошибок выборки.
курсовая работа [180,5 K], добавлен 10.08.2009Оформление результатов сводки и группировки материалов статистического наблюдения в виде рядов распределения (атрибутивных и вариационных). Расчет средних величин и показателей вариации, моды и меридианы. Графическое изображение статистических данных.
контрольная работа [226,8 K], добавлен 31.07.2011Группировка предприятий по факторному признаку, расчет размаха вариации и длины интервала. Виды и формулы расчета средних величин и дисперсии. Расчет абсолютного прироста, темпов роста и темпов прироста, среднегодовых показателей численности населения.
контрольная работа [219,7 K], добавлен 24.02.2011Понятие, классификация, применение и определение индексов. Характеристика индивидуальных, общих, агрегатных, средневзвешенных индексов. Особенности показателей динамики средних величин, переменного, постоянного составов и структурных сдвигов, дефляторов.
реферат [272,0 K], добавлен 19.12.2010Проведение расчета абсолютных, относительных, средних величин, коэффициентов регрессии и эластичности, показателей вариации, дисперсии, построение и анализ рядов распределения. Характеристика аналитического выравнивания цепных и базисных рядов динамики.
курсовая работа [351,2 K], добавлен 20.05.2010