Корреляционный анализ. Определение показателей вариации
Построение рядов распределения по факторному и результативному признакам. Расчет эмпирической и теоретической линии регрессии. Правильность гипотезы о прямолинейной форме корреляционной связи. Вычисление дисперсии, вариации и коэффициента детерминации.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 09.09.2017 |
Размер файла | 134,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Федеральное агентство по образованию РФ
Казанский Государственный Архитектурно-Строительный Университет
Кафедра экономики и предпринимательства в строительстве
Курсовая работа
по курсу «Статистика» по специальности 060800
Выполнила:
Ст. гр. 11-202
Рахимзянова Э.
Казань 2010
1. Корреляционный анализ
Таблица 1.1.
Выработка на 1 рабочего, тыс.руб.(Y2) |
6706 |
6387 |
6146 |
6586 |
7482 |
5234 |
5716 |
6580 |
6221 |
5980 |
6720 |
|
Уровень сборности, %.(X3) |
55,3 |
56,9 |
57 |
59,6 |
63,4 |
69,2 |
56,2 |
54,6 |
57,8 |
66,3 |
68 |
1.1 Построение рядов распределения по факторному и результативному признакам
a) интервальный ряд распределения:
Для корреляционного анализа зависимости результативного признака у от факторного признака х необходима статистическая обработка данных. Первоначально систематизация статистического материала производится по величине изучаемого признака в порядке убывания или возрастания, то есть необходимо произвести ранжирование рядов распределения.
При построении интервального ряда распределения определяем величину интервала i, которую вычисляем по формуле:
i =
где Rmax-максимальное значение переменной;
Rmin-минимальное значение переменной;
n- число интервалов.
Ориентировочно число интервалов определяется по формуле
n= 1+3,32lgN
В нашем случае получаем n=10.
Итак, подставим значения из таблицы 1.1. в формулу (1) и получим длину интервала по выработке на 1 рабочего в год по объему работ собственными силами:
iy= == 224,8 т. руб.
ix===1,46 %
Начальная граница первого интервального ряда равна 0,5i.
Для выработки на 1 рабочего: 1/2*224,8=112,4 , тогда
Нижняя граница 1 интервала: 5234-112,4=5121,6 т. руб.
Верхняя граница 1 интервала: 5121,6+224,8=5346, 4 т. руб.
Для объема работ собственными силами: 1/2*1,46=0,73 , тогда
Нижняя граница 1 интервала: 54,6-0,73=53,87%
Верхняя граница 1 интервала: 53,87+1,46=55,33 %
Интервальные ряды по функциональному признаку (по выработке на 1 рабочего) и по факторному признаку (объем работ собственными силами):
Таблица 1.2.
Y2 |
X3 |
|
5121,6-5346,4 |
53,87-55,33 |
|
5346,4-5571,2 |
55,33-56,79 |
|
5571,2-5796 |
56,79-58,25 |
|
5796-6020,8 |
58,25-59,71 |
|
6020,8-6245,6 |
59,71-61,17 |
|
6245,6-6470,4 |
61,17-62,63 |
|
6470,4-6695,2 |
62,63-64,09 |
|
6695,2-6920 |
64,09-65,55 |
|
6920-7144,8 |
65,55-67,01 |
|
7144,8-7369,6 |
67,01-68,47 |
|
7369,6-7594,4 |
68,47-69,93 |
б) дискретные ряды распределения:
С помощью таблицы 1.2. построим дискретные ряды распределения по y и x. Для выполнения корреляционных расчетов интервальные ряды распределения необходимо представить в дискретной форме. В связи с этим вместо размерности интервалов принимаем их центральные значения, которые рассчитываются как средние арифметические величины начала и конца интервалов. Результаты расчетов приведем в табличной форме:
Таблица 1.3 Дискретный ряд распределения по у (по выработке на 1 рабочего)
Центральные значения интервалов |
Величина интервала |
Абсолютные частоты |
Относительные частоты % |
Плотность распределения |
|
5234 |
i=224,8 |
1 |
9,09 |
0,04 |
|
5458,8 |
0 |
0 |
0 |
||
5683,6 |
1 |
9,09 |
0,04 |
||
5908,4 |
1 |
9,09 |
0,04 |
||
6133,2 |
2 |
18,18 |
0,08 |
||
6358 |
1 |
9,09 |
0,04 |
||
6582,8 |
2 |
18,18 |
0,08 |
||
6807,6 |
2 |
18,18 |
0,08 |
||
7032,4 |
0 |
0 |
0 |
||
7257,2 |
0 |
0 |
0 |
||
7482 |
1 |
9,09 |
0,04 |
||
Итого n=11 |
100 % |
Плотность распределения определяется по формуле:
с=
Таким образом, ряд распределения по выработке на 1 рабочего показывает, что наиболее характерным является группа с центральным значением интервала 6133,2, 6582,8, 6807,6 тыс. руб., так как они составляют 18,18 % от всего количества выработки на 1 рабочего.
Таким образом, ряд распределения по уровню сборности показывает, что наиболее характерным является группа центральным значением интервала 57,52% , так как она составляет по 27,27 %.
Таблица 1.4. Дискретный ряд распределения по х (по уровню сборности)
Центральные значения интервалов |
Величина интервала |
Абсолютные частоты |
Относительные частоты |
Плотность распределения |
|
54,6 |
i=1,46 |
2 |
18,18 |
12,45 |
|
56,06 |
1 |
9,09 |
6,23 |
||
57,52 |
3 |
27,27 |
18,68 |
||
58,98 |
1 |
9,09 |
6,23 |
||
60,44 |
0 |
9,09 |
6,23 |
||
61,9 |
0 |
0 |
0 |
||
63,36 |
1 |
9,09 |
6,23 |
||
64,82 |
0 |
0 |
0 |
||
66,28 |
1 |
9,09 |
6,23 |
||
67,74 |
1 |
9,09 |
6,23 |
||
69,2 |
1 |
9,09 |
6,23 |
||
Итого: |
n=11 |
100% |
1.2 Построение корреляционной таблицы
Для построения корреляционной таблицы на поле корреляции накладывается сетка, соответствующая интервальным рядам распределения по факторному и функциональному признакам. Затем подсчитывается число точек (частот) в каждой клетке координатной сетки.
Таблица 1.5
По выработке на 1 рабочего в год |
х - у |
Объем работ собственными силами |
||||||||||||
53,87-55,33 |
55,33-56,79 |
56,79-58,25 |
58,25-59,71 |
59,71-61,17 |
61,17-62,63 |
62,63-64,09 |
64,09-65,55 |
65,55-67,01 |
67,01-68,47 |
68,47-69,93 |
итого |
|||
7369,6-7594,4 |
1 |
1 |
||||||||||||
7144,8-7369,6 |
0 |
|||||||||||||
6920-7144,8 |
0 |
|||||||||||||
6695,2-6920 |
1 |
1 |
2 |
|||||||||||
6470,4-6695,2 |
1 |
1 |
2 |
|||||||||||
6245,6-6470,4 |
1 |
1 |
||||||||||||
6020,8-6245,6 |
2 |
2 |
||||||||||||
5796-6020,8 |
1 |
1 |
||||||||||||
5571,2-5796 |
1 |
1 |
||||||||||||
5346,4-5571,2 |
0 |
|||||||||||||
5121,6-5346,4 |
1 |
1 |
||||||||||||
итого |
2 |
1 |
3 |
1 |
0 |
0 |
1 |
0 |
1 |
1 |
1 |
n=11 |
Результаты расчетов, выполненные в таблице 1.5, позволяют сделать вывод о том, что при переходе слева направо в сторону больших значений факторного признака х соответствующие ряды распределения функционального признака у смещаются сверху вниз, т.е. в сторону меньших значений функций. Следовательно, выработка на 1 рабочего в год находится в корреляционной зависимости от уровня сборности.
1.3 Расчет эмпирической линии регрессии
После установления наличия корреляционной зависимости между функциональным и факторным признаками, приступаем к следующему этапу статистического моделирования - к исследованию формы связи. Под формой корреляционной связи понимают тип аналитической формулы, выражающий зависимость между изучаемыми величинами. Необходимо установить, какие изменяются средние значения у в связи с изменением х.
Рассчитываются средние величины для каждого ряда распределения по формуле средней взвешенной арифметической величины:
y=
где у - средневзвешенное значение функции
у - центральное значения интервалов по функции
m - абсолютные частоты вариантов у
Для сокращения вычислений при определении средней арифметической можно использовать метод отсчета от условного нуля.
Расчетная формула имеет вид
y=yi*iy+cy
При этом уi, где:
у' - упрощенные варианты у;
у - фактические варианты у;
Су-новое начало отсчета по оси у (условный ноль);
iy - интервал группировки по у.
Новое начало отсчета выбирается таким образом, чтобы число наблюдений распределялось примерно поровну между положительным и отрицательным направлениями оси ординат.
В нашем примере примем условный нуль в пятом интервале по оси у, тогда су=6358 т. руб., а iy=224,8 т. руб. Результаты расчетов представим в таблицу 1.6.
Таблица 1.6.
Выработка на 1 рабочего |
y' |
x- y |
Объем работ собственными силами |
||||||||||||
54,6 |
56,06 |
57,52 |
58,98 |
60,4 |
61,9 |
63,4 |
64,82 |
66,28 |
67,74 |
69,2 |
итого |
||||
5 |
7482 |
15 |
1 |
||||||||||||
4 |
7257,2 |
0 |
|||||||||||||
3 |
7032,4 |
0 |
|||||||||||||
2 |
6807,6 |
12 |
12 |
2 |
|||||||||||
1 |
6582,8 |
11 |
11 |
2 |
|||||||||||
0 |
6358 |
10 |
1 |
||||||||||||
-1 |
6133,2 |
2-1 |
2 |
||||||||||||
-2 |
5908,4 |
1-2 |
1 |
||||||||||||
-3 |
5683,6 |
1-3 |
1 |
||||||||||||
-4 |
5458,8 |
0 |
|||||||||||||
-5 |
5234 |
1-5 |
1 |
||||||||||||
1 |
Итого hi |
2 |
1 |
3 |
1 |
0 |
0 |
1 |
0 |
1 |
1 |
1 |
n=11 |
||
2 |
?miyi |
3 |
-3 |
-2 |
1 |
0 |
0 |
5 |
0 |
-2 |
2 |
-5 |
?y'=-1 |
||
3 |
y' |
1,5 |
-3 |
-0,67 |
1 |
0 |
0 |
5 |
0 |
-2 |
2 |
-5 |
- |
||
4 |
y |
6695 |
5684 |
6207,4 |
6582,8 |
6358 |
6358 |
7482 |
6358 |
5908 |
6808 |
5234 |
- |
Упрощенные варианты y' умножаются на частоты соответствующих клеток корреляционной таблицы и записываются в верхних правых углах каждой клетки.
Первая итоговая строка и итоговый столбец таблицы 1.6. выражают абсолютные частоты интервальных рядов распределения по функциональному и факторному признакам.
Вторая итоговая строка характеризует сумму произведений, записанных в верхних углах клеток. Третья итоговая строка рассчитывается делением показателей второй строки на первую. В четвертой итоговой строке показаны искомые средние yi, полученные по формуле
y=yi*iy+cy.
Показатели четвертой итоговой строки являются основой для графического изображения выполненных расчетов на поле корреляции.
Соединив между собой средние значения в каждом интервале отрезками прямых линий, получаем эмпирическую линию регрессии у по х, которая показывает, как в среднем изменяется у в связи с изменением х.
В нашем случае расчет эмпирической линии регрессии вновь подтвердил наличие корреляционной зависимости между выработкой на 1 рабочего и уровнем сборности.
1.4 Расчет теоретической линии регрессии
Теоретическая линия регрессии представляет собой такую математически правильную кривую (либо прямую) линию, которая проходит наиболее близко к точкам эмпирической линии регрессии, выражает общую закономерность средних изменений признака в связи со средними изменениями фактора.
В нашем случае характер размещения точек на корреляционном поле делает весьма вероятной гипотезу о линейной связи у от х : у = a0 + a1x.
Параметры уравнения найдем из системы по способу наименьших квадратов:
na?0 + a?1? x? = ? y?
a?0?x? + a?1?( x?)2 = ? x?y?
Исходную информацию для решения данной системы получаем из таблицы 1.7., которая основана на результатах таблицы 1.6. Примем условный нуль в пятом интервале по оси Ох, тогда С=61,9%; i = 1,46 %.
Таблица 1.7.
Выработка на 1 рабочего , т. руб. |
y' |
Объем работ собственными силами, т. руб. |
№ столбца |
|||||||||||||||
x'2 |
25 |
16 |
9 |
4 |
1 |
0 |
1 |
4 |
9 |
16 |
25 |
1 |
2 |
3 |
4 |
|||
x' |
-5 |
-4 |
-3 |
-2 |
-1 |
0 |
1 |
2 |
3 |
4 |
5 |
li |
liy' |
y'2 |
li y'2 |
|||
y x |
54,6 |
56,06 |
57,52 |
58,98 |
60,44 |
61,9 |
63,36 |
64,8 |
66,3 |
67,74 |
69,2 |
|||||||
5 |
7482 |
1 |
1 |
5 |
25 |
25 |
||||||||||||
4 |
7257 |
0 |
0 |
16 |
0 |
|||||||||||||
3 |
7032,4 |
0 |
0 |
9 |
0 |
|||||||||||||
2 |
6807,6 |
1 |
1 |
2 |
4 |
4 |
8 |
|||||||||||
1 |
6582,8 |
1 |
1 |
2 |
2 |
1 |
2 |
|||||||||||
0 |
6358 |
1 |
1 |
0 |
0 |
0 |
||||||||||||
-1 |
6133,2 |
2 |
2 |
-2 |
1 |
2 |
||||||||||||
-2 |
5908,4 |
1 |
1 |
-2 |
4 |
4 |
||||||||||||
-3 |
5683,6 |
1 |
1 |
-3 |
9 |
9 |
||||||||||||
-4 |
5458,8 |
0 |
0 |
16 |
0 |
|||||||||||||
-5 |
5234 |
1 |
1 |
-5 |
25 |
25 |
||||||||||||
№ столбца |
1 |
Итого h i |
2 |
1 |
3 |
1 |
0 |
0 |
1 |
0 |
1 |
1 |
1 |
11 |
-1 |
- |
75 |
|
2 |
?hix' |
-10 |
-4 |
-9 |
-2 |
0 |
0 |
1 |
0 |
3 |
4 |
5 |
?x' =-12 |
|||||
3 |
? hix'2 |
50 |
16 |
27 |
4 |
0 |
0 |
1 |
0 |
9 |
16 |
25 |
?х'2=148 |
|||||
4 |
? miyi |
3 |
-3 |
-2 |
1 |
0 |
0 |
5 |
0 |
-2 |
2 |
-5 |
?y' =-1 |
|||||
5 |
? my'x' |
-15 |
12 |
6 |
-2 |
0 |
0 |
5 |
0 |
-6 |
8 |
-25 |
? х'у' =-17 |
В качестве проверки правильности данной таблицы должно соблюдаться равенство итогов четвертой строки и второго столбца. Если это условие не соблюдается, то в расчетах допущена ошибка, которая может привести к существенным искажениям величины параметров теоретической линии регрессии. В систему уравнений, данную выше, и получим:
11*a0'-12*a1'= -1
-12*a0'+148*a1'=-17
В качестве метода решения системы принимаем метод Гаусса, который позволяет находить решение последовательно, исключая неизвестные. Для этого первое уравнение умножаем на -12, а второе на 11 и вычтем:
-1772*а1'=-199
a1'=0.11
Затем в первое уравнение системы подставим значение a1' и находим величину a0':
11*a0'-12*0.11= -1
a0'=0.03
Параметры a0'и a1' необходимо преобразовать исходя из фактических значений х и у. Формулы перевода из упрощенных в реальные координаты:
a1=a1'* a0=cy+iya0'-a1'**cx
где iy- интервал группировки по функции
ix- интервал группировки по аргументу
cy-новое начало отсчета по функции
cx-новое начало отсчета по аргументу
По этим формулам получаем, что a0=5290.54, a1= 17.79
Уравнение теоретической линии регрессии в реальных коэффициентах имеет вид y=5290.54+17.79х.
В уравнении регрессии первое слагаемой носит название свободного члена, второе слагаемое называется коэффициентом регрессии. Он показывает, на сколько натуральных единиц изменяется в среднем результативный признак при изменении факторного признака на единицу.
В нашем примере из уравнения теоретической линии регрессии видно, что выработка на 1 рабочего повышаются на 17.79 % при увеличении уровня сборности 1 %. Выработка на 1 рабочего, не зависящие от рассматриваемых фактов, равен 5290,54 тыс. руб. Для графического изображения линии регрессии, рассчитанной по линейной гипотезе, достаточно определить две точки, через которые можно провести прямую.
В нашем примере по х1=60 и х2=70,у1=6357,94 и у2=6535,84 проводим на поле корреляции прямую линию.
Вывод: Графическое изображение теоретической линии регрессии в виде уравнения прямой еще раз подтверждает наличие корреляционной связи между изучаемыми признаками.
1.5 Измерение тесноты связи
Коэффициент корреляции ry/x является одним из наиболее совершенных методов измерения тесноты связи. Коэффициент корреляции отвечает на вопрос, в какой мере соблюдается строгая пропорциональность в изменениях функционального и факториального признаков.
Коэффициент корреляции может принимать как положительные, так и отрицательные значения, т.е. -1?r?1.
При выполнении корреляционных расчетов, когда связь между признаками х и у выражается прямой линией, соблюдается условие, при котором знак при коэффициенте корреляции ry/x должен совпадать со знаком при коэффициенте регрессии а1.
Для расчета коэффициента корреляции существует формула, представленная в упрощенных координатах признаков х и у.
ry/x=
В нашем случае исходную информацию для нахождения ry/x принимаем из таблицы 1.7.
ry/x== 0,16
Вывод: выполненные расчеты показывают, что между выработкой на 1 рабочего и уровнем сборности существует положительная корреляция, которая говорит о том, что с увеличением факторного признака х функциональный признак у увеличивается.
Знак при коэффициенте корреляции совпадает со знаком регрессии а1, что свидетельствует о правильности произведенных вычислений. Имеем слабую связь между изучаемыми явлениями.
1.6 Проверка правильности гипотезы о прямолинейной форме корреляционной связи
Таблица 1.9.
№ |
х |
х-х |
(х-х)2 |
у |
y |
у-y |
(у-y)2 |
у2 |
|
1 |
55,3 |
-5,09 |
25,91 |
5234 |
5365,63 |
-129,63 |
16803,94 |
27394756 |
|
2 |
56,9 |
-3,49 |
12,18 |
5458,8 |
6302,8 |
-844 |
712336 |
29798497,44 |
|
3 |
57 |
-3,39 |
11,49 |
5683,6 |
6304,57 |
-620,97 |
385603,74 |
32303308,96 |
|
4 |
59,6 |
-0,79 |
0,62 |
5908,4 |
6350,82 |
-442,42 |
195735,46 |
34909190,56 |
|
5 |
63,4 |
3,01 |
9,06 |
6133,2 |
6418,43 |
-285,23 |
81356,15 |
37616142,24 |
|
6 |
69,2 |
8,81 |
77,62 |
6358 |
6521,61 |
-163,61 |
26768,23 |
40424164 |
|
7 |
56,2 |
-4,19 |
14,56 |
6582,8 |
6290,34 |
292,46 |
85532,85 |
43333255,84 |
|
8 |
54,6 |
-5,79 |
33,52 |
6807,6 |
6261,87 |
545,73 |
297821,23 |
46344417,76 |
|
9 |
57,8 |
-2,59 |
6,71 |
7032,4 |
6318,8 |
713,6 |
509224,96 |
49454649,76 |
|
10 |
66,3 |
5,91 |
34,93 |
7257,2 |
6470,02 |
787,18 |
619652,35 |
52666951,84 |
|
11 |
68 |
7,61 |
57,91 |
7482 |
6500,26 |
981,74 |
963813,43 |
55980324 |
|
Итого |
664,3 |
- |
284,51 |
699338 |
69105,15 |
- |
3894648,34 |
450225658,4 |
Расчеты при заполнении таблицы:
===60,39
Первой основной задачей, которую решает теория корреляции, является задача измерения связи. Систематизация статистического материала по двум качественным признакам производится графически путем построения поля корреляции.
Итоговая сумма частот по горизонтальным линиям поля корреляции должна соответствовать абсолютным частотам дискретного ряда распределения факторного признака, а итоговая сумма частот по вертикальным линиям поля корреляции- абсолютным частотам дискретного ряда распределения факторного признака. Общая сумма абсолютных частот точек по всем горизонтальным линиям должна быть равна сумме частот (точек) по всем вертикальным линиям поля корреляции и соответствовать числу единиц статистической совокупности, принятой для исследования.
Прежде чем использовать уравнение теоретической линии в последующем анализе, необходима проверка ее параметров (а1,а0) на типичность. Для проверки типичности параметров уравнения регрессии используется t- критерий Стьюдента. При этом вычисляются фактические значения для параметра а0:
t а0=a0
Для параметра а1:
ta1= a0
где уост=- среднее квадратическое отклонение результативного признака у от выровненных значений y
ух=-среднее квадратическое отклонение факторного признака х от общей средней х. вычисленные по формулам t а0 и ta1 сравнивают с критическим t, которое определяют по таблице Стьюдента с учетом принятого уровня значимости б и числом степеней свободы вариации k =п-2. В нашем случае б=0,1. Параметр признается значимым (существенным) при условии, что если tрасч.>tзнач.
По таблице распределения Стьюдента для k=9 и уровня значимости б=0,1 находим критическое значение tк=4,781.
Так как ta0> tк< ta1 (0,04< 3.69 >0,004), следовательно параметры a1 и а0 не признаются значимыми.
Для оценки значимости коэффициента корреляции r используют t - критерий Стьюдента. При линейной однофакторной связи t - критерий рассчитывается по формуле:
t= r*=0,16*=0,053
Получили, что t> tк (0,053 < 3,690), что свидетельствует о не значимости коэффициента корреляции и существенной связи между выработкой на 1 рабочего и уровнем сборности.
После того, как установлена форма связи и измерена теснота значимости между результативным и факторным признаками, делается проверка правильности принятой гипотезы о прямолинейной форме корреляционной связи. Проверка производится при сравнении двух показателей тесноты связи: эмпирического корреляционного отношения и линейного коэффициента корреляции r. При этом оба показателя возводятся в квадрат и называются коэффициентами детерминации. Осуществим эту проверку применительно к нашему примеру, для которого = 0,76(вычисляется в разделе 2) и r = 0,16^2=0,026.
Разница между ними составляет -0,76+0,026 = -0,73<0,1 . Полученная разница меньше, чем 0,1, следовательно, дальнейшие расчеты не ведутся.
1.7 Общий вывод по разделу «Корреляционный анализ»
По данным таблицы 1.1 мы построили интервальные и дискретные ряды. При помощи таблицы 1.2. сделали вывод, что ряд распределения по выработке на 1 рабочего показывает, что наиболее характерным является группа с центральным значением интервала 6133,2, 6582,8, 6807,6 тыс. руб., так как они составляют 18,18 % от всего количества выработки на 1 рабочего. Ряд распределения по уровню сборности показывает, что наиболее характерным является группа с центральным значением интервала 61,9 , так как составляет 27,27%.
Затем мы строим корреляционную таблицу, которая показывает, что при переходе слева направо в сторону больших значений факторного признака х соответствующие ряды распределения функционального признака у смещаются сверху вниз, т.е. в сторону меньших значений функций. Следовательно, выработка на 1 рабочего в год находится в корреляционной зависимости от уровня сборности
Далее считаем эмпирическую линию регрессии. После всех расчетов можно было сделать вывод о том, что расчет эмпирической линии регрессии вновь подтвердил наличие корреляционной зависимости между выработкой на 1 рабочего и уровнем сборности. При расчете теоретической линии регрессии из уравнения теоретической линии регрессии видно, что выработка на 1 рабочего увеличивается на 17,79% при увеличении численности на 1 %. Уровень сборности , не зависящая от рассматриваемых факторов равна 5290,54
Затем просчитываем коэффициент корреляции, который помогает определить тесноту связи между результативным и факторным признаком и сделали вывод, что выполненные расчеты показывают, что между выработкой на 1 рабочего в год и объемом работ собственными силами существует положительная корреляция, которая говорит о том, что с увеличением факторного признака х функциональный признак у увеличивается.
Знак при коэффициенте корреляции совпадает со знаком регрессии а1, что свидетельствует о правильности произведенных вычислений. Случайные факторы оказывают большое влияние на функцию, т.к. r=0,16, следовательно, имеем слабую связь между изучаемыми явлениями.
В заключении, мы выяснили при помощи расчета коэффициента детерминации, что имеется кое какое отклонение, однако оно не существенно и доказали это утверждение нахождением показателя t.
2. Определение показателей вариации
Вариация - это различия в значении какого-либо признака у разных единиц изучаемой совокупности в один и тот же момент времени.
Из исходных данных, которые мы взяли из первого раздела (корреляционный анализ) выделить три группы по результативному признаку у:
Таблица 2.1. Исходные данные
Накладные расходы тыс.руб. |
|||||||||||
6706 |
6387 |
6146 |
6586 |
7482 |
5234 |
5716 |
6580 |
6221 |
5980 |
6720 |
Таблица 2.2.
№ |
1 группа |
?1=5643 |
2 группа |
?2=6438 |
3 группа |
?3=7101 |
|
1 |
5234 |
6706 |
7482 |
||||
2 |
5716 |
6387 |
6720 |
||||
3 |
5980 |
6146 |
|||||
4 |
6586 |
||||||
5 |
6580 |
||||||
6 |
6221 |
Для каждой группы просчитаем ?i=. По данной формуле определим средние значения результативного признака для каждой из данных групп и запишем их в таблицу.
В статистике очень часто используется показатель, который называется дисперсия, представляющая собой среднеквадратическое отклонение индивидуальных значений признака от средней величины. Дисперсия - неименованная величина, т.е. она не имеет единиц измерения. Она рассчитывается как для сгруппированных данных, когда имеет частота признака f, так и для не сгруппированных данных.
2.1 Вычисление групповой дисперсии
Групповая дисперсия отражает случайную вариацию, обусловленную влиянием неучтенных факторов и независящую от признака фактора положенного в основание группировки. Она рассчитывается как для сгруппированных, когда имеет частоту признака, так и для не сгруппированных данных.
Для сгруппированных данных:
уi2=
уi2=
где yi - значение признака;
?i - среднее значение в выборке;
n - число наблюдений в выборке;
f - частоты признака
В данном случае вычисляем групповую дисперсию по формуле для не сгруппированных данных, т.к. у нас не имеется частоты признака f.
Подставив данные в таблице 2.2., найдем дисперсию каждой из трех групп:
у12==95393
у22==41474
у32==145161
Вывод: групповые дисперсии, вычисленные по трем группам, отражают действие всех факторов влияющих на величину выработки на 1 рабочего.
2.2 Вычисление средней из групповых
На основе частных дисперсий можно определить среднюю из групповых дисперсий. В данном случае она отражает изменение величины выработки на 1 рабочего под действием всех факторов влияющих на него, но в среднем по всей совокупности.
Среднюю из групповых вычисляем по формуле:
уi2====75031
Вывод: данная величина показывает зависимость всех рядов совокупности от неучтенных факторов, которые могут воздействовать на эту совокупность.
2.3 Вычисление межгрупповой дисперсии
Межгрупповая дисперсия характеризует вариацию результативного признака, обусловленную влиянием факторного признака положенного в основу группировки, она равна среднеквадратичному отклонению групповых средних величин от общей средней величины для всей изучаемой совокупности.
Межгрупповую дисперсию определяют по формуле:
д2=
Для начала определим общее среднее значение в выборке для всех рядов:
?===6342
д2===243024
Вывод: чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние факторного признака на результативный признак, т.е. на выработку на 1 рабочего. Но для того, чтобы узнать долю межгрупповой дисперсии в общей, нужно определить величину последней.
2.4 Вычисление общей дисперсии
Зная среднюю из групповых дисперсий и межгрупповую, дисперсию, можно определить по правилу сложения общую дисперсию исследуемой совокупности. Общая дисперсия тоже не имеет единицы измерения. Она вычисляется по формуле:
у2=уi2+д2=75031+243024=318055 тыс. руб.
Сделаем проверку правильности вычислений. Для этого сделаем соответствующие вычисления по формуле общей дисперсии:
уi2= - для сгруппированных данных
уi2=- для несгруппированных данных
В нашем случае используем формулу для не сгруппированных данных, где:
yi - значения признака
?i -общее среднее значение признака по всем группам
n - количество значений
у2===318055 тыс. руб.
Т.о. мы получили, что значения совпали, т.е. все проделанные выше вычисления верны.
Вывод: в дальнейшем при помощи общей дисперсии мы сможем вычислить эмпирический коэффициент детерминации, который поможет определить долю межгрупповой дисперсии в общей.
2.5 Вычисление среднеквадратичного отклонения
Мы уже рассмотрели несколько показателей вариации, но самым ярким показателем является среднеквадратичное отклонение. Эта величина показывает, насколько в среднем отклоняются конкретные варианты от их средней величины. Среднеквадратичное отклонение есть корень квадратный из общей дисперсии. Оно измеряется в тех же единицах, что и изучаемый признак.
у===563,96 тыс. руб.
Вывод: чем меньше среднее квадратическое отклонение, тем лучше средняя арифметическая отражает всю представляемую совокупность. В нашем случае среднеквадратическое отклонение показывает, что выработка на 1 рабочего отклоняются от средней величины в 563,96 тыс. руб.
2.6 Вычисление показателя вариации
Для сравнения участи одного и того же признака в нескольких совокупностях с различными средними величинами используют относительный показатель вариации - коэффициент вариации. Он представляет собой выражение в процентах отношения среднеквадратического отклонения к средней величине:
н=*100%=*100%=8,9< 33%
Вывод: измеряемая совокупность является однородной, если коэффициент вариации не превышает 33 %. Здесь это условие выполняется, значит, средняя величина характерна для данной совокупности.
2.7 Вычисление эмпирического коэффициента детерминации
Данный коэффициент представляет собой долю межгрупповой дисперсии в общей дисперсии. Он служит для того, чтобы, определив данную долю, можно было сделать вывод о степени влияния факторных признаков на результат. Эмпирический коэффициент детерминации определяется по формуле:
з2===0,76 (76%)
Вывод: из последних вычислений можно сделать вывод, что величина выработки на 1 рабочего на 76 % зависит от уровня сборности и на 24% зависит от всех остальных факторов.
2.8 Вычисление эмпирического корреляционного отношения
Эмпирическое корреляционное отношение показывает тесноту связи между накладными и расходами и основным факторным признаком. Он вычисляется как корень квадратный из эмпирического коэффициента детерминации. Для качественной оценки тесноты связи используют соотношение Чэддока:
Таблица 2.3
з |
0,1-0,3 |
0,3-0,5 |
0,5-0,7 |
0,7-0,9 |
0,9-0,99 |
|
Сила связи |
слабая |
умеренная |
заметная |
тесная |
Весьма тесная |
з===0,87
Вывод:
Эмпирическое корреляционное отношение показывает тесноту связи между выработкой на 1 рабочего и основным факторным признаком. В моем случае связь тесная.
2.9 Заключение по разделу « Определение показателей вариации»
В первом пункте данного раздела мы вычислили групповую дисперсию для каждой полученной группы и сделали соответствующий вывод: групповые дисперсии, вычисленные по трем группам, отражают действие всех факторов влияющих на величину накладных расходов.
Затем вычисляем среднюю из групповых дисперсий. Данная величина показала зависимость всех рядов совокупности от неучтенных факторов, которые могут воздействовать на эту совокупность.
Следующими действиями были вычисление межгрупповой дисперсии. Мы увидели, что чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние факторного признака на результативный признак, т.е. на выработку на 1 рабочего.
Затем вычислили общую дисперсию правилом сложения и проверили наши получившиеся значения.
Вычисленное далее эмпирический коэффициент детерминации показал, что связь между факторным и результативным признаком весьма тесная.
Среднее квадратическое отклонение выявило, что накладные расходы отклоняется от средней величины на 564 тыс. руб.
В пункте вычисления показателя вариации мы получили, что измеряемая совокупность является однородной, т.к. коэффициент вариации не превышает 33 %. Здесь это условие выполняется, значит, средняя величина характерна для данной совокупности.
С помощью вычисленных общей и межгрупповой дисперсии мы вычислили коэффициент детерминации, который показал, что величина выработки на 1 рабочего на 76% зависит от уровня сборности и на 24 % зависит от всех остальных факторов.
И в заключении, вычислили эмпирическое корреляционное отношение, указывающее на тесную связь выработкой на 1 рабочего и уровнем сборности.
регрессия дисперсия корреляционный
3. Анализ динамических рядов
Таблица 3.1 Исходные данные для выполнения данной задачи
Годы |
Среднесписочная численность работников, чел. |
Стоимость активной части ОПФ, тыс. руб. |
Механовооруженность |
|
1991 |
92 |
75 |
0,82 |
|
1992 |
97 |
85 |
0,87 |
|
1993 |
100 |
88 |
0,88 |
|
1994 |
102 |
92 |
0,9 |
|
1995 |
109 |
95 |
0,87 |
|
1996 |
120 |
97 |
0,81 |
|
1997 |
125 |
101 |
0,81 |
|
1998 |
115 |
105 |
0,91 |
3.1 Определение данных для 3-го динамического ряда по двум исходным рядам
Для определения третьего динамического ряда мы разделим показатели первого ряда на показатели второго ряда, таким образом получим фондоотдачу, единицы измерения которой не будет:
механовооруженность=
3.2 Установление вида ряда динамики
Все три ряда являются моментными, так как не отображают итоги развития изучаемых явлений за отдельные периоды времени (за год).
3.3 Определение среднего уровня ряда динамики
Средний уровень моментного ряда определяется по двум формулам с равноотстоящими и с не равноотстоящими датами:
С равноотстоящими датами:
тыс.руб.
чел.
0,86
Вывод: значения, которые мы вычислили выше показывают средние значения каждого динамического ряда, эти значения понадобятся нам при дальнейших вычислениях.
3.4 Определение показателей изменения уровня динамики: базисный и цепные абсолютные приросты, темпы роста и прироста, абсолютное значение прироста
а) анализ первого динамического ряда по среднесписочной численности работников
Таблица 3.3.
Показатели |
1991 |
1992 |
1993 |
1994 |
1995 |
1996 |
1997 |
1998 |
|
Численность работников, чел. |
92 |
97 |
100 |
102 |
109 |
120 |
125 |
115 |
|
Абсолютный прирост, тыс.руб. |
|||||||||
Базисный |
- |
5 |
8 |
10 |
17 |
28 |
33 |
13 |
|
Цепной |
- |
5 |
3 |
2 |
7 |
11 |
5 |
-10 |
|
Темпы роста % |
|||||||||
Базисный |
- |
105 |
108,7 |
110,9 |
118,5 |
130,4 |
135,9 |
125 |
|
- |
105 |
103,1 |
102 |
106,9 |
110,1 |
104,2 |
92 |
||
Темпы прироста % |
|||||||||
Базисный |
- |
5 |
8,7 |
10,9 |
118,5 |
30,4 |
35,9 |
25 |
|
- |
5 |
3,1 |
2 |
6,9 |
10,1 |
4,2 |
-8 |
||
Абсолютное значение 1% прироста % А(%)= |
- |
0,92 |
0,97 |
1 |
1,02 |
1,09 |
1,2 |
1,25 |
Вывод: по данным таблицы 3.3 можно сказать, что:
- с каждым годом базисные темпы абсолютного прироста увеличивались;
- в цепных абсолютных темпах роста наблюдается нестабильность, однако в базисных идет постоянное увеличение до 1998, после которого произошел спад.
- базисные темпы роста с каждым годом увеличивались, лишь в 1998 году понижается на 2.7%. А в тенденции цепного темпа роста наблюдаются скачки такого же рода, что в абсолютных приростах;
- базисные и цепные темпы прироста аналогичны случаю базисному и цепному темпу роста;
- абсолютное значение 1% прироста в периоде с 1991 до 1998 года только увеличивается.
б) анализ второго динамического ряда по среднегодовой стоимости ОПФ
Таблица 3.4.
Показатели |
1991 |
1992 |
1993 |
1994 |
1995 |
1996 |
1997 |
1998 |
|
Стоимость активной части ОПФ, т. руб. |
75 |
85 |
88 |
92 |
95 |
97 |
101 |
105 |
|
Абсолютный прирост, тыс.руб. |
|||||||||
Базисный |
- |
10 |
13 |
17 |
20 |
22 |
26 |
30 |
|
Цепной |
- |
Подобные документы
Построение интервальных вариационных рядов по показателям. Вычисление средней арифметической, моды и медианы, относительных и абсолютных показателей вариации. Определение количественных характеристик распределений, построение эмпирической функции.
курсовая работа [179,8 K], добавлен 11.01.2012Методы составления закона распределения случайной величины. Вычисление средней арифметической и дисперсии распределения. Расчет средней квадратической ошибки бесповторной выборки. Построение эмпирических линий регрессии, поиск уравнения прямых регрессий.
контрольная работа [77,6 K], добавлен 20.07.2010Показатели тесноты связи. Смысл коэффициентов регрессии и эластичности. Выявление наличия или отсутствия корреляционной связи между изучаемыми признаками. Расчет цепных абсолютных приростов, темпов роста абсолютного числа зарегистрированных преступлений.
контрольная работа [1,5 M], добавлен 02.02.2014Определение вероятности наступления события по формуле Бернулли. Построение эмпирической функции распределения и гистограммы для случайной величины. Вычисление коэффициента корреляции, получение уравнения регрессии. Пример решения задачи симплекс-методом.
контрольная работа [547,6 K], добавлен 02.02.2012Определение числовых характеристик производной случайной функции. Расчет корреляционной функции и дисперсии спектральной плотности. Группировка заданной выборки, построение выборочной функции распределения и гистограммы, доверительного интервала.
контрольная работа [681,0 K], добавлен 02.06.2010Построение линейной множественной регрессии для моделирования потребления продукта в разных географических районах. Расчет оценки дисперсии случайной составляющей. Вычисление и корректировка коэффициентов детерминации. Расчет доверительного интервала.
контрольная работа [814,0 K], добавлен 19.12.2013Вычисление среднего одномерных случайных величин. Определение доверительного интервала для математического ожидания и для дисперсии. Построение эмпирической и приближенной линий регрессии Y по X. Дисперсионный анализ греко-латынского куба второго порядка.
курсовая работа [698,0 K], добавлен 08.05.2012Функциональные и корреляционные зависимости. Сущность корреляционной связи. Методы выявления наличия корреляционной связи между двумя признаками и измерение степени ее тесноты. Построение корреляционной таблицы. Уравнение регрессии и способы его расчета.
контрольная работа [55,2 K], добавлен 23.07.2009Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.
задача [409,0 K], добавлен 17.10.2012Исследование сходимости рядов. Степенной ряд интеграла дифференциального уравнения. Определение вероятности событий, закона распределения случайной величины, математического ожидания, эмпирической функции распределения, выборочного уравнения регрессии.
контрольная работа [420,3 K], добавлен 04.10.2010Построение полигона относительных частот, эмпирической функции распределения, кумулянты и гистограммы. Расчет точечных оценок неизвестных числовых характеристик. Проверка гипотезы о виде распределения для простого и сгруппированного ряда распределения.
курсовая работа [216,2 K], добавлен 28.09.2011Теоретические основы юридической статистики, числовые характеристики. Построение гистограммы выборки. Оценка среднего значения, дисперсии и эксцесса. Выборочное уравнение регрессии по данным корреляционных таблиц. Интервальная оценка распределения.
курсовая работа [1,1 M], добавлен 16.11.2013Обработка одномерной и двумерной случайных выборок. Нахождение точечных оценок. Построение гистограммы функций распределения, корреляционной таблицы. Нахождение выборочного коэффициента корреляции. Построение поля рассеивания, корреляционные отношения.
курсовая работа [1,3 M], добавлен 10.06.2013Cтатистический анализ зависимости давления. Построение диаграммы рассеивания и корреляционной таблицы. Вычисление параметров для уравнений линейной и параболической регрессии, выборочных параметров. Проверка гипотезы о нормальном распределении признака.
курсовая работа [613,3 K], добавлен 24.10.2012Вариация признаков в совокупности. Типы рядов распределения: атрибутивные и вариационные. Классификация по характеру вариации. Основные характеристики и графическое изображение вариационного ряда. Показатели центра распределения и колеблемости признака.
курсовая работа [110,0 K], добавлен 23.07.2009Анализ и обработка статистического материала выборок Х1, Х2, Х3. Вычисление статистической дисперсии и стандарта случайной величины. Определение линейной корреляционной зависимости нормального распределения двух случайных величин, матрицы вероятностей.
контрольная работа [232,5 K], добавлен 25.10.2009Вычисление по классической формуле вероятности. Определение вероятности, что взятая наугад деталь не соответствует стандарту. Расчет и построение графиков функции распределения и случайной величины. Вычисление коэффициента корреляции между величинами.
контрольная работа [708,2 K], добавлен 02.02.2011Определение наличия зависимости показателя Заработная плата от Возраста и Стажа с использованием корреляционной матрицы. Нормальность распределения остатков по: гистограмме остатков, числовым характеристикам асимметрии и эксцессу, критерию Пирсона.
курсовая работа [1,1 M], добавлен 05.12.2013Закон и свойства нормального распределения случайной величины. На основе критерия согласия Пирсона построение гистограммы, статистической функции и теоретической кривой и определение согласованности теоретического и статистического распределения.
курсовая работа [894,5 K], добавлен 30.10.2013Определение вероятности определенного события. Вычисление математического ожидания, дисперсии, среднеквадратического отклонения дискретной случайной величины Х по известному закону ее распределения, заданному таблично. Расчет корреляционных признаков.
контрольная работа [725,5 K], добавлен 12.02.2010