Анализ динамических рядов и построение уравнения многофакторной корреляционной связи
Анализ исходных динамических рядов, их исследование на непрерывность. Количественное изменение тесноты связи признака-функции и признаков-факторов методом парной корреляции. Расчет показателей вариации. Построение уравнения множественной регрессии.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 22.10.2017 |
Размер файла | 503,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru//
Размещено на http://www.allbest.ru//
Аннотация
Курсовая работа нацелена на практическое закрепление знаний студентов по базовым теоретическим знаниям курса Общей Статистики. Работа включает решение комплексной статистической задачи построения уравнения множественной регрессии на конкретном информационном материале. Выполнение работы сопряжено с использованием студентом знаний, теоретических обобщений и навыков их практического применения по высшей прикладной математике, общей теории статистики и теоретическим основам отраслевой экономики.
The object of course work is fastening of theoretical knowledge received at study the course overall statistics. The work includes addressing the complex problem of constructing a statistical multiple regression equation on a specific information material. Performance of work associated with the use of student knowledge, skills and theoretical generalizations of their practical application in higher applied mathematics, statistics, and the general theory of the theoretical foundations of Industrial Economics.
Введение
Весь комплекс расчетных процедур данной работы должен быть выполнен по индивидуальным и стандартным программам на персональном компьютере.
Курсовая работа имеет комплексный характер, ее выполнение включает следующие стадии:
проведение качественного анализа таблицы исходных данных динамических рядов
выпрямление исходных данных динамических рядов
расчет показателей вариации динамических рядов. Ранжирование признаков-факторов
количественное измерение тесноты связи между динамикой признака-функции и определенного числа признаков-факторов методом парной корреляции динамический ряд корреляция регрессия
построение уравнения многофакторной корреляционной связи признака-функции с наиболее значимыми признаками-факторами
1. Качественный анализ таблицы исходных динамических рядов
1.1 Исходные данные
Исходные данные курсовой работы представлены в виде таблицы, содержащей информацию о фактической стоимости геологоразведочных работ комплексной геологоразведочной экспедиции (КГРП) и дифференциированной по видам полезных ископаемых. Данные представлены в сопоставимых ценах, полученных за 20 лет.
Табл. 1
Объемы геологоразведочных работ КГРП за 20 лет
(по сметной стоимости млн. руб)
Годы |
Стоимость ГРР, всего |
В том числе на |
||||
Черные металлы |
Цветные металлы |
Неметаллы |
Из них |
|||
Стройматериалы |
||||||
1 |
16870 |
1109 |
8360 |
5260 |
1760 |
|
2 |
16930 |
1112 |
8470 |
5340 |
1794 |
|
3 |
17080 |
1116 |
8890 |
5380 |
1827 |
|
4 |
17417 |
1117 |
9720 |
5410 |
1770 |
|
5 |
17720 |
1187 |
9031 |
6260 |
1842 |
|
6 |
17882 |
1064 |
8484 |
6862 |
1892 |
|
7 |
18429 |
1473 |
7725 |
8001 |
1930 |
|
8 |
18602 |
1082 |
7050 |
9234 |
2126 |
|
9 |
19557 |
1118 |
6697 |
10492 |
2450 |
|
10 |
19825 |
978 |
6888 |
10696 |
2665 |
|
11 |
19987 |
963 |
6123 |
11593 |
3308 |
|
12 |
16851 |
265 |
5452 |
10594 |
1980 |
|
13 |
15121 |
267 |
4090 |
9806 |
2258 |
|
14 |
15610 |
281 |
4380 |
9918 |
3087 |
|
15 |
15320 |
293 |
4820 |
9615 |
3592 |
|
16 |
15210 |
274 |
4960 |
9349 |
3627 |
|
17 |
16130 |
286 |
5170 |
9864 |
3810 |
|
18 |
16418 |
312 |
5590 |
10010 |
3506 |
|
19 |
16824 |
327 |
5632 |
10217 |
3724 |
|
20 |
17036 |
341 |
5694 |
10282 |
3612 |
В таблице Исходные данные Y- признак-функция (стоимость ГРР),X1, X2, X3, X4 -- признаки-факторы (черные металлы, цветные металлы, неметаллы, стройматериалы соответственно).
Данные в таблице являются однородными, так как показатели представлены в сопоставимых ценах.
Для проверки присутствия балансовой связи необходимо просуммировать значение всех факторов за определенный год и сравнить сумму со значением функции. Если сумма факторов не превышает 100% от значения функции, то балансовая связь присутствует. В нашем примере признак-фактор «из них» при суммировании не учитывается, так как является частью «неметаллов». Расчеты приведены в таблице 2.
Табл. 2
Анализ наличия балансовой связи
Анализируя данные табл 2 очевидно, что качественная балансовая связь присутствует.
1.2 Понятие динамических рядов и их показателей
Динамические ряды являются особой вариацией рядов распределения, характеризующей изменение признака во времени, при этом время меняется в возрастающем порядке, в то время как изменения значений признака не подчинены никаким определенным закономерностям.
Как ряд распределения, динамический ряд имеет и характеристики обычного ряда распределения -- значения признака и частоты (=1). Только в тех случаях, когда процесс циклично повторяется, частоты изменяются и становятся >1.
В зависимости от временного фактора, ряды динамики делятся на моментные и интервальные.
Интевальные динамические ряды характеризуют результат изучаемого процесса за период времени: производство или реализация продукции (за год, квартал, месяц и др. периоды), число принятых на работу, число родившихся и.т.п. Уровни интервального ряда можно суммировать. При этом получается такой же показатель за более длительные интервалы времени.Средний уровень в интервальных рядах динамики исчисляется по формуле средней арифметической простой: (1.2.1) , где у -- уровни ряда, n -- число периодов (уровней ряда)
Моментные уровни рядов динамики характеризуют состояние изучаемого явления на определенные моменты времени. Каждый последующий уровень включает в себя полностью или частично предыдущий показатель. В моментных рядах динамики с равными интервалами времени средний уровень ряда исчисляется по формуле средней хронологической:
(1.2.2)
где y -- уровни моментного ряда, n -- число моментов (уровней ряда), n-1 -- число периодов времени(лет, кварталов, месяцев).
Для характеристики интенсивности развития во времени используются статистические показатели, получаемые сравнением уровней между собой, в результате чего получаем систему абсолютных и относительных показателей динамики: абсолютный прирост, коэффициент роста, темп роста, темп прироста, абсолютное значение 1% прироста. Для характеристики интенсивности развития за длительный период рассчитываются средние показатели: средний уровень ряда, средний абсолютный прирост, средний коэффициент роста, средний темп роста, средний темп прироста, среднее абсолютное значение 1% прироста.
Если в ходе исследования необходимо сравнить несколько последовательных уровней, то можно получить или сравнение с постоянной базой (базисные показатели), или сравнение с переменной базой (цепные показатели).
Базисные показатели характеризуют итоговый результат всех изменений в уровнях ряда от периода базисного уровня до данного (i-го) периода.
Цепные показатели характеризуют интенсивность изменения уровня от одного периода к другому в пределах того промежутка времени, который исследуется.
Абсолютный прирост выражает абсолютную скорость изменения ряда динамики и определяется как разность между данным уровнем и уровнем, принятым за базу сравнения. Абсолютный прирост (базисный):
(1.2.3)
где yi -- значение отчетного уровня ряда динамики; y0 -- значение базисного уровня ряда динамики.
Абсолютный прирост с переменной базой (цепной), который называют скоростью роста, определяется по следующей формуле:
(1.2.4)
где yi - уровень ряда, для изучаемого i-го периода, yi-1 -- уровень ряда для периода, предшествующего изучаемому
Между цепными и базисными абсолютными приростами имеется следующая взаимосвязь: сумма цепных абсолютных приростов равна базисному абсолютному приросту последнего периода ряда динамики.
(1.2.5)
Абсолютный прирост может быть положительным или отрицательным знак. Он показывает, на сколько уровень текущего периода выше (ниже) базисного, и таким образом измеряет абсолютную скорость роста или снижение уровня.
Темп роста показывает относительную скорость роста уровня ряда динамики и представляет собой отношение каждого последующего уровня к предыдущему, принятому за базу сравнения. Темп роста измеряется в %, а коэффициент роста - в долях. Коэффициент роста определяется как отношение последующего уровня к предыдущему или к показателю принятому за базу сравнения. Он определяет, во сколько раз увеличился уровень по сравнению с базисным, а в случае уменьшения -- какую часть базисного уровня составляет сравниваемый.
Относительный прирост определяется следующим образом:
(базисный) (1.2.6)
(цепной) (1.2.7)
Темп роста рассчитывается по формулам:
(цепной) (1.2.8)
(базисный) (1.2.9)
(за весь период) (1.2.10)
Темп роста всегда положителен.
Между цепными и базисными темпами роста имеется взаимосвязь:
1) Произведение последовательных цепных темпов роста равно базисному темпу роста последнего периода:
2)Частное от деления последующего базисного темпа роста на предыдущий равно соответствующему цепному темпу роста
Темп прироста (Тпр) показывает относительную величину прироста и показывает, на сколько процентов сравниваемый уровень больше или меньше уровня, принятого за базу сравнения. Он может быть как положительным, так и отрицательным или равным нулю, он выражается в процентах и долях (коэффициенты прироста); рассчитывается как отношение абсолютного прироста к абсолютному уровню, принятому за базу.
Темп прироста определяется следующим образом:
(1.2.11)
Значение 1 % прироста определяется отношением абсолютного прироста к темпу прироста, и показывает сколько единиц в абсолютном
(1.2.11)
выражении приходится на 1% прироста для данного ряда динамики. Расчет этого показателя целесообразен для цепного способа, для базисного способа он не имеет смысла (будет постоянной величиной).
Абсолютное значение одного процента прироста равно сотой части предыдущего или базисного уровня. Оно показывает, какое абсолютное значение скрывается за относительным показателем -- одним процентом прироста.
Среднегодовой абсолютный прирост равен частному от деления суммы всех цепных абсолютных приростов на их число:
(1.2.12)
где n- число цепных абсолютных приростов в изучаемом периоде
Среднегодовой темп роста - дает точное представление о направленности динамики всего ряда. Рассчитывается как:
(1.2.13)
где, ti - цепной темп роста, а n - число членов ряда.
1.3 Анализ исходных динамических рядов
1.3.1 Исследование динамических рядов на непрерывность
Статистический анализ выполняется для непрерывных динамических рядов, поэтому до начала анализа следует проверить исходные динамические ряды на непрерывность. Для этой цели рассчитываются ряды цепных темпов роста в пределах каждого динамического ряда. Ряд считается непрерывным, если значения цепных темпов роста удовлетворяют определенным неравенствам. Так как в нашей работе мы имеем дело с качественными признаками, то неравенство имеет следующий вид:
0,77 ? ti ? 1,3
За базу принят 1-й уровень.
Наличие в 3-ей,4-й и 5-й колонке
значений <99.999> говорит о том,что имело место деление на ноль.
Показатели по 1-му признаку :
Показатели по 2-му признаку :
Очевидно, что по второму признаку ряд является прерывным, так как имеем три значения, которые не удовлетворяют неравенству: 1.384 ; 0.735 ; 0.275. Для устранения разрывов найдем базисные темпы роста. Ряд можно считать непрерывным, если величина искомых базисных темпов роста не будет превышать 1,2. Рассчитаем базисные темпы роста, которые соответственно равны 1,328 ; 0,976 и 0,239. Очевидно, что 1,328 > 1,2. Так как разрыв не устранен, рассчитаем среднегодовой темп роста, учитывая 5 предшествующих и 5 последующих лет. Если полученное значение будет удовлетворять неравенству, то условно ряд можно считать непрерывным.
Рассчитываем среднегодовой темп роста:
10v1.003*1.004*1.001*1.063*0.896*1.384*0.735*1.033*0.875*0.985*0.275=10v0,23912=0,8667
Так как значение удовлетворяет неравенству, то ряд можно считать условно непрерывным.
Показатели по 3-му признаку :
По третьему признаку у нас так же имеется разрыв (значение 0,750). Базисные темпы роста составляют 0,489 => ряд считаем условно непрерывным.
Показатели по 4-му признаку :
Показатели по 5-му признаку :
По пятому признаку имеется 2 разрыва : 0,599 и 1,367. Базисные темпы роста составляют соответственно 1,125 и 1,754. Так как 1,754 > 1,2, то ищем среднегодовой темп роста:
10v1,152*1,088*1,241*0,599*1,140*1,367*1,164*1,01*1,05*0,92*1,062 =10v1,7512=1,0576
Полученное значение удовлетворяет неравенству, ряд считаем непрерывным.
Так как все разрывы были устранены и ряды считаются условно непрерывными, можно преступать к следующим этапам анализа динамических рядов.
1.3.2 Характеристика исходных динамических рядов
Динамика имеет направленность - растущая и убывающая, и характер -- спокойная, пульсивная и равномерная. Кроме того, выделяют зоны интенсивной динамики (растущей или убывающей).
Для выявления характера динамики составляется таблица абсолютных разностей, каждый уровень которой равен разности двух соседних уровней исходных рядов признака-функции и признаков-факторов. В пределах каждого из столбцов этой таблицы следует выделить точки перегиба признака, которые регистрируют возрастание соседних абсолютных разностей более, чем в 2 раза, или менее знака абсолютных разностей на обратный.
По таблице абсолютных разностей необходимо рассчитать число точек «перегиба» по столбцам и их долю в объеме каждого исходного ряда (20 уровней). Кроме того, необходимо указать количество совпадений точек «перегиба» для каждого из признаков-факторов с признаком-функцией, определить долю этих совпадений в общем числе точек «перегиба» у признака-функции. Если доля точек «перегиба» превышает 50% объема ряда, то это указывает на пульсивный характер динамики. В остальных случаях имеет место спокойная или равномерная динамика. Последняя характеризуется относительно устойчивыми значениями абсолютных разностей. Спокойной динамике соответствуют следующие значения среднегодовых темпов прироста (): 1-3% для количественных признаков и 0,5-1,5% для качественных.
По данным исходной таблицы программа рассчитала абсолютные разности с указанием всех точек перегиба:
Таблица абсолютных разностей с указанием точек перегиба.
(единица под числом - перегиб, ноль - его отсутствие.)
Количество точек перегиба и их доля в объеме каждого ряда:
Количество совпадений точек перегиба признаков-факторов с признаком-функцией и их доля:
Так как динамика является пульсивной, то важно установить жесткость динамической связи признаков-факторов с признаком-функцией. Лишь при наличии таковой можно говорить о надежности информационного поля.
Оценка жесткости динамической связи :
1-й признак-фактор имеет жесткую динамическую связь с признаком-функцией.
2-й признак-фактор имеет жесткую динамическую связь с признаком-функцией.
3-й признак-фактор имеет жесткую динамическую связь с признаком-функцией.
4-й признак-фактор имеет жесткую динамическую связь с признаком-функцией.
Направленность динамики ряда определяется двояко: визуально и расчетным способом. Визуальное определение предполагает сопоставление крайних (последнего и начального) уровней ряда. Второй способ сопряжен с расчетом среднегодовых темпов роста () в пределах изучаемого периода. При растущей динамике >1, при убывающей <1.
Определение диманики по первому способу:
Определение направленности динамических рядов :
По крайним уровням ряда :
Направленность 1-го признака растущая.
Направленность 2-го признака убывающая.
Направленность 3-го признака убывающая.
Направленность 4-го признака растущая.
Направленность 5-го признака растущая.
Динамика функции - растущая, в то время как признаков-факторов и растущая, и убывающая, что свидетельствует о разнонаправленности признака-функции с признаками-факторами ( первый и второй признак-фактор).
Так же программа определила направленность диманики, используя второй способ расчета:
По цепным темпам роста :
Средний цепной темп роста по 1-му признаку равен 1.0005
Динамика растущая.
Средний цепной темп роста по 2-му признаку равен .9398
Динамика убывающая.
Средний цепной темп роста по 3-му признаку равен .9800
Динамика убывающая.
Средний цепной темп роста по 4-му признаку равен 1.0359
Динамика растущая.
Средний цепной темп роста по 5-му признаку равен 1.0386
Динамика растущая.
Так как в рассматриваемом случае одним из признаков-факторов является внутреняя сводка, а два других - разнонаправлены с признаком-функцией, то дальнейший анализ проводим без учета выявленной разнонаправленности.
1.3.3 Анализ характера связи между обобщающим признаком и признаками-факторами
По характеру связи таблицы исходной информации делятся на три вида:
1)балансовые, когда уровни признака-функции формируются из уровней признаков-факторов;
2)аналитические, когда уровни признака-функции и уровни отдельных признаков-факторов связаны аналитически;
3)комбинационные, когда уровни признака-функции связаны аналитически с несколькими признаками-факторами.
Балансовая связь между признаком-функцией и признаками-факторами в исходной таблице может быть полной, представительной и частичной. В рассматриваемом нами варианте по характеру связи таблица исходной информации является балансовой, так как уровни признака-функции формируются из уровней признаков-факторов.
Балансовая связь между признаком-функцией и признаками-факторами в исходной таблице может быть полной, представительной и частичной. Здесь имеет место представительная балансовая связь, удовлетворяющая следующему уравнению:
где, i - индекс признака-фактора, i=1,2,…,n; m - число изучаемых признаков-факторов, mn, yt и xt - ежегодные уровни признака-функции и признака-фактора соответственно
Определяем наличие представительной балансовой связи :
Табл 3
Анализ наличия балансовой связи
Годы |
Ст-ть ГРР, всего |
В том числе на |
||||
Черные Ме |
Цветные Ме |
Неметаллы |
из них |
|||
строиматериалы |
||||||
1 |
16870 |
1109 |
8360 |
5260 |
1760 |
|
2 |
16930 |
1112 |
8470 |
5340 |
1794 |
|
3 |
17080 |
1116 |
8890 |
5380 |
1827 |
|
4 |
17417 |
1117 |
9720 |
5410 |
1770 |
|
5 |
17720 |
1187 |
9031 |
6260 |
1842 |
|
6 |
17882 |
1064 |
8484 |
6862 |
1892 |
|
7 |
18429 |
1473 |
7725 |
8001 |
1930 |
|
8 |
18602 |
1082 |
7050 |
9234 |
2126 |
|
9 |
19557 |
1118 |
6697 |
10492 |
2450 |
|
10 |
19825 |
978 |
6888 |
10696 |
2665 |
|
11 |
19987 |
963 |
6123 |
11593 |
3308 |
|
12 |
16851 |
265 |
5452 |
10594 |
1980 |
|
13 |
15121 |
267 |
4090 |
9806 |
2258 |
|
14 |
15610 |
281 |
4380 |
9918 |
3087 |
|
15 |
15320 |
293 |
4820 |
9615 |
3592 |
|
16 |
15210 |
274 |
4960 |
9349 |
3627 |
|
17 |
16130 |
286 |
5170 |
9864 |
3810 |
|
18 |
16418 |
312 |
5590 |
10010 |
3506 |
|
19 |
16824 |
327 |
5632 |
10217 |
3724 |
|
20 |
17036 |
341 |
5694 |
10282 |
3612 |
|
Всего |
344819 |
14965 |
133226 |
174183 |
52560 |
|
322374 |
||||||
344819 |
= |
100,00% |
||||
322374 |
= |
93,49% |
В нашем случае данные удовлетворяют неравенству, так как 322374 > 0,6*344819 , следовательно можно сделать вывод о наличии представительной балансовой связи.
Программа так же произвела анализ наличия балансовой связи, однако производя расчеты не учитывала наличие внутренней сводки, благодаря чему сделала вывод, что исходная информация некачественная.
Степень представительности генеральной совокупности по годам :
Исходная информация некачественна, либо связь между признаками не балансовая.
Признаки-факторы составляют :108.7%
Опираясь на произведенные в ручную расчеты, можно сделать вывод, что исходная информация качественная и генеральная совокупность представительна, следовательно динамические ряды можно рассматривать как операционное поле последующего анализа.
В зависимости от характера связи между подлежащим и сказуемым таблицы исходной информации по-разному определяется представительность (значимость) признаков-факторов по их влиянию на динамику признака-функции. При балансовой связи признаки-факторы, сонаправленные с признаком-функцией, ранжируются по их представительности, исходя из удельного веса их средней функции.
Найдем долю каждого признака-фактора в признаке-функции. Для этого найдем отношение суммы каждого фактора к сумме функции, проранжировав полученные результаты в убывающем порядке. Затем выберем 2 признака-фактора с наибольшей представительностью.
Табл 4
Доля признаков-факторов в признаке-функции
?X1/?Y |
0,0433995806 |
4,34% |
|
?X2/?Y |
0,3863650205 |
38,64% |
|
?X3/?Y |
0,5051432781 |
50,51% |
|
?X4/?Y |
0,1524277955 |
15,24% |
Проранжировав результаты получаем:
х3 - 50,51%
х2 - 38,64%
х4 - 15,24%
х1 - 4,34%
Выбираем наиболее представительные - х3(50,51%) и х2 - 38,64% .
2. Расчет показателей вариации
2.1 Понятие вариации
Под вариацией понимают количественные изменения величины исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов. Задачи статистического изучения вариации заключаются в следующем:
1) изучение характера и степени вариации признаков у отдельных единиц совокупности;
2) определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности.
Наличие вариации обусловлено влиянием большого числа факторов на формирование уровня признака.
Эти факторы действуют с неодинаковой силой и в разных направлениях.
Для описания меры изменчивости признаков используют абсолютные (размах вариации ,среднее линейное отклонение, дисперсия, среднее квадратическое отклонение) и относительные (коэффициенты вариации, коэффициент осцилляции, относительное линейное отклонение) показатели вариации.
1) среднее линейное отклонение - представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической:
(2.1.1)
(2.1.2)
Первая формула применяется, если каждый из вариантов встречается в совокупности только один раз, а вторая - в рядах с неравными частотами. Необходимость использования в формулах среднего линейного отклонения модулей отклонений вариантов от средней вызвана тем, что алгебраическая сумма этих отклонений равна нулю по свойствам средней арифметической. Среднее линейное отклонение показывает, насколько в среднем колеблется величина признака у единиц исследуемой совокупности, и выражается в тех же единицах измерения, что и варианты.
2) дисперсия -средняя из квадратов отклонений вариантов значений признака от их средней величины
дисперсия не взвешенная (простая):
(2.1.3)
дисперсия взвешенная:
(2.1.4)
Свойства дисперсии.
1. Дисперсия постоянной величины равна 0.
2. Уменьшение всех значений признака на одну и ту же величину не изменяет величину дисперсии
3. Уменьшение всех значений признака в к раз уменьшает дисперсию в k2 раз
4. Средний квадрат отклонений, исчисленный от среднего арифметического, всегда будет меньше среднего квадрата отклонений, исчисляемого от любой другой величины. Величина различия между ними вполне определенная, это квадрат разности между средней и этой условной величиной
3) среднее квадратическое отклонение - регистрирует интервал колебания признака
(2.1.5)
(2.1.6)
4) коэффициент вариации - применяется для сравнения вариаций различных признаков, используется как характеристика однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%.
(2.1.7)
(2.1.8)
5) размах вариации - показывает лишь крайние (min, max) отклонения признака от общей средней
R=Х(max)-X(min) (2.1.9)
6) Коэффициент осцилляции отражает относительную колеблемость крайних значений признака вокруг общей средней.
(2.1.10)
7) Линейный коэффициент вариации характеризует долю усредненного значения абсолютных отклонений (модуль отклонений) от средней величины
(2.1.11)
2.2 Расчет показателей вариации
Программа рассчитала показатели вариации для каждого признака:
Показатели вариации для 1-го признака :
Показатели вариации для 2-го признака :
Показатели вариации для 3-го признака :
Показатели вариации для 4-го признака :
Показатели вариации для 5-го признака :
Так как в исходной таблице признаки - количественные, то критериальным показателем является коэффициент вариации. Чем меньше значение коэффициента вариации - тем устойчивее признак.
Х1 = 54,63 Х2 = 22,07 Х3 = 21,18 Х4 = 27,69
Основываясь на полученные показатели вариации очевидно, что наиболее услойчивыми признаками являются второй и третий. Наиболее неустойчиный признак - четвертый. Проранжируем признаки-факторы по их вариабельности от наиболее устойчивого к наименее устойчивому:
Х3 = 21,18
Х2 = 22,07
Х4 = 27,69
Х1 = 54,63
3. Понятие регрессии
Для количественного описания взаимосвязей между экономическими переменными в статистике используют методы регрессии и корреляции
Регрессия в статистике -- статистическая зависимость среднего значения случайной величины от значений другой случайной величины или нескольких случайных величин; введена Фрэнсисом Гальтоном.
В отличие от функциональной зависимости y=f(x), которая каждому значению независимой переменной x ставит в соответствие одно определённое значение величины y, при регрессионной зависимости одному и тому же значению x могут соответствовать различные значения величины y. Если при каждом значении наблюдаетсязначений величины y, то зависимость среднего арифметического
<у> = (y1 + ….+ yini)/ni
от и является средней регрессией.
Регрессионный (линейный) анализ -- статистический метод исследования влияния одной или нескольких независимых переменных x1, x2,x3,xi на зависимую переменную y. Регрессионный анализ предполагает следущие цели:
Определение степени детерминированности вариации критериальной (зависимой) переменной предикторами (независимыми переменными)
Предсказание значения зависимой переменной с помощью независимой(-ых)
Определение вклада отдельных независимых переменных в вариацию зависимой
Регрессионный анализ нельзя использовать для определения наличия связи между переменными, поскольку наличие такой связи и есть предпосылка для применения анализа.
Существует линейная и нелинейная регрессия. Линейная регрессия предполагает, что функция f зависит от параметров w линейно. Линейная регрессионная модель разбивает зависимость целевой переменной Y от независимых переменных Xi на отдельные, не связанные между собой компоненты. Она позволяет оценить вклад каждой независимой переменной по отдельности, определив знак и силу этого влияния. Если используется критерий наименьших квадратов, то существует эффективный алгоритм вычисления значений регрессионных коэффициентов Ai, который основан на проведении достаточно простых матричных операций. Важно отметить, что результатом работы алгоритмов, решающих линейную регрессионную задачу, является не только оценка точности полученной регрессионной модели, но также стандартные отклонения входящих в нее регрессионных коэффициентов. Поэтому мы можем судить о значимости (не случайности) вхождения отдельных переменных в регрессионную модель. Мерой этой значимости может служить значение F_статистики - квадрата отношения величины регрессионного коэффициента к величине его стандартного отклонения.
Нелинейные регрессии могут быть разделены на два существенно различных класса. Первым и более простым является класс нелинейных зависимостей, в которых имеется нелинейность относительно объясняющих переменных, но которые остаются линейными по входящим в них и подлежащим оценке параметрам. Сюда входят полиномы различных степеней и ранвосторонняя гипербола. Такая нелинейная регрессия легко сводится к обычной линейной регрессии для новых переменных. Поэтому оценка параметров в этом случае выполняется просто по методу наименьших квадратов, поскольку зависимости линейны по параметрам.
Регресии, нелинейные по параметрам разделяются на два подкласса:внешние нелинейные ( в этом случае модель можно привести к линейному виду с помощью преобразований) и внутренние нелинейные, которые преобразовать к линейному виду нельзя. Если модель внутренне нелинейна по параметрам, то для оценки параметров используются численные итеративные процедуры, успешность которых зависит от вида уравнений и от особенностей применяемого итеративного метода.
Особого внимания заслуживает исследование корреляции для нелинейной регресии. В общем случаепарабола второй степени, так же как и полиномы более высокого порядка, при линеаризации принимает вид уравнения множественной регрессии. Если нелинейное относительно объясняемой базы переменной уравнение регрессии при линеализации принимает форму линейного уравнения парной регрессии, то для оценки тесноты связи может быть использован линейный коэффициент корреляции.
Если преобразования уравнения регрессии в линейную форму связаны с зависимой переменной, то линейный коэф корреляции по преобразованным значениям признаков дает лишь приближенную оценку связи и численно не совпадает с индексом корреляции.
4. Количественное изменение тесноты связи признака-функции и признаков-факторов методом парной корреляции
4.1 Определение корреляции
Важнейшей целью статистики является изучение объективно существующих связей между явлениями. В ходе статистического исследования этих связей необходимо выявить причинно-следственные зависимости между показателями, т.е. насколько изменение одних показателей зависит от изменения других показателей.
Существует две категории зависимостей (функциональная и корреляционная) и две группы признаков: признаки, обуславливающие изменения других, связанных с ними признаков - факторные и признаки, изменяющиеся под действием факторных признаков (результативными). В отличие от функциональной связи, где существует полное соответствие между факторными и результативными признаками, в корреляционной связи отсутствует это полное соответствие.
Корреляционная связь (которую также называют неполной, или статистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Объяснение тому - сложность взаимосвязей между анализируемыми факторами, на взаимодействие которых влияют неучтенные случайные величины. Поэтому связь между признаками проявляется лишь в среднем, в массе случаев. При корреляционной связи каждому значению аргумента соответствуют случайно распределенные в некотором интервале значения функции.
В корреляционных связях между изменением факторного и результативного признака нет полного соответствия. Одновременное воздействие на изучаемый признак большого количества самых разнообразных факторов приводит к тому, что одному и тому же значению признака-фактора соответствует целое распределение значений результативного признака, поскольку в каждом конкретном случае прочие факторные признаки могут изменять силу и направленность своего воздействия
При сравнении функциональных и корреляционных зависимостей следует иметь в виду, что при наличии функциональной зависимости между признаками можно, зная величину факторного признака, точно определить величину результативного признака. При наличии же корреляционной зависимости устанавливается лишь тенденция изменения результативного признака при изменении величины факторного признака. В отличие от жесткости функциональной связи, корреляционные связи характеризуются множеством причин и следствий, и устанавливаются лишь их тенденции.
Корреляция -- это статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом, изменения одной или нескольких из этих величин приводят к систематическому изменению другой или других величин. Математической мерой корреляции двух случайных величин служит коэффициент корреляции.
Корреляционное поле и корреляционная таблица являются исходными данными при корреляционном анализе. Пусть , , - результаты парных наблюдений над случайными величинами Х и Y. Изображая полученные результаты в виде точек в декартовой системе координат, получим корреляционное поле. По характеру расположения точек поля можно составить предварительное представление о форме зависимости случайных величин (например, о том, что одна из них в среднем возрастает или убывает с возрастанием другой).
Корреляционный анализ -- метод обработки статистических данных, с помощью которого измеряется теснота связи между двумя или более переменными. Корреляционный анализ тесно связан с регрессионным анализом, с его помощью определяют необходимость включения тех или иных факторов в уравнение множественной регрессии, а также оценивают полученное уравнение регрессии на соответствие выявленным связям (используя коэффициент детерминации)
Эмпирический коэффициент детерминации широко используется в задачах статистики и является показателем, который представляет долю межгруппопой дисперсии в общей дисперсии результативного признака и характеризует силу влияния группировочного признака на образование общей вариации. Он может быть рассчитан по формуле:
(4.1.1)
Данный коэффициент показывает долю вариации результативного признака у под влиянием фактора х. При отсутствии связи эмпирический коэффициент детерминации равен нулю, а при функциональной сильной связи -- единице.
Корреляционный анализ имеет своей задачей определение тесноты связи между признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной). По силе различаются сильные и слабые связи, либо полное их отсутствие. Относительно своей аналитической формы связи бывают линейными и нелинейными. Степень, сила или теснота корреляционной связи определяется по величине коэффициента корреляции.
(4.2.2)
r изменяется в пределах от -1 до 1.
В данном случае это линейный коэффициент корреляции, он показывает линейную взаимосвязь между x1 и x2: r равен 1 (или -1), если связь линейна.
Связь считают сильной (тесной), средней если 0,5<r<0,69 , умеренной тесноты при 0,3< r <0,49 , слабой при 0,2<r<0,29 и очень слабой при r<0,19.
Частный коэффициент корреляции (partial correlation coefficient) -- это мера зависимости между двумя переменными при фиксированных (исключенных) или скорректированных эффектах одной или нескольких переменных.
Множественная корреляция занимается изучением, измерением связи между результативным признаком и двумя и более факторными.
Парная корреляция -- это связь между двумя показателями, один из которых является факторным, а другой -- результативным.
В наиболее общем виде задача статистики в области изучения взаимосвязей состоит в количественной оценке их наличия и направления, а также характеристике силы и формы влияния одних факторов на другие. Для ее решения применяются две группы методов, одна из которых включает в себя методы корреляционного анализа, а другая--регрессионный анализ. В то же время, ряд исследователей объединяет эти методы в корреляционно-регрессионный анализ, что имеет под собой некоторые основания: наличие целого ряда общих вычислительных процедур, взаимодополнения при интерпретации результатов.
С помощью корреляционно-регрессионного анализа определяют необходимость включения тех или иных факторов в уравнение множественной регрессии, а также оценивают полученное уравнение регрессии на соответствие выявленным связям, используя коэффициент детерминации.
Поэтому в данном контексте можно говорить о корреляционном анализе в широком смысле, когда всесторонне характеризуется взаимосвязь. В то же время выделяют корреляционный анализ в узком смысле, когда исследуется сила связи и регрессионный анализ, в ходе которого оценивается ее форма и воздействие одних факторов на другие.
4.2 Анализ коэффициентов парной корреляции
Для дальнейшего анализа программа рассчитала коэффициент парной корреляции для каждого признака:
Расчет коэффициентов парной корреляции :
Промежуточные цифры для 1-й пары признаков :
Промежуточные цифры для 2-й пары признаков :
Промежуточные цифры для 3-й пары признаков :
Промежуточные цифры для 4-й пары признаков :
Полученные коэффициенты парной корреляции :
Очевидно, что здесь имеет место братная связь в четвертом признаке, так как полученный коэффициент парной корреляции имеет отрицательное значение. Наиболее надежной является связь приснака-функции с первым признаком-фактором, как как имеет наибольший коэффициент.
Проранжируем полученные коэффициенты по степени надежности связи :
Х1 : 0,7
Х2 : 0,46
Х3 : 0,09
Х4 : -0,29
Для построения уравнения множественной регрессии создадим сводную таблицу, отражающую все ранжирования по различным критериям (табл 5)
Табл 5
Сводная таблица
Представительность |
Коэффициент вариации |
Коэффициент парной корреляции |
|
Х3 |
Х3 |
Х1 |
|
Х2 |
Х2 |
Х2 |
|
Х4 |
Х4 |
Х3 |
|
Х1 |
Х1 |
Х4 |
По данным таблицы необходимо выбрать два наиболее подходящих признака. Эти признаки выбираются по долевому представительсву, коэффициенту вариации и коэффициенту парной корреляции.
Наиболее представительным и имеющим наименьший коэффициент вариации является третий признак-фактор. Следующим за ним является второй, подходящий по всем трем критериям.
5. Построение уравнения многофакторной корреляционной связи
Для построения уравнения многофакторной регрессии необходимо найти коэффициенты регрессии для признаков Х2 и Х3. Данные коэффициенты показыва.т, на какую величину в среднем изменится результативный признак Y, если переменную Xj увеличить на единицу измерения.
Программа рассчитала коэффициенты регрессии, где b1=С , b2=а , b3=b
Коэффициенты регрессии :
Расчет абсолютной ошибки :
Итерация равна : 7
Абсолютная ошибка равна : .612377E+03
Относительная ошибка равна : 3.06%
Расчет произведен по 11-му уровню.
Ошибка не превышает регламента.
Имитация явления данным уравнением надежна.
Теперь необходимо произвести ручную проверку. Берем данные первых двух признаков-факторов за первый год из исходных данных табл 1 и подставляем в уравнение регрессии:
у=аХ1+bХ2+с
а=1,417
b=1,004
c= -951,971
y(1)= 16870
Определим погрешность:
(16870-9012,992)/16870 = 0,46 %
Так как определенная нами ошибка не превышает регламента, то можно говорить о надежности поля регресии.
Заключение
Таким образом, в данной курсовой работе был произведен качественный анализ динамических рядов, исследование их на непрерывность, произведено ранжирование признаков-факторов по их представительности, коэффициенту вариации и коэффициенту парной корреляции, были рассчитаны различные показатели вариации, было построено уравнение множественной регрессии и обобщены теоретические знания, затрагивающие данную тему.
Полученное в данной работе уравнение является корректным, так как относительная ошибка не превышает предельно допустимый регламент. Имитация явления данным уравнением надежна.
Размещено на Allbest.ru
...Подобные документы
Функциональные и корреляционные зависимости. Сущность корреляционной связи. Методы выявления наличия корреляционной связи между двумя признаками и измерение степени ее тесноты. Построение корреляционной таблицы. Уравнение регрессии и способы его расчета.
контрольная работа [55,2 K], добавлен 23.07.2009Характеристика экзогенных и эндогенных переменных. Теорема Гаусса-Маркова. Построение двухфакторного и однофакторных уравнения регрессии. Прогнозирование значения результативного признака. Оценка тесноты связи между результативным признаком и факторами.
курсовая работа [575,5 K], добавлен 19.05.2015Построение многофакторной корреляционно-регрессионной модели доходности предприятия: оценка параметров функции регрессии, анализ факторов на управляемость, экономическая интерпретация модели. Прогнозирование доходности на основе временных рядов.
дипломная работа [5,1 M], добавлен 28.06.2011Исследование сходимости рядов. Степенной ряд интеграла дифференциального уравнения. Определение вероятности событий, закона распределения случайной величины, математического ожидания, эмпирической функции распределения, выборочного уравнения регрессии.
контрольная работа [420,3 K], добавлен 04.10.2010Показатели тесноты связи. Смысл коэффициентов регрессии и эластичности. Выявление наличия или отсутствия корреляционной связи между изучаемыми признаками. Расчет цепных абсолютных приростов, темпов роста абсолютного числа зарегистрированных преступлений.
контрольная работа [1,5 M], добавлен 02.02.2014Методика и основные этапы расчета параметров линейного уравнения парной регрессии с помощью программы Excel. Анализ качества построенной модели, с использованием коэффициента парной корреляции, коэффициента детерминации и средней ошибки аппроксимации.
лабораторная работа [22,3 K], добавлен 15.04.2014Построение интервальных вариационных рядов по показателям. Вычисление средней арифметической, моды и медианы, относительных и абсолютных показателей вариации. Определение количественных характеристик распределений, построение эмпирической функции.
курсовая работа [179,8 K], добавлен 11.01.2012Исследование числовых рядов на сходимость. Область сходимости для разных степенных рядов. Разложение функции в ряд Тейлора. Нормы сеточной функции. Исследование устойчивости разностной схемы для однородного уравнения. Совокупность разностных уравнений.
курсовая работа [586,9 K], добавлен 19.04.2011Построение уравнения регрессии. Оценка параметров линейной парной регрессии. F-критерий Фишера и t-критерий Стьюдента. Точечный и интервальный прогноз по уравнению линейной регрессии. Расчет и оценка ошибки прогноза и его доверительного интервала.
презентация [387,8 K], добавлен 25.05.2015Ознакомление с математическим аппаратом анализа временных рядов и моделями авторегрессии. Составление простейших моделей авторегрессии стационарных временных рядов. Оценка дисперсии и автоковариации, построение графика автокорреляционной функции.
лабораторная работа [58,7 K], добавлен 14.03.2014Определение вероятности наступления события по формуле Бернулли. Построение эмпирической функции распределения и гистограммы для случайной величины. Вычисление коэффициента корреляции, получение уравнения регрессии. Пример решения задачи симплекс-методом.
контрольная работа [547,6 K], добавлен 02.02.2012Описание признака сходимости числовых рядов Даламбера, решение задач на исследование сходимости. Формулировка радикального признака сходимости Коши знакоположительного ряда в предельной форме. Доказательство знакочередующихся и знакопеременных рядов.
реферат [190,9 K], добавлен 06.12.2010Аппроксимация функции y = f(x) линейной функцией y = a1 + a2x. Логарифмирование заданных значений. Расчет коэффициентов корреляции и детерминированности. Построение графика зависимости и линии тренда. Числовые характеристики коэффициентов уравнения.
курсовая работа [954,7 K], добавлен 10.01.2015Определение частных производных первого и второго порядков заданной функции, эластичности спроса, основываясь на свойствах функции спроса. Выравнивание данных по прямой методом наименьших квадратов. Расчет параметров уравнения линейной парной регрессии.
контрольная работа [99,4 K], добавлен 22.07.2009Применение в статистике конкретных методов в зависимости от заданий. Методы массовых наблюдений, группировок, обобщающих показателей, динамических рядов, индексный метод. Корреляционный и дисперсный анализ. Расчет средних статистических величин.
контрольная работа [29,5 K], добавлен 21.09.2009Построение диаграммы рассеивания, полигонов, гистограмм нормированных относительных частот, эмпирических функций распределения по X и по Y. Параметры для уравнения параболической регрессии. Проверка гипотезы о нормальном распределении признака Х.
курсовая работа [511,8 K], добавлен 08.12.2013Исследование и подбор матрицы, удовлетворяющей условиям заданного уравнения. Разложение функции по формуле Тейлора в окрестности точки, расчет коэффициентов. Формирование уравнения гиперболы, имеющего заданные координаты фокусов. Расчет корней уравнения.
контрольная работа [113,2 K], добавлен 16.04.2016Понятие о голоморфном решении задачи Коши. Теорема Коши о существовании и единственности голоморфного решения задачи Коши. Решение задачи Коши для линейного уравнения второго порядка при помощи степенных рядов. Интегрирование дифференциальных уравнений.
курсовая работа [810,5 K], добавлен 24.11.2013Дифференциальные уравнения при входном воздействии типа скачка для заданной электрической цепи. Применение преобразования Лапласа при нулевых начальных условиях. Решение уравнения операторным методом. Построение частотных характеристик цепи. Ее динамика.
курсовая работа [721,0 K], добавлен 27.05.2008Построение модели множественной регрессии теоретических значений динамики ВВП, определение средней ошибки аппроксимации. Выбор фактора, оказывающего большее влияние. Построение парных моделей регрессии. Определение лучшей модели. Проверка предпосылок МНК.
курсовая работа [352,9 K], добавлен 26.01.2010