Корреляционно-регрессионный анализ данных из экономики Кыргызстана
Использование корреляционной зависимости для прогнозирования и принятия управленческих решений. Характеристика определения форм уравнения регрессии. Исследование корреляции валового внутреннего продукта на душу населения и импорта товаров и услуг.
Рубрика | Экономика и экономическая теория |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 01.10.2016 |
Размер файла | 384,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Бишкек 2016
Государственное образовательное учреждение высшего профессионального образования
Кыргызско-Российский Славянский университет
Факультет международных отношений
Тема: «Корреляционно-регрессионный анализ данных из экономики Кыргызстана»
Выполнил:
Махмудов Руслан
Руководитель:
Байзаков А.Б.
1. Сущность корреляционно-регрессионного анализа
Корреляционно-регрессионный анализ используется для исследования форм связи, устанавливающих количественные соотношения между случайными величинами изучаемого процесса. В социально-экономическом прогнозировании этот метод применяют для построения условных прогнозов и прогнозов, основанных на оценке устойчивых причинно-следственных связей. При этом значение независимой переменной (х) нам известно по предположению. В процессе прогнозирования оно может быть использовано нами для оценки зависимой переменной (у). Фуикция регрессии у = (х1 х2 х3, х4, ... хn) показывает, каким будет в среднем значение переменной г/, если переменные х примут конкретное значение.
Переменная у характеризующая результат, формируется под воздействием других переменных и факторов. Поэтому она всегда сто- хастична (случайна) по природе. Переменные х (объясняющие переменные) характеризуют причину. Они поддаются регистрации, а часть из них -- планированию и регулированию. Значения ряда переменных х могут характеризовать внутренние элементы системы или задаваться «извне» прогнозируемой системы.
По своей природе объясняющие переменные могут быть случайными и неслучайными. Регрессионные остатки є -- это латентные (скрытые) случайные компоненты, влияющие на г/, а также случайные ошибки в измерении анализируемых результирующих переменных.
В зависимости от количества исследуемых переменных различают парную и множественную корреляцию. Парная корреляция -- корреляционные связи между двумя переменными. Примерами парной корреляции могут служить зависимости между уровнем образования и производительностью труда, между ценой товара и спросом на него, между качественными параметрами товара и ценой. Экономико-математические модели, построенные с учетом такого рода взаимосвязей, называют однофакторными моделями. Следует отметить, что в практике прогнозирования экономических явлений однофакторные модели занимают значительное место, что определяется простотой вычислительного процесса и ясностью экономической интерпретации результатов.
Множественная корреляция -- корреляционные взаимосвязи между несколькими переменными. В качестве ее примеров можно привести зависимость спроса на товар от цены, уровня доходов населения, расходов на рекламу; зависимость объема выпускаемой продукции от размера инвестиций, технического уровня оборудования, численности занятых в процессе производства.
Примером использования корреляционной зависимости для прогнозирования и принятия управленческих решений могут служить кривые спроса и предложения, на основе которых строятся модели, описывающие последствия изменения цен.
В конце XIX в. немецкий статистик Э. Энгель сформулировал законы и построил кривые, согласно которым с ростом дохода доля расходов на питание сокращается, на одежду и жилище остается неизменной, а на образование и лечение -- увеличивается. Эти кривые послужили исходным пунктом построения различных моделей, описывающих поведение покупателей при изменении их доходов и соответственно используемых при прогнозировании спроса на товары и услуги.
Немецкий исследователь Г. Госсен сформулировал утверждение о зависимости потребительской оценки полезности от количества благ и дал им математическую интерпретацию.
Примерами множественной корреляции могут служить различные модели экономического роста (модель Е. Домара, модель Р.Ф. Харрода, модель Р. Солоу), описывающие зависимость реального дохода в экономике от наиболее значимых факторов.
В конце 1960-х гг. эмпирическим путем была установлена закономерность снижения переменных издержек на производство единицы продукции на 10--30% при каждом удвоении объема производства. Эта зависимость получила название кривой опыта, она лежит в основе многих концепций деловой стратегии.
При анализе временных рядов часто встречается ложная корреляция, когда параллельно повышаются или снижаются показатели, на самом деле совершенно не зависящие друг от друга. Ложная корреляция -- это отсутствие причинной связи между явлениями, связанными корреляционной связью.
Регрессионный анализ -- часть теории корреляции. В процессе регрессионного анализа решаются задачи выбора независимых переменных, существенно влияющих на зависимую величину, определение формы уравнения регрессии, оценивание параметров.
Я рассмотрю модель линейной регрессии как наиболее доступную для понимания и довольно часто используемую на практике. Множественные модели также находят практическое применение, но обычно для их построения используются пакеты прикладных программ. Проблема, с которой сталкивается прогнозист при использовании пакетов прикладных программ, заключается в оценке адекватности отображения действительности и будущих взаимосвязей в регрессионных моделях и корректное их использование для прогнозирования будущего.
2. Методы изучения взаимосвязи социально-экономических явлений с помощью корреляционно-регрессивного анализа
Существующие между явлениями формы и виды связей весьма разнообразны по своей классификации. Предметом статистики являются только такие из них, которые имеют количественный характер и изучаются с помощью количественных методов. Рассмотрим метод корреляционно-регрессионного анализа, который является основным в изучении взаимосвязей явлений.
Данный метод содержит две свои составляющие части -- корреляционный анализ и регрессионный анализ. Корреляционный анализ -- это количественный метод определения тесноты и направления взаимосвязи между выборочными переменными величинами. Регрессионный анализ -- это количественный метод определения вида математической функции в причинно-следственной зависимости между переменными величинами.
Для оценки силы связи в теории корреляции применяется шкала английского статистика Чеддока: слабая -- от 0,1 до 0,3; умеренная -- от 0,3 до 0,5; заметная -- от 0,5 до 0,7; высокая -- от 0,7 до 0,9; весьма высокая (сильная) -- от 0,9 до 1,0. Она используется далее в примерах по теме.
Данная корреляция характеризует линейную взаимосвязь в вариациях переменных. Она может быть парной (две коррелирующие переменные) или множественной (более двух переменных), прямой или обратной -- положительной или отрицательной, когда переменные варьируют соответственно в одинаковых или разных направлениях.
Если переменные -- количественные и равноценные в своих независимых наблюдениях при их общем количестве , то важнейшими эмпирическими мерами тесноты их линейной взаимосвязи являются коэффициент прямой корреляции знаков австрийского психолога Г.Т.Фехнера (1801-1887) и коэффициенты парной, чистой (частной) и множественной (совокупной) корреляции английского статистика-биометрика К.Пирсона (1857-1936).
Коэффициент парной корреляции знаков Фехнера определяет согласованность направлений в индивидуальных отклонениях переменных и от своих средних и . Он равен отношению разности сумм совпадающих () и несовпадающих () пар знаков в отклонениях и к сумме этих сумм:
Величина Кф изменяется от -1 до +1. Суммирование в (1) производится по наблюдениям, которые не указаны в суммах ради упрощения. Если какое-то одно отклонение или , то оно не входит в расчет. Если же сразу оба отклонения нулевые: , то такой случай считается совпадающим по знакам и входит в состав . В таблице 1 показана подготовка данных для расчета (1).
Таблица 1 Данные для расчета коэффициента Фехнера.
Магазин |
Число работников, тыс. чел. |
Товарооборот, у.е. |
Отклонение от средних и |
Сравнение знаков и |
|||
совпа-дение |
несов-падение (Нк) |
||||||
1 |
0,2 |
3,1 |
+0,0 |
-0,9 |
0 |
1 |
|
2 |
0,1 |
3,1 |
-0,1 |
-0,9 |
1 |
0 |
|
3 |
0,4 |
5,0 |
+0,2 |
+1,0 |
1 |
0 |
|
4 |
0,2 |
4,4 |
+0,0 |
+0,4 |
1 |
0 |
|
5 |
0,1 |
4,4 |
-0,1 |
+0,4 |
0 |
1 |
|
Итого |
1,0 |
20,0 |
- |
- |
3 |
2 |
По (1) имеем Кф = (3 -- 2)/(3 + 2) = 0,20. Направление взаимосвязи в вариациях и объема товарооборота -- положительное (прямолинейное): знаки в отклонениях и и в своем большинстве (в 3 случаях из 5) совпадают между собой. Теснота взаимосвязи переменных по шкале Чеддока -- слабая.
Коэффициенты парной, чистой (частной) и множественной (совокупной) линейной корреляции Пирсона, в отличие от коэффициента Фехнера, учитывают не только знаки, но и величины отклонений переменных. Для их расчета используют разные методы. Так, согласно методу прямого счета по несгруппированным данным, коэффициент парной корреляции Пирсона имеет вид:
Этот коэффициент также изменяется от -1 до +1. При наличии нескольких переменных рассчитывается коэффициент множественной (совокупной) линейной корреляции Пирсона. Для трех переменных x, y, z он имеет вид
Этот коэффициент изменяется от 0 до 1. Если элиминировать (совсем исключить или зафиксировать на постоянном уровне) влияние на и , то их "общая" связь превратится в "чистую", образуя чистый (частный) коэффициент линейной корреляции Пирсона:
Этот коэффициент изменяется от -1 до +1. Квадраты коэффициентов корреляции (2)-(4) называются коэффициентами (индексами) детерминации -- соответственно парной, чистой (частной), множественной (совокупной):
Каждый из коэффициентов детерминации изменяется от 0 до 1 и оценивает степень вариационной определенности в линейной взаимосвязи переменных, показывая долю вариации одной переменной (y), обусловленную вариацией другой (других) -- x и y. Многомерный случай наличия более трех переменных здесь не рассматривается.
Согласно разработкам английского статистика Р.Э. Фишера (1890-1962), статистическая значимость парного и чистого (частного) коэффициентов корреляции Пирсона проверяется в случае нормальности их распределения, на основании -распределения английского статистика В.С. Госсета (псевдоним "Стьюдент"; 1876-1937) с заданным уровнем вероятностной значимости и имеющейся степени свободы , где -- число связей (факторных переменных). Для парного коэффициента имеем его среднеквадратическую ошибку и фактическое значение -критерия Стьюдента:
Для чистого коэффициента корреляции при расчете его вместо (n-2) надо брать , т.к. в этом случае имеется m=2 (две факторные переменные x и z). При большом числе n>100 вместо (n-2) или (n-3) в (6) можно брать n, пренебрегая точностью расчета.
Если tr > tтабл. , то коэффициент парной корреляции -- общий или чистый является статистически значимым, а при tr ? tтабл. -- незначимым.
Значимость коэффициента множественной корреляции R проверяется по F -- критерию Фишера путем расчета его фактического значения
При FR > Fтабл. коэффициент R считается значимым с заданным уровнем значимости a и имеющихся степенях свободы и , а при Fr? Fтабл -- незначимым.
В совокупностях большого объема n > 100 для оценки значимости всех коэффициентов Пирсона вместо критериев t и F применяется непосредственно нормальный закон распределения (табулированная функция Лапласа-Шеппарда).
Наконец, если коэффициенты Пирсона не подчиняются нормальному закону, то в качестве критерия их значимости используется Z -- критерий Фишера, который здесь не рассматривается.
Анализ данных Кыргызстана
1. Изучение зависимости ВВП на душу населения и импорта товаров и услуг. Данные в таблице 2.
Таблица 2
Год |
ВВП на душу населения |
Импорт товаров и услуг |
|
Тысячи сом |
млн. сом |
||
2010 |
42,4 |
179 994,4 |
|
2011 |
54,4 |
233 485,4 |
|
2012 |
58 |
295 791,4 |
|
2013 |
65 |
326077,6 |
|
2014 |
71,8 |
351318,6 |
|
2015 |
74,4 |
305 982,8 |
|
Итого: |
492,9 |
1 692 650,2 |
Имея такие данные можно посчитать коэффициент корреляции r. r = 0,901652055, что говорит о тесной связи. Иначе говоря, при повышении ВВП на душу населения растет и импорт товаров и услуг. Что в принципе логично, ведь имея больше денег, люди будут стремиться покупать импортные товары.
Чтобы рассмотреть тенденцию изменения данных величин, лучше начертить график. корреляционный регрессия валовый импорт
График 1
На графике хорошо видно, что точки находятся близко к линии, построенной по уравнению регрессии: y = 4815,5x - 11635. При увеличении ВВП растет и объем импорта.
Пример 2. Изучение зависимости ВВП и выпуска продукции. Данные в таблице 3.
Данные с 2010 по 2015 год. Выпуск продукции основа ВВП, поэтому зависимость должна быть очень тесной, то есть коэффициент корреляции должен быть близок к 1.
Таблица 3
Год |
Выпуск продукции |
ВВП всего |
|
млн сом |
млн сом |
||
2010 |
472 372,5 |
220369,3 |
|
2011 |
601228,7 |
285989,1 |
|
2012 |
635 564,6 |
310471,3 |
|
2013 |
717877,9 |
355294,8 |
|
2014 |
808914,4 |
400694 |
|
2015 |
859851,4 |
423635,5 |
|
всего |
4 095 809,5 |
1996454 |
Коэффициент корреляции: r= 0,999194531. То есть мои предположения верны. Связь почти прямая. Значит, график уравнения регрессии должен совпадать с точками на диаграмме.
График 2
Уравнение регрессии y = 0,5309x - 29676. Положительный коэффициент говорит о прямой связи. Мои ожидания оправдались.
Пример 3. Я решил попробовать проверить более отдаленные друг от друга понятия. Например, ВВП на душу населения и уровень преступности. Причем для расчета я решил использовать коэффициент, полученный в результате отношения количества преступлений в год к общему числу населения, чтобы получить объективные данные. Они занесены в таблицу 4.
Таблица 4
Год |
Уровень преступности |
ВВП на душу населения |
число преступлений |
численность населения |
|
Отношение числа преступлений к численности населения |
Тысячи сом |
единиц |
Тыс. человек |
||
2006 |
6,049487397 |
22,6 |
31392 |
5 189,2 |
|
2007 |
5,555110908 |
28,1 |
29151 |
5 247,6 |
|
2008 |
5,580995236 |
37 |
29519 |
5 289,2 |
|
2009 |
5,555971056 |
39,2 |
29715 |
5 348,3 |
|
2010 |
6,557038185 |
42,4 |
35528 |
5 418,3 |
|
2011 |
5,571783263 |
54,4 |
30520 |
5 477,6 |
|
2012 |
5,195878888 |
58 |
28847 |
5 551,9 |
|
2013 |
4,805495223 |
65 |
27214 |
5 663,1 |
|
2014 |
4,686147561 |
71,8 |
27070 |
5 776,6 |
|
всего |
268956 |
418,5 |
268956 |
48 961,8 |
Для расчетов мне нужны только второй и третий столбцы. Сначала, я нашел коэффициент корреляции: r=-0,722791556. Так как он отрицателен, значит зависимость обратная. То есть, с ростом ВВП падает уровень преступности. Это хорошо видно на графике 3.
График 3
Уравнение регрессии равно y = -0,0249x + 6,6658
Можно сделать вывод, что тенденция к уменьшению уровня преступности наблюдается при улучшении уровня жизни, или увеличения ВВП на душу населения.
В программе EXCELL можно сделать регрессионный анализ по данной таблице.
Регрессионная статистика |
||
Множественный R |
0,722791556 |
|
R-квадрат |
0,522427633 |
|
Нормированный R-квадрат |
0,454203009 |
|
Стандартная ошибка |
0,427118063 |
|
Наблюдения |
9 |
В первую очередь обращаем внимание на R-квадрат и коэффициенты.
R-квадрат - коэффициент детерминации. В нашем примере - 0,522, или 52,2%. Это означает, что расчетные параметры модели на 52,2% объясняют зависимость между изучаемыми параметрами. Чем выше коэффициент детерминации, тем качественнее модель. Хорошо - выше 0,8. Плохо - меньше 0,5 (такой анализ вряд ли можно считать резонным). В нашем примере - «неплохо».
Дисперсионный анализ:
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
1 |
1,396950019 |
1,396950019 |
7,657464469 |
0,027805521 |
|
Остаток |
7 |
1,277008881 |
0,18242984 |
|||
Итого |
8 |
2,6739589 |
Коэффициент 6,66582607 показывает, каким будет Y, если все переменные в рассматриваемой модели будут равны 0. То есть на значение анализируемого параметра влияют и другие факторы, не описанные в модели.
Коэффициент -0,024933159 показывает весомость переменной Х на Y. То есть уровень преступности в пределах данной модели влияет на количество ВВП на душу населения с весом -0,16285 (это небольшая степень влияния). Знак «-» указывает на отрицательное влияние: чем больше уровень преступности, тем меньше уровень жизни. Что справедливо.
Размещено на Allbest.ru
...Подобные документы
Понятие и виды валового внутреннего продукта. Использование метода добавленной стоимости в расчете ВВП на основе стоимости товаров и услуг, предназначенных для потребления. Исследование динамики ВВП на душу населения России за период 2009-2015 годов.
реферат [31,1 K], добавлен 01.02.2017Характеристика валового внутреннего продукта, представляющего собой показатель стоимости произведенных конечных товаров и услуг. Изучение методов расчета ВВП на душу населения. Сравнительный анализ валового внутреннего и валового национального продукта.
реферат [21,6 K], добавлен 03.06.2010Этапы корреляционно-регрессионного анализа, построение корреляционной модели и определение функции, отражающей механизм связи между факторным и результативным признаками. Измерение тесноты корреляционной связи, расчет индекса корреляции и дисперсии.
лекция [38,1 K], добавлен 13.02.2011Анализ динамики и структуры показателей безработицы в Приволжском федеральном округе. Корреляционный анализ валового регионального продукта на душу населения. Регрессионный анализ зависимости ВРП на душу населения от численности безработных граждан.
курсовая работа [1,8 M], добавлен 01.12.2011Классическая линейную модель множественной регрессии. Значимость уравнения регрессии и его коэффициентов. Доверительный интервал. Матрица парных коэффициентов корреляции. Модель множественной регрессии. Автокорреляция.
контрольная работа [172,9 K], добавлен 17.01.2004Анализ структуры и динамики доходов и расходов населения. Корреляционно-регрессионный анализ взаимосвязи показателей потребления и уровня заработной платы. Прогнозирование уровня потребления товаров на основе уравнения тренда и уравнения регрессии.
курсовая работа [441,0 K], добавлен 13.02.2015Понятие валового национального продукта и его место в системе национальных счетов. Оценка составных элементов валового накопления основного капитала. Показатели уровня цен и инфляции. Использование валового внутреннего продукта в экономике по элементам.
курсовая работа [254,5 K], добавлен 19.12.2014Макроэкономические показатели результативности экономики Республики Беларусь. Сущность валового внутреннего продукта в системе национального счетоводства. Направления распределения и использования валового внутреннего продукта в национальной экономике.
курсовая работа [68,5 K], добавлен 23.04.2014Специфические свойства национальной экономики, ее макроэкономические показатели. Способы исчисления валового внутреннего продукта. Анализ производственной инфраструктуры и социально-культурной сферы экономики, динамики экспорта и импорта товаров.
курсовая работа [250,4 K], добавлен 27.02.2015Методы расчета валового продукта: доходный и затратный, реальный и номинальный. Трендовые модели, методы их оценки, временные ряды. Построение трендовой модели, оценка уравнения и прогнозирование объема валового внутреннего продукта на 2011 год.
курсовая работа [1,6 M], добавлен 21.01.2011Характеристика валового внутреннего продукта как важнейшего обобщающего показателя системы национальных счетов. Основные проблемы измерения результатов национального производства. Расчет валового внутреннего продукта по источникам доходов и расходов.
курсовая работа [244,9 K], добавлен 02.06.2015Виды корреляции и регрессии, применяемые в статистическом анализе социально-экономических явлений и процессов. Построение корреляционной модели (уравнения регрессии). Построение корреляционной таблицы, выполнение интервальной группировки по признакам.
курсовая работа [131,7 K], добавлен 03.10.2014- Использование корреляционно-регрессионного анализа для обработки экономических статистических данных
Роль корреляцонно-регрессионного анализа в обработке экономических данных. Корреляционно-регрессионный анализ и его возможности. Предпосылки корреляционного и регрессионного анализа. Пакет анализа Microsoft Excel.
курсовая работа [68,4 K], добавлен 11.06.2002 Понятие и принципы определения валового внутреннего продукта. Место и роль основных показателей национальной экономики, необходимых для объективной оценки ее социально-экономического развития. Обзор алгоритма и методов определения валового продукта.
контрольная работа [24,6 K], добавлен 03.08.2014Парная линейная регрессия. Полный регрессионный анализ. Коэффициент корреляции и теснота линейной связи. Стандартная ошибка регрессии. Значимость уравнения регрессии. Расположение доверительных интервалов. Расчет параметров множественной регрессии.
контрольная работа [932,7 K], добавлен 09.06.2012Расчет валового и чистого внутреннего продуктов в рыночных ценах. Определение валового национального располагаемого дохода и чистого внутреннего продукта экономики. Сводный счет распределения доходов. Финансовый счет сектора "остальной мир".
контрольная работа [19,1 K], добавлен 08.09.2010Направление деятельности ОАО "Татнефть", его место на рынке. Система управления компанией. Исследование зависимости прибыли от совокупных активов компании методом корреляционно-регрессионного анализа. Анализ и прогнозирование деятельности предприятия.
курсовая работа [600,9 K], добавлен 30.10.2011Порядок построения линейного уравнения парной регрессии, расчет коэффициентов и оценка статической значимости параметров регрессии и корреляции. Точность прогноза. Множественная регрессия и корреляция. Системы эконометрических уравнений. Временные ряды.
контрольная работа [1,3 M], добавлен 24.09.2013Теоретические аспекты статистики валового внутренего продукта (ВВП). Определение совокупности показателей, характеризующих его структуру. Методы исчисления ВВП, используемые в социально-экономических исследованиях. Основные тенденции роста экономики РФ.
курсовая работа [55,9 K], добавлен 03.12.2009Понятие валового внутреннего продукта и основные методы его расчета. Метод конечного использования и распределительный метод. Оценка динамики валового внутреннего продукта (ВВП). Анализ показателей динамики и прогнозирование ВВП Российской Федерации.
курсовая работа [742,7 K], добавлен 30.11.2013