Определение зависимостей и построение прогнозных значений на основе корреляционно-регрессионного анализа
Понятие о регрессионной зависимости и коэффициенте детерминации. Построение трендов и получение прогнозных значений на основе регрессионного анализа. Порядок проведения корреляционного анализа средствами Excel. Особенности исследования временных рядов.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 15.12.2013 |
Размер файла | 400,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Введение
При оптимальном проектировании важными элементами математической модели являются зависимости между параметрами объекта проектирования, как в форме ограничений, так и целевой функцией. Такие зависимости могут быть теоретическими и статистическими.
Примером теоретических зависимостей может служить рентабельность активов предприятия:
.
Подобные зависимости между параметрами бывают известны далеко не всегда.
Если теоретические зависимости отсутствуют, то необходимые соотношения можно определять на основании имеющихся статистических данных. Полученные аналитические зависимости называются уравнениями регрессии и в общем случае имеют вид:
.
Регрессия называется парной, если она описывает зависимость между функцией и одной переменной и имеет вид:
.
Регрессия называется множественной, если она описывает зависимость функции от нескольких переменных и имеет вид:
.
Если выявленная зависимость является линейной, то регрессия называется линейной, в противном случае регрессия нелинейная.
Важной характеристикой регрессионных зависимостей является мера их достоверности, которая оценивается коэффициентом детерминации R2, находящимся в пределах 0 ? R2 ? 1. Коэффициент детерминации характеризует долю дисперсии результативного признака y, объясняемую регрессией, в общей дисперсии результативного признака. Соответственно величина 1-R2 характеризует долю дисперсии y, вызванную влиянием остальных неучтенных в модели факторов.
Таким образом, величина коэффициента детерминации служит одним из критериев оценки качества линейной модели. Чем больше доля объясненной вариации, тем соответственно меньше роль прочих факторов, и, следовательно, линейная модель хорошо аппроксимирует исходные данные и ею можно воспользоваться для прогноза значений результативного признака.
При R2 =0 величины, для которых определяются уравнения регрессии, являются независимыми; При R2 =1 имеет место функциональная (а не статистическая) зависимость.
1. Построение трендов и получение прогнозных значений на основе регрессионного анализа
Линии тренда позволяют графически отображать тенденции данных и прогнозировать их поведение на будущее. Подобный анализ называется также регрессионным анализом. Используя регрессионный анализ, можно продлить линию тренда в диаграмме за пределы реальных данных для предсказания будущих значений.
1.1 Виды линий тренда и рекомендации по выбору наиболее подходящего типа аппроксимации данных
регрессионный зависимость тренд корреляционный анализ
Существует шесть различных видов линий тренда (аппроксимация и сглаживание), которые могут быть добавлены в диаграмму Microsoft Excel. Выбор линии тренда определяется типом данных.
1. Линейная (арифметическая) аппроксимация
Это прямая линия, наилучшим образом описывающая набор данных. Она используется для аппроксимации данных по методу наименьших квадратов в соответствии с уравнением:
где m -- угол наклона
b -- координата пересечения оси абсцисс.
Линейная аппроксимация применяется в самых простых случаях, когда точки данных расположены близко к прямой. Говоря другими словами, линейная аппроксимация хороша для величины, которая увеличивается или убывает с постоянной скоростью.
Рисунок 1.1. -- Пример арифметической аппроксимации
2. Логарифмическая аппроксимация.
Используется для аппроксимации данных по методу наименьших квадратов в соответствии с уравнением:
где c и b -- константы,
ln -- функция натурального логарифма.
Она хорошо описывает величину, которая вначале быстро растет или убывает, а затем постепенно стабилизируется. Описывает как положительные, так и отрицательные величины.
Рисунок 1.2. -- Пример логарифмической аппроксимации
3. Полиномиальная аппроксимация.
Используется для аппроксимации данных по методу наименьших квадратов в соответствии с уравнением:
где b и с -- константы.
Применяется для описания величин, попеременно возрастающих и убывающих. Она полезна, например, для анализа большого набора данных о нестабильной величине. Степень полинома определяется количеством экстремумов (максимумов и минимумов) кривой. Полином второй степени может описать только один максимум или минимум. Полином третьей степени имеет один или два экстремума. Полином четвертой степени может иметь не более трех экстремумов.
Рисунок 1.3. -- Пример полиномиальной аппроксимации
4. Степенное приближение.
Используется для аппроксимации данных по методу наименьших квадратов в соответствии с уравнением:
где c и b - константы.
Степенное приближение дает хорошие результаты, если зависимость, которая содержится в данных, характеризуется постоянной скоростью роста. Примером такой зависимости может служить график ускорения автомобиля. Если в данных имеются нулевые или отрицательные значения, использование степенного приближения невозможно.
Рисунок 1.4. -- Пример степенного приближения
5. Экспоненциальное приближение.
Используется для аппроксимации данных по методу наименьших квадратов в соответствии с уравнением:
где c и b - константы,
e - основание натурального логарифма.
Экспоненциальное приближение следует использовать в том случае, если скорость изменения данных непрерывно возрастает. Однако для данных, которые содержат нулевые или отрицательные значения, этот вид приближения неприменим.
Рисунок 1.5. -- Пример экспоненциального приближения
6. Использование в качестве приближения скользящего среднего позволяет сгладить колебания данных и таким образом наглядно показать характер зависимости.
Линия тренда строится по определенному числу точек (оно задается параметром Шаг). Элементы данных усредняются, и полученный результат используется в качестве среднего значения для приближения. Так, если Шаг равен 2, первая точка сглаживающей кривой определяется как среднее значение первых двух элементов данных, вторая точка -- как среднее следующих двух элементов и так далее.
Скользящее среднее определяется по формуле:
Число точек, образующих линию скользящего среднего, равно числу точек в исходном ряде минус значение периода.
Рисунок 1.6. -- Пример скользящего среднего
1.2 Надежность линии тренда
Чем больше статистических данных используется при определении уравнения регрессии, тем точнее будет определена искомая зависимость. Но при этом следует иметь в виду, что количество статистических данных не может обеспечить получение достоверной зависимости, если в действительности такой зависимости между исследуемыми величинами нет. Вместе с тем, есть минимальное количество необходимых исходных данных, которое определяется методом наименьших квадратов и не может быть меньше 4, т.е. каждый исследуемый статистический ряд должен содержать набор как минимум из четырех значений. При этом если есть возможность детализировать статистический ряд, т.е., например, вместо годовых значений показателей использовать квартальные, то анализировать следует ряд, состоящий из квартальных значений показателей, что будет способствовать повышению точности аппроксимации исходных данных и полученных прогнозных значений.
Для оценки качества подобранной линии тренда и уравнения регрессии рассчитывается коэффициент детерминации (R-квадрат), находящийся в пределах 0 ? R2 ? 1.
При подборе линии тренда к данным Excel автоматически рассчитывает значение R2. Его значение можно отобразить на диаграмме.
Наиболее надежна линия тренда, для которой значение R-квадрат равно или близко к 1. Она в наибольшей степени приближается к представленной на диаграмме зависимости.
На практике считается допустимым использовать следующую шкалу оценки достоверности полученной зависимости, представленную в таблице 3.1.
Таблица 1.1. Шкала оценки достоверности регрессионной зависимости
№ |
Величина коэффициента детерминации |
Уровень достоверности |
|
1 |
до 0,2 |
зависимость недостоверна |
|
2 |
0,2-0,4 |
очень низкий |
|
3 |
0,4-0,6 |
умеренный |
|
4 |
0,6-0,8 |
высокий |
|
5 |
свыше 0,8 |
очень высокий |
1.3 Типы диаграмм, поддерживающие линии тренда
Линиями тренда можно дополнить ряды данных, представленные на:
- ненормированных плоских диаграммах с областями;
- линейчатых диаграммах;
- гистограммах;
- графиках;
- биржевых диаграммах;
- точечных диаграммах;
- пузырьковых диаграммах.
Нельзя дополнить линиями тренда ряды данных на:
- объемных диаграммах;
- нормированных диаграммах;
- лепестковых диаграммах;
- круговых и кольцевых диаграммах.
При замене типа диаграммы на один из этих типов, например, изменении типа диаграммы на объемную диаграмму, линии тренда, соответствующие данным, будут потеряны.
1.4 Исходная информация
В качестве исходной информации для определения уравнения регрессии и построения тренда используются статистические ряды данных, отражающие временные или какие-либо иные изменения показателей. Статистический ряд должен содержать как минимум четыре значения. При этом, чем больше статистических данных содержит ряд, тем точнее будет получен результат.
Исходная информация должна быть представлена в виде диаграммы, поддерживающей линии тренда. На графике может быть как один ряд данных, так и несколько. Линии тренда можно добавлять к нескольким рядам данных. Если диаграмма не построена, следует воспользоваться типовым алгоритмом добавления диаграмм в Excel (пиктограмма Мастер диаграмм ). Последовательность действий при добавлении диаграммы в Excel для построения линий тренда. Мастер диаграмм: шаг 1 -- выбрать тип (График); шаг 2 -- Ряд - Добавить (Имя, Ссылка на ячейки со значениями; Подписи по оси X); шаг 3 -- ввести название, подписи осей, добавить легенду (если есть несколько рядов); шаг 4 -- поместить диаграмму на листе: имеющемся.
1.5 Порядок создания линии тренда (парной регрессии)
1. На имеющейся диаграмме выберите ряд данных, к которому нужно добавить линию тренда или скользящее среднее.
Рисунок 1.7. -- Исходная диаграмма с выделенным рядом данных
2. Выберите команду Добавить линию тренда в меню «Диаграмма».
Рисунок 1.8. -- Меню «Диаграмма» с выделенной командой «Добавить линию тренда»
3. На вкладке Тип исходя из статистических данных с учетом вышеизложенных рекомендаций выберите нужный тип регрессионной линии тренда или линии скользящего среднего.
Рисунок 1.9. -- Диалоговое окно «Линия тренда». Вкладка «Тип»
При выборе типа Полиномиальная введите в поле Степень наибольшую степень для независимой переменной.
При выборе типа Скользящее среднее введите в поле Период число периодов, используемых для расчета скользящего среднего.
4. На вкладке Параметры укажите количество периодов, на которое необходимо построить прогноз и назначьте: Показывать уравнение на диаграмме и Поместить на диаграмму величину достоверности аппроксимации (R^2).
5. В результате на графике появляется линия тренда, продленная на заданное количество интервалов, а также уравнение парной регрессии и величина R2.
На одном графике допустимо строить линии тренда к нескольким рядам данных и по нескольку линий тренда к одному и тому же ряду данных.
Рисунок. 1.10. -- Диалоговое окно «Линия тренда». Вкладка «Параметры»
Рисунок. 1.11. Исходная диаграмма с построенной линией тренда (линия без маркеров) и выведенными коэффициентом детерминации и уравнением регрессии
1.6 Анализ примера и интерпретация результатов
Пример.
К методам определения стоимости предприятия, использующим информацию прошлого, настоящего и ожидаемого будущего, относится метод капитализации дохода. Для использования этого метода необходимо определить величины ежегодных чистых доходов предприятия за несколько периодов в прошлом и прогнозы на ближайшее будущее.
Для расчета чистого дохода можно воспользоваться простейшим способом -- рассчитать его среднеарифметическую или средневзвешенную величину, однако более точные значения, как правило, получаются в случае оценки доходности по тренду.
Например, предприятие в каждом из семи периодов имеет следующие доходы, представленные в таблице 1.2.
Таблица 1.2. Динамика чистых доходов предприятия за 1996-2002 гг*
Год |
Чистый доход, млн. руб. |
|
1996 |
1 |
|
1997 |
1,15 |
|
1998 |
1,25 |
|
1999 |
1,5 |
|
2000 |
1,6 |
|
2001 |
2 |
|
2002 |
2,5 |
* В сопоставимых ценах.
Необходимо построить линию тренда для определения прогнозных значений чистых доходов предприятия.
Решение.
Вносим данные таблицы 1.2 в Excel (см. рис. 1.12) и строим на их основе диаграмму, выбрав тип График.
Результат построения представлен на рис. 1.13.
Рисунок 1.12. -- Исходные данные, введенные в Excel для построения диаграммы
Рисунок 1.13. -- График изменения чистых доходов предприятия в 1996-2002 гг
Далее, в соответствии с вышеизложенными рекомендациями, добавляем к графику линии тренда с построением прогноза на один период вперед. Исходя из характера изменения имеющихся данных, можно сделать вывод, что построение логарифмической аппроксимации в данном случае неуместно, т.к. она хорошо описывает только величину, быстро изменяющуюся в начале, а затем стабилизирующуюся. Таким образом, строим только линейную, полиномиальную, степенную и экспоненциальную аппроксимации, из которых выберем одну, которой соответствует наибольшее значение R2.
1. Линейная аппроксимация (линия тренда) (рис. 1.14) характеризуется очень высокой степенью достоверности (R2=0,9234).
Рисунок 1.14. Линейная аппроксимация
2. Полиномиальную аппроксимацию целесообразно построить в нескольких вариантах: полином второй, третьей и четвертой степеней (рис. 1.15, 1.16, 1.17). Построенные линии тренда характеризуются еще более высокой степенью достоверности (R2=0,9859, 0,9949 и 0,9953).
Рисунок 1.15. -- Полиномиальная аппроксимация второй степени
Рисунок 1.16. -- Полиномиальная аппроксимация третьей степени
Рисунок 1.17. -- Полиномиальная аппроксимация четвертой степени
3. Степенная аппроксимация (рис. 1.18) характеризуется менее высокой степенью достоверности, чем предыдущие (R2=0,8547).
Рисунок 1.18. -- Степенная аппроксимация
4. Экспоненциальная аппроксимация (рис. 1.19) характеризуется степенью достоверности R2=0,9756.
Рисунок 1.19. -- Степенная аппроксимация
Таким образом, на основе построенных линий трендов и полученной информации об уравнениях парной регрессии и коэффициентах детерминации (параметрах их достоверности) можно сделать вывод, что наиболее точно описывает изменение показателя величины чистого дохода, а, следовательно, дает наиболее достоверный прогноз полиномиальная аппроксимация четвертой степени (R2=0,9953), описываемая уравнением регрессии:
y = 0,0011х4 - 0,0098х3 + 0,0333х2 + 0,0907х + 0,8857
Подставив в это уравнение х = 8, которое соответствует восьмому периоду, получим прогнозное значение величины чистого дохода предприятия в восьмом квартале: y8=3,2305 (млн. руб.).
Высокое значение коэффициента детерминации полученного уравнения регрессии означает, что модель хорошо аппроксимирует исходные данные и ею можно воспользоваться для средне- и долгосрочного прогноза показателей объекта планирования при условии сохранения существующих тенденций его развития.
2. Основы корреляционного анализа методами Excel
В экономике в большинстве случаев между переменными величинами существуют такие зависимости, когда каждому значению одной из них соответствует не какое-то одно значение, а множество возможных значений другой переменной. Т.е. значению одной переменной соответствует определенное статистическое распределение другой переменной. Такая зависимость называется статистической.
Это понятие возникло вследствие того, что зависимая переменная, как правило, подвержена влиянию ряда неконтролируемых или неучтенных факторов, а также тем, что измерение значений переменных неизбежно сопровождается некоторыми случайными ошибками. Например, себестоимость единицы продукции зависит от общего объема производства, трудоемкости единицы продукции, стоимости энергоносителей и ряда других факторов.
Корреляционной зависимостью между двумя переменными величинами называется функциональная зависимость между значениями одной из них и условным математическим ожиданием (вероятным значением) другой.
Корреляционный анализ дает возможность установить, ассоциированы ли наборы данных по величине, т.е. большие значения из одного набора данных связаны с большими значениями другого набора (положительная корреляция), или, наоборот, малые значения одного набора связаны с большими значениями другого (отрицательная корреляция), или данные двух диапазонов никак не связаны (корреляция близка к нулю). Например, увеличение расходов на маркетинговые мероприятия, как правило, приводит к увеличению объема реализации продукции, т.е. между ними существует положительная корреляция.
2.1 Оценка значимости (достоверности) результатов
Точность результатов корреляционно-регрессионного анализа во многом зависит от количества наблюдений (статистических данных). Чем их больше, тем выше степень достоверности выявленных зависимостей. Минимально допустимым (для учебных целей) является количество данных в каждом ряде, равное четырем, на практике количество наблюдений должно быть значительно больше. При этом ряд может состоять из данных, отражающих изменение показателя во времени, либо его вариацию по различным объектам наблюдения (изменение по цехам, подразделениям, предприятиям, отраслям, регионам).
В случае исследования ряда данных, отражающих временную динамику, необходимо перед проведением анализа определенным образом преобразовать значения показателей, о чем будет сказано далее в п. 2.5.
Итогом линейного корреляционного анализа является набор линейных коэффициентов парной корреляции rxy, оценивающий тесноту связи изучаемых явлений. Он находится в пределах -1 ? rxy ? 1.
Для анализа полученных значений коэффициентов корреляции, оценки степени тесноты связи показателей можно воспользоваться шкалой, представленной в таблице 1.3.
Таблица 1.3. Шкала оценки степени тесноты связей анализируемых показателей по коэффициентам парной линейной корреляции
№ |
Величина коэффициента парной линейной корреляции |
Уровень тесноты связи |
|
1 |
до 0,2 |
связь практически отсутствует |
|
2 |
0,2-0,4 |
очень низкий |
|
3 |
0,4-0,6 |
умеренный |
|
4 |
0,6-0,8 |
высокий |
|
5 |
свыше 0,8 |
очень высокий |
2.2 Исходная информация
В качестве исходной информации для корреляционного анализа используются статистические ряды данных, отражающие временные или какие-либо иные изменения показателей. Статистический ряд должен содержать как минимум четыре значения. При этом, чем больше статистических данных содержит ряд, тем точнее будет получен результат.
Исходная информация должна быть представлена в виде таблицы, занесенной на лист Excel с указанными в заголовках строк и столбцов наименованиями показателей и обозначениями наблюдений (объектов, периодов времени).
Таким образом, для того чтобы провести корреляционный анализ средствами Excel необходимо запустить Excel и в открывшемся рабочем листе ввести в ячейки наименования показателей и их значения.
Например, в исходной таблице для анализа, приведенной на рисунке 3.19, содержатся данные о трех показателях деятельности двенадцати предприятий за определенный период.
2.3 Порядок проведения корреляционного анализа средствами Excel
В Excel существует два инструмента, предназначенных для вычисления линейных парных коэффициентов корреляции: инструмент Корреляция из Пакета анализа и статистическая функция КОРРЕЛ (только для двух наборов данных).
Сначала рассмотрим правила работы с инструментом Корреляция, дающим более обширные возможности для анализа.
1. Введите в таблицу Excel исходную информацию, расположив ряды данных вертикально либо горизонтально и озаглавив строки и столбцы таблицы.
Рисунок 1.20 -- Исходная таблица для анализа
2. Выполните команду Сервис Анализ данных Подробнее о работе с Пакетом анализа см. раздел Работа со статистическим пакетом анализа данных Excel.
Рисунок 1.21 -- Меню Сервис, пункт Анализ данных
3. Выберите инструмент анализа Корреляция из списка Инструменты анализа и нажмите кнопку ОК.
Рисунок 1.22 -- Инструменты анализа данных из Пакета анализа
Рисунок 1.23 -- Диалоговое окно Корреляция
4. В появившемся диалоговом окне Корреляция укажите ссылки на входной и выходной интервалы.
В текстовом поле Входной интервал введите ссылку на ячейки, содержащие анализируемые данные либо выделите эти ячейки на рабочем листе, нажав (рис 1.23). Ссылка должна состоять не менее чем из двух смежных диапазонов данных, информация в которых расположена по строкам или столбцам.
Установите переключатель (рис. 1.23) в положение «по столбцам» или «по строкам» в зависимости от расположения данных во входном диапазоне. В нашем примере его следует установить в положение «по столбцам».
Рисунок 1.24. Процедура указания входного интервала
Если первая строка исходного диапазона содержит названия столбцов, установите переключатель (рис. 1.23) в положение Метки в первой строке. Если названия строк находятся в первом столбце входного диапазона, установите переключатель в положение Метки в первом столбце. Если входной диапазон не содержит меток, то необходимые заголовки в выходном диапазоне будут созданы автоматически.
Для указания выходного интервала введите ссылку на левую верхнюю ячейку диапазона, в котором будут размещены результаты анализа (рис. 1.23).
Поскольку коэффициент корреляции двух наборов данных не зависит от последовательности их обработки, то выходная область занимает только половину предназначенного для нее места. Ячейки выходного диапазона, имеющие совпадающие координаты строк и столбцов, содержат значение 1, так как каждая строка или столбец во входном диапазоне полностью коррелирует с самим собой (см., например, рис. 1.25).
Нажмите кнопку ОК.
5. В результате работы инструмента Корреляция на рабочем листе появится матрица треугольного вида с коэффициентами парной линейной корреляции анализируемых показателей.
Рисунок 1.25 -- Матрица коэффициентов парной линейной корреляции
Для вычисления коэффициента корреляции между двумя наборами данных на листе можно также использовать статистическую функцию КОРРЕЛ. Данная функция возвращает коэффициент корреляции меду интервалами ячеек Массив1 и Массив2.
Функция записывается в виде КОРРЕЛ(массив1;массив2), где массив1 -- это ссылка интервал ячеек со значениями первого показателя, а массив2 -- ссылка интервал со значениями второго показателя.
Например, для вычисления коэффициента корреляции между валовым доходом и среднегодовой стоимостью основных фондов в строке формул выбранной ячейки необходимо ввести:
=КОРРЕЛ(В2:В13;С2:С13).
После нажатия клавиши Ввод в выбранной ячейке появится результат вычислений 0,57082488938163.
Если массив1 и массив2 имеют различное количество точек данных, то функция КОРРЕЛ возвращает значение ошибки #Н/Д.
Если массив1 либо массив2 пуст, или если у (стандартное отклонение) их значений равно нулю, то функция КОРРЕЛ возвращает значение ошибки #ДЕЛ/0!
2.4 Анализ примера и интерпретация результатов
Пример.
Исследуется зависимость объема реализации (спроса) некоторого товара от его цены, величины дохода потребителей и объема затрат на маркетинг. Информация об изменении показателей за восемь лет представлена в таблице 1.4.
Таблица 1.4
Год |
Спрос |
Цена |
Доход потребителей в текущем году |
Доход потребителей в предшествующем году |
Величина затрат на маркетинг |
|
1 |
40 |
6 |
15 |
13 |
3 |
|
2 |
45 |
6 |
15 |
15 |
3 |
|
3 |
40 |
5 |
18 |
15 |
2 |
|
4 |
50 |
8 |
20 |
18 |
3,5 |
|
5 |
35 |
5 |
18 |
20 |
2,5 |
|
6 |
45 |
9 |
22 |
18 |
4 |
|
7 |
50 |
10 |
21 |
22 |
3,5 |
|
8 |
45 |
9 |
22 |
21 |
3,5 |
Необходимо определить факторы, повлиявшие на изменение объемов реализации.
Решение.
Вносим данные таблицы 1.4 в Excel (см. рис. 1.26) для проведения корреляционного анализа с использованием инструмента Корреляция.
Рисунок 1.26 -- Исходные данные, введенные в Excel для проведения корреляционного анализа
Далее, в соответствии с вышеизложенными рекомендациями, запускаем инструмент Корреляция из Пакета анализа. В появившемся окне устанавливаем границы входного диапазона: $B$1:$F$9; способ группирования: По столбцам; указываем, что в первой колонке находятся метки столбцов; вводим левую верхнюю границу выходного диапазона: $B$17 (рис. 1.27).
Рисунок 1.27
Результат вычислений представлен на рисунке 1.28.
Рисунок 1.28
Проанализируем полученную информацию. В первом столбце находятся коэффициенты парной корреляции, показывающие степень влияния исследуемых факторов (цены, доходов потребителей в текущем и предшествующем годах, величины затрат на маркетинг) на результирующий показатель (величину спроса).
Используя шкалу оценки степени тесноты связей анализируемых показателей по коэффициентам парной линейной корреляции (табл. 1.3), проранжируем факторы по степени их влияния на результирующий:
- цена -- очень высокий уровень тесноты связи (0,8) свидетельствует о наличии очень высокой положительной взаимозависимости;
- величина затрат на маркетинг -- высокий уровень тесноты связи (0,6 < 0,699 < 0,8) свидетельствует о наличии высокой положительной взаимозависимости;
- доход потребителей в текущем году -- умеренный уровень (0,4 < 0,472 < 0,6) говорит об относительно невысокой положительной взаимозависимости;
- доход потребителей в предшествующем году -- очень низкий уровень (0,2 < 0,323 < 0,4) -- связь крайне мала.
Таким образом, наиболее существенное влияние на величину спроса оказывают факторы цены и затрат на маркетинг -- на них следует сконцентрировать внимание при формировании соответствующих мероприятий, также в случае необходимости можно рассмотреть фактор доходов потребителей в текущем году. Фактор доходов потребителей в предшествующем году можно не рассматривать вследствие его незначительного влияния на величину спроса.
Для решения этой же задачи можно воспользоваться функцией КОРРЕЛ, позволяющей вычислять значения коэффициента парной линейной корреляции для двух рядов данных.
Например, для определения величины коэффициента корреляции между спросом на товар и его ценой (на основе введенной в Excel исходной информации -- рис. 1.25) необходимо, выбрав ячейку, в которую будет помещен результат (В11), в строке формул набрать «=КОРРЕЛ(В2:В9;С2:С9)» (рис. 1.29).
Рисунок 1.29
Как видим, результат вычислений равен значению, полученному с использованием инструмента Корреляция.
Последовательный анализ всех рядов в конечном итоге позволит заполнить ту же самую матрицу коэффициентов парной линейной корреляции.
2.5 Особенности исследования временных рядов
Корреляционно-регрессионный анализ можно проводить на основе двух типов исходных данных:
- данные, характеризующие совокупность различных объектов в определенный момент (период) времени;
- данные, характеризующие один объект за ряд последовательных моментов (периодов) времени.
Временнуй ряд -- это совокупность значений какого-либо показателя за несколько последовательных моментов или периодов.
Изучение причинно-следственных зависимостей показателей, представленных в форме временных рядов имеет свою специфику.
Применение в этих целях традиционных методов корреляционно-регрессионного анализа может привести к ряду проблем. Они связаны со спецификой временных рядов как источника данных для анализа. Каждый уровень временнуго ряда содержит три основные компоненты: тенденцию, циклические или сезонные колебания и случайную компоненту.
Особое значение имеет тенденция. Если рассматриваемые временные ряды имеют тенденцию, коэффициент корреляции по абсолютной величине будет высоким (положительным в случае совпадения или отрицательным в случае противоположной направленности тенденций рядов). Однако из этого еще нельзя делать вывод о том, что имеет место причинно-следственная связь. Высокий коэффициент корреляции в данном случае может быть следствием того, что ряды данных зависят от времени или содержат тенденцию. При этом одинаковую или противоположную тенденцию могут иметь ряды, совершенно не связанные друг с другом причинно-следственной зависимостью. Например, коэффициент корреляции между численностью выпускников вузов и числом домов отдыха в РФ в период 1970-1990 гг. составил 0,8. Это, конечно, не означает, что увеличение количества домов отдыха способствует росту числа выпускников вузов или наоборот.
Чтобы получить коэффициенты корреляции, характеризующие причинно-следственную связь между изучаемыми рядами, следует избавиться от так называемой ложной корреляции, вызванной наличием тенденции в каждом ряде. Наличие тенденции в каждом из анализируемых временных рядов означает, что на зависимую (результирующую) и независимую (факторную) переменные модели оказывает воздействие фактор времени, который непосредственно в корреляционно-регрессионной модели не учтен. Это влияние фактора времени будет выражено в корреляционной зависимости между значениями остатков в модели за текущий и предыдущий моменты времени, которая получила название автокорреляции в остатках.
Обычно устранение ложной корреляции осуществляют методами исключения тенденции, сущность которых заключается в том, чтобы устранить или зафиксировать воздействие фактора времени на формирование уровней ряда.
С целью устранения тенденции можно применять наиболее простой из существующих способов -- метод последовательных разностей. Также существуют более сложные методы: метод отклонения от трендов, метод включения в модель регрессии по временным рядам фактора времени и др.
Если временнуй ряд содержит ярко выраженную линейную тенденцию Определить характер тенденции ряда можно воспользовавшись рекомендациями раздела «Построение трендов», ее можно устранить путем замены исходных данных (уровней ряда) цепными абсолютными приростами (разностями).
Если временнуй ряд содержит тенденцию в форме параболы второго порядка, то для ее устранения можно заменить исходные данные (уровни ряда) на вторые разности (разности разностей).
Основными недостатками метода последовательных разностей являются, во-первых, то, что он не всегда обеспечивает высокую точность результатов, особенно при определении уравнения регрессии, и во-вторых, при переходе на абсолютные приросты (разности) и вторые разности уменьшается количество исходных данных (наблюдений) на одно и два соответственно.
Пример.
Вернемся к рассмотренному ранее примеру анализа зависимости объема реализации (спроса) товара от его цены, величины дохода потребителей и объема затрат на маркетинг. В таблице 1.4 были представлены данные об изменении показателей по годам. В них просматривается некоторая тенденция к росту. Для ее устранения в качестве исходной информации для корреляционного анализа перейдем на абсолютные приросты (рис. 1.30). Таким образом, в нашем распоряжении остается восемь наблюдений.
Рисунок 1.30 -- Модифицированные исходные данные, введенные в Excel для проведения корреляционного анализа
Проведенный по уточненным данным анализ дал следующие результаты (рис. 1.31): более четко проявилась связь спроса с ценой (коэффициент корреляции возрос с 0,8 до 0,94) и затратами на маркетинг (корреляции возрос с 0,7 до 0,8); уровень связи с величиной доходов потребителей в текущем году практически не изменился, а с величиной доходов в предшествующем году существенно снизился (до 0,07) -- связь этого фактора с уровнем спроса практически отсутствует.
Рисунок 1.31
Таким образом, гипотезы, выдвинутые по результатам анализа данных первого уровня, в целом подтвердились и приобрели более яркую выраженность.
В практике эконометрических исследований корреляционный анализ является первым этапом, за которым следует регрессионный анализ, позволяющий получить уравнение регрессии (статистическую модель). В совокупности корреляционный и регрессионный анализ являются важным инструментом исследования социально-экономических процессов и явлений.
Например, можно разработать статистическую модель, связывающую показатели роста экономики и показатели (факторы), отображающие результативность работы нефтяного комплекса.
В качестве показателей, оценивающих нефтяной комплекс, могут быть отобраны: внутренний валовой продукт в году (y1); величина промышленного производства в год (y2); выручка от экспорта в год (y3).
В качестве показателей, отражающих результаты работы нефтяного комплекса страны, можно взять: объем добычи нефти в год (x1); инвестиции в основной капитал нефтяных компаний в год (x2); выручка от экспорта нефти и нефтепродуктов в год (x3); эксплуатационный фонд скважин в год (x4); величина потребления нефти в РФ в год (x5).
В этом случае корреляционный анализ данных показал высокую тесноту связи между y1 и y2 (ry1y2=0,86), y3 и y2 (ry3y2=0,7), а также между x1 и x5 (rx1x5=0,96), x2 и x4 (rx2x4=0,78), поэтому для дальнейшего анализа следует оставить y1, x1, x2 и x3.
В результате проведенного регрессионного анализа получено уравнение множественной регрессии следующего вида:
.
Уравнение характеризуется коэффициентом множественной корреляции R=0,997 и критерием Фишера (F) (критерий уровня значимости) F = 734,451 при критическом значении Fкр = 5,987. На основе этого можно сделать вывод о том, что уравнение регрессии значимо и имеется сильная связь между признаками.
Список литературы
1. Елисеева И.И. и др. Эконометрика. Учебник. М.: Финансы и статистика, 2002.
2. Карасев А.И. и др. Математические методы и модели в планировании. М.: Экономика, 1987.
3. Практикум по эконометрике: Учеб. пособие / И.И. Елисеева и др. М.: Финансы и статистика, 2001.
Размещено на Allbest.ru
...Подобные документы
Статистический анализ по выборке. Проведение регрессионного анализа исходных данных и выбор аналитической формы записи производственной функции. Выполнение экономического анализа в выбранной регрессионной модели на основе коэффициентов эластичности.
курсовая работа [2,2 M], добавлен 22.07.2015Основные элементы эконометрического анализа временных рядов. Задачи анализа и их первоначальная обработка. Решение задач кратко- и среднесрочного прогноза значений временного ряда. Методы нахождения параметров уравнения тренда. Метод наименьших квадратов.
контрольная работа [37,6 K], добавлен 03.06.2009Сущность корреляционно-регрессионного анализа и его использование в сельскохозяйственном производстве. Этапы проведения корреляционно-регрессионного анализа. Области его применения. Анализ объекта и разработка числовой экономико-математической модели.
курсовая работа [151,0 K], добавлен 27.03.2009Теоретические основы прикладного регрессионного анализа. Проверка предпосылок и предположений регрессионного анализа. Обнаружение выбросов в выборке. Рекомендации по устранению мультиколлинеарности. Пример практического применения регрессионного анализа.
курсовая работа [1,2 M], добавлен 04.02.2011Линеаризация нелинейных зависимостей. Специальный вид линейной зависимости. Элементы теории корреляции. Вычисление прогнозных значений величины содержания ионов Cl- по сформированным уравнениям. Решение задачи с помощью средств MS Excel и MathCad.
курсовая работа [1,7 M], добавлен 11.12.2012Связь между случайными переменными и оценка её тесноты как основная задача корреляционного анализа. Регрессионный анализ, расчет параметров уравнения линейной парной регрессии. Оценка статистической надежности результатов регрессионного моделирования.
контрольная работа [50,4 K], добавлен 07.06.2011Построение математической модели выбранного экономического явления методами регрессионного анализа. Линейная регрессионная модель. Выборочный коэффициент корреляции. Метод наименьших квадратов для модели множественной регрессии, статистические гипотезы.
курсовая работа [1,1 M], добавлен 22.05.2015Определение зависимой и независимой переменной. Построение корреляционного поля зависимости издержек производства от объема затраченных ресурсов и их цены. Произведение статистического анализа регрессионной модели. Нахождение коэффициента детерминации.
лабораторная работа [62,3 K], добавлен 26.12.2011Задачи на выявление зависимости между объемом продаж и расходами на рекламу методом парного корреляционно-регрессионного анализа. Построение поля корреляции. Использование для аппроксимации прямолинейной, параболической и логарифмической зависимости.
контрольная работа [118,6 K], добавлен 11.12.2009Построение классической нормальной линейной регрессионной модели. Проведение корреляционно-регрессионного анализа уровня безработицы - социально-экономической ситуации, при которой часть активного, трудоспособного населения не может найти работу.
реферат [902,8 K], добавлен 15.03.2015Сведения о методе скользящей средней, коэффициенте линейной парной корреляции, регрессионном анализе. Построение графиков изменения значений показателей по данным варианта. Обработка динамических рядов методом скользящей средней и построение графиков.
курсовая работа [614,4 K], добавлен 08.06.2012Построение поля корреляции, оценка тесноты связи с помощью показателей корреляции и детерминации, адекватности линейной модели. Статистическая надёжность нелинейных моделей по критерию Фишера. Модель сезонных колебаний и расчёт прогнозных значений.
практическая работа [145,7 K], добавлен 13.05.2014- Использование корреляционно-регрессионного анализа для обработки экономических статистических данных
Расчет стоимости оборудования с использованием методов корреляционного моделирования. Метод парной и множественной корреляции. Построение матрицы парных коэффициентов корреляции. Проверка оставшихся факторных признаков на свойство мультиколлинеарности.
задача [83,2 K], добавлен 20.01.2010 Проведение регрессионного анализа опытных данных в среде Excel. Построение графиков полиномиальной зависимости и обобщенной функции желательности Харрингтона. Определение дисперсии коэффициентов регрессии. Оценка частных откликов по шкале желательности.
контрольная работа [375,6 K], добавлен 21.01.2014Проведение корреляционно-регрессионного анализа в зависимости выплаты труда от производительности труда. Построение поля корреляции, выбор модели уравнения и расчет его параметров. Вычисление средней ошибки аппроксимации и тесноту связи между признаками.
практическая работа [13,1 K], добавлен 09.08.2010Определение методом регрессионного и корреляционного анализа линейных и нелинейных связей между показателями макроэкономического развития. Расчет среднего арифметического по столбцам таблицы. Определение коэффициента корреляции и уравнения регрессии.
контрольная работа [4,2 M], добавлен 14.06.2014Модель зависимости доходности индекса телекоммуникации от индекса рынка. Результаты регрессионного анализа. Уравнение регрессии зависимости доходности отраслевого индекса от индекса. Регрессионная статистика, дисперсный анализ. Минимальный риск портфеля.
лабораторная работа [1,7 M], добавлен 15.11.2010Порядок построения линейного регрессионного уравнения, вычисление его основных параметров и дисперсии переменных, средней ошибки аппроксимации и стандартной ошибки остаточной компоненты. Построение линии показательной зависимости на поле корреляции.
контрольная работа [75,1 K], добавлен 29.01.2010Проведение анализа экономической деятельности предприятий отрасли: расчет параметров линейного уравнения множественной регрессии с полным перечнем факторов, оценка статистической значимости параметров регрессионной модели, расчет прогнозных значений.
лабораторная работа [81,3 K], добавлен 01.07.2010Понятие сетевого планирования, его особенности, назначение и сферы применения. Правила и этапы построения сетевых графиков, необходимые расчеты и решение типовых задач. Общая характеристика корреляционного и регрессивного анализа, их применение.
контрольная работа [142,3 K], добавлен 29.04.2009