Парная нелинейная корреляционная зависимость в исследованиях экономических вопросов
Нелинейная корреляции для парного и множественного уравнений регрессии. Проверка их значимости. Оценка качества построенной модели с помощью средней ошибки аппроксимации. Интервальная оценка функции регрессии и её параметров. Метод наименьших квадратов.
Рубрика | Экономика и экономическая теория |
Вид | реферат |
Язык | русский |
Дата добавления | 03.01.2013 |
Размер файла | 392,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Институт Экономики и Антикризисного управления
Кафедра Экономики и управления
Реферат
По дисциплине «Экономическая статистика»
Тема: «Парная нелинейная корреляционная зависимость в исследованиях экономических вопросов»
Москва
2010
Содержание
Введение
1. Нелинейная корреляция
2. Нелинейная корреляции для множественного уравнения регрессии
3. Парная регрессия и корреляция
4. Оценка значимости уравнения регрессии
5. Оценка качества модели
6. Интервальная оценка функции регрессии и её параметров
7. Метод наименьших квадратов
Заключение
Список литературы
Введение
Величины, характеризующие различные свойства объектов, могут быть независимыми или взаимосвязанными. Различают два вида зависимостей между величинами (факторами): функциональную и статистическую.
При функциональной зависимости двух величин значению одной из них обязательно соответствует одно или несколько точно определенных значений другой величины. Функциональная связь двух факторов возможна лишь при условии, что вторая величина зависит только от первой и не зависит ни от каких других величин. Функциональная связь одной величины с множеством других возможна, если эта величина зависит только от этого множества факторов. В реальных ситуациях существует бесконечно большое количество свойств самого объекта и внешней среды, влияющих друг на друга, поэтому такого рода связи не существуют, иначе говоря, функциональные связи являются математическими абстракциями. Их применение допустимо тогда, когда соответствующая величина в основном зависит от соответствующих факторов.
При исследовании многие параметры следует считать случайными, что исключает проявление однозначного соответствия значений. Воздействие общих факторов, наличие объективных закономерностей в поведении объектов приводят лишь к проявлению статистической зависимости. Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения других (другой), и эти другие величины принимают некоторые значения с определенными вероятностями. Функциональную зависимость в таком случае следует считать частным случаем статистической: значению одного фактора соответствуют значения других факторов с вероятностью, равной единице. Однако на практике такое рассмотрение функциональной связи применения не нашло.
Более важным частным случаем статистической зависимости является корреляционная зависимость, характеризующая взаимосвязь значений одних случайных величин со средним значением других, хотя в каждом отдельном случае любая взаимосвязанная величина может принимать различные значения.
Если же у взаимосвязанных величин вариацию имеет только одна переменная, а другая является детерминированной, то такую связь называют не корреляционной, а регрессионной. Например, при анализе скорости обмена с жесткими дисками можно оценивать регрессию этой характеристики на определенные модели, но не следует говорить о корреляции между моделью и скоростью.
При исследовании зависимости между одной величиной и такими характеристиками другой, как, например, моменты старших порядков (а не среднее значение), то эта связь будет называться статистической, а не корреляционной.
Корреляционная связь описывает следующие виды зависимостей:
причинную зависимость между значениями параметров, "зависимость" между следствиями общей причины.
Корреляционная зависимость определяется различными параметрами, среди которых наибольшее распространение получили показатели, характеризующие взаимосвязь двух случайных величин (парные показатели): корреляционный момент, коэффициент корреляции.
Одной из типовых задач обработки статистических данных является определение количественной зависимости показателей качества объекта от значений его параметров и характеристик внешней среды. Примером такой постановки задачи является установление зависимости между временем обработки запросов к базе данных и интенсивностью входного потока. Время обработки зависит от многих факторов, в том числе от размещения искомой информации на внешних носителях, сложности запроса. Следовательно, время обработки конкретного запроса можно считать случайной величиной.
Но вместе с тем, при увеличении интенсивности потока запросов следует ожидать возрастания его среднего значения, т.е. считать, что время обработки и интенсивность потока запросов связаны корреляционной зависимостью.
корреляция регрессия уравнение
1. Нелинейная корреляция
1. Нелинейная корреляция для парного уравнения регрессии.
Уравнение нелинейной регрессии, как и в линейной зависимости, дополняется показателем корреляции, а именно индексом корреляции:
где
Так как то индекс корреляции можно выразить как
Величина данного показателя находится в границах: 0?R?1, чем ближе к единице, тем теснее связь рассматриваемых признаков, тем более надежно найденное уравнение регрессии.
Если нелинейное относительно объясняемой переменной уравнение регрессии при линеаризации принимает форму линейного уравнения парной регрессии, то для оценки тесноты связи может быть использован линейный коэффициент корреляции, величина которого в этом случае совпадает с индексом корреляции Rху= rуz, где z - преобразованная величина признака-фактора, например, z = 1/x или z = ln x.
Обратимся для примера к равносторонней гиперболе y = a + b/x. Заменив 1/x на z, имеем линейное уравнение y = a + bx, для которого может быть определен линейный коэффициент корреляции: r = b z /y. Возводя данное выражение в квадрат, получим:
Преобразовывая далее, придем к следующему выражению для
следовательно,
Но так как
и ,
То
Таким образом, приходим к формуле индекса корреляции
Заменив далее z на 1/х, получим , соответственно . Аналогично для других функций подобного вида, в которых образования в линейный вид не затрагивают зависимую переменную, и требование МНК выполнимо.
Иначе обстоит дело, когда преобразования уравнения в линейную форму связаны с зависимой переменной. В этом случае линейный коэффициент корреляции по преобразованным значениям признаков дает лишь приближенную оценку тесноты связи и численно не совпадает с индексом корреляции.
Например, степенная функция после перехода к логарифмически линейному уравнению может быть найден линейный коэффициент корреляции не для фактических значений х и у, а для их логарифмов, то есть . Соответственно квадрат его значения будет характеризовать отношение факторной суммы квадратов отклонений к общей, но не для у, а для его логарифмов:
Между тем при расчете индекса корреляции корреляции используются суммы квадратов отклонений признака у, а не их логарифмов. С этой целью определяются теоретические значения результативного признака, то есть у, как антилогарифм рассчитанной по уравнению величины lny и остаточная сумма квадратов как . Индекс корреляции определяется по формуле
В знаменателе расчета участвует сумма квадратов отклонений фактических значений у от их средней величины, а в расчете участвует . Соответственно различаются числители рассматриваемых показателей:
- в индексе корреляции и - в коэффициенте корреляции.
Необходимо также помнить, что если при линейной зависимости признаков сопряженные регрессии имеют один и тот же коэффициент корреляции, то есть , то при криволинейной зависимости они не равны, то есть .
Так как в расчете индекса корреляции используется соотношение факторной и общей суммы квадратов отклонений, то R2 имеет тот же смысл, что и коэффициент детерминации. В специальных исследованиях величину R2 для нелинейных связей называют индексом детерминации.
Оценка существенности индекса корреляции проводится, так же как и оценка надежности коэффициента корреляции. Индекс детерминации используется для проверки существенности в целом уравнения линейной регрессии по F -критерию Фишера:
,
где n- число наблюдений, m - число параметров при переменной х. Величина m характеризует число степеней свободы для факторной суммы квадратов, а (n-m-1) - число степеней свободы для остаточной суммы квадратов.
Индекс детерминации можно сравнивать с коэффициентом детерминации для обоснования возможности применения линейной функции. Чем больше кривизна линии регрессии, тем величина коэффициента детерминации меньше индекса детерминации. Близость иx означает, что нет необходимости усложнять форму уравнения регрессии и можно использовать линейную функцию. Если , то предположение о линейной форме связи считается оправданным. В противном случае проводится оценка существенности различия и , вычисленных по одним и тем же исходным данным через t-критерий Стьюдента:
,
где - ошибка разности между и .
Если tф > tт, то различия между рассматриваемыми показателями корреляции существенны и замена нелинейной регрессии уравнением линейной функции невозможна. Если t < 2, то различия несущественны и, следовательно, возможно применение линейной регрессии.
2. Нелинейная корреляции для множественного уравнения регрессии
Для криволинейной зависимости, нелинейной по переменным индекс множественной корреляции равен совокупному коэффициенту корреляции.
Например, если для фирмы модель прибыли у имеет вид
У = a + b1x1 + b2x2 + b3lnx3 + b4lnx4
где х1 - удельные расходы на рекламу;
х2 - капитал фирмы;
х3 - доля продукции фирмы в общем объеме продаж данной группы товаров по региону;
х4 - процент увеличения объема продаж фирмы по сравнению с предыдущим годом.
Тогда независимо от того, что фактор х1 задан линейно, а х2, х3, х4 - в логарифмах, оценка тесноты связи может быть произведена с помощью линейного коэффициента множественной корреляции.
Иначе обстоит дело с криволинейной регрессией, нелинейной по оцениваемым параметрам. Предположим, что рассматривается производственная функция Кобба-Дугласа:
,
где P- объем продукции, L - затраты труда, К - величина капитала, b1+b2=1.
Логарифмируя ее, получим линейное уравнение в логарифмах
Ln P = lna + b1lnL + b2lnK
Индекс детерминации для нелинейных по оцениваемым параметрам функции принять называть «квази R2» определения по функциям, использующим логарифмические преобразования (степенная, экспонента), необходимо найти сначала теоретические значения ln y, затем трансформировать их через антилогарифмы, то есть найти теоретические значения результативного признака и далее определять индекс детерминации как «квази R2» по формуле
Величина индекса множественной корреляции, определенная как «квази R2» не будет совпадать с совокупным коэффициентом корреляции.
Для того, чтобы не допустить возможного преувеличения тесноты связи, используется скорректированный индекс (коэффициент) множественной корреляции. Он содержит поправку на число степеней свободы и рассчитывается по формуле
,
где n - число наблюдений, m - число факторов.
Чем больше величина m, тем сильнее различия между .
Для линейной зависимость признаков скорректированный коэффициент корреляции определяется по той же формуле, что и индекс множественной корреляции. Отличие заключается лишь в том, что в линейной зависимости под m понимается число факторов, включенных в анализ, а в криволинейной зависимости это число параметров при х. Например, если y=f(x1,x2), то для линейной зависимости m = 2, а для регрессии вида
у = a + b1x12+b12x1 + b2x2 +b22x22
число параметров при х = 4, то есть m = 4.
3. Парная регрессия и корреляция
В математике мы привыкли к тому, что речь идет о функциональной зависимости, когда каждому значению одной переменной соответствует вполне определенное значение другой.
В экономике в большинстве случаев, между переменными величинами существуют зависимости, когда каждому значению одной переменной соответствует не какое-то определенное, а множество возможных значений другой переменной (или определенное условное распределение другой переменной). Такая зависимость получила название статистической, вероятностной.
Возникновение такой связи обусловлено тем, что зависимая переменная подвержена влиянию неконтролируемых или неучтенных факторов, а также случайными ошибками.
В силу неоднозначности статистической зависимости между и , представляет интерес усредненная по схема зависимости, т.е. закономерность в измерении условного математического ожидания (математическое ожидание случайной переменной , вычисленного в предположении, что переменная приняла значение ) в зависимости .
- независимая переменная, объясняющая, входная, предсказывающая, экзогенная, фактор, регрессор, факторный признак.
- зависимая переменная, функция отклика, объясняемая, выходная, результирующая, эндогенная переменная, результативный признак.
Нас интересует односторонняя зависимость случайной переменной от независимой переменной .
Определение: Когда каждому значению одной переменной соответствует определенное условное математическое ожидание (среднее значение) другой, то такая зависимость называется корреляционной.
Иначе, корреляционной зависимостью между двумя переменными называется функциональная зависимость между значениями одной и средним значением другой (условным математическим ожиданием),
(1)
это уравнение называется модельным уравнением регрессии (или просто уравнением регрессии, или функцией регрессии, а её график - линией регрессии).
Для точного описания уравнения регрессии необходимо знать условный закон распределения переменной при условии, что переменная примет значение , .
В статистической практике такой информации получить не удается, т.к. обычно имеется выборка пар значений объема .
В этом случае речь может идти о приближенном выражении, аппроксимации по выборке функции регрессии. Такой оценкой является выборочная линия (кривая) регрессии
- условная средняя переменной при фиксированном значении ,
- параметры кривой.
При должна сходиться по вероятности к функции регрессии .
Таким образом, эконометрическая модель имеет вид:
где - наблюдаемое значение зависимой переменной,
- объясненная часть, зависящая от значений объясняющих переменных,
- случайная составляющая.
В многомерном случае, когда х - вектор, , где - могут считаться как случайными, так и детерминированными.
.
Итак, чтобы получить достаточно достоверные и информативные данные о распределении какой-либо случайной величины, необходимо иметь выборку её наблюдений достаточно большого объема. Такие выборки представляют собой наборы значений - число наблюдений, - количество объясняющих переменных.
Рассмотрим .
Парная регрессия - уравнение связи двух переменных .
Определение. Любое эконометрическое исследование начинается со спецификации модели, т.е. с формулировки (выбора) вида модели, исходя из соответствующей теории связи между переменными.
Различают линейные и нелинейные регрессии. Нелинейные регрессии делят на два класса: регрессии, нелинейные относительно включенных объясняющих переменных, но линейных по оцениваемым параметрам, и, регрессии, нелинейные по оцениваемым параметрам.
Линейная: .
Нелинейные по объясняющим параметрам:
Регрессии, нелинейные по оцениваемым параметрам:
Степенная:
Показательная:
Экспоненциальная:
Логарифмическая:
Полулогарифмическая: ,
Обратная:
Если у нас есть набор значений двух переменных и то на плоскости эти значения можно отобразить точками, таким образом получаем поле корреляции, которое изображено на рис. 1.
Рис.1. Поле корреляции
Предположим, что нашей задачей является подобрать (подогнать) функцию из параметрического семейства функций , наилучшим способом описывающую зависимость y от x.
Подобрать функцию - это два шага:
1 шаг: спецификация модели
2 шаг: выбрать наилучшие значения параметров и .
В качестве меры отклонения функции от набора наблюдений можно взять:
1.
2.
3. в общем случае: , где - мера, с которой отклонение входит в функционал .
Примером такой меры может служить функция Хубера, которая при малых отклонениях квадратична, а при больших линейна:
Наиболее употребительной является функция g вида 1.
4. Оценка значимости уравнения регрессии
Проверить значимость уравнения регрессии - значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной.
Проверка значимости уравнения регрессии производится на основе дисперсионного анализа.
Обозначим через - теоретически вычисляемые по формуле значения, тогда
Преобразуем формулу дисперсии с учетом вышеуказанной суммы:
Далее
Так как имеет место равенство ,
и из МНК следуют два соотношения ,
то
(*)
Введем обозначения:
TSS (total sum of sguares) - вся дисперсия: сумма квадратов отклонений от среднего.
RSS (regression sum of sguares) - объясненная часть всей дисперсии (обусловленная
регрессией), факторная, объясненная дисперсия.
ESS (error sum of sguares) - остаточная сумма, дисперсия остаточная.
Определение. Коэффициентом детерминации, или долей объясненной дисперсии называется
.
В силу определения .
Если , то это означает, что регрессия ничего не дает, т.е. не улучшает качество предсказания , по сравнению с тривиальным .
Если , то лежат на линии регрессии и между и y существует линейная функциональная зависимость, т.е. абсолютно точное совпадение: .
Для линейной регрессии определяется коэффициент регрессии по формуле:
или .
Тогда
-
получившаяся формула есть дисперсия объясненная, факторная, тогда
;
отсюда, можно построить коэффициент (индекс корреляции ) для нелинейной регрессии
.
Т.к. формулы для связи TSS, RSS, ESS мы получили в предположении что , то при , полученная формула не будет справедливой.
5. Оценка качества модели
Оценку качества построенной модели можно определить через коэффициент (индекс) детерминации, а также с помощью средней ошибки аппроксимации.
Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических в процентах:
.
Предел значений считаем допустимым при построении модели.
Средний коэффициент эластичности показывает, на сколько % в среднем по совокупности изменится результат от своей средней величины при изменении фактора на 1% от своего среднего значения
- характеризует соотношение прироста результата и фактора для соответствующей формы связи.
Т.к., коэффициент Э не всегда const, то используем среднее значение - .
В таблице представлены формулы эластичности для наиболее употребительных функций.
Таблица 1.
y |
|||
Иногда коэффициент Э экономического смысла не имеет. Это происходит тогда, когда для рассматриваемых признаков бессмысленно определение изменения значений в процентах. Например, изменение роста заработной платы с ростом стажа работы на 1%.
Если линеаризация не затрагивает зависимую переменную, например
,
то требование МНК: выполнимо, то (коэффициент корреляции совпадает с индексом корреляции), в этом легко убедиться.
Использование F-критерия
С помощью F-критерия можно оценить качество построенной функции.
Поскольку при заданном объеме наблюдений (,) факторная сумма квадратов при линейной регрессии зависит только от одной константы - коэффициента регрессии , то говорят, что данная сумма квадратов имеет одну степень свободы.
К этому же выводу мы придем формальным путем, а именно, . Но свободный член , тогда
при заданном наборе переменных и , расчетное значение является в линейной регрессии функцией только одного параметра . Соответственно факторная сумма квадратов отклонений имеет число степеней свободы равное 1.
Любая сумма квадратов отклонений связана с числом степеней свободы, т.е. с числом свободы независимого варьирования признака. Значит число степеней свободы связано с числом единиц совокупности и с числом определяемых по ней констант. Применительно к исследуемой проблеме число степеней свободы должно показывать, сколько независимых отклонений из возможных требуется для образования данной суммы квадратов. Так для общей суммы квадратов требуется независимое отклонение, ибо по совокупности из единиц после расчета среднего уровня , свободно варьируют лишь числом отклонений.
Например, имеем ряд 1, 2, 3, 4, 5. Среднее =3, тогда n отклонений от среднего: -2, -1, 0, 1, 2. Т.к. то свободно варьируют 4 отклонения, а пятое может быть определено, если 4 известны.
Число степеней свободы в левой и правой частях соотношения (*) должно совпадать, то число степеней свободы второго слагаемого должно быть равно (n - 2).
То есть
.
Разделив каждую сумму квадратов на соответствующее ей число степеней свободы, получим средний квадрат отклонений, или, что тоже самое, дисперсию на одну степень свободы D
.
Это приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточные дисперсии в расчете на одну степень свободы, получим величину F - отношения (F- критерия):
,
где F- критерий для проверки нулевой гипотезы : .
Если нулевая гипотеза справедлива, то и не отличаются друг от друга. Для необходимо опровержение, то есть, чтобы факторная дисперсия превышала остаточную в несколько раз.
- это максимальная величина отношения дисперсий, которая может иметь место при случайном их расхождении для данного уровня вероятности.
F-критерий - это оценивание качества уравнения регрессии, которое состоит в проверке гипотезы о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого производится сравнение фактического и значений F критерия Фишера-Снедекора. определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы
.
- это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости . Уровень значимости - это вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно .
Если < , то - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность.
Если > , то - гипотеза не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.
6. Интервальная оценка функции регрессии и её параметров
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитывается - критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза о случайной природе показателей, т.е. о незначимом их отличии от нуля. Оценка значимости коэффициентов регрессии и корреляции с помощью - критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки.
Рассчитываются:
.
Уравнение регрессии представимо в виде:
.
Стандартная ошибка , т.е. стандартная ошибка прогнозного значения зависит от ошибки и ошибки коэффициента регрессии.
Для доказательства этого рассмотрим дисперсии: .
- здесь учтено, что неслучайная (детерминированная) величина, при вынесении которой за знак дисперсии её необходимо возвести в квадрат,
Т.о.
.
Определим стандартную ошибку через остаточную дисперсию на одну степень свободы:
или
Сравнивая фактические и табличные значения - статистики и принимаем или отвергаем гипотезу . Установим связь между F-критерием Фишера и - статистикой Стьюдента:
,
но , очевидно .
Следовательно: .
Т.о. проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного уравнения регрессии.
Если < , но отклоняется, т.е. не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора . Если >, то не отклоняется и признается случайная природа формирования или .
Для расчета доверительного интервала определяем предельную ошибку для каждого показателя:
,
тогда формула для расчета доверительных интервалов имеют следующий вид:
Если в границы доверительного интервала попадает ноль, т.е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр принимается нулевым, т.к. он не может одновременно принимать и положительное и отрицательное значения.
Прогнозное значение определяется путем подстановки в уравнение регрессии соответствующего прогнозного значения . Вычисляется средняя стандартная ошибка прогноза
и строится доверительный интервал прогноза
.
Рассмотренные формулы стандартных ошибок предсказываемого среднего значения при заданном характеризует ошибку положения линии регрессии, при , и возрастает при удалении от .
Но фактические значения варьируют около среднего , индивидуальные значения могут отклоняться на величину , дисперсия которой оценивается как остаточная дисперсия на одну степень свободы, поэтому ошибка предсказываемого индивидуального значения должна включать не только , но и случайную составляющую , или
.
7. Метод наименьших квадратов
При оценке параметров уравнения регрессии применяется МНК. При этом делаются определенные предпосылки относительно случайной составляющей
.
- ненаблюдаемая величина. После того, как произведена оценка параметров модели, рассчитывая разности фактических и теоретических значений , можно определить оценки случайной составляющей . Поскольку они не являются реальными случайными остатками, их можно считать некоторой выборочной реализацией неизвестного остатка заданного уравнения, т.е. . При изменении спецификации модели, добавлении в неё новых наблюдений, выборочные оценки остатков могут меняться. Поэтому в задачу регрессионного анализа входит не только построение самой модели, но и исследование случайных отклонений , т.е. остатков.
До сих пор мы останавливались на формальных проверках статистической достоверности коэффициентов регрессии и корреляции с помощью - критерия Стьюдента, - критерия Фишера. Оценки параметров регрессии должны отвечать определенным критериям. Они должны быть несмещенными, состоятельными и эффективными.
Несмещенность оценки означает, что математическое ожидание остатков равно нулю. Следовательно, при большом числе выборочных оцениваний, остатки не будут накапливаться и найденный параметр можно рассматривать как среднее значение из возможного большого числа несмещенных оценок.
Эффективность оценки - оценки, характеризующиеся наименьшей дисперсией.
Состоятельность оценок характеризует увеличение их точности с увеличением выборки.
Указанные критерии должны учитываться при разных способах оценивания. МНК строит оценки регрессии на основе минимизации суммы квадратов остатков. Поэтому очень важно исследовать поведение остаточных величин регрессии .
Исследования остатков предполагают проверку наличия следующих предпосылок МНК (т.е. при выполнении их получаются несмещенные эффективные и состоятельные оценки):
1. случайный характер остатков
2. нулевая средняя величина , не зависящая от
3. гомоскедастичность - дисперсия каждого одинакова для всех значений
4. отсутствие автокорреляции остатков. Значения остатков распределены независимо друг от друга.
5. остатки подчиняются нормальному распределению.
Если не все предпосылки выполняются, то следует корректировать модель.
Рассмотрим все предпосылки.
1). На рис. ниже изображено поведение остатков в различных случаях:
2). Эта предпосылка означает, что . Это выполнимо для линейных моделей и моделей, нелинейных относительно включаемых переменных. Для моделей нелинейных относительно оцениваемых параметров и приводимых к линейному виду, например, логарифмированием, средняя ошибка равна нулю для логарифмов.
Вместе с тем несмещенность оценок регрессии означает независимость случайных остатков и . Строятся графики, если полоса, то независимы от , если график показывает зависимость, то модель неадекватна.
5). Предпосылка о нормальным распределении остатков позволяет проводить проверку параметров регрессии с помощью критериев и . Вместе с тем оценки регрессии, найденные с МНК, обладают хорошими свойствами даже при отсутствии нормального распределения остатков.
Совершенно необходимы 3) и 4) предпосылки.
3). Для каждого фактора остатки имеют одинаковую дисперсию, если это условие не выполняется, то имеет место гетероскедастичность.
Для каждого значения распределения остатков одинаковы (гомоскедастичность) и диапазон варьирования остатков меняется с переходом от одного значения к другому (гетероскедастичность).
Наличие гомо и гетероскедастичности можно видеть и по рассмотренным выше двум графикам зависимости остатков от .
Итак, основные предпосылки регрессионного анализа:
1. В модели возмущение есть величина случайная, а объясняющая переменная - величина детерминированная.
2. Математическое ожидание возмущения равно нулю: - несмещенность.
3. Дисперсия возмущения постоянна (условие гомоскедастичности или равноизменчивости возмущения).
4. указывает на некоррелированность ошибок для разных наблюдений. Это условие часто нарушается в случае, когда данные являются временными рядами. В случае, когда это условие не выполняется, говорят об автокорреляции ошибок.
5. Возмущение есть нормально распределенная случайная величина. В этом случае модель называется нормальной линейной регрессионной (CNLR model).
Итак, мы хотим оценить и наилучшим способом. Что значит «наилучшим»? Например, найти в классе линейных (по ) несмещенных оценок наилучшую в смысле минимальной дисперсии.
Заметим, что когда такая оценка найдена, это вовсе не означает, что не существует нелинейной несмещенной оценки с меньшей дисперсией.
Заключение
Любой показатель практически зависит от бесконечного количества факторов. Однако лишь ограниченное количество факторов действительно существенно воздействуют на исследуемый показатель. Доля влияния остальных факторов столь незначительна, что их игнорирование не может привести к существенным отклонениям в поведении исследуемого объекта. Выделение и учет в модели лишь ограниченного числа реально доминирующих факторов является важной задачей качественного анализа, прогнозирования и управления ситуаций.
Если в естественных науках большей частью имеют дело со строгими (функциональными) зависимостями, при которых каждому значению одной переменной соответствует единственное значение другой, то между экономическими переменными, в большинстве случаев, таких зависимостей нет, и дело имеют с корреляционными зависимостями.
Список литературы.
1. Годин А.М. «Статистика» Донецк, 2007.
2. Дуброва Т.А. Статистические методы прогнозирования в экономике», МЭСИ, М.,2000.
3. Сиротина Т.П. Руководство по изучению дисциплины «Экономика и статистика» М., МЭСИ,2001.
4. Сиротина Т.П. «Экономика и статистика предприятия», М., МЭСИ, 2001.
5. Суслов В.И., Ибрагимов Н.М., Талышева Л.П., Цыплаков А. А. Эконометрия. - Новосибирск: Издательство СО РАН, 2005. - 744с.
6. Сиротина Т.П. Практикум по дисциплине «Экономика и статистика предприятия» МЭСИ, М.,2001.
7. Зарубин В. С., Крищенко А.П. «Математическая статистика». М.: МГТУ Баумана, 2002.
8. Иванов Ю.Н. «Экономическая статистика». М.: Инфра-М, 2002
Размещено на Allbest.ru
...Подобные документы
Составление матрицы парных коэффициентов корреляции переменных. Построение линейного уравнения регрессии, характеризирующее зависимость цены от факторов. Оценка статистической значимости параметров в регрессионной модели с помощью t-критерия Стьюдента.
лабораторная работа [1,6 M], добавлен 13.04.2010Порядок построения линейного уравнения парной регрессии, расчет коэффициентов и оценка статической значимости параметров регрессии и корреляции. Точность прогноза. Множественная регрессия и корреляция. Системы эконометрических уравнений. Временные ряды.
контрольная работа [1,3 M], добавлен 24.09.2013Основы линейного регрессионного анализа. Особенности использования функции Кобба-Дугласа. Применение множественной линейной регрессии. Сущность метода наименьших квадратов. Пути избегания ложной корреляции. Проверка значимости коэффициентов регрессии.
реферат [101,8 K], добавлен 31.10.2009Сущность и применение метода наименьших квадратов для однофакторной линейной регрессии. Нахождение коэффициента эластичности для указанной модели в заданной точке X и его экономический анализ. Прогноз убыточности на основании линейной регрессии.
контрольная работа [47,3 K], добавлен 15.06.2009Основные этапы многофакторного корреляционного анализа и интерпретация его параметров. Назначение коэффициентов эластичности и стандартизированных бетта-коэффициентов. Расчет значимости коэффициентов регрессии и корреляции с помощью f-критерия Стьюдента.
контрольная работа [605,2 K], добавлен 29.07.2010Расчет параметров уравнения линейной регрессии, экономическая интерпретация регрессии. Определение остаточной суммы квадратов. Выполнение предпосылок МНК. Расчет коэффициента детерминации, проверка значимости уравнения регрессии с помощью критерия Фишера.
контрольная работа [317,0 K], добавлен 11.05.2009Параметры уравнений линейной, степенной парной. Оценка тесноты связи с помощью показателей корреляции и детерминации, качества уравнений с помощью средней ошибки аппроксимации. Определение прогнозного значения от среднего значения заданного параметра.
контрольная работа [150,5 K], добавлен 22.02.2016Проверка выполнения предпосылок МНК. Значимость параметров уравнения регрессии с помощью t-критерия Стьюдента и F-критерия Фишера. Средняя относительная ошибка аппроксимации. Гиперболические, степенные и показательные уравнения нелинейной регрессии.
контрольная работа [253,4 K], добавлен 17.03.2011Оценка статистической значимости параметров регрессии. Построение экономического прогноза прибыли при прогнозном значении произведенной валовой продукции. Статистическая оценка параметров уравнения регрессии. Построение мультипликативной модели тренда.
контрольная работа [132,1 K], добавлен 10.03.2013Парная линейная регрессия. Полный регрессионный анализ. Коэффициент корреляции и теснота линейной связи. Стандартная ошибка регрессии. Значимость уравнения регрессии. Расположение доверительных интервалов. Расчет параметров множественной регрессии.
контрольная работа [932,7 K], добавлен 09.06.2012Расчет параметров линейной и степенной парной регрессии. Показатели корреляции и детерминации, методика их расчета. Средняя ошибка аппроксимации. Оценка с помощью F-критерия Фишера статистической надежности результатов регрессионного моделирования.
контрольная работа [25,2 K], добавлен 20.11.2014Статистика розничного и оптового товарооборота: показательная регрессия, построение регрессии. Дисперсионный анализ для линейной регрессии, изучение ее качества. Доверительные интервалы для оцененных параметров и критерий Фишера значимости регрессии.
контрольная работа [300,4 K], добавлен 21.08.2008Проверка статистической гипотезы о значимости коэффициента функции регрессии. Практическое применение интерполирования. Применение процедуры линеаризации в решении нелинейной задачи регрессии. Построение квадратичной модели полулогарифмической функции.
курсовая работа [291,1 K], добавлен 23.03.2015Составление матрицы парных коэффициентов корреляции. Построение уравнения регрессии, характеризующего зависимость цены от всех факторов. Проведение регрессионного анализа с помощью пакета SPSS. Экономическая интерпретация коэффициентов модели регрессии.
лабораторная работа [2,5 M], добавлен 27.09.2012Эффективность оборотных средств. Оценка тесноты связи между факторным и результативным показателями на основе корреляционного анализа. Проверка значимости коэффициента корреляции. Оценка значимости уравнения линейной регрессии. Формы связи показателей.
курсовая работа [143,2 K], добавлен 15.03.2015Порядок проведения проверки статистических гипотез. Проверка однородности результатов эксперимента в целях исключения грубых ошибок. Расчет теоретических частот для нормального распределения. Уравнение линейной регрессии и метод наименьших квадратов.
курсовая работа [349,5 K], добавлен 09.01.2011Характеристика двухшагового метода наименьших квадратов для решения систем эконометрических уравнений. Способы оценки неизвестных параметров регрессионных моделей по выборочным данным. Знакомство с особенностями системы эконометрических уравнений.
курсовая работа [593,8 K], добавлен 04.06.2015Временной ряд и его основные элементы. Автокорреляция уровней временного ряда и выявление структуры. Моделирование тенденции временного ряда. Метод наименьших квадратов. Приведение уравнения тренда к линейному виду. Оценка параметров уравнения регрессии.
контрольная работа [95,7 K], добавлен 25.02.2010Зависимость между стоимостью основных производственных фондов и объемом продукции. Вычисление индексов сезонности. Индекс цен переменного состава. Индекс структурных сдвигов. Расчёт параметров линейной регрессии. Оценка качества уравнения регрессии.
контрольная работа [272,1 K], добавлен 09.04.2016Виды и способы статистического наблюдения. Построение и анализ вариационных рядов распределения. Оценка параметров генеральной совокупности банков на основе выборочных данных. Расчет парного коэффициента корреляции и уравнения однофакторной регрессии.
контрольная работа [712,1 K], добавлен 30.03.2014