Обработка экспериментальных данных

Статистическая гипотеза о значимости коэффициента функции регрессии. Построение квадратичной модели функции регрессии. Интерполирование функций. Регрессионные модели, нелинейные относительно как неизвестных параметров, так и включенных переменных.

Рубрика Экономика и экономическая теория
Вид курсовая работа
Язык русский
Дата добавления 30.11.2014
Размер файла 323,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ

Федеральное государственное бюджетное образовательное учреждение

Высшего профессионального образования

«Санкт-Петербургский государственный технологический институт

(технический университет)» (СПбГТИ(ТУ))

КАФЕДРА Инноватики и информационных технологий

УГС 220701

СПЕЦИАЛЬНОСТЬ Менеджмент высоких технологий

ДИСЦИПЛИНА Организационно-экономическое моделирование

Курсовая работа

Обработка экспериментальных данных

Выполнила студентка 5 курса, группы 6993 Жердева М.В.

Принял доцент кафедры прикладной математики, к.т.н. Урванцев В.Г.

Санкт-Петербург

2014

ТЕМА 1. Проверка статистических гипотез

1.1 Проверка статистической гипотезы о значимости коэффициента функции регрессии

Статистическая гипотеза - это гипотеза о виде неизвестного распределения, или о параметрах известных распределений.

Нулевой гипотезой (H0) называют выдвинутую гипотезу.

Конкурирующей (альтернативной)(H1) называют гипотезу, которая противоречит нулевой.

Так как проверку производят методами статистики, ее называют статистической. Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность совершить ошибку первого рода принято обозначать ? , ее называют уровень значимости. Наиболее уровень значимости принимают равным 0,05 или 0,01.

Статистическим критерием называют случайную величину, которая служит для проверки нулевой гипотезы. Наблюдаемым значением называют значения критерия, вычисленного по выборкам. Критической областью называют совокупность значений критерия, при которых нулевая гипотеза отвергается.

Основной принцип проверки статистических гипотез: если наблюдаемое значение принадлежит критической области - гипотезу отвергают; если наблюдаемое значение принадлежит области допустимых значений - гипотезу принимают.

Правило принятия решения для проверки статистических гипотез - это модель расчета значений выборочных статистических показателей, на основании которых принимается или отвергается нулевая гипотеза.

Процедура проверки гипотезы следующая: необходимо сформулировать нулевую и альтернативную гипотезы; определить уровень значимости; найти наблюдаемое значение, используя формулу стандартизированного критерия; по таблице выяснить критическое значение в соответствии с уровнем значимости и размером выборки, если это необходимо; сравнить критическое значение с наблюдаемым, тем самым использовать правило принятия решения.

Данные гипотезы проверяются с помощью t-критерия Стьюдента, который вычисляется посредством частного F-критерия Фишера.

1.2 Построение квадратичной модели функции регрессии

По данным КР №2 построим квадратичную модель функции регрессии:

y(x)=ax2+bx+c

Задание:

Имеются результаты серии экспериментальных измерений (таблица 1)., причем считается, что величины х измерены точно, а у содержат случайные ошибки измерений. Предполагается, что ошибки измерений - независимые нормально распределенные случайные величины с одинаковыми нулевыми дисперсиями и нулевыми математическими ожиданиями.

Таблица 1 - Исходные данные

Среднегодовая стоимость ОПФ, 103 руб.

xi

Товарная продукция, 103 руб.

yi

1

389

292

2

407

280

3

420

293

4

465

390

5

501

415

6

524

425

Если уравнение регрессии представляет собой полином некоторой степени, то при использовании метода наименьших квадратов коэффициенты этого полинома находят решением системы линейных уравнений. Например, требуется определить по методу наименьших квадратов коэффициенты квадратичной функции -- параболы второго порядка:

y = b0 + b1 x + b11 x2

В этом случае

и система нормальных уравнений имеет вид:

I

Xi

Yi

Xi2

Xi3

Xi4

ХiYi

Хi2Yi

1

389

292

151321

58863869

22898045041

113588

44185732

2

407

280

165649

67419143

27439591201

113960

46381720

3

420

293

176400

74088000

31116960000

123060

51685200

4

465

390

216225

100544625

46753250625

181350

84327750

5

501

415

251001

125751501

63001502001

207915

104165415

6

524

425

274576

143877824

75391979776

222700

116694800

Суммы

2706

2095

1235172

570544962

266601328644

962573

447440617

Найдём коэффициенты a, b и c уравнения квадратичной регрессии из системы уравнений

Решим эту систему методом Крамера.

Итак, искомое уравнение квадратичной регрессии имеет вид:

y = -0,0017x2 + 2,7528x - 542,38

1.3 Проверка гипотезы о виде функции регрессии

По данным и результатам КР №2, используя результат п 1.2, сравнивая линейную и квадратичную модели проверить гипотезу о виде функции регрессии. Применить критерии Стьюдента и Фишера. При расчетах уровень значимости выбрать самостоятельно.

x*1000

y*1000

yЮ*1000

389

292

271

407

280

296

420

293

314

465

390

370

501

415

410

524

425

433

Сумма квадратов отклонений:

= 1.628 * 109

Оценка дисперсии отдельного измерения:

у = v407*106 = 20.2 * 103

Распределение Фишера:

Из таблицы распределения Фишера по уровню значимости, например, а=0,1 и числам степеней свободы k1 и k2 найдем критическое значение статистики Fa, Fa=10,13. Так как F<Fa, то гипотеза о допустимости упрощенной модели функции регрессии принимается. Следовательно, можно использовать функцию линейной регрессии.

ТЕМА 2. Интерполирование

2.1 Интерполирование функций

регрессия квадратичный интерполирование линейный

При разработке математического обеспечения САПР часто приходится иметь дело с функциями f(x), заданными в виде таблиц, когда известны некоторое конечное множество значений аргумента и соответствующие им значения функции. Аналитическое выражение функции f(x) при этом неизвестно, что не позволяет определять ее значения в промежуточных точках аргумента, отсутствующих в таблице. В таком случае решается задача интерполирования, которая формулируется следующим образом.

На отрезке [a, b] заданы n + 1 точки x0, x1, ..., xn, которые называются узлами интерполяции, и значения некоторой функции f(x) в этих точках f(x0) = y0, f(x1) = y1, ..., f(xn) = yn. Требуется построить интерполирующую функцию F(x), принимающую в узлах интерполяции те же значения, что и f(x), т.е. такую, что F(x0) = y0, F(x1) = y1, ..., F(xn) = yn.

Геометрически это означает, что нужно найти кривую y = F(x) некоторого определенного типа, проходящую через заданную систему точек Mi(xi, yi) для i = . Полученная таким образом интерполяционная формула y = F(x) обычно используется для вычисления значений исходной функции f(x) для значений аргумента x, отличных от узлов интерполяции. Такая операция называется интерполированием функцииf(x). При этом различают интерполирование в узком смысле, когда x принадлежит интервалу [x0, xn], и экстраполирование, когда x не принадлежит этому интервалу.

В такой общей постановке задача интерполирования может иметь бесчисленное множество решений. Чтобы получить единственную функцию F(x), необходимо предположить, что эта функция не произвольная, а удовлетворяет некоторым дополнительным условиям.

В простейшем случае предполагается, что зависимость y = f(x) на каждом интервале (xi, xi+1) является линейной. Тогда для каждого участка (xi, xi+1) в качестве интерполяционной формулы y = F(x) используется уравнение прямой, проходящей через точки Mi(xi, yi) и Mi+1(xi+1, yi+1), которое имеет вид

(1).

При программировании процедур линейной интерполяции следует учитывать, что процесс решения задачи интерполирования с использованием формулы (1) включают два этапа: выбор интервала (xi, xi+1), которому принадлежит значение аргумента х; собственно вычисление значения y = F(x) по формуле (1).

На практике в качестве интерполирующей функции F(x) обычно используется алгебраический многочлен

Pn(x) = a0 + a1x + a2x2 + ... + anxn

степени не выше n, такой, что Pn(x0) = y0, Pn(x1) = y1, ..., Pn(xn) = yn. Наиболее известными методами построения интерполяционного многочлена Pn(x) являются метод Лагранжа, итерационные и разностные методы.

Интерполяционная формула Лагранжа обеспечивает построение алгебраического многочлена Pn(x) для произвольно заданных узлов интерполирования. Для n + 1 различных значений аргумента x0, x1, ..., xn и соответствующих значений функции f(x0) = y0, f(x1) = y1, ..., f(xn) = yn интерполяционная формула Лагранжа имеет вид

,

где х - значение аргумента функции, расположенного в интервале [x0, xn].

Интерполирование по формуле Лагранжа связано с большим объемом вычислений, значительная часть которых повторяется при получении нескольких значений Pn(x) для одной функции f(x). В том случае, когда формула Лагранжа используется для многократного получения значений одной функции при различных значениях аргумента, можно значительно уменьшить объем вычислений. Для этого формула Лагранжа представляется в виде

где - лагранжевы коэффициенты, определяемые как

Используя исходные данные Вашего варианта из КР №2 получить значение функции Y(х) в точке «х0», соответствующей середине имеющегося интервала, используя интерполяционный многочлен 2-й, 3-й и 5-й степени. Сравнить значения Y по функциям регрессии и многочленам интерполяции.

Интерполяционный многочлен второй степени - это ломаная линия, соединяющая пары точек.

Рисунок 1 -Линейная интерполяция

Интерполяционный полином третьей степени - это кусочная функция, каждый интервал которой проходит через 1,2,3 точку, затем через 3,4,5 точки и затем через 5 и 6 точки и дополнительно определим 7-ую точку из уравнения параболической регрессии.

y = -0,0017x2 + 2,7528x - 542,38

Рисунок 2 -Квадратичная интерполяция

Расчет с помощью Mathcad:

Рисунок 3 - График многочлена Лагранжа пятой степени

значение в точке, вычисленное многочленом Лагранжа пятой степени:

значение в точке, вычисленное квадратичным многочленом Лагранжа (значение х0 приходится на участок, вычисляемое этой параболой):

Значение в точке, вычисленное линейным многочленом Лагранжа (значение х0 приходится на участок, вычисляемое этим отрезком прямой):

значение, вычисленное с помощью линии параболической регрессии:

значение, вычисленное с помощью линейной регрессии:

ТЕМА 3 Процедура линеаризации в решении нелинейной задачи регрессии

3.1 Регрессионные модели, нелинейные относительно как неизвестных параметров, так и относительно включенных переменных

Если между экономическими явлениями существуют нелинейные соотношения, то они выражаются с помощью соответствующих нелинейных функций: например, равносторонней гиперболы, параболы второй степени и др.

Различают два класса нелинейных регрессий:

§ регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам;

§ регрессии, нелинейные по оцениваемым параметрам.

Примером нелинейной регрессии по включаемым в нее объясняющим переменным могут служить следующие функции:

· полиномы разных степеней

у = а +bх + с2 + е,

у =а + bх +сх +dx3+ е,

· равносторонняя гипербола

К нелинейным регрессиям по оцениваемым параметрам относятся функции:

· показательная - у = аbх е

· экспоненциальная - y=ea+bxе

· степенная -- y = axbе

Приведение к линейному виду регрессий, нелинейных по объясняющим переменным

Нелинейная регрессия по включенным переменным не таит каких-либо сложностей в оценке ее параметров. Она определяется, как и в линейной регрессии, методом наименьших квадратов (МНК), ибо эти функции линейны по параметрам. Так, в параболе второй степени

у= а0 + а1 х + а2 х2 + е

заменяя переменные х1 =х, х2 = х2, получим двухфакторное уравнение линейной регрессии:

у= а0 + а1 х + а2 х2 + е

для оценки параметров которого, как будет показано далее, используется МНК.

Следовательно, полином любого порядка сводится к линейной регрессии с ее методами оценивания параметров и проверки гипотез. Как показывает опыт большинства исследователей, среди нелинейной полиномиальной регрессии чаще всего используется парабола второй степени; в отдельных случаях - полином третьего порядка. Ограничения в использовании полиномов более высоких степеней связаны с требованием однородности исследуемой совокупности: чем выше порядок полинома, тем больше изгибов имеет кривая и соответственно менее однородна совокупность по результативному признаку.

Парабола второй степени целесообразна к применению, если для определенного интервала значений фактора меняется характер связи рассматриваемых признаков: прямая связь меняется на обратную или обратная на прямую. В этом случае определяется значение фактора, при котором достигается максимальное (или минимальное) значение результативного признака: приравниваем к нулю первую производную параболы второй степени.

Если же исходные данные не обнаруживают изменения направленности связи, то параметры параболы второго порядка становятся трудно интерпретируемыми, а форма связи часто заменяется другими нелинейными моделями.

Применение МНК для оценки параметров параболы второй степени приводит к следующей системе нормальных уравнений: при b > 0 и с < 0 кривая симметрична относительно высшей точки, т. е. точки перелома кривой, изменяющей направление связи, а именно рост на падение.

Среди класса нелинейных функций, параметры которых без особых затруднений оцениваются МНК, следует назвать хорошо известную в эконометрике равностороннюю гиперболу

Для равносторонней гиперболы такого вида, заменив на z, получим линейное уравнение регрессии y = a +bz +е оценка параметров которого может быть дана МНК.

В отдельных случаях может использоваться и нелинейная модель вида

так называемая обратная модель, являющаяся разновидностью гиперболы Но, если в равносторонней гиперболе преобразованию подвергается объясняющая переменная z = 1/x и y= а + bz + е, то для получения линейной формы зависимости в обратной модели преобразовывается у, а именно: z =1/y и z = a + bx +е.

В результате обратная модель оказывается внутренне нелинейной и требование МНК выполняется не для фактических значений признака у, а для их обратных величин 1/у, а именно

следовательно полученная методом наименьших квадратов оценка уже не будет эффективной.

Приведение к линейному виду регрессий, нелинейных по параметрам

Данный класс нелинейных моделей подразделяется на два типа: нелинейные модели внутренне линейные и нелинейные модели внутренне нелинейные.

Если нелинейная модель внутренне линейна, то она с помощью соответствующих преобразований может быть приведена к линейному виду.

Если нелинейная модель внутренне нелинейна, то она не может быть сведена к линейной функции.

Например, в эконометрических исследованиях при изучении эластичности спроса от цен широко используется степенная функция:

y = axbе

где у - спрашиваемое количество;

х - цена;

е - случайная ошибка.

Данная модель нелинейна относительно оцениваемых пaраметров, ибо включает параметры а и b неаддитивно. Однако ее можно считать внутренне линейной, ибо логарифмирование данного уравнения по основанию е приводит его к линейному виду:

lnу = lnа + b lnx + ln е.

Соответственно оценки параметров а и b могут быть найдены МНК.

Если же модель представить в виде y = axbе, то она становится внутренне нелинейной, ибо ее невозможно превратить в линейный вид. Внутренне нелинейной будет и модель вида -- у = а+ bхc + е, ибо это уравнение не может быть преобразовано в уравнение, линейное по коэффициентам.

В специальных исследованиях по регрессионному анализу часто к нелинейным относят модели, только внутренне нелинейные по оцениваемым параметрам, а все другие модели, которые внешне нелинейны, но путем преобразований параметров могут быть приведены к линейному виду, относятся к классу линейных моделей.

В этом плане к линейным относят, например, экспоненциальную модель y = еa+bхе, ибо логарифмируя ее по натуральному основанию, получим линейную форму модели

lnу = а + b х +lnе.

Если модель внутренне не линейна по параметрам, то для оценки параметров используются итеративные процедуры, успешность которых зависит от вида уравнений и особенностей применяемого итеративного подхода. Модели внутренне нелинейные по параметрам могут иметь место в эконометрических исследованиях. Однако гораздо большее распространение получили модели, приводимые к линейному виду.

Среди нелинейных функций, которые могут быть приведены к линейному виду, в эконометрических исследованиях очень широко используется степенная функция y = axbе.

Связано это с тем, что параметр b в ней имеет четкое экономическое истолкование, т. е. он является коэффициентом эластичности. Это значит, что величина коэффициента b показывает, на сколько процентов изменится в среднем результат, если фактор изменится на 1%.

В моделях, нелинейных по оцениваемым параметрам, но приводимых к линейному виду, МНК применяется к преобразованным уравнениям.

Если в линейной модели и моделях, нелинейных по переменным, при оценке параметров исходят из критерия

,

то в моделях, нелинейных по оцениваемым параметрам, требование МНК применяется не к исходным данным результативного признака, а к их преобразованным величинам, т. е. lnу, 1/у.

Так, в степенной функции y = axbе МНК применяется к преобразованному уравнению lnу = lnа + xlnb.

Это значит, что оценка параметров основывается на минимизации суммы квадратов отклонений в логарифмах:

Вследствие этого оценки параметров для линеаризуемых функций МНК оказываются несколько смещенными. При исследовании взаимосвязей среди функций, использующих ln у, в эконометрике преобладают степенные зависимости - это и кривые спроса и предложения, и кривые Энгеля, и производственные функции, и кривые освоения для характеристики связи между трудоемкостью продукции и масштабами производства в период освоения выпуска нового вида изделий, и зависимость валового национального дохода от уровня занятости.

При использовании линеаризуемых функций, затрагивающих преобразования зависимой переменной y, следует особенно проверять наличие предпосылок МНК, чтобы они не нарушались при преобразовании.

3.2 Нахождение линии гиперболической регрессии

Используя данные для КР№2, решить задачу нелинейной (относительно переменных «х») регрессии на примере равносторонней гиперболы .

1

2

3

4

5

6

389

407

420

465

501

524

292

280

293

390

415

425

1. Составим таблицу вспомогательных величин:

1

389

292

0.00257069

0.00000661

0.75064267

2

407

280

0.002457

0.00000604

0.68796069

3

420

293

0.00238095

0.00000567

0.69761905

4

465

390

0.00215054

0.00000462

0.83870968

5

501

415

0.00199601

0.00000398

0.82834331

6

524

425

0.0019084

0.00000364

0.8110687

2706

2095

0.01346359

0.00003057

4.6143441

Вычислим коэффициенты и уравнения гиперболической регрессии по известным формулам:

Итак, искомое уравнение регрессии имеет вид:

.

Размещено на Allbest.ru

...

Подобные документы

  • Проверка статистической гипотезы о значимости коэффициента функции регрессии. Практическое применение интерполирования. Применение процедуры линеаризации в решении нелинейной задачи регрессии. Построение квадратичной модели полулогарифмической функции.

    курсовая работа [291,1 K], добавлен 23.03.2015

  • Оценка статистической значимости параметров регрессии. Построение экономического прогноза прибыли при прогнозном значении произведенной валовой продукции. Статистическая оценка параметров уравнения регрессии. Построение мультипликативной модели тренда.

    контрольная работа [132,1 K], добавлен 10.03.2013

  • Составление матрицы парных коэффициентов корреляции переменных. Построение линейного уравнения регрессии, характеризирующее зависимость цены от факторов. Оценка статистической значимости параметров в регрессионной модели с помощью t-критерия Стьюдента.

    лабораторная работа [1,6 M], добавлен 13.04.2010

  • Статистика розничного и оптового товарооборота: показательная регрессия, построение регрессии. Дисперсионный анализ для линейной регрессии, изучение ее качества. Доверительные интервалы для оцененных параметров и критерий Фишера значимости регрессии.

    контрольная работа [300,4 K], добавлен 21.08.2008

  • Расчет параметров уравнения линейной регрессии, экономическая интерпретация регрессии. Определение остаточной суммы квадратов. Выполнение предпосылок МНК. Расчет коэффициента детерминации, проверка значимости уравнения регрессии с помощью критерия Фишера.

    контрольная работа [317,0 K], добавлен 11.05.2009

  • Сущность и применение метода наименьших квадратов для однофакторной линейной регрессии. Нахождение коэффициента эластичности для указанной модели в заданной точке X и его экономический анализ. Прогноз убыточности на основании линейной регрессии.

    контрольная работа [47,3 K], добавлен 15.06.2009

  • Порядок построения линейного уравнения парной регрессии, расчет коэффициентов и оценка статической значимости параметров регрессии и корреляции. Точность прогноза. Множественная регрессия и корреляция. Системы эконометрических уравнений. Временные ряды.

    контрольная работа [1,3 M], добавлен 24.09.2013

  • Построение корреляционного поля между ценой акции и доходностью капитала. Гипотеза о тесноте и виде зависимости между доходностью и ценой. Расчет коэффициента детерминации. Оценка статистической значимости уравнения регрессии с помощью F-критерия Фишера.

    контрольная работа [274,3 K], добавлен 25.09.2013

  • Построение диаграммы рассеивания (корреляционного поля). Группировка данных и построение корреляционной таблицы. Оценка числовых характеристик для негруппированных и группированных данных. Выборочное значение статистики. Параметры линейной регрессии.

    контрольная работа [150,5 K], добавлен 14.12.2010

  • Проверка выполнения предпосылок МНК. Значимость параметров уравнения регрессии с помощью t-критерия Стьюдента и F-критерия Фишера. Средняя относительная ошибка аппроксимации. Гиперболические, степенные и показательные уравнения нелинейной регрессии.

    контрольная работа [253,4 K], добавлен 17.03.2011

  • Основы линейного регрессионного анализа. Особенности использования функции Кобба-Дугласа. Применение множественной линейной регрессии. Сущность метода наименьших квадратов. Пути избегания ложной корреляции. Проверка значимости коэффициентов регрессии.

    реферат [101,8 K], добавлен 31.10.2009

  • Эконометрическое моделирование динамики экспорта и импорта РФ: построение регрессии, дисперсионный анализ для линейной регрессии, эластичность показательной регрессии, изучение качества линейной регрессии, колеблемость признака. Доверительные интервалы.

    курсовая работа [367,5 K], добавлен 21.08.2008

  • Основные этапы многофакторного корреляционного анализа и интерпретация его параметров. Назначение коэффициентов эластичности и стандартизированных бетта-коэффициентов. Расчет значимости коэффициентов регрессии и корреляции с помощью f-критерия Стьюдента.

    контрольная работа [605,2 K], добавлен 29.07.2010

  • Виды корреляции и регрессии, применяемые в статистическом анализе социально-экономических явлений и процессов. Построение корреляционной модели (уравнения регрессии). Построение корреляционной таблицы, выполнение интервальной группировки по признакам.

    курсовая работа [131,7 K], добавлен 03.10.2014

  • Порядок составления и исследование вариационного ряда, первичная обработка полученных данных. Подбор закона распределения одномерной случайной величины и построение регрессионной модели данной системы. Вывод о значимости коэффициента корреляции.

    лабораторная работа [147,6 K], добавлен 15.03.2014

  • Составление матрицы парных коэффициентов корреляции. Построение уравнения регрессии, характеризующего зависимость цены от всех факторов. Проведение регрессионного анализа с помощью пакета SPSS. Экономическая интерпретация коэффициентов модели регрессии.

    лабораторная работа [2,5 M], добавлен 27.09.2012

  • Исследование типа регрессии между случайными переменными. Построение эмпирического уравнения регрессии. Расчет выборочных средних, дисперсий и среднеквадратического отклонения. Определение показателя тесноты связи как линейного коэффициента корреляции.

    контрольная работа [513,5 K], добавлен 02.05.2015

  • Расчет коэффициентов корреляции Пирсона и ранговой корреляции Спирмена по регионам Российской Федерации для заданных показателей. Построение линейной и нелинейной (квадратической) модели регрессии. Проведение проверки значимости для полученных данных.

    контрольная работа [464,0 K], добавлен 28.05.2012

  • Автоматический анализ тренда на базе диаграммы экспериментальных данных Х и У с помощью программы MSExcel. Прогноз заработной платы при заданном значении среднедушевого прожиточного минимума с помощью пакета анализа. Уравнение линейной парной регрессии.

    контрольная работа [363,4 K], добавлен 22.01.2015

  • Основные принципы работы в MathCAD. Типовые статистические функции. Функции вычисления плотности распределения вероятности. Функции и квантили распределения. Функции создания векторов с различными законами распределения. Функции для линейной регрессии.

    курсовая работа [684,3 K], добавлен 19.05.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.