Главная Коллекция "Revolution" Экономика и экономическая теория Оценки параметров регрессионных моделей

Оценки параметров регрессионных моделей

Понятие асимптотической относительной эффективности оценок. Цели регрессионного анализа и необходимость проведения обзора наиболее популярных методов оценивания параметров модели. Численный сравнительный анализ. Построение модели на реальных данных.

Рубрика	Экономика и экономическая теория
Вид	дипломная работа
Язык	русский
Дата добавления	11.02.2017
Размер файла	999,4 K

посмотреть текст работы

скачать работу можно здесь

полная информация о работе

весь список подобных работ

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Страница:

Рис. 3.1. Зависимость пенсии от уровня ВВП

Для определения эффективности применяемых методов внесем в данные изменения: у двух случайно выбранных наблюдений значения зависимой переменной увеличим в 10 раз. Показателем качества оценок будет являться, как и раньше

где - вектор с оценками параметров после изменения (символ «о» сверху обозначает выброс - «outlier»), а - вектор с оценками параметров до изменения. Результаты для наглядности представлены в Таблице 3.2, проанализировав которые можно сделать следующий вывод: наилучшим образом на выбросы в данных реагирует М-оценка Тьюки и Вельша, а также М-оценка Хьюбера. Наихудшим - МНК-оценка. Визуализация моделей после изменения данных представлена на Рисунке 3.2

Таблица 3.2 Оценки параметров модели на реальных данных

Вид оценок
МНМ	-41,6041	-12,1811	22,4258	21,6713	866,2821
МНК	-83,3851	-1373,0754	31,2978	106,6865	1668984,53
М-оценки Хьюбера	-68,0623	-79,5903	25,4376	29,8315	152,2011
М-оценки Fair	-69,6524	-143,4568	26,2943	35,3134	5528,4340
М-оценки Коши	-55,0598	-22,6662	23,6606	21,6094	1053,5527
М-оценки Вельша	-19,6959	-14,1779	20,8956	20,6862	30,4922
М-оценки Тьюки	-10,3375	-5,1781	20,3699	20,2362	26,6373

Рис. 3.2 Построение моделей после изменения данных

В Приложении № 10 представлен код Matlab, при помощи которого была вычислена оценка параметров регрессии и построены графики, а также проведен эксперимент на реальных данных.

В данной главе был рассмотрен пример применения М-оценок параметров линейной регрессионной модели к реальным данным и была построена линейная модель зависимости уровня пенсии от ВВП страны. Также влияние выбросов в данных на М-, МНК- и МНМ-оценки параметров модели с реальными данными были рассмотрены.

Заключение

В данной работе были рассмотрены М-оценки параметров регрессионной модели, а также изучены их свойства. Были введены различные оценки параметров регрессионной модели, а также реализован алгоритм нахождения М-, МНМ- и МНК-оценок.

С помощью моделирования методом Монте-Карло было установлено, что М-оценки могут быть успешно применены к моделям с любым из рассматриваемых в данной работе распределением остатков. М-оценки Хьюбера и Коши неоднократно достигали наиболее качественных результатов при применении к моделям, в которых ошибки имеют распределение Стьюдента. Тем не менее, нельзя определить точную степень свободы, больше или меньше которой стоит применять тот или иной метод оценивания, так как экспериментальные результаты получились смешанные.

М-оценка Тьюки хорошо себя зарекомендовала в случае распределения Тьюки с различным параметром зашумления. Также М-оценки Вельша могут быть применены в случае, когда ошибки распределены по данному закону, демонстрируя при этом результат, не сильно отличный от оценок параметров, построенных М-оценкой Тьюки. Бо?льшая устойчивость к выбросам у М-оценок Тьюки и М-оценок Вельша обусловлена тем, что с-функция, соответствующая этим оценкам, является ограниченной (в отличии, например, от М-оценок Хьюбера).

В сравнении с рассматриваемыми конкурентами, МНК наиболее точен для оценивания параметров регрессионной модели с шумами, распределёнными по закону Гаусса, также метод точен при применении к треугольному и «двугорбому» распределению на основе треугольных и гаусcовских величин, однако применение метода с случае, когда распределение ошибок имеет «тяжелые хвосты» не приносит хороших результатов.

В случае разного распределения данных матрицы Х, рекомендации относительно применения того или иного метода оценок параметров различаются незначительно. Таким образом, результаты работы можно представить в виде таблицы, где на пересечении столбцов и строк стоит в случае, если тот или иной метод оценивания неизвестных параметров модели может быть успешно применен при каком-либо распределении остатков; , если метод может быть применен, но применение его конкурентов даст более лучший, устойчивый результат; , если применение метода не рекомендуется.

Таблица 4.1 Рекомендации относительно применения методов оценивания параметров линейной регрессионной модели

Распределение/метод оценивания	МНМ	МНК	М-оценка Хьюбера	М-оценка Fair	М-оценка Коши	М-оценка Вельша	М-оценка Тьюки
Стандартное нормальное распределение
Распределение Лапласа
Распределение Коши
Распределение Стьюдента
Двугорбое распределение как комбинация нормальных
Распределение Тьюки						+	+
Треугольное распределение
Двугорбое распределение как комбинация треугольных
Логистическое распределение

Таким образом, принимая во внимание тот факт, что при построении модели на реальных данных зачастую нельзя наверняка знать, какому закону подчиняются ошибки модели, М-оценки должны быть применены.

В проведенных экспериментах ни одна из рассматриваемых робастных М-оценок не показала себя с худшей стороны, наименее качественные результаты демонстрировали МНК- и МНМ-оценки.

В работе посчитана асимптотическая относительная эффективность оценок, которая позволяет сделать выводы о том, какой метод лучше применять для оценки параметров в моделях с большим объемом выборки. Для большинства рассматриваемых распределений М-оценки показали большую эффективность, нежели МНК- и МНМ- оценки.

В работе был рассмотрен пример применения М-оценок параметров линейной регрессионной модели к реальным данным и была построена линейная модель зависимости уровня пенсии от ВВП страны. Также влияние выбросов в данных на М-, МНК- и МНМ-оценки параметров модели с реальными данными были рассмотрены. При применении М-оценок к реальным данным, наиболее качественными оценками оказались М-оценки Тьюки и Вельша, также неплохой результат показала М-оценка Хьюбера. Широко распространенный метод наименьших квадратов оказался менее качественным в случае выбросов в реальных данных.

Итак, все поставленные задачи были выполнены и цель исследования была достигнута. Подытоживая общий результат работы, хочется отметить, что М-оценки являются качественной и робастной альтернативой МНК и МНМ в задаче оценивания параметров линейной регрессионной модели.

Список используемой литературы

1. Белов А. Г., Щедрин Б. М. Относительная эффективность МНК- и МНМ- оценок // "Ломоносовские чтения" (к 300-летию М.В.Ломоносова), 14-23 ноября 2011г. -- М., Макс Пресс Москва, факультет ВМК МГУ, 2011. -- С. 113-114.

2. Вьюгин В.В. Математические основы теории машинного обучения и прогнозирования. - М.: 2013. - 387 с.

3. Гуриев С.М., Колотилин А.Д., Сонин К.И. Цены на нефть и риск национали- зации: о чем говорят панельные данные? // Экономический журнал ВШЭ. 2008. Т. 12, № 2.

4. Дж. Себер «Линейный регрессионный анализ», М.: Мир, 1980, с.54

5. Крыштановский, А. О. Анализ социологических данных с помощью пакета SPSS [Текст]: учеб. пособие для вузов / А. О. Крыштановский; Гос. ун-т -- Высшая школа экономи-ки. -- М. : Изд. дом ГУ ВШЭ, 2006. -- 281, [3] с. -- (Учебники Высшей школы экономики). -- Прил.: с. 225-- 281. -- 2000 экз. -- ISBN 5-7598-0373-5 (в пер.).

6. Линник Ю. В. Метод наименьших квадратов и основы математико-статистической теории обработки наблюдений. -- 2-е изд. -- М., 1962.(математическая теория)

7. Мун С.А. Регрессионный анализ в медико-биологических исследованиях: методические рекомендации/ С.А. Мун, А.Н. Глушков, Т.А. Штернис, С.А. Ларин, С.А. Максимов; ГБОУ ВПО КемГМА Минздравсоцразвития России. - Кемерово: КемГМА, 2012. - 115 с.

8. Научная библиотека [Электронный ресурс].

URL: http://stu.sernam.ru/book_stat1.php?id=1 - (дата обращения: 11.12.2015).

9. Савина, И. А. Методика библиографического описания : практическое пособие . - М. : Либерия-Бибинформ, 2007. - 144 с.

10. Сидоренко Е. В. Методы математической обработки в психологии. -- СПб.: ООО «Речь», 2000. -- 350 с., ил., стр. 240-245.]

11. Смирнов А.В. Анализ финансового состояния коммерческих банков. - М.: Финансы и статистика, 2007. - 225 с.

12. Т. Хеттманспергер "Статистические выводы, основанные на рангах", М.: Финансы и статистика,1987, с. 249

13. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. Изд. 3-е, перераб. и доп./Под ред. В.Э.Фигурнова - М.: ИНФРА-М, 2002. [Электронный ресурс].

URL:http://antonpiter.narod.ru/7361/5semestr/VM_analiz_dannix.PDF - (дата обращения: 29.05.2015).

14. Хьюбер Дж. П. Робастность в статистике: Пер. с англ. - М.: Мир, 1984. 304 с., ил.

15. Bill Jacoby. Regression III: Advanced Methods [Электронный ресурс].

URL:http://polisci.msu.edu/icpsr/regress3, - (дата обращения: 17.05.2016).

16. Encyclopedia of Environments, Vol. 2. Abdel H. El-Shaarawi, Walter W. Piegorsch 2002 John Wiley & Sons, Ltd ISBN: 0 472 89997 6

17. Joiner, Brian L.; Rosenblatt, Joan R. (1971), "Some Properties of the Range in Samples from Tukey's Symmetric Lambda Distributions", Journal of the American Statistical Association 66(334): 394-399

Приложение 1

Визуализация зависимости p-функции Тьюки от b

1) Для реализации алгоритма используется вспомогательная функция

weight_function( ), вычисляющая веса w для различных w-функций М-оценок.

load('random_matrix_X_norm.mat')

X = X(:,1);

c = 4.6851;

b=-10:0.01:10;

error_norm = randn(50,1);

Y = X+error_norm;

Y(1:5) = 100;

X(1:5) = 20;

b_0 = (X'*X)^(-1)*X'*Y;

error = Y - b_0*X;

s = 1.4826*median(abs(error));

for t = 1:size(b,2)

error = Y - b(t)*X;

for k=1:50

x= error(k)/s;

if abs(x) <= c

p(k) = c^2/6*(1-(1-(x/c)^2)^3);

else

p(k) = c^2/6;

end

loss_function(t) = sum(p);

end

plot(b,loss_function,'k');

hold on;

error = Y - X;

b_0 = (X'*X)^(-1)*X'*Y; %мнк-оценка первого приближения

eps = 0.0001;

s = 1.4826*median(abs(error));

weight = weight_function(error/s,'tukey');

for i = 1:size(X,1)

W(i,i)=weight(i);

end

b_robust = (X'*W*X)^(-1)*X'*W*Y;

while norm(b_robust-b_0, 2)/norm(b_robust,2) >= eps

error = Y - X*b_robust;

s = 1.4826*median(abs(error));

weight = weight_function(error/s,'tukey');

for i = 1:size(X,1)

W(i,i)=weight(i);

end

b_0 = b_robust;

b_robust = (X'*W*X)^(-1)*X'*W*Y;

end

error = Y - b_robust*X;

s = 1.4826*median(abs(error));

for t=1:50

x= error(t)/s;

if abs(x) <= c

p(t) = c^2/6*(1-(1-(x/c)^2)^3);

else

p(t) = c^2/6;

end

loss= sum(p);

plot (b_robust, loss,'*');

xlabel('b');

ylabel ('L');

Приложение 2

Код для вычисления асимптотических относительных эффективностей М-оценок по отношению к МНК- и МНМ-оценкам

Результатом работы скрипта является 6 excel-файлов.

«results_mnk_triug.xlsx» содержит АОЭ исследуемых М-оценок по отношению к МНК-оценкам в случае треугольного распределения.

«results_mnm_triug.xlsx» содержит АОЭ исследуемых М-оценок по отношению к МНМ-оценкам в случае треугольного распределения.

«results_ass_mnk.xlsx» содержит АОЭ исследуемых М-оценок по отношению к МНK-оценкам в случае стандартного нормального распределения, распределения Лапласа, распределения Коши, распределения Стьюдента с 2,3,5,8,13,15 степенями свободы, «двугорбого» распределения на основе двух нормальных, Тьюки с параметрами г=0,1, у12=100, у22=1.

«results_ass_mnm.xlsx» содержит АОЭ исследуемых М-оценок по отношению к МНM-оценкам в случае стандартного нормального распределения, распределения Лапласа, распределения Коши, распределения Стьюдента с 2,3,5,8,13,15 степенями свободы, «двугорбого» распределения на основе двух нормальных, Тьюки с параметрами г=0,1, у12=100, у22=1.

«results_mnk_log.xlsx» содержит АОЭ исследуемых М-оценок по отношению к МНК-оценкам в случае логистического распределения.

«results_mnm_log.xlsx» содержит АОЭ исследуемых М-оценок по отношению к МНМ-оценкам в случае логистического распределения.

clear all

c_k = 2.3849;

c_h = 1.345;

c_t = 4.6851;

c_w = 2.9846;

c_f = 1.3998;

f_norm = @(u) (1/sqrt(2*pi)*exp(-u.^2/2));

f_lapl = @(u) 1/2*exp(-abs(u));

f_koshi = @(u) 1./(pi*(u.^2+1));

n=2;

f_student_2 = @(u) gamma((n+1)/2)/(sqrt(pi*n)*gamma(n/2))*(1+u.^2/n).^(-(n+1)/2);

n=3;

f_student_3 = @(u) gamma((n+1)/2)/(sqrt(pi*n)*gamma(n/2))*(1+u.^2/n).^(-(n+1)/2);

n=5;

f_student_5 = @(u) gamma((n+1)/2)/(sqrt(pi*n)*gamma(n/2))*(1+u.^2/n).^(-(n+1)/2);

n=8;

f_student_8 = @(u) gamma((n+1)/2)/(sqrt(pi*n)*gamma(n/2))*(1+u.^2/n).^(-(n+1)/2);

n=13;

f_student_13 = @(u) gamma((n+1)/2)/(sqrt(pi*n)*gamma(n/2))*(1+u.^2/n).^(-(n+1)/2);

n=15;

f_student_15 = @(u) gamma((n+1)/2)/(sqrt(pi*n)*gamma(n/2))*(1+u.^2/n).^(-(n+1)/2);

f_dv_gaus = @(u) 1/2*1/sqrt(2*pi).*exp(-(u-3).^2./2) + 1/2*1/sqrt(2*pi).*exp(-(u+3).^2./2);

y = 0.1;

s_1 = 100;

s_2 = 1;

f_tukey = @(u) y./(sqrt(s_1*2*pi)).*exp(-(u.^2)./(2*s_1)) + (1-y)./(sqrt(s_2*2*pi)).*exp(-(u.^2)./(2*s_2));

distribution = {@(u) f_norm(u), @(u) f_lapl(u), f_koshi, f_student_2, f_student_3,f_student_5,f_student_8, f_student_13,f_student_15, f_dv_gaus, f_tukey};

v_m_mnk = zeros (5,11);

v_m_mnm = zeros (5,11);

k=1;

%1 - norm, 2 - laplass, 3-koshi

%4 - student with n=2, 5 - student with n=3,

%6 - student with n=5, 7 - student with n=8,

%8 - student with n=13, 9 - student with n=15

%10 - dvug_gauss, 11 - tukey,

for i=1:11

if i==1

s=1;

end

if i==2

s=sqrt(2);

end

if i==3

s=100000; %->inf

end

if i==4

s=10000000; % ->inf

end

if i==5

s=sqrt(3/(3-2));

end

if i==6

s=sqrt(5/(5-2));

end

if i==7

s=sqrt(8/(8-2));

end

if i==8

s=sqrt(13/(13-2));

end

if i==9

s=sqrt(15/(15-2));

end

if i==10

s=sqrt(10);

end

if i==11

s=sqrt(10.9);

end

%HUBER

fun_1 = @(u) (u./s).^2.*distribution{i}(u);

fun_2 = @(u) 2*c_h^2.*distribution{i}(u);

fun_3 = @(u) distribution{i}(u);

v_1 = integral(fun_1,-s*c_h,s*c_h);

v_2 = integral(fun_2,s*c_h,inf);

v_3 = integral(fun_3,-s*c_h,s*c_h);

v_h = (v_1+v_2)/v_3^2;

v_m_mnk(k,i) = 1/v_h;

v_m_mnm(k,i) = 1/(4*s^2*v_h*(distribution{i}(0))^2);

k=k+1;

%FAIR

fun_1 = @(u) ((u./s)./(1+abs((u./s)/c_f))).^2.*distribution{i}(u);

pr_1 = @(u) c_f^2./(abs(u./s) + c_f).^2.*distribution{i}(u);

v_1 = integral(fun_1,-inf,inf);

v_2 = integral(pr_1,-inf,inf);

v_f = (v_1)/v_2^2;

v_m_mnk(k,i) = 1/v_f;

v_m_mnm(k,i) = 1/(4*s^2*v_f*(distribution{i}(0))^2);

k=k+1;

%KOSHI

fun_1 = @(u) ((u./s)./(1+((u./s)/c_k).^2)).^2.*distribution{i}(u);

fun_2 = @(u) ((c_k^2*(c_k^2-(u./s).^2)./(c_k^2+(u./s).^2).^2)).*distribution{i}(u);

v_k = integral(fun_1,-inf,inf)/integral(fun_2,-inf,inf)^2;

v_m_mnk(k,i) = 1/v_k;

v_m_mnm(k,i) = 1/(4*s^2*v_k*(distribution{i}(0))^2);

k=k+1;

%WELSH

fun_1 = @(u) ((u./s).*exp(-((u./s)./c_w).^2)).^2.*distribution{i}(u);

pr_1 = @(u) exp(-(u./s).^2./c_w^2).*(c_w^2-2*(u./s).^2)./c_w.^2.*distribution{i}(u);

v_1 = integral(fun_1,-inf,inf);

v_2 = integral(pr_1,-inf,inf);

v_w = (v_1)/v_2^2;

v_m_mnk(k,i) = 1/v_w;

v_m_mnm(k,i) = 1/(4*s^2*v_w*(distribution{i}(0))^2);

k=k+1;

%TUKEY

fun_1 = @(u) ((u./s).*(1-(u./(s*c_t)).^2).^2).^2.*distribution{i}(u);;

pr_1 = @(u) (5*(u./s).^4/c_t^4 - 6*(u./s).^2/c_t^2 +1).*distribution{i}(u);;

v_1 = integral(fun_1,-s*c_t,s*c_t);

v_2 = integral(pr_1,-s*c_t,s*c_t);

v_t = (v_1)/v_2^2;

v_m_mnk(k,i) = 1/v_t;

v_m_mnm(k,i) = 1/(4*s^2*v_t*(distribution{i}(0))^2);

k=1;

end

v_m_mnk = v_m_mnk';

v_m_mnm = v_m_mnm';

filename = 'results_ass_mnk.xlsx';

xlswrite(filename,v_m_mnk,1,'A1:E11')

filename = 'results_ass_mnm.xlsx';

xlswrite(filename,v_m_mnm,1,'A1:E11')

%logistick

f_logist = @(u) exp(-u)./(1+exp(-u)).^2;

s = sqrt(pi^2/3);

%HUBER

fun_1 = @(u) (u./s).^2.*f_logist(u);

fun_2 = @(u) 2*c_h^2.*f_logist(u);

fun_3 = @(u) f_logist(u);

v_1 = integral(fun_1,-s*c_h,s*c_h);

v_2 = integral(fun_2,s*c_h,100);

v_3 = integral(fun_3,-s*c_h,s*c_h);

v_h = (v_1+v_2)/v_3^2;

mnk_log(1) = 1/v_h;

mnm_log(1) = 1/(4*s^2*v_h*(f_logist(0))^2);

%FAIR

fun_1 = @(u) ((u./s)./(1+abs((u./s)/c_f))).^2.*f_logist(u);

pr_1 = @(u) c_f^2./(abs(u./s) + c_f).^2.*f_logist(u);

v_1 = integral(fun_1,-100,100);

v_2 = integral(pr_1,-100,100);

v_f = (v_1)/v_2^2;

mnk_log(2) = 1/v_f;

mnm_log(2) = 1/(4*s^2*v_f*(f_logist(0))^2);

%KOSHI

fun_1 = @(u) ((u./s)./(1+((u./s)/c_k).^2)).^2.*f_logist(u);

fun_2 = @(u) ((c_k^2*(c_k^2-(u./s).^2)./(c_k^2+(u./s).^2).^2)).*f_logist(u);

v_k = integral(fun_1,-100,100)/integral(fun_2,-100,100)^2;

mnk_log(3) = 1/v_k;

mnm_log(3) = 1/(4*s^2*v_k*(f_logist(0))^2);

%WELSH

fun_1 = @(u) ((u./s).*exp(-((u./s)./c_w).^2)).^2.*f_logist(u);

pr_1 = @(u) exp(-(u./s).^2./c_w^2).*(c_w^2-2*(u./s).^2)./c_w.^2.*f_logist(u);

v_1 = integral(fun_1,-100,100);

v_2 = integral(pr_1,-100,100);

v_w = (v_1)/v_2^2;

mnk_log(4) = 1/v_w;

mnm_log(4) = 1/(4*s^2*v_w*(f_logist(0))^2);

%TUKEY

fun_1 = @(u) ((u./s).*(1-(u./(s*c_t)).^2).^2).^2.*f_logist(u);

pr_1 = @(u) (5*(u./s).^4/c_t^4 - 6*(u./s).^2/c_t^2 +1).*f_logist(u);

v_1 = integral(fun_1,-s*c_t,s*c_t);

v_2 = integral(pr_1,-s*c_t,s*c_t);

v_t = (v_1)/v_2^2;

mnk_log(5) = 1/v_t;

mnm_log(5) = 1/(4*s^2*v_t*(f_logist(0))^2);

filename = 'results_mnk_log.xlsx';

xlswrite(filename,mnk_log,1,'A1:E1')

filename = 'results_mnm_log.xlsx';

xlswrite(filename,mnm_log,1,'A1:E1')

%TRIUGOLNOE

a=-2;

b=2;

f_triug = @(u) 2/(b-a) - 2/(b-a)^2.*abs(a+b-2.*u);

s=sqrt((b-a)^2/24);

%HUBER

fun_1 = @(u) (u./s).^2.*f_triug(u);

fun_2 = @(u) 2*c_h^2.*f_triug(u);

fun_3 = @(u) f_triug(u);

v_1 = integral(fun_1,-s*c_h,s*c_h);

v_2 = integral(fun_2,s*c_h,b);

v_3 = integral(fun_3,-s*c_h,s*c_h);

v_h = (v_1+v_2)/v_3^2;

mnk_triug(1) = 1/v_h;

mnm_triug(1) = 1/(4*s^2*v_h*(f_triug(0))^2);

%FAIR

fun_1 = @(u) ((u./s)./(1+abs((u./s)/c_f))).^2.*f_triug(u);

pr_1 = @(u) c_f^2./(abs(u./s) + c_f).^2.*f_triug(u);

v_1 = integral(fun_1,a,b);

v_2 = integral(pr_1,a,b);

v_f = (v_1)/v_2^2;

mnk_triug(2) = 1/v_f;

mnm_triug(2) = 1/(4*s^2*v_f*(f_triug(0))^2);

%KOSHI

fun_1 = @(u) ((u./s)./(1+((u./s)/c_k).^2)).^2.*f_triug(u);

fun_2 = @(u) ((c_k^2*(c_k^2-(u./s).^2)./(c_k^2+(u./s).^2).^2)).*f_triug(u);

v_k = integral(fun_1,a,b)/integral(fun_2,a,b)^2;

mnk_triug(3) = 1/v_k;

mnm_triug(3) = 1/(4*s^2*v_k*(f_triug(0))^2);

%WELSH

fun_1 = @(u) ((u./s).*exp(-((u./s)./c_w).^2)).^2.*f_triug(u);

pr_1 = @(u) exp(-(u./s).^2./c_w^2).*(c_w^2-2*(u./s).^2)./c_w.^2.*f_triug(u);

v_1 = integral(fun_1,a,b);

v_2 = integral(pr_1,a,b);

v_w = (v_1)/v_2^2;

mnk_triug(4) = 1/v_w;

mnm_triug(4) = 1/(4*s^2*v_w*(f_triug(0))^2);

%TUKEY

fun_1 = @(u) ((u./s).*(1-(u./(s*c_t)).^2).^2).^2.*f_triug(u);

pr_1 = @(u) (5*(u./s).^4/c_t^4 - 6*(u./s).^2/c_t^2 +1).*f_triug(u);

v_1 = integral(fun_1,a,b);

v_2 = integral(pr_1,a,b);

v_t = (v_1)/v_2^2;

mnk_triug(5) = 1/v_t;

mnm_triug(5) = 1/(4*s^2*v_t*(f_triug(0))^2);

filename = 'results_mnk_triug.xlsx';

xlswrite(filename,mnk_triug,1,'A1:E1')

filename = 'results_mnm_triug.xlsx';

xlswrite(filename,mnm_triug,1,'A1:E1')

Приложение 3

Код для визуализации функций p, ф, w

1) Используется дополнительная функция plot_3_graph( ), позволяющая вывести в одном окне 3 графика.

function [ smt ] = plot_3_graph(x, ro, psi, w )

smt = 1;

subplot(1,3,1);

plot (x, ro);

ylabel('\rho(u)');

xlabel ('u');

subplot(1,3,2);

plot (x, psi);

ylabel ('\psi(u)');

xlabel ('u');

subplot(1,3,3);

plot (x, w);

ylabel ('w(u)');

xlabel ('u');

end

2) Визуализации функций

x = -10:0.0001:10;

ro_huber = zeros (size(x));

phi_huber = zeros (size(x));

w_huber = zeros (size(x));

c = 1.345;

for k = 1:size(x,2)

if abs(x(k)) <= c

ro_huber(k) = (x(k)^2)/2;

phi_huber(k) = x(k);

w_huber(k) = 1;

else

ro_huber(k) = c*(abs(x(k)) - c/2);

phi_huber(k)=c*sign(x(k));

w_huber(k) = c/abs(x(k));

end

plot_3_graph (x, ro_huber, phi_huber, w_huber);

figure;

ro_fair = zeros (size(x));

phi_fair = zeros (size(x));

w_fair = zeros (size(x));

c = 1.3998;

for k = 1:size(x,2)

ro_fair(k) = c^2*(abs(x(k))/c - log(1+abs(x(k)/c)));

phi_fair(k) = x(k)/(1+abs(x(k))/c);

w_fair(k) = 1/(1+abs(x(k))/c);

end

plot_3_graph (x, ro_fair, phi_fair, w_fair);

figure;

ro_koshi = zeros (size(x));

phi_koshi= zeros (size(x));

w_koshi = zeros (size(x));

c = 2.3849;

for k = 1:size(x,2)

ro_koshi(k) = c^2/2*log(1+(x(k)/c)^2);

phi_koshi(k) = x(k)/(1+((x(k))/c)^2);

w_koshi(k) = 1/(1+((x(k))/c)^2);

end

plot_3_graph (x, ro_koshi, phi_koshi, w_koshi);

figure;

ro_g = zeros (size(x));

phi_g= zeros (size(x));

w_g = zeros (size(x));

for k = 1:size(x,2)

ro_g(k) = x(k)^2/2/(1+x(k)^2);

phi_g(k) = x(k)/(1+(x(k))^2)^2;

w_g(k) = 1/(1+(x(k))^2)^2;

end

plot_3_graph (x, ro_g, phi_g, w_g);

figure;

ro_welsh = zeros (size(x));

phi_welsh= zeros (size(x));

w_welsh = zeros (size(x));

c = 2.9846;

for k = 1:size(x,2)

ro_welsh(k) = c^2/2*(1-exp(-(x(k)/c)^2));

phi_welsh(k) = x(k) * exp(-(x(k)/c)^2);

w_welsh(k) = exp(-(x(k)/c)^2);

end

plot_3_graph (x, ro_welsh, phi_welsh, w_welsh);

figure;

ro_tukey = zeros (size(x));

phi_tukey = zeros (size(x));

w_tukey = zeros (size(x));

c = 4.6851;

for k = 1:size(x,2)

if abs(x(k)) <= c

ro_tukey(k) = c^2/6*(1-(1-(x(k)/c)^2)^3);

phi_tukey(k) = x(k)*(1-(x(k)/c)^2)^2;

w_tukey(k) = (1-(x(k)/c)^2)^2;

else

ro_tukey(k) = c^2/6;

phi_tukey(k)=0;

w_tukey(k) = 0;

end

plot_3_graph (x, ro_tukey, phi_tukey, w_tukey);

Приложение 4

Пример работы М-оценок

p = randn(1,10);

x = 0:1:9;

y = x + p;

x = [x 15];

y = [y 1];

scatter(x,y, 'filled');grid on;

hold on;

types = cellstr(['lad ';'ols '; 'huber';'fair ';'koshi'; 'welsh';'tukey']);

types_color = (['m'; 'y';'g';'r';'b'; 'c';'k']);

x = [ones(size(x,2),1) x'];

for k = 1:size(types,1)

b = IRLS(x,y,'ols',types(k));

plot (x, b(2)*x + b(1), types_color(k));

hold on;

err(:,k) = y'-x*b;

end

xlabel ('x');

grid on;

ylabel ('y');

Приложение 5

Алгоритм для вычисления IRLS

1) Для реализации алгоритма используется вспомогательная функция weight_function( ), вычисляющая веса w для различных w-функций М-оценок.

function [ weight ] = weight_function(x,f_name)

if strcmp(f_name, 'huber') == 1

c = 1.345;

weight = zeros(size(x));

for k=1:size (weight,1)

if abs(x(k)) <= c

weight(k) = 1;

else

weight(k) = c/abs(x(k));

end

if strcmp(f_name, 'fair') == 1

c = 1.3998;

weight = zeros(size(x));

for k=1:size (weight,1)

weight(k) = 1/(1+abs(x(k))/c);

end

if strcmp(f_name, 'koshi') == 1

c = 2.3849;

weight = zeros(size(x));

for k=1:size (weight,1)

weight(k) = 1/(1+((x(k))/c)^2);

end

if strcmp(f_name, 'welsh') == 1

c = 2.9846;

weight = zeros(size(x));

for k=1:size (weight,1)

weight(k)=exp(-(x(k)/c)^2);

end

if strcmp(f_name, 'tukey') == 1

c = 4.6851;

weight = zeros(size(x));

for k=1:size (weight,1)

if abs(x(k)) <= c

weight(k) = (1-(x(k)/c)^2)^2;

else

weight(k) = 0;

end

2) Функция для вычисления IRLS.

function [ b_robust ] = IRLS(x,y, initial_b_type,weighted_f_name)

X = x;

if strcmp(weighted_f_name,'ols') == 1 || strcmp(weighted_f_name,'lad') == 1

if strcmp(weighted_f_name,'ols') == 1

b_robust = (X'*X)^(-1)*X'*y';

else

[b_robust, fval]=fminsearch(@(b_robust)sum(abs(y'-X*b_robust)), ones(size(X,2),1));

end

else

if strcmp(initial_b_type,'ols') == 1

b_0 = (X'*X)^(-1)*X'*y';

end

eps = 0.0001;

error = y' - X*b_0;

s = 1.4826*median(abs(error));

weight = weight_function(error/s,weighted_f_name);

for i = 1:size(X,1)

W(i,i)=weight(i);

end

b_robust = (X'*W*X)^(-1)*X'*W*y';

while norm(b_robust-b_0, 2)/norm(b_robust,2) >= eps

error = y' - X*b_robust;

s = 1.4826*median(abs(error));

weight = weight_function(error/s,weighted_f_name);

for i = 1:size(X,1)

W(i,i)=weight(i);

end

b_0 = b_robust;

b_robust = (X'*W*X)^(-1)*X'*W*y';

end

Приложение 6

Визуализация функций плотностей распределения Гаусса и Тьюки

x = -8:0.001:8;

Y = normpdf(x,0,1);%norm

plot(x,Y)

xlabel('x');

ylabel('f(x)');

hold on;

Y = 0.1*normpdf(x,0,10) + (0.9)*normpdf(x,0,1); %tukey

plot(x,Y,'r')

xlabel('x');

ylabel('f(x)');

Приложение 7

Результаты вычисления М-оценок, МНК- и МНМ-оценок

1) Для реализации используется функция IRLS() [см. Приложение 5]

2) Результаты вычисления записываются в отдельный excel-файл «results.xlsx», содержащий 12 строк и 7 столбцов, соответствующий различным распределениям и оценкам.

clear all;

n=50;

m=2;

n_distributions = 12;

b = [3;-7;8];

b_robust_vector = zeros(m+1,1);

X = 5*rand(n,m);

X = [ones(n,1) X];

types = cellstr(['lad ';'ols '; 'huber';'fair ';'koshi'; 'welsh';'tukey']);

kriteriy = zeros(size(types,1),n_distributions);

b_robust_mean = zeros(m+1, size(types,1));

error_matrix = zeros(n,n_distributions);rng(1);

for dist_column = 1:n_distributions

for t = 1:size(types,1)

for k=1:2000

%1norn

error_norm = randn(n,1);

%2laplass

z1=-log(rand(n,1));

z2=-log(rand(n,1));

error_laplass=z1-z2;

%3koshi

error_koshi=tan(pi*rand(n,1) - pi/2);

%4,5,6,7student

error_stud_2 = tinv(rand(n,1),2);

error_stud_3 = tinv(rand(n,1),3);

error_stud_8 = tinv(rand(n,1),8);

error_stud_15 = tinv(rand(n,1),15);

%8dvugorbovoe

p=rand(n,1);

error_gaus_dvud=randn(n,1)+3;

eps=randn(n,1)-3;

I=find(p>=0.5);

error_gaus_dvud(I)=eps(I);

%9tukey

p=rand(n,1);

error_tukey=randn(n,1);

eps=sqrt(100)*randn(n,1);

I=find(p>=0.9);

error_tukey(I)=eps(I);

%10triangle

u1=2*rand(n,1)-1;

u2=2*rand(n,1)-1;

error_triangle=u1+u2;

%11double_triangle

p=rand(n,1);

u1=rand(n,1);

u2=rand(n,1);

error_doub_triang=u1+u2;

v1=-rand(n,1);

v2=-rand(n,1);

eps=v1+v2;

I=find(p>=0.5);

error_doub_triang(I)=eps(I);

%12logistick

error_logistick=-log((1./rand(n,1)) -1);

error_matrix = [error_norm error_laplass error_koshi error_stud_2 error_stud_3 error_stud_8 error_stud_15];

error_matrix = [error_matrix error_gaus_dvud error_tukey error_triangle error_doub_triang error_logistick];

Y = X*b+error_matrix(:,dist_column);

b_robust = IRLS(X,Y','ols',types(t));

b_robust_vector(:,k) = b_robust;

end

for p = 1:size(b_robust_vector,2)

d_vector_error(1,p) = sum((b_robust_vector(:,p) - b).^2);

end

avg_error_b(t,dist_column) = mean(d_vector_error');

end

avg_error_b = avg_error_b';

filename = 'results.xlsx';

xlswrite(filename,avg_error_b,1,'A1:G12')

Приложение 8

Дополнительные тесты для распределения Тьюки

1) Для реализации используется функция IRLS() [см. Приложение 5]

2) Дополнительны тесты для Распределения Тьюки. Матрица X может содержать данные, распределенные нормально ('random_matrix_X_norm), по закону Коши ('random_matrix_X_koshi'), либо по закону Тьюки ('random_matrix_X_tukey'). Результат программы - excel-файл 'results_tukey.xlsx';

clear all

load('random_matrix_X_norm.mat')

n=50;

m=2;

types = cellstr(['lad ';'ols '; 'huber';'fair ';'koshi'; 'welsh';'tukey']);

X = [ones(n,1) X];

b = [3;-7;8];

b_robust_vector = zeros(m+1,1);

param = [0.05 0.1 0.15 0.2 0.3];

for r=1:9

for t = 1:size(types,1)

for k=1:2000

p=rand(n,1);

disp_1 = disp1(r);

disp_2=disp2(r);

error_tukey=sqrt(1)*randn(n,1);

eps=sqrt(100)*randn(n,1);

I=find(p>=1-param(r));

error_tukey(I)=eps(I);

Y = X*b+error_tukey;

b_robust = IRLS(X,Y','ols',types(t));

b_robust_vector(:,k) = b_robust;

end

for p = 1:size(b_robust_vector,2)

d_vector_error(1,p) = sum((b_robust_vector(:,p) - b).^2);

end

avg_error_b(t,r) = mean(d_vector_error');

end

avg_error_b = avg_error_b';

filename = 'results_tukey.xlsx';

xlswrite(filename,avg_error_b,1,'A1:G9')

Приложение 9

Данные по 27 странам. Уровень пенсии и ВВП

№	Страна	Пенсия, USD	ВВП, млн. USD
1	Дания	2800	37,00
2	Финляндия	1900	35,30
3	Норвегия	1542	59,10
4	Израиль	1350	29,50
5	Германия	1200	35,90
6	Испания	1190	29,50
7	США	1164	47,40
8	Швейцария	874	42,90
9	Швеция	833	39,00
10	Япония	717	34,20
11	Великобритания	700	36,12
12	Франция	700	33,30
13	Канада	667	39,60
14	Италия	583	30,70
15	Венгрия	400	19,00
16	Польша	380	18,80
17	Литва	298	15,90
18	Россия	285	15,90
19	Болгария	280	12,80
20	Казахстан	210	12,50
21	Азербайджан	202	11,00
22	Белоруссия	175	7,41
23	Украина	142	6,70
24	Аргентина	96	14,70
25	Молдова	80	2,50
26	Узбекистан	55	3,10
27	Грузия	40	4,80

Приложение 10

Построение модели зависимости пенсии от уровня ВВП

1) Для реализации используется функция IRLS() [см. Приложение 5]

2) Построение модели

load('pension_and_gdp.mat')

p=fix(rand(1)*5);

Y = X(:,1);

Y(p) = Y(p)*5;

p=fix(rand(1)*5);

Y(p) = Y(p)*5;

X=[ones(27,1) X(:,2)];

scatter(X(:,2),Y, 'filled');grid on;

hold on;

types = cellstr(['lad ';'ols '; 'huber';'fair ';'koshi'; 'welsh';'tukey']);

types_color = (['m'; 'y';'g';'r';'b'; 'c';'k']);

for t=1:size(types,1)

b_robust = IRLS(X,Y','ols',types(t));

b_robust_vector(:,t) = b_robust;

plot(X(:,2), b_robust(2)*X(:,2) + b_robust(1), types_color(t));

hold on;

end

xlabel('ВВП, млн долл. США');

ylabel('Пенсия, долл. США');

Размещено на Allbest.ur

...

Страница:

дипломная работа "Оценки параметров регрессионных моделей" скачать

Подобные документы

Регрессионные модели
Основы построения регрессионных моделей: метод наименьших квадратов; двухмерная линейная концепция корреляционного и регрессионного анализа. Показатели статистической обработки информации: дисперсия, математическое ожидание и стандартное отклонение.

контрольная работа [80,8 K], добавлен 27.11.2012
Понятие, предмет и метод экономического анализа
Понятие экономического анализа. Характеристика основных приемов и методов экономического анализа. Методика факторного анализа. Многофакторные мультипликативные модели. Построение факторной модели - первый этап детерминированного анализа.

контрольная работа [105,1 K], добавлен 12.09.2006
Разработка и анализ модели бизнес-процесса по оказанию услуг турагентства
Описание модели бизнеса по Остервальдеру и оценка ее параметров. Построение и анализ цепочки добавленной стоимости. Оценка возможности развития модели бизнеса и вариант новой модели. Возможность оптимизации процессов и основные идеи реинжиниринга.

курсовая работа [2,4 M], добавлен 15.09.2014
Оценка кредитоспособности ООО "Татарскэнергогаз" с помощью рейтинговой модели
Содержание, функции и классификация кредитных отношений. Кредитоспособность заемщика: сущность и необходимость оценки, изучение методов комплексного анализа. Применение рейтинговой модели для оценки кредитоспособности на примере ООО "Татарскэнергогаз".

дипломная работа [70,9 K], добавлен 17.01.2011
Использование корреляционно-регрессионного анализа для обработки экономических статистических данных
Роль корреляцонно-регрессионного анализа в обработке экономических данных. Корреляционно-регрессионный анализ и его возможности. Предпосылки корреляционного и регрессионного анализа. Пакет анализа Microsoft Excel.

курсовая работа [68,4 K], добавлен 11.06.2002
Анализ эффективности стерилизованных интервенций, осуществляемых Банком России
Задачи, способы и последствия проведения стерилизованных интервенций. Обзор валютного рынка России. Модели оценки валютного курса. Анализ эффективности стерилизованных интервенций с помощью векторной модели коррекции остатков на дневных и месячных данных.

курсовая работа [700,4 K], добавлен 27.09.2016
Статистические показатели деятельности предприятия
Оценка статистической значимости параметров регрессии. Построение экономического прогноза прибыли при прогнозном значении произведенной валовой продукции. Статистическая оценка параметров уравнения регрессии. Построение мультипликативной модели тренда.

контрольная работа [132,1 K], добавлен 10.03.2013
Экономическое моделирование
Методы анализа структуры временных рядов, содержащих сезонные колебания. Рассмотрение подхода методом скользящей средней и построение аддитивной (или мультипликативной) модели временного ряда. Расчет оценок сезонной компоненты в мультипликативной модели.

контрольная работа [57,9 K], добавлен 12.02.2015
Основные модели инфляции
Понятие термина "инфляция", цели и общие принципы моделирования инфляционного процесса. Концепции и основные модели инфляции в экономике. Особенности проведения антиинфляционной политики государства. Анализ моделей и концепции инфляции в экономике.

курсовая работа [136,9 K], добавлен 20.12.2015
Методика проведения парного корреляционно-регрессионного анализа
Изучение зависимости доли сельского населения от величины среднедушевых денежных доходов. Расчет параметров линейной функции на основании исходных данных по областям. Определение среднего коэффициента эластичности. Расчет коэффициента корреляции.

методичка [55,1 K], добавлен 02.06.2012
Методологические основы анализа хозяйственной деятельности
Предмет, объект, цель, содержание и задачи анализа хозяйственной деятельности в современных условиях. Построение логических и математических моделей факторных систем. Построение факторной модели прибыли и расчет общего прироста результативного показателя.

контрольная работа [14,8 K], добавлен 28.01.2010
Статистическая совокупность
Характеристика методов выполнения оценок параметров больших множеств по данным выборочного наблюдения. Особенности работы с большими массивами данных. Расчет основных показателей совокупности. Корреляционно-регрессионный анализ. Анализ рядов динамики.

курсовая работа [1,2 M], добавлен 24.08.2010
Составление дискретных экономических моделей и анализ сценариев развития на основе этих моделей
Моделирование односекторной экономической системы. Построение графической, статистической и динамической моделей. Графики погашения внешних инвестиций. Моделирование двухсекторной экономической системы. Архитектура системы. Спецификация данных модели.

дипломная работа [1023,8 K], добавлен 16.12.2012
Модели прогнозирования банкротства компаний в российской практике
Модели дискриминантного анализа. Эффективность классических западных и российских моделей предсказания банкротства. Отраслевая специфика. Описание статей, включающее характеристики выборки, метод, список факторов и прогнозную силу метода анализа.

реферат [68,6 K], добавлен 24.07.2016
Уровень жизни населения
Обзор математических моделей финансовых пирамид. Анализ модели динамики финансовых пузырей Чернавского. Обзор модели долгосрочного социально-экономического прогнозирования. Оценка приоритета простых моделей. Вывод математической модели макроэкономики.

курсовая работа [1,7 M], добавлен 27.11.2017
Методология экономического анализа
Методы анализа детерминированных моделей. Построение моделей факторного анализа. Методы анализа стохастических моделей. Методы оптимизации в экономическом анализе. Методы комплексного анализа. Рейтинговая оценка финансового состояния.

курсовая работа [47,9 K], добавлен 12.05.2008
Методы анализа и обработки данных
Понятие экономического анализа как науки, его сущность, предмет, общая характеристика методов и социально-экономическая эффективность. Основные группы эконометрических методов анализа и обработки данных. Факторный анализ экономических данных предприятия.

реферат [44,7 K], добавлен 04.03.2010
Корреляционно-регрессионный анализ
Этапы корреляционно-регрессионного анализа, построение корреляционной модели и определение функции, отражающей механизм связи между факторным и результативным признаками. Измерение тесноты корреляционной связи, расчет индекса корреляции и дисперсии.

лекция [38,1 K], добавлен 13.02.2011
Оценка эффективности реальных инвестиций
Моделирование оценки стоимости финансовых инструментов инвестирования. Основные модели, используемые при формировании текущей рыночной цены акций и облигаций. Моделирование рациональной структуры инвестиционного портфеля. Методы оценки инвестиций.

курсовая работа [680,9 K], добавлен 16.04.2015
Типы и модели экономических систем
Элементы, критерии и типы экономической системы. Смешанная экономика: сущность и модели. Сравнительный анализ основных социально-экономических моделей развитых стран. Неоиндустриальная модернизация в современной России. Инновационный путь развития.

курсовая работа [32,4 K], добавлен 10.04.2016

Другие документы, подобные "Оценки параметров регрессионных моделей"

весь список подобных работ

скачать работу можно здесь

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.