Оценки параметров регрессионных моделей
Понятие асимптотической относительной эффективности оценок. Цели регрессионного анализа и необходимость проведения обзора наиболее популярных методов оценивания параметров модели. Численный сравнительный анализ. Построение модели на реальных данных.
Рубрика | Экономика и экономическая теория |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 11.02.2017 |
Размер файла | 999,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Рис. 3.1. Зависимость пенсии от уровня ВВП
Для определения эффективности применяемых методов внесем в данные изменения: у двух случайно выбранных наблюдений значения зависимой переменной увеличим в 10 раз. Показателем качества оценок будет являться, как и раньше
где - вектор с оценками параметров после изменения (символ «о» сверху обозначает выброс - «outlier»), а - вектор с оценками параметров до изменения. Результаты для наглядности представлены в Таблице 3.2, проанализировав которые можно сделать следующий вывод: наилучшим образом на выбросы в данных реагирует М-оценка Тьюки и Вельша, а также М-оценка Хьюбера. Наихудшим - МНК-оценка. Визуализация моделей после изменения данных представлена на Рисунке 3.2
Таблица 3.2 Оценки параметров модели на реальных данных
Вид оценок |
||||||
МНМ |
-41,6041 |
-12,1811 |
22,4258 |
21,6713 |
866,2821 |
|
МНК |
-83,3851 |
-1373,0754 |
31,2978 |
106,6865 |
1668984,53 |
|
М-оценки Хьюбера |
-68,0623 |
-79,5903 |
25,4376 |
29,8315 |
152,2011 |
|
М-оценки Fair |
-69,6524 |
-143,4568 |
26,2943 |
35,3134 |
5528,4340 |
|
М-оценки Коши |
-55,0598 |
-22,6662 |
23,6606 |
21,6094 |
1053,5527 |
|
М-оценки Вельша |
-19,6959 |
-14,1779 |
20,8956 |
20,6862 |
30,4922 |
|
М-оценки Тьюки |
-10,3375 |
-5,1781 |
20,3699 |
20,2362 |
26,6373 |
Рис. 3.2 Построение моделей после изменения данных
В Приложении № 10 представлен код Matlab, при помощи которого была вычислена оценка параметров регрессии и построены графики, а также проведен эксперимент на реальных данных.
В данной главе был рассмотрен пример применения М-оценок параметров линейной регрессионной модели к реальным данным и была построена линейная модель зависимости уровня пенсии от ВВП страны. Также влияние выбросов в данных на М-, МНК- и МНМ-оценки параметров модели с реальными данными были рассмотрены.
Заключение
В данной работе были рассмотрены М-оценки параметров регрессионной модели, а также изучены их свойства. Были введены различные оценки параметров регрессионной модели, а также реализован алгоритм нахождения М-, МНМ- и МНК-оценок.
С помощью моделирования методом Монте-Карло было установлено, что М-оценки могут быть успешно применены к моделям с любым из рассматриваемых в данной работе распределением остатков. М-оценки Хьюбера и Коши неоднократно достигали наиболее качественных результатов при применении к моделям, в которых ошибки имеют распределение Стьюдента. Тем не менее, нельзя определить точную степень свободы, больше или меньше которой стоит применять тот или иной метод оценивания, так как экспериментальные результаты получились смешанные.
М-оценка Тьюки хорошо себя зарекомендовала в случае распределения Тьюки с различным параметром зашумления. Также М-оценки Вельша могут быть применены в случае, когда ошибки распределены по данному закону, демонстрируя при этом результат, не сильно отличный от оценок параметров, построенных М-оценкой Тьюки. Бо?льшая устойчивость к выбросам у М-оценок Тьюки и М-оценок Вельша обусловлена тем, что с-функция, соответствующая этим оценкам, является ограниченной (в отличии, например, от М-оценок Хьюбера).
В сравнении с рассматриваемыми конкурентами, МНК наиболее точен для оценивания параметров регрессионной модели с шумами, распределёнными по закону Гаусса, также метод точен при применении к треугольному и «двугорбому» распределению на основе треугольных и гаусcовских величин, однако применение метода с случае, когда распределение ошибок имеет «тяжелые хвосты» не приносит хороших результатов.
В случае разного распределения данных матрицы Х, рекомендации относительно применения того или иного метода оценок параметров различаются незначительно. Таким образом, результаты работы можно представить в виде таблицы, где на пересечении столбцов и строк стоит в случае, если тот или иной метод оценивания неизвестных параметров модели может быть успешно применен при каком-либо распределении остатков; , если метод может быть применен, но применение его конкурентов даст более лучший, устойчивый результат; , если применение метода не рекомендуется.
Таблица 4.1 Рекомендации относительно применения методов оценивания параметров линейной регрессионной модели
Распределение/метод оценивания |
МНМ |
МНК |
М-оценка Хьюбера |
М-оценка Fair |
М-оценка Коши |
М-оценка Вельша |
М-оценка Тьюки |
|
Стандартное нормальное распределение |
||||||||
Распределение Лапласа |
||||||||
Распределение Коши |
||||||||
Распределение Стьюдента |
||||||||
Двугорбое распределение как комбинация нормальных |
||||||||
Распределение Тьюки |
+ |
+ |
||||||
Треугольное распределение |
||||||||
Двугорбое распределение как комбинация треугольных |
||||||||
Логистическое распределение |
Таким образом, принимая во внимание тот факт, что при построении модели на реальных данных зачастую нельзя наверняка знать, какому закону подчиняются ошибки модели, М-оценки должны быть применены.
В проведенных экспериментах ни одна из рассматриваемых робастных М-оценок не показала себя с худшей стороны, наименее качественные результаты демонстрировали МНК- и МНМ-оценки.
В работе посчитана асимптотическая относительная эффективность оценок, которая позволяет сделать выводы о том, какой метод лучше применять для оценки параметров в моделях с большим объемом выборки. Для большинства рассматриваемых распределений М-оценки показали большую эффективность, нежели МНК- и МНМ- оценки.
В работе был рассмотрен пример применения М-оценок параметров линейной регрессионной модели к реальным данным и была построена линейная модель зависимости уровня пенсии от ВВП страны. Также влияние выбросов в данных на М-, МНК- и МНМ-оценки параметров модели с реальными данными были рассмотрены. При применении М-оценок к реальным данным, наиболее качественными оценками оказались М-оценки Тьюки и Вельша, также неплохой результат показала М-оценка Хьюбера. Широко распространенный метод наименьших квадратов оказался менее качественным в случае выбросов в реальных данных.
Итак, все поставленные задачи были выполнены и цель исследования была достигнута. Подытоживая общий результат работы, хочется отметить, что М-оценки являются качественной и робастной альтернативой МНК и МНМ в задаче оценивания параметров линейной регрессионной модели.
Список используемой литературы
1. Белов А. Г., Щедрин Б. М. Относительная эффективность МНК- и МНМ- оценок // "Ломоносовские чтения" (к 300-летию М.В.Ломоносова), 14-23 ноября 2011г. -- М., Макс Пресс Москва, факультет ВМК МГУ, 2011. -- С. 113-114.
2. Вьюгин В.В. Математические основы теории машинного обучения и прогнозирования. - М.: 2013. - 387 с.
3. Гуриев С.М., Колотилин А.Д., Сонин К.И. Цены на нефть и риск национали- зации: о чем говорят панельные данные? // Экономический журнал ВШЭ. 2008. Т. 12, № 2.
4. Дж. Себер «Линейный регрессионный анализ», М.: Мир, 1980, с.54
5. Крыштановский, А. О. Анализ социологических данных с помощью пакета SPSS [Текст]: учеб. пособие для вузов / А. О. Крыштановский; Гос. ун-т -- Высшая школа экономи-ки. -- М. : Изд. дом ГУ ВШЭ, 2006. -- 281, [3] с. -- (Учебники Высшей школы экономики). -- Прил.: с. 225-- 281. -- 2000 экз. -- ISBN 5-7598-0373-5 (в пер.).
6. Линник Ю. В. Метод наименьших квадратов и основы математико-статистической теории обработки наблюдений. -- 2-е изд. -- М., 1962.(математическая теория)
7. Мун С.А. Регрессионный анализ в медико-биологических исследованиях: методические рекомендации/ С.А. Мун, А.Н. Глушков, Т.А. Штернис, С.А. Ларин, С.А. Максимов; ГБОУ ВПО КемГМА Минздравсоцразвития России. - Кемерово: КемГМА, 2012. - 115 с.
8. Научная библиотека [Электронный ресурс].
URL: http://stu.sernam.ru/book_stat1.php?id=1 - (дата обращения: 11.12.2015).
9. Савина, И. А. Методика библиографического описания : практическое пособие . - М. : Либерия-Бибинформ, 2007. - 144 с.
10. Сидоренко Е. В. Методы математической обработки в психологии. -- СПб.: ООО «Речь», 2000. -- 350 с., ил., стр. 240-245.]
11. Смирнов А.В. Анализ финансового состояния коммерческих банков. - М.: Финансы и статистика, 2007. - 225 с.
12. Т. Хеттманспергер "Статистические выводы, основанные на рангах", М.: Финансы и статистика,1987, с. 249
13. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. Изд. 3-е, перераб. и доп./Под ред. В.Э.Фигурнова - М.: ИНФРА-М, 2002. [Электронный ресурс].
URL:http://antonpiter.narod.ru/7361/5semestr/VM_analiz_dannix.PDF - (дата обращения: 29.05.2015).
14. Хьюбер Дж. П. Робастность в статистике: Пер. с англ. - М.: Мир, 1984. 304 с., ил.
15. Bill Jacoby. Regression III: Advanced Methods [Электронный ресурс].
URL:http://polisci.msu.edu/icpsr/regress3, - (дата обращения: 17.05.2016).
16. Encyclopedia of Environments, Vol. 2. Abdel H. El-Shaarawi, Walter W. Piegorsch 2002 John Wiley & Sons, Ltd ISBN: 0 472 89997 6
17. Joiner, Brian L.; Rosenblatt, Joan R. (1971), "Some Properties of the Range in Samples from Tukey's Symmetric Lambda Distributions", Journal of the American Statistical Association 66(334): 394-399
Приложение 1
Визуализация зависимости p-функции Тьюки от b
1) Для реализации алгоритма используется вспомогательная функция
weight_function( ), вычисляющая веса w для различных w-функций М-оценок.
load('random_matrix_X_norm.mat')
X = X(:,1);
c = 4.6851;
b=-10:0.01:10;
error_norm = randn(50,1);
Y = X+error_norm;
Y(1:5) = 100;
X(1:5) = 20;
b_0 = (X'*X)^(-1)*X'*Y;
error = Y - b_0*X;
s = 1.4826*median(abs(error));
for t = 1:size(b,2)
error = Y - b(t)*X;
for k=1:50
x= error(k)/s;
if abs(x) <= c
p(k) = c^2/6*(1-(1-(x/c)^2)^3);
else
p(k) = c^2/6;
end
end
loss_function(t) = sum(p);
end
plot(b,loss_function,'k');
hold on;
error = Y - X;
b_0 = (X'*X)^(-1)*X'*Y; %мнк-оценка первого приближения
eps = 0.0001;
s = 1.4826*median(abs(error));
weight = weight_function(error/s,'tukey');
for i = 1:size(X,1)
W(i,i)=weight(i);
end
b_robust = (X'*W*X)^(-1)*X'*W*Y;
while norm(b_robust-b_0, 2)/norm(b_robust,2) >= eps
error = Y - X*b_robust;
s = 1.4826*median(abs(error));
weight = weight_function(error/s,'tukey');
for i = 1:size(X,1)
W(i,i)=weight(i);
end
b_0 = b_robust;
b_robust = (X'*W*X)^(-1)*X'*W*Y;
end
error = Y - b_robust*X;
s = 1.4826*median(abs(error));
for t=1:50
x= error(t)/s;
if abs(x) <= c
p(t) = c^2/6*(1-(1-(x/c)^2)^3);
else
p(t) = c^2/6;
end
end
loss= sum(p);
plot (b_robust, loss,'*');
xlabel('b');
ylabel ('L');
Приложение 2
Код для вычисления асимптотических относительных эффективностей М-оценок по отношению к МНК- и МНМ-оценкам
Результатом работы скрипта является 6 excel-файлов.
«results_mnk_triug.xlsx» содержит АОЭ исследуемых М-оценок по отношению к МНК-оценкам в случае треугольного распределения.
«results_mnm_triug.xlsx» содержит АОЭ исследуемых М-оценок по отношению к МНМ-оценкам в случае треугольного распределения.
«results_ass_mnk.xlsx» содержит АОЭ исследуемых М-оценок по отношению к МНK-оценкам в случае стандартного нормального распределения, распределения Лапласа, распределения Коши, распределения Стьюдента с 2,3,5,8,13,15 степенями свободы, «двугорбого» распределения на основе двух нормальных, Тьюки с параметрами г=0,1, у12=100, у22=1.
«results_ass_mnm.xlsx» содержит АОЭ исследуемых М-оценок по отношению к МНM-оценкам в случае стандартного нормального распределения, распределения Лапласа, распределения Коши, распределения Стьюдента с 2,3,5,8,13,15 степенями свободы, «двугорбого» распределения на основе двух нормальных, Тьюки с параметрами г=0,1, у12=100, у22=1.
«results_mnk_log.xlsx» содержит АОЭ исследуемых М-оценок по отношению к МНК-оценкам в случае логистического распределения.
«results_mnm_log.xlsx» содержит АОЭ исследуемых М-оценок по отношению к МНМ-оценкам в случае логистического распределения.
clear all
c_k = 2.3849;
c_h = 1.345;
c_t = 4.6851;
c_w = 2.9846;
c_f = 1.3998;
f_norm = @(u) (1/sqrt(2*pi)*exp(-u.^2/2));
f_lapl = @(u) 1/2*exp(-abs(u));
f_koshi = @(u) 1./(pi*(u.^2+1));
n=2;
f_student_2 = @(u) gamma((n+1)/2)/(sqrt(pi*n)*gamma(n/2))*(1+u.^2/n).^(-(n+1)/2);
n=3;
f_student_3 = @(u) gamma((n+1)/2)/(sqrt(pi*n)*gamma(n/2))*(1+u.^2/n).^(-(n+1)/2);
n=5;
f_student_5 = @(u) gamma((n+1)/2)/(sqrt(pi*n)*gamma(n/2))*(1+u.^2/n).^(-(n+1)/2);
n=8;
f_student_8 = @(u) gamma((n+1)/2)/(sqrt(pi*n)*gamma(n/2))*(1+u.^2/n).^(-(n+1)/2);
n=13;
f_student_13 = @(u) gamma((n+1)/2)/(sqrt(pi*n)*gamma(n/2))*(1+u.^2/n).^(-(n+1)/2);
n=15;
f_student_15 = @(u) gamma((n+1)/2)/(sqrt(pi*n)*gamma(n/2))*(1+u.^2/n).^(-(n+1)/2);
f_dv_gaus = @(u) 1/2*1/sqrt(2*pi).*exp(-(u-3).^2./2) + 1/2*1/sqrt(2*pi).*exp(-(u+3).^2./2);
y = 0.1;
s_1 = 100;
s_2 = 1;
f_tukey = @(u) y./(sqrt(s_1*2*pi)).*exp(-(u.^2)./(2*s_1)) + (1-y)./(sqrt(s_2*2*pi)).*exp(-(u.^2)./(2*s_2));
distribution = {@(u) f_norm(u), @(u) f_lapl(u), f_koshi, f_student_2, f_student_3,f_student_5,f_student_8, f_student_13,f_student_15, f_dv_gaus, f_tukey};
v_m_mnk = zeros (5,11);
v_m_mnm = zeros (5,11);
k=1;
%1 - norm, 2 - laplass, 3-koshi
%4 - student with n=2, 5 - student with n=3,
%6 - student with n=5, 7 - student with n=8,
%8 - student with n=13, 9 - student with n=15
%10 - dvug_gauss, 11 - tukey,
for i=1:11
if i==1
s=1;
end
if i==2
s=sqrt(2);
end
if i==3
s=100000; %->inf
end
if i==4
s=10000000; % ->inf
end
if i==5
s=sqrt(3/(3-2));
end
if i==6
s=sqrt(5/(5-2));
end
if i==7
s=sqrt(8/(8-2));
end
if i==8
s=sqrt(13/(13-2));
end
if i==9
s=sqrt(15/(15-2));
end
if i==10
s=sqrt(10);
end
if i==11
s=sqrt(10.9);
end
%HUBER
fun_1 = @(u) (u./s).^2.*distribution{i}(u);
fun_2 = @(u) 2*c_h^2.*distribution{i}(u);
fun_3 = @(u) distribution{i}(u);
v_1 = integral(fun_1,-s*c_h,s*c_h);
v_2 = integral(fun_2,s*c_h,inf);
v_3 = integral(fun_3,-s*c_h,s*c_h);
v_h = (v_1+v_2)/v_3^2;
v_m_mnk(k,i) = 1/v_h;
v_m_mnm(k,i) = 1/(4*s^2*v_h*(distribution{i}(0))^2);
k=k+1;
%FAIR
fun_1 = @(u) ((u./s)./(1+abs((u./s)/c_f))).^2.*distribution{i}(u);
pr_1 = @(u) c_f^2./(abs(u./s) + c_f).^2.*distribution{i}(u);
v_1 = integral(fun_1,-inf,inf);
v_2 = integral(pr_1,-inf,inf);
v_f = (v_1)/v_2^2;
v_m_mnk(k,i) = 1/v_f;
v_m_mnm(k,i) = 1/(4*s^2*v_f*(distribution{i}(0))^2);
k=k+1;
%KOSHI
fun_1 = @(u) ((u./s)./(1+((u./s)/c_k).^2)).^2.*distribution{i}(u);
fun_2 = @(u) ((c_k^2*(c_k^2-(u./s).^2)./(c_k^2+(u./s).^2).^2)).*distribution{i}(u);
v_k = integral(fun_1,-inf,inf)/integral(fun_2,-inf,inf)^2;
v_m_mnk(k,i) = 1/v_k;
v_m_mnm(k,i) = 1/(4*s^2*v_k*(distribution{i}(0))^2);
k=k+1;
%WELSH
fun_1 = @(u) ((u./s).*exp(-((u./s)./c_w).^2)).^2.*distribution{i}(u);
pr_1 = @(u) exp(-(u./s).^2./c_w^2).*(c_w^2-2*(u./s).^2)./c_w.^2.*distribution{i}(u);
v_1 = integral(fun_1,-inf,inf);
v_2 = integral(pr_1,-inf,inf);
v_w = (v_1)/v_2^2;
v_m_mnk(k,i) = 1/v_w;
v_m_mnm(k,i) = 1/(4*s^2*v_w*(distribution{i}(0))^2);
k=k+1;
%TUKEY
fun_1 = @(u) ((u./s).*(1-(u./(s*c_t)).^2).^2).^2.*distribution{i}(u);;
pr_1 = @(u) (5*(u./s).^4/c_t^4 - 6*(u./s).^2/c_t^2 +1).*distribution{i}(u);;
v_1 = integral(fun_1,-s*c_t,s*c_t);
v_2 = integral(pr_1,-s*c_t,s*c_t);
v_t = (v_1)/v_2^2;
v_m_mnk(k,i) = 1/v_t;
v_m_mnm(k,i) = 1/(4*s^2*v_t*(distribution{i}(0))^2);
k=1;
end
v_m_mnk = v_m_mnk';
v_m_mnm = v_m_mnm';
filename = 'results_ass_mnk.xlsx';
xlswrite(filename,v_m_mnk,1,'A1:E11')
filename = 'results_ass_mnm.xlsx';
xlswrite(filename,v_m_mnm,1,'A1:E11')
%logistick
f_logist = @(u) exp(-u)./(1+exp(-u)).^2;
s = sqrt(pi^2/3);
%HUBER
fun_1 = @(u) (u./s).^2.*f_logist(u);
fun_2 = @(u) 2*c_h^2.*f_logist(u);
fun_3 = @(u) f_logist(u);
v_1 = integral(fun_1,-s*c_h,s*c_h);
v_2 = integral(fun_2,s*c_h,100);
v_3 = integral(fun_3,-s*c_h,s*c_h);
v_h = (v_1+v_2)/v_3^2;
mnk_log(1) = 1/v_h;
mnm_log(1) = 1/(4*s^2*v_h*(f_logist(0))^2);
%FAIR
fun_1 = @(u) ((u./s)./(1+abs((u./s)/c_f))).^2.*f_logist(u);
pr_1 = @(u) c_f^2./(abs(u./s) + c_f).^2.*f_logist(u);
v_1 = integral(fun_1,-100,100);
v_2 = integral(pr_1,-100,100);
v_f = (v_1)/v_2^2;
mnk_log(2) = 1/v_f;
mnm_log(2) = 1/(4*s^2*v_f*(f_logist(0))^2);
%KOSHI
fun_1 = @(u) ((u./s)./(1+((u./s)/c_k).^2)).^2.*f_logist(u);
fun_2 = @(u) ((c_k^2*(c_k^2-(u./s).^2)./(c_k^2+(u./s).^2).^2)).*f_logist(u);
v_k = integral(fun_1,-100,100)/integral(fun_2,-100,100)^2;
mnk_log(3) = 1/v_k;
mnm_log(3) = 1/(4*s^2*v_k*(f_logist(0))^2);
%WELSH
fun_1 = @(u) ((u./s).*exp(-((u./s)./c_w).^2)).^2.*f_logist(u);
pr_1 = @(u) exp(-(u./s).^2./c_w^2).*(c_w^2-2*(u./s).^2)./c_w.^2.*f_logist(u);
v_1 = integral(fun_1,-100,100);
v_2 = integral(pr_1,-100,100);
v_w = (v_1)/v_2^2;
mnk_log(4) = 1/v_w;
mnm_log(4) = 1/(4*s^2*v_w*(f_logist(0))^2);
%TUKEY
fun_1 = @(u) ((u./s).*(1-(u./(s*c_t)).^2).^2).^2.*f_logist(u);
pr_1 = @(u) (5*(u./s).^4/c_t^4 - 6*(u./s).^2/c_t^2 +1).*f_logist(u);
v_1 = integral(fun_1,-s*c_t,s*c_t);
v_2 = integral(pr_1,-s*c_t,s*c_t);
v_t = (v_1)/v_2^2;
mnk_log(5) = 1/v_t;
mnm_log(5) = 1/(4*s^2*v_t*(f_logist(0))^2);
filename = 'results_mnk_log.xlsx';
xlswrite(filename,mnk_log,1,'A1:E1')
filename = 'results_mnm_log.xlsx';
xlswrite(filename,mnm_log,1,'A1:E1')
%TRIUGOLNOE
a=-2;
b=2;
f_triug = @(u) 2/(b-a) - 2/(b-a)^2.*abs(a+b-2.*u);
s=sqrt((b-a)^2/24);
%HUBER
fun_1 = @(u) (u./s).^2.*f_triug(u);
fun_2 = @(u) 2*c_h^2.*f_triug(u);
fun_3 = @(u) f_triug(u);
v_1 = integral(fun_1,-s*c_h,s*c_h);
v_2 = integral(fun_2,s*c_h,b);
v_3 = integral(fun_3,-s*c_h,s*c_h);
v_h = (v_1+v_2)/v_3^2;
mnk_triug(1) = 1/v_h;
mnm_triug(1) = 1/(4*s^2*v_h*(f_triug(0))^2);
%FAIR
fun_1 = @(u) ((u./s)./(1+abs((u./s)/c_f))).^2.*f_triug(u);
pr_1 = @(u) c_f^2./(abs(u./s) + c_f).^2.*f_triug(u);
v_1 = integral(fun_1,a,b);
v_2 = integral(pr_1,a,b);
v_f = (v_1)/v_2^2;
mnk_triug(2) = 1/v_f;
mnm_triug(2) = 1/(4*s^2*v_f*(f_triug(0))^2);
%KOSHI
fun_1 = @(u) ((u./s)./(1+((u./s)/c_k).^2)).^2.*f_triug(u);
fun_2 = @(u) ((c_k^2*(c_k^2-(u./s).^2)./(c_k^2+(u./s).^2).^2)).*f_triug(u);
v_k = integral(fun_1,a,b)/integral(fun_2,a,b)^2;
mnk_triug(3) = 1/v_k;
mnm_triug(3) = 1/(4*s^2*v_k*(f_triug(0))^2);
%WELSH
fun_1 = @(u) ((u./s).*exp(-((u./s)./c_w).^2)).^2.*f_triug(u);
pr_1 = @(u) exp(-(u./s).^2./c_w^2).*(c_w^2-2*(u./s).^2)./c_w.^2.*f_triug(u);
v_1 = integral(fun_1,a,b);
v_2 = integral(pr_1,a,b);
v_w = (v_1)/v_2^2;
mnk_triug(4) = 1/v_w;
mnm_triug(4) = 1/(4*s^2*v_w*(f_triug(0))^2);
%TUKEY
fun_1 = @(u) ((u./s).*(1-(u./(s*c_t)).^2).^2).^2.*f_triug(u);
pr_1 = @(u) (5*(u./s).^4/c_t^4 - 6*(u./s).^2/c_t^2 +1).*f_triug(u);
v_1 = integral(fun_1,a,b);
v_2 = integral(pr_1,a,b);
v_t = (v_1)/v_2^2;
mnk_triug(5) = 1/v_t;
mnm_triug(5) = 1/(4*s^2*v_t*(f_triug(0))^2);
filename = 'results_mnk_triug.xlsx';
xlswrite(filename,mnk_triug,1,'A1:E1')
filename = 'results_mnm_triug.xlsx';
xlswrite(filename,mnm_triug,1,'A1:E1')
Приложение 3
Код для визуализации функций p, ф, w
1) Используется дополнительная функция plot_3_graph( ), позволяющая вывести в одном окне 3 графика.
function [ smt ] = plot_3_graph(x, ro, psi, w )
smt = 1;
subplot(1,3,1);
plot (x, ro);
ylabel('\rho(u)');
xlabel ('u');
subplot(1,3,2);
plot (x, psi);
ylabel ('\psi(u)');
xlabel ('u');
subplot(1,3,3);
plot (x, w);
ylabel ('w(u)');
xlabel ('u');
end
2) Визуализации функций
x = -10:0.0001:10;
ro_huber = zeros (size(x));
phi_huber = zeros (size(x));
w_huber = zeros (size(x));
c = 1.345;
for k = 1:size(x,2)
if abs(x(k)) <= c
ro_huber(k) = (x(k)^2)/2;
phi_huber(k) = x(k);
w_huber(k) = 1;
else
ro_huber(k) = c*(abs(x(k)) - c/2);
phi_huber(k)=c*sign(x(k));
w_huber(k) = c/abs(x(k));
end
end
plot_3_graph (x, ro_huber, phi_huber, w_huber);
figure;
ro_fair = zeros (size(x));
phi_fair = zeros (size(x));
w_fair = zeros (size(x));
c = 1.3998;
for k = 1:size(x,2)
ro_fair(k) = c^2*(abs(x(k))/c - log(1+abs(x(k)/c)));
phi_fair(k) = x(k)/(1+abs(x(k))/c);
w_fair(k) = 1/(1+abs(x(k))/c);
end
plot_3_graph (x, ro_fair, phi_fair, w_fair);
figure;
ro_koshi = zeros (size(x));
phi_koshi= zeros (size(x));
w_koshi = zeros (size(x));
c = 2.3849;
for k = 1:size(x,2)
ro_koshi(k) = c^2/2*log(1+(x(k)/c)^2);
phi_koshi(k) = x(k)/(1+((x(k))/c)^2);
w_koshi(k) = 1/(1+((x(k))/c)^2);
end
plot_3_graph (x, ro_koshi, phi_koshi, w_koshi);
figure;
ro_g = zeros (size(x));
phi_g= zeros (size(x));
w_g = zeros (size(x));
for k = 1:size(x,2)
ro_g(k) = x(k)^2/2/(1+x(k)^2);
phi_g(k) = x(k)/(1+(x(k))^2)^2;
w_g(k) = 1/(1+(x(k))^2)^2;
end
plot_3_graph (x, ro_g, phi_g, w_g);
figure;
ro_welsh = zeros (size(x));
phi_welsh= zeros (size(x));
w_welsh = zeros (size(x));
c = 2.9846;
for k = 1:size(x,2)
ro_welsh(k) = c^2/2*(1-exp(-(x(k)/c)^2));
phi_welsh(k) = x(k) * exp(-(x(k)/c)^2);
w_welsh(k) = exp(-(x(k)/c)^2);
end
plot_3_graph (x, ro_welsh, phi_welsh, w_welsh);
figure;
ro_tukey = zeros (size(x));
phi_tukey = zeros (size(x));
w_tukey = zeros (size(x));
c = 4.6851;
for k = 1:size(x,2)
if abs(x(k)) <= c
ro_tukey(k) = c^2/6*(1-(1-(x(k)/c)^2)^3);
phi_tukey(k) = x(k)*(1-(x(k)/c)^2)^2;
w_tukey(k) = (1-(x(k)/c)^2)^2;
else
ro_tukey(k) = c^2/6;
phi_tukey(k)=0;
w_tukey(k) = 0;
end
end
plot_3_graph (x, ro_tukey, phi_tukey, w_tukey);
Приложение 4
Пример работы М-оценок
p = randn(1,10);
x = 0:1:9;
y = x + p;
x = [x 15];
y = [y 1];
scatter(x,y, 'filled');grid on;
hold on;
types = cellstr(['lad ';'ols '; 'huber';'fair ';'koshi'; 'welsh';'tukey']);
types_color = (['m'; 'y';'g';'r';'b'; 'c';'k']);
x = [ones(size(x,2),1) x'];
for k = 1:size(types,1)
b = IRLS(x,y,'ols',types(k));
plot (x, b(2)*x + b(1), types_color(k));
hold on;
err(:,k) = y'-x*b;
end
xlabel ('x');
grid on;
ylabel ('y');
Приложение 5
Алгоритм для вычисления IRLS
1) Для реализации алгоритма используется вспомогательная функция weight_function( ), вычисляющая веса w для различных w-функций М-оценок.
function [ weight ] = weight_function(x,f_name)
if strcmp(f_name, 'huber') == 1
c = 1.345;
weight = zeros(size(x));
for k=1:size (weight,1)
if abs(x(k)) <= c
weight(k) = 1;
else
weight(k) = c/abs(x(k));
end
end
end
if strcmp(f_name, 'fair') == 1
c = 1.3998;
weight = zeros(size(x));
for k=1:size (weight,1)
weight(k) = 1/(1+abs(x(k))/c);
end
end
if strcmp(f_name, 'koshi') == 1
c = 2.3849;
weight = zeros(size(x));
for k=1:size (weight,1)
weight(k) = 1/(1+((x(k))/c)^2);
end
end
if strcmp(f_name, 'welsh') == 1
c = 2.9846;
weight = zeros(size(x));
for k=1:size (weight,1)
weight(k)=exp(-(x(k)/c)^2);
end
end
if strcmp(f_name, 'tukey') == 1
c = 4.6851;
weight = zeros(size(x));
for k=1:size (weight,1)
if abs(x(k)) <= c
weight(k) = (1-(x(k)/c)^2)^2;
else
weight(k) = 0;
end
end
end
end
2) Функция для вычисления IRLS.
function [ b_robust ] = IRLS(x,y, initial_b_type,weighted_f_name)
X = x;
if strcmp(weighted_f_name,'ols') == 1 || strcmp(weighted_f_name,'lad') == 1
if strcmp(weighted_f_name,'ols') == 1
b_robust = (X'*X)^(-1)*X'*y';
else
[b_robust, fval]=fminsearch(@(b_robust)sum(abs(y'-X*b_robust)), ones(size(X,2),1));
end
else
if strcmp(initial_b_type,'ols') == 1
b_0 = (X'*X)^(-1)*X'*y';
end
eps = 0.0001;
error = y' - X*b_0;
s = 1.4826*median(abs(error));
weight = weight_function(error/s,weighted_f_name);
for i = 1:size(X,1)
W(i,i)=weight(i);
end
b_robust = (X'*W*X)^(-1)*X'*W*y';
while norm(b_robust-b_0, 2)/norm(b_robust,2) >= eps
error = y' - X*b_robust;
s = 1.4826*median(abs(error));
weight = weight_function(error/s,weighted_f_name);
for i = 1:size(X,1)
W(i,i)=weight(i);
end
b_0 = b_robust;
b_robust = (X'*W*X)^(-1)*X'*W*y';
end
end
end
Приложение 6
Визуализация функций плотностей распределения Гаусса и Тьюки
x = -8:0.001:8;
Y = normpdf(x,0,1);%norm
plot(x,Y)
xlabel('x');
ylabel('f(x)');
hold on;
Y = 0.1*normpdf(x,0,10) + (0.9)*normpdf(x,0,1); %tukey
plot(x,Y,'r')
xlabel('x');
ylabel('f(x)');
Приложение 7
Результаты вычисления М-оценок, МНК- и МНМ-оценок
1) Для реализации используется функция IRLS() [см. Приложение 5]
2) Результаты вычисления записываются в отдельный excel-файл «results.xlsx», содержащий 12 строк и 7 столбцов, соответствующий различным распределениям и оценкам.
clear all;
n=50;
m=2;
n_distributions = 12;
b = [3;-7;8];
b_robust_vector = zeros(m+1,1);
X = 5*rand(n,m);
X = [ones(n,1) X];
types = cellstr(['lad ';'ols '; 'huber';'fair ';'koshi'; 'welsh';'tukey']);
kriteriy = zeros(size(types,1),n_distributions);
b_robust_mean = zeros(m+1, size(types,1));
error_matrix = zeros(n,n_distributions);rng(1);
for dist_column = 1:n_distributions
for t = 1:size(types,1)
for k=1:2000
%1norn
error_norm = randn(n,1);
%2laplass
z1=-log(rand(n,1));
z2=-log(rand(n,1));
error_laplass=z1-z2;
%3koshi
error_koshi=tan(pi*rand(n,1) - pi/2);
%4,5,6,7student
error_stud_2 = tinv(rand(n,1),2);
error_stud_3 = tinv(rand(n,1),3);
error_stud_8 = tinv(rand(n,1),8);
error_stud_15 = tinv(rand(n,1),15);
%8dvugorbovoe
p=rand(n,1);
error_gaus_dvud=randn(n,1)+3;
eps=randn(n,1)-3;
I=find(p>=0.5);
error_gaus_dvud(I)=eps(I);
%9tukey
p=rand(n,1);
error_tukey=randn(n,1);
eps=sqrt(100)*randn(n,1);
I=find(p>=0.9);
error_tukey(I)=eps(I);
%10triangle
u1=2*rand(n,1)-1;
u2=2*rand(n,1)-1;
error_triangle=u1+u2;
%11double_triangle
p=rand(n,1);
u1=rand(n,1);
u2=rand(n,1);
error_doub_triang=u1+u2;
v1=-rand(n,1);
v2=-rand(n,1);
eps=v1+v2;
I=find(p>=0.5);
error_doub_triang(I)=eps(I);
%12logistick
error_logistick=-log((1./rand(n,1)) -1);
error_matrix = [error_norm error_laplass error_koshi error_stud_2 error_stud_3 error_stud_8 error_stud_15];
error_matrix = [error_matrix error_gaus_dvud error_tukey error_triangle error_doub_triang error_logistick];
Y = X*b+error_matrix(:,dist_column);
b_robust = IRLS(X,Y','ols',types(t));
b_robust_vector(:,k) = b_robust;
end
for p = 1:size(b_robust_vector,2)
d_vector_error(1,p) = sum((b_robust_vector(:,p) - b).^2);
end
avg_error_b(t,dist_column) = mean(d_vector_error');
end
end
avg_error_b = avg_error_b';
filename = 'results.xlsx';
xlswrite(filename,avg_error_b,1,'A1:G12')
Приложение 8
Дополнительные тесты для распределения Тьюки
1) Для реализации используется функция IRLS() [см. Приложение 5]
2) Дополнительны тесты для Распределения Тьюки. Матрица X может содержать данные, распределенные нормально ('random_matrix_X_norm), по закону Коши ('random_matrix_X_koshi'), либо по закону Тьюки ('random_matrix_X_tukey'). Результат программы - excel-файл 'results_tukey.xlsx';
clear all
load('random_matrix_X_norm.mat')
n=50;
m=2;
types = cellstr(['lad ';'ols '; 'huber';'fair ';'koshi'; 'welsh';'tukey']);
X = [ones(n,1) X];
b = [3;-7;8];
b_robust_vector = zeros(m+1,1);
param = [0.05 0.1 0.15 0.2 0.3];
for r=1:9
for t = 1:size(types,1)
for k=1:2000
p=rand(n,1);
disp_1 = disp1(r);
disp_2=disp2(r);
error_tukey=sqrt(1)*randn(n,1);
eps=sqrt(100)*randn(n,1);
I=find(p>=1-param(r));
error_tukey(I)=eps(I);
Y = X*b+error_tukey;
b_robust = IRLS(X,Y','ols',types(t));
b_robust_vector(:,k) = b_robust;
end
for p = 1:size(b_robust_vector,2)
d_vector_error(1,p) = sum((b_robust_vector(:,p) - b).^2);
end
avg_error_b(t,r) = mean(d_vector_error');
end
end
avg_error_b = avg_error_b';
filename = 'results_tukey.xlsx';
xlswrite(filename,avg_error_b,1,'A1:G9')
Приложение 9
Данные по 27 странам. Уровень пенсии и ВВП
№ |
Страна |
Пенсия, USD |
ВВП, млн. USD |
|
1 |
Дания |
2800 |
37,00 |
|
2 |
Финляндия |
1900 |
35,30 |
|
3 |
Норвегия |
1542 |
59,10 |
|
4 |
Израиль |
1350 |
29,50 |
|
5 |
Германия |
1200 |
35,90 |
|
6 |
Испания |
1190 |
29,50 |
|
7 |
США |
1164 |
47,40 |
|
8 |
Швейцария |
874 |
42,90 |
|
9 |
Швеция |
833 |
39,00 |
|
10 |
Япония |
717 |
34,20 |
|
11 |
Великобритания |
700 |
36,12 |
|
12 |
Франция |
700 |
33,30 |
|
13 |
Канада |
667 |
39,60 |
|
14 |
Италия |
583 |
30,70 |
|
15 |
Венгрия |
400 |
19,00 |
|
16 |
Польша |
380 |
18,80 |
|
17 |
Литва |
298 |
15,90 |
|
18 |
Россия |
285 |
15,90 |
|
19 |
Болгария |
280 |
12,80 |
|
20 |
Казахстан |
210 |
12,50 |
|
21 |
Азербайджан |
202 |
11,00 |
|
22 |
Белоруссия |
175 |
7,41 |
|
23 |
Украина |
142 |
6,70 |
|
24 |
Аргентина |
96 |
14,70 |
|
25 |
Молдова |
80 |
2,50 |
|
26 |
Узбекистан |
55 |
3,10 |
|
27 |
Грузия |
40 |
4,80 |
Приложение 10
Построение модели зависимости пенсии от уровня ВВП
1) Для реализации используется функция IRLS() [см. Приложение 5]
2) Построение модели
load('pension_and_gdp.mat')
p=fix(rand(1)*5);
Y = X(:,1);
Y(p) = Y(p)*5;
p=fix(rand(1)*5);
Y(p) = Y(p)*5;
X=[ones(27,1) X(:,2)];
scatter(X(:,2),Y, 'filled');grid on;
hold on;
types = cellstr(['lad ';'ols '; 'huber';'fair ';'koshi'; 'welsh';'tukey']);
types_color = (['m'; 'y';'g';'r';'b'; 'c';'k']);
for t=1:size(types,1)
b_robust = IRLS(X,Y','ols',types(t));
b_robust_vector(:,t) = b_robust;
plot(X(:,2), b_robust(2)*X(:,2) + b_robust(1), types_color(t));
hold on;
end
xlabel('ВВП, млн долл. США');
ylabel('Пенсия, долл. США');
Размещено на Allbest.ur
...Подобные документы
Основы построения регрессионных моделей: метод наименьших квадратов; двухмерная линейная концепция корреляционного и регрессионного анализа. Показатели статистической обработки информации: дисперсия, математическое ожидание и стандартное отклонение.
контрольная работа [80,8 K], добавлен 27.11.2012Понятие экономического анализа. Характеристика основных приемов и методов экономического анализа. Методика факторного анализа. Многофакторные мультипликативные модели. Построение факторной модели - первый этап детерминированного анализа.
контрольная работа [105,1 K], добавлен 12.09.2006Описание модели бизнеса по Остервальдеру и оценка ее параметров. Построение и анализ цепочки добавленной стоимости. Оценка возможности развития модели бизнеса и вариант новой модели. Возможность оптимизации процессов и основные идеи реинжиниринга.
курсовая работа [2,4 M], добавлен 15.09.2014Содержание, функции и классификация кредитных отношений. Кредитоспособность заемщика: сущность и необходимость оценки, изучение методов комплексного анализа. Применение рейтинговой модели для оценки кредитоспособности на примере ООО "Татарскэнергогаз".
дипломная работа [70,9 K], добавлен 17.01.2011- Использование корреляционно-регрессионного анализа для обработки экономических статистических данных
Роль корреляцонно-регрессионного анализа в обработке экономических данных. Корреляционно-регрессионный анализ и его возможности. Предпосылки корреляционного и регрессионного анализа. Пакет анализа Microsoft Excel.
курсовая работа [68,4 K], добавлен 11.06.2002 Задачи, способы и последствия проведения стерилизованных интервенций. Обзор валютного рынка России. Модели оценки валютного курса. Анализ эффективности стерилизованных интервенций с помощью векторной модели коррекции остатков на дневных и месячных данных.
курсовая работа [700,4 K], добавлен 27.09.2016Оценка статистической значимости параметров регрессии. Построение экономического прогноза прибыли при прогнозном значении произведенной валовой продукции. Статистическая оценка параметров уравнения регрессии. Построение мультипликативной модели тренда.
контрольная работа [132,1 K], добавлен 10.03.2013Методы анализа структуры временных рядов, содержащих сезонные колебания. Рассмотрение подхода методом скользящей средней и построение аддитивной (или мультипликативной) модели временного ряда. Расчет оценок сезонной компоненты в мультипликативной модели.
контрольная работа [57,9 K], добавлен 12.02.2015Понятие термина "инфляция", цели и общие принципы моделирования инфляционного процесса. Концепции и основные модели инфляции в экономике. Особенности проведения антиинфляционной политики государства. Анализ моделей и концепции инфляции в экономике.
курсовая работа [136,9 K], добавлен 20.12.2015Изучение зависимости доли сельского населения от величины среднедушевых денежных доходов. Расчет параметров линейной функции на основании исходных данных по областям. Определение среднего коэффициента эластичности. Расчет коэффициента корреляции.
методичка [55,1 K], добавлен 02.06.2012Предмет, объект, цель, содержание и задачи анализа хозяйственной деятельности в современных условиях. Построение логических и математических моделей факторных систем. Построение факторной модели прибыли и расчет общего прироста результативного показателя.
контрольная работа [14,8 K], добавлен 28.01.2010Характеристика методов выполнения оценок параметров больших множеств по данным выборочного наблюдения. Особенности работы с большими массивами данных. Расчет основных показателей совокупности. Корреляционно-регрессионный анализ. Анализ рядов динамики.
курсовая работа [1,2 M], добавлен 24.08.2010Моделирование односекторной экономической системы. Построение графической, статистической и динамической моделей. Графики погашения внешних инвестиций. Моделирование двухсекторной экономической системы. Архитектура системы. Спецификация данных модели.
дипломная работа [1023,8 K], добавлен 16.12.2012Модели дискриминантного анализа. Эффективность классических западных и российских моделей предсказания банкротства. Отраслевая специфика. Описание статей, включающее характеристики выборки, метод, список факторов и прогнозную силу метода анализа.
реферат [68,6 K], добавлен 24.07.2016Обзор математических моделей финансовых пирамид. Анализ модели динамики финансовых пузырей Чернавского. Обзор модели долгосрочного социально-экономического прогнозирования. Оценка приоритета простых моделей. Вывод математической модели макроэкономики.
курсовая работа [1,7 M], добавлен 27.11.2017Методы анализа детерминированных моделей. Построение моделей факторного анализа. Методы анализа стохастических моделей. Методы оптимизации в экономическом анализе. Методы комплексного анализа. Рейтинговая оценка финансового состояния.
курсовая работа [47,9 K], добавлен 12.05.2008Понятие экономического анализа как науки, его сущность, предмет, общая характеристика методов и социально-экономическая эффективность. Основные группы эконометрических методов анализа и обработки данных. Факторный анализ экономических данных предприятия.
реферат [44,7 K], добавлен 04.03.2010Этапы корреляционно-регрессионного анализа, построение корреляционной модели и определение функции, отражающей механизм связи между факторным и результативным признаками. Измерение тесноты корреляционной связи, расчет индекса корреляции и дисперсии.
лекция [38,1 K], добавлен 13.02.2011Моделирование оценки стоимости финансовых инструментов инвестирования. Основные модели, используемые при формировании текущей рыночной цены акций и облигаций. Моделирование рациональной структуры инвестиционного портфеля. Методы оценки инвестиций.
курсовая работа [680,9 K], добавлен 16.04.2015Элементы, критерии и типы экономической системы. Смешанная экономика: сущность и модели. Сравнительный анализ основных социально-экономических моделей развитых стран. Неоиндустриальная модернизация в современной России. Инновационный путь развития.
курсовая работа [32,4 K], добавлен 10.04.2016