Моделирование денежных потоков по портфелю ипотечных кредитов
Рассмотрение основных подходов к моделированию рисков наступления досрочного погашения, дефолта и реализации залога. Проверка правильности спецификации модели и выбор наилучшей модели денежных потоков. Изучение переменных, участвующих в исследовании.
Рубрика | Экономико-математическое моделирование |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 30.01.2016 |
Размер файла | 1,2 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Далее предполагают некоторую функциональную зависимость коэффициента при регрессоре с номером u от времени, например,
,
где - константа (коэффициент наклона), а - некоторая функция времени.
Понятно, что если гипотеза о пропорциональности рисков верна, то . Grambsch, Therneau предложили способ взвешивания остатка, так что взвешенный остаток удовлетворяет соотношению:
Формальный статистический тест - основан на оценке линейной регрессии на или Наряду с проверкой наличия временной зависимости в отдельном регрессоре, можно тестировать в целом гипотезу о нулевом коэффициенте наклона в модели. Также об остатках Шонефельда можно прочитать в работе [28].
Для выбора лучшей модели среди параметрических спецификаций, различают ситуации, когда модели является вложенными или невложенными.
Если модели вложенные, то выбор лучшей среди них осуществляется с помощью критерия отношения правдоподобия или теста Вальда. Например, если мы тестируем регрессию Вейбулла против экспоненциальной регрессии, или гамма регрессию против логнормальной.
В случае, если модели не являются вложенными, выбор наилучшей среди подогнанных параметрических спецификаций можно проводить с помощью информационного критерия Акаике:
,
где p - число оцениваемых параметров и lnL - логарифмическая функция правдоподобия. Лучшей считается модель с наименьшим значением критерия Акаике.
С практической точки зрения, при выборе между непараметрической и параметрической моделями можно руководствоваться следующими аргументами. Основной довод в пользу непараметрической модели - отсутствие ограничений на опорное распределение, возможность получать оценки коэффициентов при регрессорах, не определяя вид функции риска или дожития. Хотя можно оценить модель Кокса, а затем интегральную функцию риска по формуле Бреслоу (10), однако восстановленное распределение будет несобственным. Параметрический анализ может быть предпочтительнее, если важны не только коэффициенты модели, но и опорное распределение. Например, для определения временной зависимости или экстраполяции функций дожития и риска за пределы наблюдаемых значений длительности.
В настоящем исследовании будем по возможности подгонять под данные и параметрическую, и непараметрическую модели. В этом случае для выбора лучшей модели нельзя опираться на критерий Акаике. Будем, к примеру, сравнивать модели по прогнозной силе.
С этой целью разбивают выборку на 2 части: обучающую часть и тестовую часть. На обучающей части данных оценивают основные модели и проверяют правильность спецификаций графически с помощью анализа остатков Кокса-Снелла.
Для проверки прогнозной силы моделей воспользуемся тестовой частью выборки и будем проверять, насколько точно прогнозирует каждая из моделей с помощью:
· Визуального анализа на основании анализа остатков Кокса-Снелла;
· Формального анализа на основании ранговых коэффициентов.
Для проведения визуального анализа рассчитаем остатки Кокса-Снелла для обеих моделей на данных из тестовой части выборки, воспользовавшись оценками коэффициентов и параметров, полученных в результате оценивания моделей на обучающей части выборки, а затем построим графики оценок NA для остатков. Сравним модели между собой с точки зрения качества подгонки.
Формальный анализ будем проводить с помощью коэффициента Somer's D. Это ранговый коэффициент из семейства ранговых коэффициентов Кендала (наряду с коэффициентом Harrel's C) и описывает ранговую корреляцию между прогнозируемым и реальным временем жизни. Этот коэффициент удобен тем, что хорошо распространяется на цензурированные данные. Подробнее можно прочитать в статье Roger B. Newson [22].
Для оценки прогнозной силы отобранных моделей с помощью индекса Somer's D автор рекомендует следовать следующему алгоритму.
На обучающей выборке оцениваются 3 модели Кокса: на полном наборе факторов и 2 модели - на части факторов. По результатам оценивания каждой из моделей создаются соответственно переменные invhr1, invhr2, и invhr3, равные обратной величине относительного риска hazard ratio. По определению относительный риск - это потенциированное значение линейного прогноза, то есть exp(x). Смысл использования обратных отношений риска состоит в том, чтобы получить положительный предиктор времени жизни. Переменные invhr1, invhr2, и invhr3 создаются как для наблюдений обучающей части данных, так и тестовой. Далее на наблюдениях тестовой части выборки рассчитывается индекс Somers' D для всех трех моделей с помощью соответствующей команды Stata.
Далее три модели сравнивают между собой с помощью команды lincom, рассчитывающей точечные оценки и доверительные интервалы для некоторого класса функций от предсказанной линейной комбинации факторов x. На основании полученных оценок делается вывод о выборе модели, обладающей наибольшей прогнозной силой.
Аналогичные манипуляции проводятся для подогнанной параметрической спецификации. А именно, на тестовой части выборки оцениваются 3 модели на том же наборе факторов и сравниваются между собой, используя квантили medsurv1, medsurv2, medsurv3 - предсказанные медианы времени жизни. Для наблюдения с номером j medsurvj = {t:. Прогнозная медиана времени жизни является альтернативным (по отношению к обратной величине риска invhr) положительным предиктором времени жизни.
Выводы, полученные для изученных спецификаций, сопоставляются и принимается итоговое решение по выбору модели, обладающей наибольшей прогнозной силой - это модель, у которой значение индекса Somer's D выше.
3. Переменные, участвующие в исследовании
Для исследования риска наступления досрочного погашения, дефолта и риска реализации залога с помощью регрессионных моделей мы отобрали факторы (регрессоры x), характеризующие портрет основного заемщика, а также факторы, описывающие параметры самого кредита и предмета ипотеки, находящегося под залогом. Для описания портрета основного заемщика (это заемщик, на которого оформлен кредитный договор) отобраны следующие факторы: пол, возраст, семейный статус основного заемщика, уровень образования, вид занятости.
Признаки, характеризующие непосредственно кредит: срок кредита, процентная ставка, общее число созаемщиков (включая основного заемщика), а также очень распространенные в различных ипотечных исследованиях показатели: коэффициент LTV (loan to value), равный отношению суммы кредита к стоимости жилья на момент выдачи кредиты, и коэффициент PTI, равный отношению ежемесячного платежа к совокупному доходу созаемщиков на момент выдачи кредита. Признаки, описывающие параметры предмета ипотеки: регион предмета ипотеки, тип жилья (квартира/дом), количество комнат, соотношение жилой площади и общей площади и др.. Также для анализа сконструирован показатель, представляющий, по-нашему мнению, интерес для заемщика. Это показатель в начальном приближении показывает переплату за жилье, то есть характеризует психологическую готовность заемщика платить по кредиту, и рассчитывается как отношение совокупных денежных выплат по кредиту за весь срок жизни (плановый срок, по графику) к стоимости жилья, то есть равен (Аннуитет*Срок)/Стоимость.
Все факторы организованы как dummy переменные. Определим их:
Переменные, характеризующие портрет основного заемщика:
age_28 - принимает значение 1, если возраст основного заемщика на момент среза данных (на 1 января 2014 года) не превосходит 28 лет и 0 - в противном случае;
age_35 - принимает значение 1, если возраст основного заемщика на момент среза данных (на 1 января 2014 года) не превосходит 35 лет и 0 - в противном случае;
age_45 - принимает значение 1, если возраст основного заемщика на момент среза данных (на 1 января 2014 года) от 45 лет и старше и 0 - в противном случае;
age_50 - принимает значение 1, если возраст основного заемщика на момент среза данных от 50 лет и старше и 0 - в противном случае;
sex - принимает значение 1, если пол основного заемщика - женщина и 0 - если мужчина;
marital - принимает значение 1, если основной заемщик женат/замужем и 0 - в противном случае;
educ_level1 - принимает значение 1, если основной заемщик имеет высшее образование или ученые степени и 0 - в противном случае;
educ_level2 - принимает значение 1, если основной заемщик имеет незаконченное высшее образование или среднее специализированное образование и 0 - в противном случае;
При этом категория, получающаяся пересечением двух предыдущих переменных (одновременно выполняется educ_level1 = 0 , educ_level2 = 0) характеризует заемщиков, имеющих начальное или среднее образование.
employm_1 - принимает значение 1, если заемщик является наемным работником и 0 - в противном случае;
employm_2 - принимает значение 1, если заемщик является госслужащим или военным;
При этом категория, получающаяся пересечением двух предыдущих переменных, соответствует заемщикам, являющихся пенсионером, студентом, индивидуальным предпринимателем или не имеющим определенного вида занятости.
mainborr_contr_07 - принимает значение 1, если доля дохода основного заемщика в общем доходе не превосходит 0.7 и 0 - в противном случае;
Переменные, характеризующие параметры кредита:
rate_11 - принимает значение 1, если годовая кредитная ставка менее 11.5% и 0 - в противном случае;
rate_14 - принимает значение 1, если годовая кредитная ставка не менее 14.5% и 0 - в противном случае;
term_60 - принимает значение 1, если срок кредита по графику составляет не более 60 месяцев (5 лет) и 0 - в противном случае;
term_120 - принимает значение 1, если срок кредита по графику составляет не более 120 месяцев (5 лет) и 0 - в противном случае;
term_180 - принимает значение 1, если срок кредита по графику не менее 180 месяцев (15 лет) и 0 - в противном случае;
Максимальный срок кредита (по графику) в портфеле Агентства составляет 30 лет (360 месяцев).
cobor_1 - принимает значение 1, если в кредитном договоре только основной заемщик (без созаемщиков) и 0 - в противном случае;
cobor_3 - принимает значение 1, если в кредитном договоре не менее трех созаемщиков (включая основного заемщика);
PTI_20 -принимает значение 1, если доля ежемесячного платежа в совокупном ежемесяном доходе заемщиков составляет не более 20% и 0 - в противном случае;
PTI_35 - принимает значение 1, если доля ежемесячного платежа в совокупном ежемесячном доходе заемщиков составляет более 35% и 0 - в противном случае;
Согласно Стандартам Агентства (свод правил по выдаче кредитов) максимальное значение коэффициента PTI на момент выдачи кредита не должно превышать 50%.
LTV_50 - принимает значение 1, если доля заемных (кредитных) средств в стоимости жилья составляет менее 50% и 0 - в противном случае;
LTV_70 - принимает значение 1, если доля заемных (кредитных) средств в стоимости жилья составляет более 70% и 0 - в противном случае;
Согласно Стандартам Агентства (свод правил по выдаче кредитов) максимальное значение коэффициента LTV на момент выдачи кредита не должно превышать 90%.
payed_sum1 - принимает значение 1, если отношение совокупных денежных выплат за плановый срок жизни кредита к стоимости жилья составляет не более 1 и 0 - в противном случае;
payed_sum2 - принимает значение 1, если отношение совокупных денежных выплат за плановый срок жизни кредита к стоимости жилья составляет не менее 1.82 и 0 - в противном случае.
Показатели, характеризующие параметры жилого помещения, находящегося под залогом:
region_1 - принимает значение 1, если предмет ипотеки находится в развитом регионе (top 10 регионов согласно рейтингу социально-экономического положения субъектов РФ по итогам 2013 года рейтингового Агентства "РИА Рейтинг") и 0 - в противном случае.
Согласно рейтингованию к развитым регионам относят Москву, Санкт-Петербург, Московскую область, Пермский край, республику Татарстан, Самарскую область, Свердловскую область, Тюменскую область, Ханты-Мансийский А.О. - Югра, Ямало-Ненецкий А.О.
region_3 - принимает значение 1, если предмет ипотеки находится в недостаточно развитом регионе (последние 10 мест в рейтинге) и 0 - в противном случае.
К недостаточно развитым регионам относят Еврейская А.О., Кабардино-Балкурскую республику, Карачаево-Черкесскую республику, республику Алтай, республику Ингушетию, республику Калмыкию, республика Северная Осетию-Аланию, республику Тыву, Чеченскую республику, Чукотский А.О.
Промежуточная категория соответствует умеренно развитым регионам и объединяет оставшиеся 64 региона.
Рейтинг социально-экономического положения регионов строился на основе агрегирования групп показателей, характеризующих экономическую, социальную и бюджетную сферы. Подробнее о принципах рейтингования регионов можно ознакомиться в [4].
realty_flat - принимает значение 1, если тип недвижимости под залогом - квартира и 0 - в противном случае;
realty_house - принимает значение 1, если тип жилья под залогом - дом или таунхаус и 0 - в противном случае;
К промежуточной категории относятся комната или иное - тип жилого помещения, не относящийся ни к одному из вышеперечисленных объектов.
rooms_1 - принимает значение 1, если количество комнат в предмета ипотеки равно 1 и 0 - в противном случае;
rooms_3 - принимает значение 1, если количество комнат в предмета ипотеки не менее 3 и 0 - в противном случае;
live_tot_05 - принимает значение 1, если соотношение жилой и общей площади предмета ипотеки не превосходит 0.49 и 0 - в противном случае;
live_tot_06 - принимает значение 1, если соотношение жилой и общей площади предмета ипотеки не превосходит 0.6 и 0 - в противном случае;
live_tot_07 - принимает значение 1, если соотношение жилой и общей площади предмета ипотеки не менее 0.7 и 0 - в противном случае;
floor_num_9 - принимает значение 1, если число этажей в жилом помещении не выше 9 и 0 - в противном случае.
При создании вышеперечисленных переменных частично были исправлены некорректные данные, возникшие вследствие операционной ошибки (ошибка при вводе данных в базу данных). Для тех кредитов, где имелась необходимая информация, были произведены корректировочные расчеты некоторых показателей (PTI, LTV), выходящих за границы допустимых значений. Например, значения PTI, превосходящие 50%, были пересчитаны согласно общей формуле, и в большинстве случаев расчетные значения удовлетворяли нормативам.
В следующей таблице перечислены объясняющие переменные для оценивания следующих регрессионных моделей длительности состояния:
· Модель 1 - для исследования риска наступления досрочного погашения;
· Модель 2 - для исследования риска наступления дефолта;
· Модель 3 - для исследования риска реализации залога.
При этом знак плюс "+" указывает на вхождение переменной в соответствующую модель, знак минус "-" - на ее отсутствие.
Таблица 3. Объясняющие переменные для исследования моделей длительности
Переменные |
Модель 1 |
Модель 2 |
Модель 3 |
|
age_28 |
- |
+ |
- |
|
age_35 |
+ |
- |
- |
|
age_45 |
- |
+ |
- |
|
age_50 |
+ |
- |
- |
|
sex |
+ |
+ |
+ |
|
marital |
+ |
+ |
+ |
|
educ_level1 |
+ |
+ |
+ |
|
educ_level2 |
+ |
+ |
- |
|
employm_1 |
+ |
+ |
- |
|
employm_2 |
+ |
+ |
- |
|
mainborr_contr_07 |
- |
- |
+ |
|
rate_11 |
+ |
- |
- |
|
rate_14 |
+ |
- |
- |
|
term_60 |
+ |
- |
- |
|
term_120 |
- |
+ |
+ |
|
term_180 |
+ |
+ |
+ |
|
cobor_1 |
+ |
+ |
- |
|
cobor_3 |
+ |
+ |
- |
|
PTI_20 |
+ |
+ |
- |
|
PTI_35 |
+ |
+ |
- |
|
LTV_50 |
+ |
+ |
+ |
|
LTV_70 |
+ |
+ |
+ |
|
payed_sum1 |
+ |
+ |
- |
|
payed_sum2 |
+ |
+ |
- |
|
region_1 |
+ |
+ |
+ |
|
region_3 |
+ |
+ |
- |
|
realty_flat |
- |
+ |
- |
|
realty_house |
+ |
+ |
+ |
|
rooms_1 |
+ |
+ |
+ |
|
rooms_3 |
+ |
+ |
- |
|
live_tot_05 |
+ |
+ |
- |
|
live_tot_06 |
- |
- |
+ |
|
live_tot_07 |
+ |
+ |
- |
|
floor_num_9 |
- |
- |
+ |
4. Результаты исследования
Все расчеты, сделанные в настоящем исследовании, произведены в пакете Stata.
Моделирование риска наступления досрочного погашения.
1) Одномерный анализ.
В предположении независимости целевых функций от индивидуальных характеристик кредита, а только от времени жизни кредита, получены оценка Каплана-Майера (KM) функции дожития (см. формулу (7)) и оценка Нельсона-Аалена (NA) интегральной функции риска (см. формулу (8)) для события досрочное погашение:
денежный дефолт залог моделирование
Рис. 3 Оценка KM функции дожития
Рис. 4 Оценка NA интегральной функции риска
На следующем рисунке приведена оценка функции риска:
Рис. 5 Оценка функции риска
По горизонтальной оси отложено время жизни кредита в днях. Видим, что максимальный срок жизни составляет около 4000 дней, то есть около 11 лет.
Первый горизонтальный участок оцененной функции дожития показывает, что в начале жизни кредиты не гасятся. Начиная с отметки в 3800 дней, функция дожития снова стабилизируется и досрочных погашений практически не наблюдается. Видим, что доля кредитов, проживших не менее 10 лет, составляет менее 20% портфеля. Данная стремительная динамика показывает, что благодаря досрочному погашению реальный срок жизни кредита радикально сокращается, и ипотечный портфель истощается.
Интегральная функция риска растёт возрастающим темпом, так что видна положительная временная зависимость: среди кредитов, проживших уже продолжительное время, вероятность наступления досрочного погашения выше, чем среди недавно выданных кредитов.
Неожиданный всплеск оценённой функции риска после отметки в 3000 дней может быть случайным следствием малого количества наблюдений в этой области. Значение функции риска в каждый такт времени характеризует вероятность наступления досрочного погашения в предположении, что это событие не наступило ранее.
2) Модели с объясняющими переменными.
Для построения функции риска наступления досрочного погашения с помощью регрессионных моделей мы отобрали следующие факторы:
· Переменные, описывающие портрет основного заемщика:
age_35, age_50, sex, marital, educ_level1, educ_level2, employm_1, employm_2.
· Переменные, характеризующие параметры кредита:
rate_11, rate_14, term_60, term_180, cobor_1, cobor_3, PTI_20, PTI_35, LTV_50, LTV_70, payed_sum1, payed_sum2
· Показатели, характеризующие параметры жилого помещения, находящегося под залогом:
region_1, region_3, realty_house, rooms_1, rooms_3, live_tot_05, live_tot_07.
Описание вышеперечисленных переменных для моделирования риска наступления досрочного погашения содержится в части IV настоящего исследования.
Далее для построения моделей длительности определим еще 2 переменные: переменную, характеризующая длительность состояния и индикатор прекращения состояния.
time_to_prep - время до наступления досрочного погашения или конца наблюдения в днях,
censor_prep - индикатор досрочного погашения кредита (1 - кредит погашен и 0 - в противном случае)
Укажем, что переменная time_to_prep есть длительность, а переменная censor_prep - индикатор прекращения состояния:
Видим, что из 286 072 наблюдений по 118 186 наступило досрочное погашение. В строчке "earliest observed entry" приводится наименьшее время жизни кредита на момент первого наблюдения за ним. В нашем случае все кредиты наблюдались с момента их выдачи, так как усечение слева отсутствует. Строчка "last observed exit" содержит наибольшую длительность в выборке - в нашем случае она соответствует цензурированному наблюдению.
Данные случайным образом разбиваются на 2 части: обучающая выборка (60% данных), на которой мы строим различные модели и контрольная выборка (40% данных), которая используется для оценки качества прогнозирования моделей.
Подгонка моделей.
На тестовой части выборки произведена оценка регрессии Кокса с помощью процедуры Бреслоу оценки коэффициентов для связных событий:
Модель в целом оказывается значимой, поскольку p-value модели равно 0.
Почти все оценки коэффициентов получились значимыми. Направления связи регрессоров с функцией риска в целом соответствуют нашим ожиданиям и не противоречат здравому смыслу.
Для проверки правильности спецификации модели Кокса проведен анализ остатков Кокса-Снелла (см. формулу (14)). Посмотрим на график оценки Нельсона-Аалена для остатков Кокса-Снелла (KS):
Рис. 6 Оценка NA для остатков KS в модели Кокса
На графике не видно заметных отступлений от линейности, так что регрессия Кокса демонстрирует отличную подгонку наших данных. Поэтому анализ остатков Кокса-Снелла не даёт веских оснований считать выбранную спецификацию ошибочной. Заметим, что модель Кокса чуть-чуть занижает риск наступления досрочного погашения.
Отмечаем, что на риск наступления досрочного погашения наиболее сильно влияет срок кредита. Оцененное направление влияния регрессора на целевую функцию свидетельствует об уменьшении риска наступления досрочного погашения по мере увеличения срока кредита. А именно, если кредит выдан на короткий срок до 60 месяцев (до 5 лет), то для него риск наступления досрочного погашения в = 2.5 раза выше, чем для кредита, выданного на срок от 60 до 180 месяцев (15 лет) при прочих равных характеристиках. В то же время для кредита, выданного на длительный срок не менее 15 лет, риск наступления досрочного погашения меньше в = 1.27 раз, чем для кредита из группы со средним сроком кредитования от 5 до 15 лет при прочих равных. Выявленная отрицательная зависимость досрочного погашения от срока кредита (чем длиннее срок кредита, тем меньше риск наступления досрочного погашения) не оправдала наших априорных ожиданий. Мы рассчитывали увидеть обратную динамику, объясняя наши ожидания психологическим фактором - неуверенностью в завтрашнем дне. Однако полученную зависимость можно понимать так: среднестатистический заемщик имеет, как правило, только трудовой доход и "лишних" денег (для совершения досрочного погашения) у него нет. Поэтому длинные сроки кредитования позволяют ослабить долговую нагрузку на бюджет, уменьшив размер ежемесячного платежа за счет увеличения срока, тем самым сделав выполнение ежемесячных долговых обязательств не столь обременительным для заемщика. Высокая интенсивность досрочного погашения в случае краткосрочных кредитов может быть обусловлена тем, что заемщик брал кредит на минимальный срок, ожидая денежных поступлений в недалеком будущем.
Показатель PTI является одним из ключевых факторов при исследовании досрочного погашения. Выявленное направление связи регрессора с целевой функцией ожидаемое и правильное. С увеличением значения показателя PTI, то есть с увеличением долговой нагрузки, заемщик менее интенсивно осуществляет досрочное погашение. Так, если доля платежа в доходе заемщика (или совокупном доходе созаемщиков) составляет не более 20%, то при прочих равных характеристиках риск наступления досрочного погашения по такому кредиту в = 1.4 раза выше, чем для кредитов с показателем PTI, принимающем значения в диапазоне от 20% до 35%. Если доля платежа в доходе заемщика высока и составляет более 35%, то риск наступления досрочного погашения в = 1.14 раз меньше, чем для группы кредитов с PTI в диапазоне от 20% до 35%.
Отметим, что данный вывод не противоречит рассуждениям, изложенным в части I настоящего исследования, где мы рассматривали изменение платежеспособности заемщика в качестве возможного фактора, влияющего на досрочное погашение. Платежеспособность заемщика может быть измерена с помощью показателя PTI. Не смотря на то, что изменение платежеспособности - это динамический показатель, то есть меняющийся во времени, включение в модель стационарного фактора PTI, представляющего собой долю платежа в доходе на момент выдачи кредита, уже демонстрирует заметное влияние данной величины на целевую функцию. Построение динамического фактора требует информации об изменениях дохода заемщика, что редко отражается в базе данных корректно, а чаще просто не предоставляется.
Отметим также существенное влияние на целевую функцию однокомнатного жилья. Так, если предмет ипотеки - однокомнатное жилье, то при прочих равных характеристиках риск наступления досрочного погашения в = 1.33 раза выше, чем для двухкомнатного предмета ипотеки.
Наличие высшего образования или ученой степени у заемщика также заметно увеличивает риск наступления досрочного погашения по сравнению с заемщиками, имеющими начальное или среднее образование. В то же время наличие незаконченного высшего или средне-специального образования вообще является незначимым признаком.
Среди значимых факторов, увеличивающих интенсивность досрочного погашения можно выделить кредитную ставку, тип занятости основного заемщика, возраст основного заемщика до 35 лет, показатель LTV. Если тип занятости основного заемщика - наемный работник или госслужащий/военнослужащий, то риск наступления досрочного погашения по кредиту при прочих равных характеристиках выше, чем в группе кредитов, где заемщик является либо студентом, либо пенсионером, либо индивидуальным предпринимателем, либо не имеет определенного вида занятости. С увеличением показателя LTV, то есть доли заемных средств в стоимости жилья, риск наступления досрочного погашения снижается, причем более значимо различие между группой кредитов с LTV, превышающим 70% и группой кредитов с LTV в диапазоне от 50% до 70%.
Также интересно направление связи возраста основного заемщика и риска наступления досрочного погашения. При прочих равных характеристиках, если возраст заемщика до 35 лет, то досрочное погашение происходит интенсивнее, чем в группе заемщиков от 35 до 50 лет. В то же время в группе пожилых заемщиков от 50 лет и старше, досрочное погашение также наступает чаще, чем в группе заемщиков среднего возраста, хотя данный эффект и не такой сильный, как предыдущий. Таким образом, группа кредитов с заемщиками среднего возраста от 35 до 50 лет, наиболее инертна с точки зрения осуществления досрочного погашения. Данный эффект можно объяснить повышенными расходами на воспитание/образование детей или самообразование, поскольку заемщики этого возраста - экономически активная часть населения, имеющая, как правило, детей школьного возраста. Так, из 127 000 кредитов, выданных заемщикам в возрасте от 35 до 50 лет, по 82 565 кредитам есть информация о детях младше 18 лет. Из них у 72 280 заемщиков есть по крайней мере один ребенок младше 18 лет, что составляет 88% от общего числа заемщиков, по которым информация о детях младше 18 лет заполняется корректно.
Не слишком значительным оказалось влияние кредитной ставки на интенсивность досрочного погашения. Вероятно, для исследования влияния ставки лучше использовать другой показатель - стимул рефинансирования С/R, равный отношению собственной кредитной ставки coupon rate к рыночной ставке prevailing rate (ставке рефинансирования) по кредитам с аналогичными характеристиками. В американских исследованиях данный показатель является одной из важнейших детерминант досрочного погашения (см. часть I настоящего исследования), причем интересен весь ряд значений (C/R)t с момента выдачи кредита. Для включения в модель динамического фактора (C/R)t необходимо расширить исходную постановку задачи, допустив возможность регрессорам меняться во времени. Это отдельная задача, подробнее о ней можно прочитать, например, в [10], [11].
Далее отмечаем, что женщины более инертны с точки зрения осуществления досрочного погашения. Если основной заемщик - женщина, то при прочих равных риск наступления досрочного погашения ниже в = 1.09 раз, чем у мужчин.
Отметим несущественное влияние на целевое событие региона предмета ипотеки. Если предмет ипотеки находится в недостаточно развитом регионе, то при прочих равных условиях риск наступления досрочного погашения меньше в = 1.12 раз, чем в умеренно развитых регионах. В развитых регионах интенсивность осуществления досрочного погашения незначительно выше, чем в умеренно развитых регионах, однако данный признак не слишком значимый.
Также несильно на целевое событие влияет фактор, характеризующий соотношение жилой и общей площади в предмете ипотеки. Однако направление влияния регрессоров на целевую функцию довольно интересно и представляется логичным. Если доля жилой площади в общей площади жилья невысока менее 50% (новые планировки с большими коридорами и кухнями) или, наоборот, высока более 70% (жилье старого типа, например, хрущевки с маленькой кухней), то заемщики инертны в осуществлении досрочного погашения. В то же время существует некая оптимальная планировка жилья, характеризуемая определенным соотношением жилой и общей площади, при которой интенсивность осуществления досрочного погашения максимальна.
Что касается остальных признаков, перечисленных в части I настоящего исследования, а именно влияние миграции населения и изменение состава семьи, на интенсивность досрочного погашения, то включение их в модель хотя и было бы интересно, однако на текущий момент не представляется возможным. Это связано с отсутствием данной информации в базе данных Агентства.
Для подгонки параметрической спецификации, исследуется характер временной зависимости. Для этого посмотрим на график оценки опорного интегрального риска, который получается при равенстве нулю всех регрессоров:
Рис. 7. Оценка опорной функции интегрального риска
График свидетельствует о положительной временной зависимости - скорость роста интегрального риска возрастает. Тот же результат мы получили ранее при анализе оценки Нельсона-Аалена по всей выборке без учёта регрессоров (см. рис. 4).
Ввиду положительной временной зависимости на данных построены модели Вейбулла и Гомперца.
В результате оценивания регрессии Вейбулла оценка параметра формы = 1.74869, что подтверждает вывод о положительной временной зависимости (p>1).
Для проверки правильности данных параметрических спецификаций посмотрим на оценки NA интегральной функции риска для остатков KS:
Рис. 8 Оценка NA для остатков KS в регрессии Вейбулла
Рис. 9. Оценка NA для остатков KS в регрессии Гомперца
Судя по графикам оценок, модель Вейбулла лучше описывает данные, нежели модель Гомперца, но заметно хуже, чем модель Кокса (см. рис. 6).
Также подгоним к данным AFT модель обобщенной гамма регрессии, поскольку это наиболее гибкая из всех моделей.
В результате оценивания обобщенной гамма регрессии получаем:
Поскольку 95%-доверительный интервал для оцененного параметра к не содержит 1, то модель Вейбулла не подходит для описания наших данных. Этот вывод также подтверждает формальный тест Вальда, проверяющий, является ли соответствующая модель вложенной (nested model).
Результаты проверки гипотезы о том, что тестируемая модель - модель Вейбулла:
Видим, что нулевая гипотеза однозначно отвергается. Таким образом, регрессия Вейбулла не годится для описания наших данных.
Графический анализ остатков Кокса-Снелла доказывает правильность спецификации модели обобщенной гамма регрессии:
Рис. 10. Оценка NA для остатков КS в гамма регрессии
Визуально гамма модель обеспечивает отличную подгонку наших данных. Отметим, что гамма модель чуть-чуть завышает риск наступления досрочного погашения.
Теперь поговорим об оценках коэффициентов модели. Поскольку гамма регрессия - это модель AFT, то при оценивании таких моделей Stata приводит оценки коэффициентов без потенцирования. В данном случае интерпретация возможна, как через среднее время до наступления события, так и через ускорение или замедление времени.
Незначимыми оказываются те же признаки, что и при оценивании регрессии Кокса: индикатор незаконченного высшего образования educ_level2, индикатор того, что предмет ипотеки находится в развитом регионе region_1. Чуть менее значимым стал признак marital - семейный статус основного заемщика, но он по-прежнему значим на 10% уровне.
По степени убывания влияния на момент наступления досрочного погашения можно выделить те же факторы, что и в регрессии Кокса. Перечислим некоторые.
Итак, при прочих равных условиях момент наступления досрочного погашения при сроках кредита до 60 месяцев приближается в = 1.7 раз быстрее, чем в группах кредитов со средним сроком кредитования от 60 до 180 месяцев. Этот результат согласуется с выводами, полученными при оценивании регрессии Кокса. Напомним, там риск наступления досрочного погашения убывал с ростом срока кредита, а наибольший риск приходился на короткие сроки до 5 лет.
Существенным образом на время наступления досрочного погашения влияет коэффициент PTI. Если доля платежа в совокупном доходе по кредиту не превышает 20%, то момент досрочного погашения при прочих равных приближается в = 1.26 раз быстрее, чем для кредитов со средним PTI от 20% до 35%.
При условии, что предмет ипотеки - однокомнатное жилье, при прочих равных момент наступления досрочного погашения приближается в = 1.2 раза быстрее, чем для двухкомнатного жилья.
По результатам оценивания гамма регрессии можно оценить функции дожития (Survival Function SF) при различных значениях факторов. Так, например, факторами, наибольшим образом влияющими на интенсивность досрочного погашения, являются срок кредита и показатель PTI.
Вот, как выглядят функции дожития при различных значениях срока кредита и показателя PTI при условии, что все остальные переменные равны 0:
Рис. 11. Оценка SF при различных сроках кредита
Рис. 12. Оценка SF при различных значениях PTI
Видим, что с уменьшением срока кредита вероятность дожития уменьшается, по мере снижения значения показателя PTI вероятность дожития кредита уменьшается.
Выбор наилучшей модели.
Выбор модели, наилучшим образом подгоняющей данные, производится в соответствии с изложенным в части III.II настоящей работы алгоритме.
Для выбора среди параметрических спецификаций воспользуемся критерием AIC. Рассчитаем соответствующие значения AIC подогнанных моделей:
Таблица 4. Значения AIC для оцененных моделей
Модель |
AIC |
|
Вейбулла |
268 351.5 |
|
Гомперца |
275 890.8 |
|
Гамма |
267 570.3 |
Согласно критерию Акаике гамма регрессия наилучшим образом описывает данные среди всех подогнанных параметрических спецификаций. Таким образом, и формальный, и визуальный тест говорят в пользу гамма регрессии.
Для выбора между непараметрической моделью пропорциональных рисков Кокса и параметрической AFT моделью обобщенной гамма регрессии, сравним их по прогнозной силе.
Для визуального анализа рассчитываются остатки Кокса-Снелла для обеих моделей на данных из тестовой части выборки, воспользовавшись оценками коэффициентов и параметров, полученных в результате оценивания моделей на обучающей части выборки.
Тогда графики оценок NA для остатков KS:
Рис. 13. Оценка NA для остатков KS в регрессии Кокса на тестовой выборке
Рис. 14 Оценка NA для остатков KS в гамма регрессии на тестовой выборке
Видим, что гамма регрессия точнее прогнозирует вне выборки, хотя отступление от биссектрисы в регрессии Кокса на правом хвосте связано с небольшим количеством наблюдений в данной области.
Формальный анализ производится с помощью рангового коэффициента Somer's D. На обучающей выборке оценим 3 модели Кокса: на полном наборе факторов (27 факторов) и 2 модели - на части факторов (модель 2 - на 19 факторах, модель 3 - на 11 факторах). По результатам оценивания создадим переменные invhr1, invhr2, и invhr3, равные обратной величине относительного риска hazard ratio. Далее на наблюдениях контрольной части выборки рассчитываем индекс Somers' D для всех трех моделей:
Сравним прогнозную силу оцененных моделей:
Результаты сравнения показывают, что модели немного различаются: максимальное различие наблюдается между моделями 1 и 3, чуть меньше различаются модели 1 и 2. Из оценки заключаем, что модель с полным набором факторов (модель 1) обладает наибольшей прогнозной силой.
Повторим аналогичные манипуляции для гамма регрессии, то есть на тестовой части выборки оценим 3 модели на том же наборе факторов и сравним их между собой, используя квантили medsurv1, medsurv2, medsurv3 - предсказанные медианы времени жизни. Далее на наблюдениях тестовой части выборки рассчитываем индекс Somers' D для всех трех моделей:
Теперь сравним прогнозную силу моделей:
В целом, результаты аналогичны выводам, полученным ранее для модели Кокса. Модели различаются, и модель с полным набором факторов обладает наибольшей прогнозной силой.
Если сравнивать между собой регрессию Кокса и гамма регрессию, опираясь на индекс Somers' D, то можно сказать, что гамма регрессия незначительно лучше прогнозирует вне выборки. Этот формальный вывод согласуется с результатами визуального анализа графиков оценок NA для остатков Кокса-Снелла (см. рис. 13 и 14), построенных на тестовой выборке. Поскольку разница между моделями не очень значительная, обе годятся для целей исследования. Единственное хоть как-то значимое различие, которое говорит в пользу гамма регрессии - это то, что её можно распространить на правый хвост.
Моделирование риска наступления дефолта.
1) Одномерный анализ.
При упрощенном подходе к моделированию получены оценка Каплана-Майера (KM) функции дожития (см. формулу (7)) и оценка NA интегральной функции риска (см. формулу (9)) в зависимости от времени жизни кредита:
Рис. 15 Оценка KM функции дожития.
Рис. 16 Оценка NA интегральной функции риска
Видим, что функция дожития практически не убывает, событие дефолт наступает для небольшого количества кредитов, а после отметки 2000 дней дефолтов практически не наблюдается. Интегральная функция риска растёт убывающим темпом, так что существует отрицательная временная зависимость: среди кредитов, проживших уже продолжительное время, доля дефолтов меньше, чем среди недавно выданных кредитов.
2) Модели с объясняющими переменными.
Для исследования риска наступления дефолта по кредиту используются следующие факторы:
· Переменные, описывающие портрет основного заемщика:
age_28, age_45, sex, marital, educ_level1, educ_level2, employm_1, employm_2,
· Переменные, характеризующие параметры кредита:
term_120, term_180, cobor_1, cobor_3, PTI_20, PTI_35, LTV_50, LTV_70, payed_sum1, payed_sum2.
Отметим, что выбор term_120 вместо term_60 (как в случае анализа риска наступления досрочного погашения) обусловлен тем, что дефолты редко возникают при небольших сроках кредита.
· Показатели, характеризующие параметры жилого помещения, находящегося под залогом:
region_1, region_3, realty_flat, realty_house, rooms_1, rooms_3, live_tot_05, live_tot_07.
Описание вышеперечисленных переменных для моделирования риска наступления дефолта содержится в части IV настоящего исследования.
Для анализа риска наступления дефолта по закладной из числа объясняющих факторов исключена кредитная ставка, поскольку в формулу для ставки как раз закладывается премия за риск утраты платежеспособности заемщиком (то есть риск наступления дефолта).
Укажем, что переменная time_to_default есть длительность, а переменная censor_del - индикатор прекращения состояния, то получим, что из 286 072 наблюдений событие дефолт по закладной наступило по 5069 наблюдениям:
Как и ранее поделим выборку на 2 части: тестовую (60% наблюдений) и контрольную (40% наблюдений).
Подгонка моделей.
Оценим, для начала, модель Кокса пропорциональных рисков:
Почти все оценки, кроме educ_level2, employ_2, sex значимы. Обращаем внимание, что при анализе досрочного погашения признак пол был значимым.
Правильность спецификации модели проверим с помощью оценки NA интегральной функции риска для остатков Кокса-Снелла:
Рис. 17 Оценка NA для остатков KS в регрессии Кокса
Анализ остатков Кокса-Снелла показывает, что выбранная спецификация неудачна и ставит под сомнение правомерность предположения о пропорциональности рисков в модели. Формальный тест, основанный на остатках Шонефельда, проверяющий данное предположение, дает следующий результат:
Нулевая гипотеза - в исследуемой модели риски пропорциональны. Видим, что нулевая гипотеза однозначно отвергается. Поэтому, видимо, подгонять под данные стандартные модели пропорциональных рисков бессмысленно.
Подгонка AFT моделей логнормальной, логлогистической (картинка остатков аналогична логнормальной регрессии) и гамма регрессии дает следующий результат:
Рис. 18 Оценка NA в логнормальной регрессии
Рис. 19 Оценка NA в гамма регрессии
Анализ остатков показывает, что гамма регрессия обеспечивает наилучшую подгонку к данным.
3) Модели с ненаблюдаемой разнородностью.
Поскольку в данных был выявлен ненаблюдаемый эффект, учтем выявленную разнородность при моделировании, добавив дополнительный параметр для оценивания: в одном случае - ненаблюдаемый эффект, в другом - вероятность принадлежности к классу кредитов, по которым наступает дефолт.
a) Модели с ненаблюдаемым эффектом.
Были оценены PH модели: Вейбулла и Гомперца, а также AFT модели: логнормальная и лог-логистическая регрессии, в каждую из которых добавлен фактор ненаблюдаемой разнородности.
Предполагаем, что ненаблюдаемый эффект имеет гамма-распределение с единичным математическим ожиданием и дисперсией ??. Сравним результаты на графиках NA и сопоставим с подгонкой, обеспечиваемой гамма регрессией.
При оценке каждой из регрессий с ненаблюдаемым эффектом гипотеза о том, что ненаблюдаемый эффект отсутствует, однозначно отвергается.
Проверку правильности спецификации подогнанных моделей проводим с помощью оценки NA интегральной функции риска для остатков Кокса-Снелла:
Рис. 20 Оценка NA для остатков KS в регрессии Вейбулла с ненаблюдаемым эффектом
Рис. 21 Оценка NA для остатков KS в регрессии Гомперца с ненаблюдаемым эффектом
Рис. 22 Оценка NA для остатков KS в логнормальной регрессии с ненаблюдаемым эффектом
Рис. 23 Оценка NA для остатков KS в логлогистической регрессии с ненаблюдаемым эффектом
Рис. 24 Оценка NA для остатков KS в гамма регрессии
Судя по графикам, наилучшую подгонку к данным обеспечивают гамма регрессия, немного ей уступает на правом хвосте логнормальная регрессия с ненаблюдаемым эффектом.
Посмотрим на оценки коэффициентов логнормальной регрессии с ненаблюдаемым эффектом и гамма регрессии:
Поговорим немного про оценки коэффициентов. Для этого воспользуемся результатами, полученными при оценивании гамма регрессии, поскольку модели с ненаблюдаемым эффектом не годятся для интерпретации.
Будем интерпретировать коэффициенты в терминах ускорения или замедления времени наступления дефолта. Напомним, что при оценивании AFT-моделей Stata приводит оценки коэффициентов без потенцирования.
Наиболее сильным образом на целевую функцию влияют: realty_house - индикатор того, что тип предмета ипотеки - дом или таунхаус, LTV_70 - индикатор того, что доля заемных средств в стоимости жилья превышает 70%, educ_level1 - наличие высшего образования у основного заемщика, region_3 - индикатор того, что предмет ипотеки находится в недостаточно развитом регионе, rooms_1 - индикатор того, что предмет ипотеки представляет собой однокомнатное жилье.
При прочих равных условиях в группе кредитов с предметом ипотеки - дом или таунхаус, момент наступления дефолта приближается в раз быстрее, чем в группе кредитов с предметом ипотеки - комната. При этом квартира является незначимым признаком с точки зрения влияния на целевое событие.
При прочих равных условиях в группе кредитов с коэффициентом LTV, превышающим 70%, момент наступления дефолта приближается в раза быстрее, чем в группе кредитов с коэффициентом LTV, принимающем значения в промежутке от 50% до 70%. При этом в группе кредитов с LTV, не превосходящим 50%, момент наступления дефолта при прочих равных условиях наступает в раза медленнее, чем в группе кредитов с LTV в промежутке от 50% до 70%.
Таким образом, выявляется положительная зависимость показателя LTV на момент наступления дефолта: чем выше доля заемных средств в стоимости жилья, тем событие дефолт наступает быстрее. Данный вывод логичен и согласуется с нашими ожиданиями. В части I настоящей работы мы отмечали, что для изучения факторов, влияющих на наступление дефолта по закладной, было бы интересно рассмотрение динамики изменения рыночной стоимости жилья, то есть динамики изменения самого показателя LTV. Это расширение модели Кокса с учетом меняющихся во времени факторов (см. [10]). Для включения в модель динамического показателя необходим периодический мониторинг рыночной стоимости жилья на основании данных риэлторских агентств, что представляется нам трудоемкой задачей. Однако включение в модель стационарного фактора LTV (напомним, что он рассчитывается на момент выдачи кредита) уже продемонстрировало хорошие результаты: данный показатель заметным образом влияет на целевое событие, причем направление его влияния не противоречит здравому смыслу.
При прочих равных условиях наличие высшего образования у основного заемщика замедляет момент наступления дефолта в раза по сравнению с группой кредитов, в которых основной заемщик не имеет образования.
При этом незаконченное высшее образование влияет на целевое событие не значимо.
При прочих равных условиях для кредитов с предметом ипотеки, располагающемся в недостаточно развитом регионе, момент наступления дефолта приближается в 1.84 раз быстрее, чем для группы кредитов с предметом ипотеки в средне - развитом регионе.
При прочих равных условиях, если предмет ипотеки в кредитном договоре представляет собой однокомнатное жилье, то момент наступления дефолта наступает в раза позднее, чем для группы кредитов с предметом ипотеки, представляющем собой двухкомнатное жилье.
Если в предмете ипотеки не менее 3 комнат, то при прочих равных условиях момент наступления дефолта наступает в раз быстрее, чем для двухкомнатного жилья.
Видим, что на вхождение в дефолт совсем не влияет признак пол. Коэффициент при нем оказался незначимым.
Если посмотреть по статистике, то из 5069 кредитов, по которым был объявлен дефолт, 2834 приходится на неплательщиков мужчин и 2235 - на женщин (в долях 0.56 и 0.44 соответственно), то есть примерно поровну.
Далее отметим следующие выявленные зависимости.
При прочих равных характеристиках:
• чем длиннее срок кредита, тем событие дефолт наступает раньше;
• чем больше количество созаемщиков в кредитном договоре, тем событие дефолт наступает позднее;
• если основной заемщик на момент среза данных моложе 28 лет или старше 45 лет, то момент наступления дефолта наступает быстрее, чем в средней группе заемщиков;
• если основной заемщик женат/замужем, то дефолт наступает позже;
• чем выше значение показателя PTI (доля платежа в совокупном доходе), тем раньше случается дефолт;
• чем выше коэффициент переплаты по кредиту, тем раньше наступает дефолт;
• если основной заемщик - наемный работник, тем дефолт наступает раньше, чем для группы студентов, пенсионеров, индивидуальных предпринимателей и людей, не имеющих определенного вида занятости. Однако данный эффект может быть связан с тем, что эта категория наемных работников - самая обширная в портфеле Агентства.
Итак, среди факторов, наибольшим образом влияющих на дефолт, выделяем тип предмета ипотеки, показатель LTV, а также количество комнат в предмете ипотеки.
Посмотрим на то, как выглядят оценки функции дожития для различных типов жилья и различных значениях LTV на примере логнормальной модели с ненаблюдаемым эффектом.
Все прочие признаки полагаем равными 0:
Рис. 25 Оценка функции дожития для различных типов предмета ипотеки
Рис. 26 Оценка функции дожития для различных значений показателя LTV
Видим, что среди кредитов, проживших одинаковое время, вероятность дожития для кредитов с предметом ипотеки дом или таунхаус заметно ниже соответствующей вероятности для квартир либо комнат. Вероятности дожития для квартир и комнат практически совпадают.
С точки зрения LTV наименьшая вероятность дожития у высокорисковых кредитов с показателем LTV, превосходящим 70%. Еще раз убеждаемся, что данный признак оказывает существенное влияние на наступление дефолта.
Выбор наилучшей модели.
Для выбора среди параметрических спецификаций посмотрим на значение критерия Акаике для каждой оцененной модели:
Таблица 5. Значения AIC для оцененных моделей
Модель |
AIC |
|
Вейбулла с ненаблюдаемым эффектом |
31 625.08 |
|
Гомперца с ненаблюдаемым эффектом |
31 827.26 |
|
Логнормальная с ненаблюдаемым эффектом |
31 586.09 |
|
Логлогистическая с ненаблюдаемым эффектом |
31 646.68 |
|
Гамма |
31 567.47 |
Критерий Акаике подтверждает результаты визуального анализа: наилучшим образом данные подгоняет гамма регрессия, немного ей уступает логнормальная регрессия с ненаблюдаемым эффектом.
Теперь сравним логнормальную регрессию с ненаблюдаемым эффектом и гамма регрессию по прогнозной силе, следуя изложенному в III.II алгоритму.
Для визуального анализа, как обычно, посмотрим на оценки NA интегральной функции риска для остатков Кокса-Снелла, рассчитанным по данным из тестовой части выборки:
Рис. 27 Оценка NA в логнормальной регрессии с ненаблюдаемым эффектом на тестовой выборке
Рис. 28 Оценка NA в гамма регрессии на тестовой выборке
Видим, что модели прогнозируют похожим образом, однако можно сказать, что гамма регрессия точнее на правом хвосте, хотя очень незначительно.
Далее сравним отобранные модели формально. Будем исследовать, какая модель лучше прогнозирует вне выборки, с помощью индекса Somers' D .
Оценим 3 модели: одну модель - на полном наборе факторов (24) и две - на части факторов (2 модель - на 15, 3 модель - на 10). Далее на наблюдениях тестовой части выборки на основании линейных прогнозов , , рассчитаем индекс Somers' D и сравним прогнозную силу оцененных моделей.
Для гамма регрессии значения коэффициента Somers' D, рассчитанные на тестовой части выборки:
Разница между оцененными моделями:
Видим, что модели различаются. Наибольшая разница наблюдается по отношению к третьей модели, между первой и второй разница не столь существенна. Также можно c уверенностью утверждать, что лучше всех прогнозирует первая модель, на что указывает максимальное значению индекса Somers'D.
Проведем аналогичные манипуляции для логнормальной спецификации. Расчетные значения индекса для логнормальных регрессий с ненаблюдаемым эффектом:
Сравним модели между собой:
Итоговые выводы аналогичны выводам, сделанным ранее для гамма регрессии. Наилучшим образом прогнозирует модель с максимальным набором факторов.
Поскольку расчетные коэффициенты Somers' D для обеих регрессий с максимальным набором факторов очень близки (0.6867 для гамма и 0.6877 для логнормальной), то сделать выбор в пользу какой-либо из моделей трудно. С формальной точки зрения, согласно оценкам, полученным с помощью индекса Somers' D, логнормальная регрессия с ненаблюдаемым эффектом немного точнее прогнозирует вне выборки. Однако результаты визуального анализа на основании оценок NA для остатков КС на тестовой части выборки (см. рис. 27, 28) указывают на то, что скорее гамма регрессия лучше прогнозирует вне выборки.
Поэтому с точки зрения прогнозной силы обе модели достаточно хороши, так что сделать однозначный выбор в пользу конкретной спецификации затруднительно. Что касается параметрического анализа, основанного на значении критерия Акаике, предпочтительнее модель обобщенной гамма регрессии, поскольку она обладает наименьшим значением AIC (см. Таблицу 5).
b) Модели mover-stayer.
В предыдущем разделе были найдены спецификации, наилучшим образом подгоняющие данные. Это модель обобщенной гамма регрессии, а также модель логнормальной регрессии с ненаблюдаемым эффектом. В надежде получить лучшее качество подгонки для модели логнормальной регрессии на правом хвосте мы обратились к моделям mover-stayer. Процедура оценивания моделей mover-stayer не запрограммирована в пакете Stata, поэтому их реализация прописывалась вручную. Примерные коды для оценивания моделей mover-stayer приводятся в Приложении на стр. 81-83.
С этой целью были апробированы модели mover-stayer, в которых длительность состояния в классе кочевых описывается логнормальной моделью или моделью гамма, а вероятность принадлежности к классу mover, т.е. вероятность принадлежности к классу кредитов, по которым наступает дефолт - моделью logit. Выбирая в качестве моделей, описывающих длительность состояния в классе кочевых, спецификации, отобранные в ходе анализа дефолтов, мы надеемся тем самым достигнуть большей точности подгонки за счет оценивания еще одного параметра - вероятности принадлежности к классу кочевых.
...Подобные документы
Возможные ошибки спецификации модели. Симптомы наличия ошибки спецификации первого типа. Проблемы с использованием замещающих переменных. Построение функции Кобба-Дугласа. Проверка адекватности модели. Переменные социально-экономического характера.
презентация [264,5 K], добавлен 19.01.2015Модели движения людских потоков на основе уравнений динамики жидкости и газов, основанные на социальных силах и теории клеточных автоматов. Численное исследование полевой стохастической дискретно-непрерывной модели движения людей на примере "коридор".
дипломная работа [1,1 M], добавлен 18.12.2013Анализ сложных систем. Проведение экономического исследования с применением технологии компьютерного моделирования. Построение блок-схем, маршрутов потоков сообщений. Разработка модели работы автобусного маршрута. Многовариантные расчеты модели.
контрольная работа [53,3 K], добавлен 22.10.2012Обзор методов разработки и испытания имитационных моделей сложных систем. Анализ производственной деятельности ООО СПК "Федоровский". Описание имитационной модели потоков внутренних ресурсов сельскохозяйственной организации в среде Vensim PLE 6.2.
курсовая работа [2,6 M], добавлен 13.06.2014Сущность экономико-математической модели, ее идентификация и определение достаточной структуры для моделирования. Построение уравнения регрессии. Синтез и построение модели с учетом ее особенностей и математической спецификации. Верификация модели.
контрольная работа [73,9 K], добавлен 23.01.2009Управление материальными, информационными и финансовыми потоками предприятия. Основные модели имитации денежных потоков. Понятие случайного процесса. Финальные вероятности состояний. Правила составления системы уравнений А.Н. Колмогорова и их решение.
презентация [654,5 K], добавлен 22.10.2014Сущность и необходимость применения математических моделей в экономике. Характеристика предприятия "Лукойл", определение стоимости компании с помощью модели дисконтированных денежных потоков. Использование математических моделей в управлении предприятием.
дипломная работа [1,7 M], добавлен 25.09.2010Построение схемы сети. Расчет интенсивностей входных потоков для каждой СМО. Проверка стационарности сети. Модель сети на языке моделирования GPSS. Сравнение расчетных и экспериментальных данных по критерию Стьюдента. Проверка адекватности модели.
контрольная работа [94,6 K], добавлен 28.07.2013Теоретические основы и методики управления денежными потоками; источники привлечения денежных средств. Анализ эффективности формирования денежных потоков в ПЖРЭО Курчатовского района, оценка уровня их генерирования в процессе хозяйственной деятельности.
курсовая работа [142,2 K], добавлен 02.04.2013Создание бизнес-модели процесса выдачи потребительских кредитов. Организационное обеспечение кредитного процесса. Моделирование и документирование бизнес-процессов в программе BPwin. Построение модели AS IS. Предложение по автоматизации бизнес-процесса.
курсовая работа [401,5 K], добавлен 07.01.2012Процедура проведения имитационных экспериментов с моделью исследуемой системы. Этапы имитационного моделирования. Построение концептуальной модели объекта. Верификация и адаптация имитационной модели. Метод Монте-Карло. Моделирование работы отдела банка.
курсовая работа [549,5 K], добавлен 25.09.2011Исследование особенностей разработки и построения модели социально-экономической системы. Характеристика основных этапов процесса имитации. Экспериментирование с использованием имитационной модели. Организационные аспекты имитационного моделирования.
реферат [192,1 K], добавлен 15.06.2015Основные понятия корреляции. Методика частной корреляции, анализ взаимосвязи между двумя величинами при фиксированных значениях остальных величин. Решение проблемы спецификации модели (присоединения-удаления) при помощи пошагового отбора переменных.
курсовая работа [88,0 K], добавлен 16.01.2015Рынок ритейла в России. Страхование собственности от бизнес-рисков. Характеристика временных рядов остатков денежных средств и запасов товаров в торговых точках ритейловых компаний. Эконометрическое моделирование и прогнозирование страхового покрытия.
дипломная работа [3,3 M], добавлен 03.07.2017Данные для разработки трендовой модели изменения объемов грузооборота предприятий транспорта. Проверка гипотезы на наличие тенденции. Понятие и обоснование периода упреждения прогноза. Выбор оптимальной прогнозной модели по коэффициенту детерминации.
курсовая работа [1008,3 K], добавлен 01.10.2014Модель оценки долгосрочных активов (Capital Asset Pricing Model, САРМ). Оценка доходности и риска на основе исторических данных. Выбор оптимального портфеля из рискованных активов. Риск и неопределенность денежных потоков. Расчет бета-коэффициента.
презентация [104,1 K], добавлен 30.07.2013Базовые принципы и приемы, используемые при имитационном моделировании доходности финансового актива. Построение модели, способной прогнозировать доходность акции компании "РосНефть" через индекс MICEX и нефть марки Brent. Проверка модели на адекватность.
контрольная работа [415,5 K], добавлен 11.12.2014Проектирование регрессионной модели по панельным данным. Скрытые переменные и индивидуальные эффекты. Расчет коэффициентов однонаправленной модели с фиксированными эффектами по панельным данным в MS Excel. Выбор переменных для построения данной регрессии.
курсовая работа [2,3 M], добавлен 26.08.2013Построение уравнения регрессии, учитывающего взаимодействия факторов, проверка полученной модели на адекватность. Построение математической модели и нахождение численных значений параметров этой модели. Вычисление коэффициентов линейной модели.
курсовая работа [1005,0 K], добавлен 07.08.2013Определение понятия страховых рисков. Изучение основ математического и компьютерного моделирования величины премии, размера страхового портфеля, доходов компании при перестраховании рисков, предела собственного удержания при перестраховании рисков.
дипломная работа [1,7 M], добавлен 17.09.2014