Моделирование вероятности дефолта российских банков
Раскрытие экономического содержания понятий "дефолт" и "банкротство". Разработка эффективной модели оценки возможности дефолта российского банка при помощи эконометрических методов. Деление банков на кластеры и построение моделей вероятности их дефолта.
Рубрика | Экономико-математическое моделирование |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 04.12.2019 |
Размер файла | 580,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Еще одной заметной работой в отечественной практике является исследование Карминского, Кострова и Мурзенкова (2012), которые использовали логистическую регрессию для построения модели прогнозирования дефолта банка. В базовую модель были включены финансовые показатели по методологии CAMELS, после чего было проанализировано, что целесообразно включать в модель факторы с двухквартальным лагом. Были учтены: нелинейность параметров, фактор времени по годам, сезонность, макроэкономические и институциональные факторы. В результате в финальную спецификацию вошли следующие параметры:
· отношение собственных средств к чистым активам и его квадрат;
· логарифм чистых активов и его квадрат;
· отношение просроченной задолженности по ссудам к чистым активам;
· логарифм отношения оборотов по корреспондентским счетам к чистым активам;
· отношение балансовой прибыли к чистым активам и его квадрат;
· отношение объема негосударственных ценных бумаг к чистым активам и его квадрат;
· дамми переменные, отвечающие за 2009 г. и 1-ый квартал года;
· поквартальный темп прироста ВВП;
· индекс потребительских цен;
· индекс Лернера;
· дамми переменная отвечающая за регион (1, если головной офис зарегистрирован в Москве; 0 в ином случае).
Была выявлена квадратичная зависимость между вероятностью дефолта и отношением собственных средств к чистым активам, логарифмом чистых активов, отношением балансовой прибыли к чистым активам и отношением объема негосударственных ценных бумаг к чистым активам. Также были выявлены следующие соотношения:
· чем выше отношение просроченной задолженности по ссудам к чистым активам, тем выше вероятность дефолта, так как повышаются риски для банка;
· чем ниже логарифм отношения оборотов по корреспондентским счетам к чистым активам, тем выше вероятность дефолта, так как снижается активность, а значит и прибыльность банка;
· в 2009 г. вероятность дефолта была выше (мировой финансовый кризис);
· в 1-ом квартале каждого года вероятность дефолта ниже (надзор над банками усиливается к концу года);
· чем выше индекс потребительских цен, тем выше вероятность дефолта (инфляция снижает реальную доходность банка);
· чем ниже индекс Лернера, тем выше вероятность дефолта (конкуренция негативно сказывается на прибыльности банка);
· в Москве вероятность дефолта выше ввиду жесткой конкуренции и нежелания ЦБ отзывать лицензии на неразвитых региональных рынках;
· прирост ВВП оказался незначимым фактором.
Предсказательная сила модели неплохая: было верно предсказано более 60% дефолтов, произошедших в 2010-2011 гг. Более того, в данной работе логистическая регрессия оказалась качественнее, чем методы панельных данных, Z-индекса и нейронных сетей.
Таким образом, разработка моделей, предсказывающих банкротство предприятий началась еще в 1960-ых гг. (пионером выступил Альтман, представив множественный дискриминантный анализ). Постепенно исследователи стали составлять подобные модели и для банков. Начиная с 1970-ых гг. начали приобретать популярность логит и пробит модели, а особенно логит модели в силу отсутствия необходимости принятия предпосылки о нормальности входных данных, что более реалистично. С конца 1980-ых гг. некоторые исследователи стали использовать более продвинутые полупараметрические модели, в частности так называемую модель Кокса (Lane et al. (1986),Whalen (1991), Henebry (1996)), которая позволяла оценить время до банкротства. Начиная с 1990-ых гг. по мере развития искусственного интеллекта авторы применяют непараметрические компьютеризированные методы (нейронные сети, классификационные деревья, алгоритмы распознавания и т.д.), которые являются более гибкими и удобными по сравнению с параметрическими моделями: не требуются предположения о распределении данных; количество и характер параметров модели гибкие и могут быть изменены исследователем при необходимости; точность прогнозирования обычно выше. Ряд работ был посвящен сравнению различных параметрических и непараметрических моделей предсказания вероятности банкротства (Kolari et al. (2002), Lanine and Vander Vennet (2006), Boyacioglu et al. (2009)), которые выявили превосходство непараметрических методов над классическими статистическими моделями. После финансового кризиса 2008 г. исследователи стали акцентировать внимание на макрофакторах и систематических рисках как важных предикторах банкротства. Некоторые исследователи вводили также такие альтернативные объясняющие переменные, как характеристики аудирующих фирм (Jin et al. (2011)), непроцентные доходы (DeYoung and Torna (2013)) и спреды кредитных дефолтных свопов (Avino et al. (2019)). Основными предикторами банкротства почти во всех работах выступали метрики согласно методологии CAMELS (показатели достаточности капитала, качества активов и менеджмента, прибыльности, ликвидности и чувствительности к рыночному риску), что наблюдается и в отечественных статьях (Карминский, Костров и Мурзенков (2012)).
Глава 2. Методология, используемая для моделирования вероятности дефолта банков
В настоящее время среди параметрических способов моделирования дефолта банков выделяют два: множественный дискриминантный анализ и модели бинарного выбора. MDA используется, если в качестве зависимой переменной выступает категориальная переменная, позволяющая отнести определенное наблюдение к той или иной группе. В качестве независимых переменных, которых также называют дискриминантными, выступают интервальные переменные. Первым шагом MDA является определение дискриминантных функций- линейных комбинаций независимых переменных, которые наилучшим образом различают разные группы наблюдений:
где D- дискриминантный показатель;- весовые коэффициенты, -независимые переменные. Максимальное количество дискриминантных функций равно количеству групп минус один. Затем проверяется существование значимых различий между независимыми переменными разных групп, и определяются факторы, вносящие наибольший вклад в дискриминацию между группами. Наконец, на тестируемой выборке проверяется эффективность дискриминантных функций, которые относят наблюдение к той или иной группе в зависимости от значений дискриминантов, и оценивается точность классификации (как отношение правильно соотнесенных наблюдений к общему числу наблюдений). Различают дискриминацию с одновременным введением всех предикторов и пошаговую дискриминацию (stepwise), при которой переменные вводятся постепенно в зависимости от их дискриминирующей силы: сначала вводятся переменные, которые различаются наибольшим образом между группами, затем факторы, которые обладают меньшей дискриминирующей силой и т.д.
В случае моделирования банкротства банка изначально существуют две группы: объявившие дефолт банки (1) и недефолтные банки(0). Одним из достоинств модели (помимо возможности исследовать влияния нескольких параметров на вероятность банкротства) является уменьшение размерности задачи: при 2 группах достаточно составить одну дискриминантную функцию. Однако MDA обладает двумя существенными ограничениями. Во-первых, число наблюдений должно как минимум в два раза превышать число независимых переменных, при чем последние должны быть линейно независимыми. Во- вторых, каждая независимая переменная должна подчиняться нормальному распределению, что является существенным ограничением для использования модели. MDA также не позволяет оценить вероятность банкротства (в отличие от моделей бинарного выбора).
Вторым наиболее распространенным способом моделирования вероятности банкротства являются логит и пробит модели. Здесь зависимая переменная может принимать два значения: 1 (если банк объявил дефолт) и 0 (если у банка нет дефолта). Зависимость можно записать как
Если F имеет нормальное распределение, используется пробит регрессия. В этом случае вероятность дефолта следующая:
В случае если F имеет логистическое распределение, используется логистическая регрессия. Вероятность того, что банк столкнется с дефолтом следующая:
где - коэффициенты, - регрессоры, - зависимая переменная (0 или 1). Цель- подобрать коэффициенты , при которых максимизируется логарифм функции правдоподобия
где ,
v- количество случаев события «дефолт» и w-количество недефолтных банков.
Чтобы определить, имело ли место событие «дефолт», устанавливается порог отсечения c. Если зависимая переменная оказывается ниже c, считается, что дефолта не было; если выше- значит, имел место дефолт:
Пробит и логит модели приводят к одинаковым результатам, однако логит модель более распространена, так как не требует предположения о нормальности.
Для оценки качества модели, построенной на основе логит регрессии, используется классификационная таблица следующего типа:
Таблица 1. Классификационная таблица
Дефолт |
Не дефолт |
||
Дефолт |
Верно классифицированные: TP |
Ошибка II рода: FP |
|
Не дефолт |
Ошибка I рода: FN |
Верно классифицированные: TN |
· TP (truepositive)- количество банков, действительно потерпевших дефолт, которые были классифицированы как дефолтные;
· FP (falsepositive)- количество банков, в действительности являющихся платежеспособными, классифицированные как потерпевшие дефолт - ошибка II рода;
· FN (falsenegative)- количество банков, в действительности потерпевших дефолт, классифицированные как платежеспособные- ошибка I рода;
· TN (truenegative) - количество банков, в действительности являющихся платежеспособными, классифицированные как платежеспособные.
Основываясь на данных классификационной таблицы, считают следующие относительные показатели качества разделения:
· TPR (truepositiverate) или Se (sensitivity)-доля верно классифицированных банков, потерпевших дефолт: ;
· FPR (falsepositiverate)- доля банков, неверно классифицированных как потерпевших дефолт: ;
· Sp (specificity)- доля банков, верно классифицированных как платежеспособных: , при чем .
Взаимосвязь между FPR и TPR отображается на графике в виде ROC кривой. Качество бинарного классификатора позволяет оценить площадь под ROC кривой AUC (areaunderROCcurve), которая ограниченна ROC кривой и горизонтальной осью FPR. Значение AUC, равное 0.5, соответствует случайному гаданию и говорит о непригодности модели в качестве точного классификатора. Чем выше AUC, тем лучше модель предсказывает дефолт. Значение ниже 0.5 говорит о том, что модель предсказывает все с точностью наоборот.
В последнее время стали набирать популярность непараметрические методы, особенно выделяется метод нейронных сетей. Данная сеть состоит из множества нейронов, соединяющихся между собой и являющихся по сути вычислительными средствами. Каждый нейрон получает на вход сигнал (извне или от других нейронов), сигнал активации преобразуется в функцию активации, в результате чего нейрон генерирует выходной сигнал, передающийся следующему нейрону и т.д. В случае моделирования дефолта на вход подаются финансовые показатели из отчетности банков, макроэкономические и институциональные факторы, которые анализируются внутренними слоями нейронов, и в итоге сеть выдает выходной сигнал: 0 (не дефолт) или 1 (дефолт). Сеть необходимо обучить перед запуском, чтобы она могла эффективно предсказывать вероятность дефолта и понимать, как нужно интерпретировать информацию. Еще один непараметрический алгоритм- метод k ближайших соседей, который чаще применяется, когда переменные имеют не нормальное распределение. Согласно данному алгоритму объект присваивается той группе, которая наиболее распространена среди k соседей этого объекта. Расстояние между двумя объектами x и y находится по формуле:
Популярностью пользуются и разновидности алгоритма дерева решений (ID3, CART), в котором каждому объекту соответствует один узел, дающий решение. Выборка дробится до тех пор, пока в каждой части не окажутся объекты одной группы. Хоть непараметрические методы и отличаются тем, что не требуют предположения нормальности распределения факторов, однако их использование возможно только при малых объемах выборки, что не совсем оптимально при составлении таковой для моделирования вероятности дефолта банков.
Глава 3. Построение и тестирование модели для предсказания вероятности дефолта банков
3.1 Определение выборки и сбор данных
В качестве периода для анализа был выбран промежуток 3-ий квартал 2013 г.--3-ий квартал 2018 г. Это объясняется тем, что в 3-ем квартале 2013 г. (24.06.2013) главой ЦБ была назначена Набиуллина Э.С., которая начала расчистку банковского сектора России и его оздоровление путем массового отзыва лицензий у кредитных организаций. В частности, в течение 2014-2016 гг. каждый год более 80 банков лишались лицензий (86 банков в 2014 г., 93 банка в 2015 г. и 97 банков в 2016 г.). Моделирование дефолта на выборке банков, лишившихся лицензий с 3-его квартала 2013 г, позволит понять, действительно ли массовый отзыв лицензий связан с плохим финансовым состоянием многих российских банков, которые не выдерживают конкуренцию, или это связано с другими факторами.
Среди 455 банков и небанковских кредитных организаций, лишившихся лицензий в период Q3 2013--Q3 2018 в анализ были включены те, которые обанкротились преимущественно из-за неспособности удовлетворить требования кредиторов и вкладчиков, т.е. те, которые потерпели дефолт. В анализ не включались небанковские кредитные организации. Таким образом, выборка сократилась до 89 банков. Среди других причин отзыва лицензий фигурировали несоблюдение законов, регулирующих отмывание доходов, полученных преступным путем, и финансирование терроризма; проведение сомнительных и схемных операций; существенное искажение финансовой отчетности; снижение собственного капитала ниже минимального значения, установленного на дату регистрации банка; полная утрата собственного капитала; несоблюдение нормативов.
Так как банков, потерпевших дефолт гораздо меньше, чем действующих банков, существует проблема несбалансированности данных: т.е. если выборка в большей своей части будет состоять из недефолтных банков, статистические оценки будут неточными, что скажется на прогнозной силе модели. По этой причине в пару каждому банку с отозванной лицензией был поставлен действующий банк с соизмеримым количеством чистых активов. Таким образом, в финальную выборку вошло 178 российских банков: половина из которых- действующие банки; другая половина- банки, потерпевшие дефолт за период Q3 2013-- Q3 2018 гг. Количество наблюдений по всем банкам за 5 лет (20 квартальных периодов) - 2884.
В модель прогнозирования дефолта были включены 5 квартальных финансовых показателей из отчетности банков, взятой из базы данных ИАС Банки и Финансы информационного агентства «Мобиле». Отбор показателей происходил по методологии CAMELS:
· С (capitaladequacy) - в качестве показателя, связанного с капиталом, было взято отношение капитала к чистым активам (sk_ca), что отражает достаточность капитала; в начале работы предполагается, что зависимость между sk_ca и вероятностью дефолта отрицательная: чем выше достаточность капитала, тем большими собственными средствами обладает банк для покрытия обязательств и тем меньше вероятность дефолта;
· A (assetquality)- в качестве прокси качества активов выступает отношение РВПС к чистым активам (res_ca); выдвигается гипотеза, что чем больше данный показатель, тем более некачественными являются кредиты с точки зрения возвратности, соответственно доходность активов падает, а вероятность дефолта повышается;
· M (management) - в работе Карминского и др. (2012) в качестве прокси выступает отношение оборотов по корреспондентским счетам к чистым активам- oks_ca (чем больше данный показатель, тем больше активных операций проводит банк, тем качественнее работа менеджмента и меньше вероятность дефолта), однако далеко не по всем банкам была доступна данная информация, в связи с чем данный показатель не использовался;
· E (earnings)- в качестве прокси доходности использовалось отношение чистой прибыли к чистым активам (cp_ca); предполагается отрицательная взаимосвязь между cp_ca и вероятностью дефолта: чем выше прибыль, тем более доходный бизнес ведет банк, тем меньше вероятность дефолта;
· L (liquidity) - отношение ликвидных активов к чистым активам (la_ca) в данной работе отражает ликвидность банка; гипотеза такова, что чем больше la_ca, тем больше ликвидных средств находится в распоряжении у банка для покрытия операционных расходов, внезапных убытков, исполнения части обязательств и тем меньше вероятность дефолта;
· S (sensitivitytorisk) - чувствительность к риску отражает отношение негосударственных ценных бумаг к чистым активам (ncb_ca), так как проценты, выплачиваемые по ним (в случае, если они не фиксированные) зависят от колебания ставок на рынке, которые отражают степень риска; предполагается, что чем больше данный показатель, тем большему внешнему риску подвержен банк и тем больше вероятность дефолта.
Также в условиях реалий российской экономики благосостояние банков зачастую зависит от состояния экономики России в целом, которая периодически переживает спады и подъемы. Поэтому в ходе данного исследования будут строиться разные спецификации моделей с добавлением дополнительных регрессоров: макрофакторов- поквартального роста ВВП (gdp) и квартальной инфляции (cpi), а также институциональных параметров- дамми переменной, отвечающей за расположение головного офиса банка (1- в Москве, 0- в регионе) - city, и дамми переменной, отвечающей за участие банка в системе страхования вкладов (ins): 1- банк участвует в ССВ, 0- банк не участвует в ССВ. Информация о макрофакторах была взята из Блумберга, а данные по институциональным параметрам- из ИАС Банки и Финансы. Гипотеза такова, что чем выше рост ВВП, тем меньше вероятность дефолта банка, так как рост экономики стимулирует инвестиции, кредитование и способствует увеличению маржи для банка, что понижает вероятность дефолта. Что касается инфляции, вполне возможно, что ее увеличение приводит к снижению реальной доходности инвестиций, а для банка--реальной процентной маржи, что увеличивает вероятность дефолта банка. Гипотезы, касающиеся институциональных переменных, таковы, что участие в ССВ предполагает лучшую выживаемость банка (за счет большего привлечения вкладчиков и большей ресурсной базы), а расположение в Москве предполагает жесткую конкуренцию, которая вытесняет слабых игроков с рынка, т.е. расположение офиса в столице означает большую вероятность дефолта. Важным замечанием является тот факт, что все объясняющие переменные изначально берутся с лагом в 2 квартала, так как разработка модели предсказания дефолта банков должна учитывать время, которое потребуется для потенциальных банкротов и ЦБ, чтобы предпринять необходимые меры для улучшения финансового состояния банка и его оздоровления. Так как горизонт прогнозирования-этоQ3 2013-- Q3 2018 гг., то фактически берутся данные за Q1 2013--Q1 2018 гг.Во многих исследованиях, посвященных предсказанию дефолта банков, лаг в 2 квартала был признан оптимальным: меньший лаг не позволяет своевременно стабилизировать состояние банка, а использование большего лага в модели приводит к ее слабой прогнозной силе.
3.2 Методология
Для предсказания вероятности дефолта банков будет использоваться логит модель, где в качестве зависимой переменной выступает бинарный классификатор: 1, если у банка наступил дефолт; 0, если банк платежеспособен:
В качестве регрессоров выступают определённые в предыдущем пункте финансовые показатели банков, макрофакторы и институциональные параметры: sk_ca, res_ca, cp_ca, la_ca, ncb_ca, gdp, cpi, city, ins. Оценки для находятся путем максимизации функции правдоподобия:
Так как переменная default непрерывная, то необходимо установить пороговое значение c: если default<c, то банк считается продолжающим деятельность; если default>c, банк признается дефолтным. В данной работе во всех моделях c=0.5. Для сравнения прогнозной силы моделей используются классификационные таблицы, а именно показатели точности классификатора TPR(чувствительность) и Sp (специфичность), посчитанные на основе таблицы. Важны и величины ошибок I и II рода: доля дефолтных банков, классифицированных как платежеспособных (что важнее), и доля действующих банков, классифицированных как дефолтных. Еще один показатель, позволяющий сравнить качество прогнозов, - AUC (площадь под ROC кривой). Чем она больше, тем лучше предсказательная сила модели (0.5 соответствует случайному гаданию и непригодности модели; 1 соответствует идеальному классификатору).
3.3 Описательная статистика
В таблицах 2 и 3 представлена описательная статистика по недефолтным и дефолтным банкам соответственно.
Таблица 2. Описательная статистика по недефолтным банкам
Capital/Net Assets |
Reserves/Net Assets |
Profit/Net Assets |
LA/Net Assets |
Corp Bonds/Net Assets |
City |
Insurance |
||
Среднее |
0.22 |
0.08 |
0.0045 |
0.38 |
0.1 |
0.51 |
0.94 |
|
Ст. отклонение |
0.15 |
0.06 |
0.02 |
0.19 |
0.11 |
0.5 |
0.23 |
|
Асимметрия |
1.83 |
1.46 |
2.85 |
1.05 |
1.52 |
-0.02 |
-3.86 |
|
Эксцесс |
4.42 |
2.36 |
49.62 |
1.31 |
2.31 |
-2.00 |
12.9 |
|
Максимум |
1.01 |
0.41 |
0.34 |
1.28 |
0.6 |
1 |
1 |
|
Минимум |
-0.19 |
0.00001 |
-0.14 |
0.03 |
0 |
0 |
0 |
Таблица 3. Описательная статистика по дефолтным банкам
Capital/Net Assets |
Reserves/Net Assets |
Profit/Net Assets |
LA/Net Assets |
Corp Bonds/Net Assets |
City |
Insurance |
||
Среднее |
0.18 |
0.08 |
-0.006 |
0.24 |
0.08 |
0.61 |
0.90 |
|
Ст. отклонение |
0.11 |
0.08 |
0.03 |
0.11 |
0.09 |
0.49 |
0.30 |
|
Асимметрия |
2.10 |
2.66 |
-2.01 |
0.98 |
1.67 |
-0.43 |
-2.70 |
|
Эксцесс |
5.34 |
10.02 |
21.78 |
1.72 |
3.36 |
-1.82 |
5.29 |
|
Максимум |
0.77 |
0.64 |
0.18 |
0.73 |
0.61 |
1 |
1 |
|
Минимум |
-0.18 |
0.0022 |
-0.27 |
0.01 |
0 |
0 |
0 |
Можно сделать вывод, что в основном финансовые показатели имеют правостороннюю асимметрию (As>0) и островершинное распределение (Ex>3). Как и следовало ожидать, у недефолтных банков средняя достаточность капитала, прибыльность и доля ликвидных активов выше, чем у дефолтных. Хотя резервы по ссудам одинаковы по обеим категориям банков, максимальная и минимальная доля резервов, а также ее разброс выше у дефолтных банков, что говорит о худшем качестве активов у банков, потерпевших дефолт. Наибольшим разбросом характеризуются такие показатели, как достаточность капитала и доля ликвидных активов: 0.15 и 0.19 у недефолтных банков; 0.11 у дефолтных банков. Это говорит о том, что величина капитала и ликвидных активов подвержены сильному колебанию от года к году. Во-первых, капитал состоит из таких изменчивых составляющих, как нераспределённая прибыль, резервный фонд, страховые резервы и т.д.; кроме того, данные о капитале зачастую подвержены фальсификации даже у действующих банков для поддержания норматива Н1.0. Во-вторых, ликвидные активы банка, состоящие из денежной наличности, межбанковских кредитов, высоколиквидных ценных бумаг, векселей, также подвержены большим изменениям, так как банк использует данные активы для покрытия краткосрочных обязательств, покрытия потерь и других расходов. Необходимо также подметить, что действующие банки примерно в одинаковой степени находятся как в регионах, так и в столице (city=0.51), однако дефолтные банкив основном находятся в Москве (city=0.61), что уже предварительно подтверждает гипотезу о том, что жесткая конкуренция в Москве увеличивает количество событий «дефолт», а к региональным банкам ЦБ относится более снисходительно, учитывая неразвитую инфраструктуру и низкое экономическое развитие регионов. Еще одно наблюдение- подавляющее большинство банков (ins=0.94 среди недефолтных банков и ins=0.9 среди дефолтных банков) участвует в ССВ, что как видно, не предотвращает дефолт банков.
В таблице 4 представлена корреляционная таблица между объясняющими переменными. Так как по модулю все коэффициенты меньше 0.4, то опасность мультиколлинеарности низкая, значит, оценки коэффициентов получатся достаточно точными.
Таблица 4. Корреляционная таблица
Capital/Net assets |
Provisions/Net assets |
Net income/Net assets |
LA/Net assets |
Corp Securities/Net assets |
City |
Insurance |
GDP % |
CPI |
||
Capital/Net assets |
1 |
|||||||||
Provisions/Net assets |
0.12 |
1 |
||||||||
Net income/Net assets |
0.18 |
-0.24 |
1 |
|||||||
LA/Net assets |
0.38 |
-0.13 |
0.12 |
1 |
||||||
Corp Securities/Net assets |
0.04 |
-0.20 |
0.06 |
0.22 |
1 |
|||||
City |
0.24 |
0.01 |
0.05 |
0.05 |
0.09 |
1 |
||||
Insurance |
-0.31 |
-0.30 |
-0.06 |
-0.04 |
0.03 |
-0.21 |
1 |
|||
GDP % |
-0.02 |
0.00 |
0.04 |
-0.03 |
-0.01 |
0.00 |
0.00 |
1 |
||
CPI |
-0.07 |
-0.09 |
0.06 |
-0.14 |
-0.02 |
0.03 |
-0.01 |
-0.37 |
1 |
3.4 Построение общей модели вероятности дефолта банков
Так как наблюдения разнятся и по времени (Q3 2013-- Q3 2018 гг.) и по банкам, то необходимо строить панельную регрессию. Существует 3 метода построения панельных регрессий: сквозная регрессия (pooledregression), модель с фиксированными эффектами (fixedeffect) и модель со случайными эффектами (randomeffect). Сквозная регрессия не учитывает значимых различий между объектами, строя модель по объединенной выборке, что не подходит в данном случае, так как описательная статистика показала, что характеристики недефолтных и дефолтных банков разнятся. По этой причине будут строиться модели с fixedeffect и randomeffect, выбираться будет та, которая будет обладать лучшей предсказательной силой. Модель с fixedeffect используется, когда каждый объект считается уникальным, не выбранным случайно из генеральной совокупности, что больше подходит для регрессий по странам, отраслям экономики, крупным предприятиям. Модель с randomeffect используется наоборот, когда каждый объект случайно попал в выборку, что приемлемо, когда речь идет о малых компаниях. Модель randomeffect к тому же предполагает, что ошибки не коррелированы с регрессорами (индивидуальный эффект не связан с объясняющими переменными).
По всей выборке были построены регрессии fixedeffect (FE) и randomeffect (RE). Результаты представлены в таблицах 5, 6 и графиках 1,2.
Таблица 5. Классификационная таблица по модели FE
Дефолт |
Не дефолт |
Всего |
||
Дефолт |
0 |
0 |
0 |
|
Не дефолт |
1015 |
1869 |
2884 |
|
Всего |
1015 |
1869 |
2884 |
|
Точность (TPR, Sp) |
0% |
100% |
64.81% |
|
Ошибки I и II рода |
100% |
0% |
График 1. ROC кривая по модели FE
Таблица 6. Классификационная таблица по модели RE
Дефолт |
Не дефолт |
Всего |
||
Дефолт |
468 |
288 |
756 |
|
Не дефолт |
547 |
1581 |
2128 |
|
Всего |
1015 |
1869 |
2884 |
|
Точность (TPR, Sp) |
46.11% |
84.59% |
71.05% |
|
Ошибки I и II рода |
53.89% |
15.41% |
График 2. ROC кривая по модели RE
Таким образом, модель RE значительно превосходит модель FEпо прогнозной силе в силу нескольких причин. Во-первых, общая точность классификации к дефолту и не дефолту выше у модели RE (71.05% против 64.81%), причем модельFEклассифицирует абсолютно все банки, потерпевшие дефолт, как платежеспособных- ошибка I рода составляет 100%.Такая модель непригодна для использования ЦБ, так как регулятор попросту не сможет вовремя предупреждать дефолт банков, классифицируя все банки как платежеспособные. Во-вторых, AUC выше по модели RE (0.7614 против 0.575). Так как модель RE показала свое превосходство, в дальнейшем все спецификации будут проводиться по модели со случайными эффектами.
Чтобы убедиться в том, что макрофакторы и институциональные параметры необходимы для улучшения прогнозной силы модели, были построены 4 спецификации: регрессия с финансовыми показателями; регрессия с финансовыми показателями и макрофакторами;регрессия с финансовыми показателями и институциональными параметрами;регрессия с финансовыми показателями, макрофакторами и институциональными параметрами. Результаты оценивания приведены в таблице 7.
Таблица 7. Сравнение 4 спецификаций моделей по общей выборке ***-значимость на уровне 1%
**- значимость на уровне 5%
*- значимость на уровне 10%
В скобках указаны стандартные ошибки коэффициентов.
С финансовыми показателями (1) |
С финансовыми показателями и макрофакторами (2) |
С финансовыми показателями и институциональными параметрами (3) |
С финансовыми показателями, макрофакторамии институциональными параметрами (4) |
||
sk_ca |
0.1379 (0.3879) |
0.1453 (0.3887) |
-1.1545*** (0.433) |
-1.1231*** (0.4331) |
|
res_ca |
-1.8654*** (0.6726) |
-1.7153** (0.6771) |
-3.4601*** (0.743) |
-3.3122*** (0.7471) |
|
cp_ca |
-7.1699*** (2.0554) |
-7.6797*** (2.0789) |
-9.3503*** (2.1694) |
-9.8110*** (2.1914) |
|
la_ca |
-6.3891*** (0.3687) |
-6.3262*** (0.3707) |
-6.478*** (0.38) |
-6.4282*** (0.3818) |
|
ncb_ca |
-0.3647 (0.4749) |
-0.3284 (0.4757) |
-0.6371 (0.4815) |
-0.6113 (0.4824) |
|
gdp |
0.0048 (0.0045) |
0.0041 (0.0046) |
|||
cpi |
0.0864*** (0.0287) |
0.0771*** (0.0292) |
|||
city |
0.4861*** (0.0905) |
0.4821*** (0.0906) |
|||
ins |
-1.292*** (0.1942) |
-1.2767*** (0.1944) |
|||
Точность( |
68.24% |
68.86% |
70.84% |
71.05% |
|
Ошибка I рода |
59.02% |
58.52% |
54.58% |
53.89% |
|
AUC |
0.7382 |
0.7402 |
0.7603 |
0.7614 |
Можно видеть, что переходя от спецификации (1) к (4) улучшается точность прогноза с 68.24% до 71.05%, при чем наибольший вклад в увеличение точности вносят не макрофакторы, а институциональные параметры: увеличение точности при переходе от спецификации (1) к (2) составляет 0.62% против 2.6% при переходе от спецификации (1) к (3). Аналогично наибольший вклад в уменьшение ошибки I рода и увеличениеAUCпривносят институциональные параметры: ошибкаI рода уменьшается всего на 0.5% при переходе от спецификации (1) к (2), а при переходе от спецификации (1) к (3)- на целых 4.44%; увеличение AUCопять же значительнее при переходе от спецификации (1) к спецификации (3): 0.0221 (по сравнению с 0.002). При всех сравнениях базовой моделью является спецификация (1), включающая только финансовые показатели, так как именно они являются дискриминирующими факторами, позволяющими разделить здоровые банки и банки-банкроты. Таким образом, участие в ССВ и расположение банка больше влияют на вероятность дефолта, нежели макрофакторы. Почти все финансовые показатели оказываются значимыми, кроме отношения негосударственных ценных бумаг к чистым активам. Среди нефинансовых показателей незначимым оказывается только рост ВВП. Что касается знаков при коэффициентах, то почти все они предсказуемы: зависимость между вероятностью дефолта и каждым из следующих показателей: достаточность капитала, отношение чистой прибыли к чистым активам и доля ликвидных активов, отрицательная. Знаки при институциональных переменных также ожидаемы: знак при коэффициенте cityположительный, т.е. расположение в Москве уменьшает вероятность остаться платежеспособным, а коэффициент при insотрицателен, т.е. участие в ССВ повышает вероятность выжить. Зависимость между вероятностью дефолта и инфляцией положительна: увеличение цен приводит к уменьшению реальной прибыльности для банка, что увеличивает вероятность дефолта. Единственная взаимосвязь, которая противоречит ожиданиям, наблюдается между вероятностью дефолта и долей резервов: согласно модели увеличение доли резервов приводит к уменьшению вероятности дефолта.
Базируясь на лучшей спецификации из вышеперечисленных (4) была учтена нелинейность регрессоров. В итоге была получена модель, представленная в таблице 8.
Таблица 8. Финальная спецификация модели по общей выборке ***-значимость на уровне 1%
**- значимость на уровне 5%
*- значимость на уровне 10%
В скобках указаны стандартные ошибки коэффициентов.
Коэффициент |
||
Intercept |
2.6842*** (0.2905) |
|
sk_ca |
-1.2549*** (0.4381) |
|
res_ca |
-3.6499*** (0.7582) |
|
cp_ca |
-10.6500*** (2.2300) |
|
48.2695*** (16.5272) |
||
la_ca |
-6.4318*** (0.3819) |
|
ncb_ca |
-0.6139 (0.4828) |
|
city |
0.4791*** (0.0908) |
|
ins |
-1.3077*** (0.1946) |
|
gdp |
0.0034 (0.0046) |
|
cpi |
0.0767*** (0.0292) |
Была обнаружена квадратичная зависимость между долей прибыли от чистых активов и вероятностью дефолта, которая выглядит следующим образом:
Минимум функции достигает при cp_ca=0.11, т.е. оптимальное отношение прибыли к чистым активам, при котором вероятность дефолта минимальна,- 0.11. Если прибыльностьниже, чем 0.11, то при увеличении доли прибыли вероятность дефолта снижается: банк получает больше средств, с помощью которых он может расплачиваться с кредиторами и увеличивать достаточность капитала, то есть риск дефолта снижается. Однако слишком высокая прибыльность,во-первых, говорито слишком высоких рисках, которые на себя берет банк, а во-вторых, это индикатор либо фальсификации финансовой отчетности, либо признак проведения сомнительных операций, так как банковская отрасль в целом характеризуется низкими прибылями. То есть слишком высокая прибыль в любом случае приближает банк к состоянию дефолта, либо увеличивает вероятность отзыва лицензии. Незначимыми переменными оказываются отношение негосударственных ценных бумаг к чистым активам ирост ВВП. Знаки при коэффициентахпо остальным переменным остаются прежними, как и в спецификации (4) из таблицы 7. Прогнозная сила финальной модели чуть ниже, чем у спецификации (4), что отражают показатели точности (специфичностьупала с 84.59% до 84.48%, а чувствительность упала с 46.11% до 45.52%) и ошибка I рода (соответственно увеличилась с 53.89% до 54.48%). Однако AUC увеличился с 0.7614 до 0.763. Таким образом, финальная модель обладает примерно таким же качеством, как и модель (4) из таблицы 7. Результаты оценивания представлены в таблице 9 и на графике 3.
Таблица 9. Классификационная таблица по финальной модели (общая выборка)
Дефолт |
Не дефолт |
Всего |
||
Дефолт |
462 |
290 |
752 |
|
Не дефолт |
553 |
1579 |
2132 |
|
Всего |
1015 |
1869 |
2884 |
|
Точность (TPR, Sp) |
45.52% |
84.48% |
70.77% |
|
Ошибки I и II рода |
54.48% |
15.52% |
График 3. ROC кривая по финальной модели (общая выборка)
3.5 Деление банков на кластеры и построение моделей вероятности дефолта для каждого кластера
Банки, вошедшие в выборку, разнятся по своим характеристикам. Именно поэтому была проведена их кластеризация с целью построения наиболее подходящей модели вероятности дефолта для каждой группы банков. Банки были поделены исходя из размера чистых активов и достаточности капитала. По каждому году было посчитано медианное значение чистых активов банков, соответственно те банки, чьи чистые активы превышают медианное значение, относятся к группе больших банков (B); банки, у которых чистые активы меньше медианы, подпадают под категорию малых банков (S). Также по каждому году 30% банков с наименьшей долей капитала от чистых активов относились к группе L (low), 30% банков с наивысшей долей капитала относились к группе H (high), остальные 40% банков относились к группе M (medium). В таблице 10 отражены пороговые значения для отсечения банков в ту или иную группу, а в таблице 11 представлено количество банков, вошедших в каждый кластер по годам. В силу того, что в группе B/H оказалось мало банков относительно всех остальных кластеров, панель оказалась нерепрезентативной по времени и объектам, поэтому модель, построенная по банкам B/H, оказалась низкой по качеству и прогнозной силе. В силу данных обстоятельств было решено строить единую модель для целой группы больших банков (B/L, B/M, B/H). Что касается кластеров S/L, S/M, S/H, модель для каждой группы строилась отдельно.
Таблица 10. Пороговые значения для отсечения банков по кластерам
Категория |
Порог |
2013 |
2014 |
2015 |
2016 |
2017 |
2018 |
Среднее |
|
Чистые активы (тыс.руб.) |
50% |
5 689 998 |
6 581 159 |
6 764 585 |
7 520 988 |
7 388 599 |
7 038 093 |
6 830 570 |
|
sk_ca |
30% |
0.11 |
0.12 |
0.12 |
0.12 |
0.14 |
0.15 |
0.13 |
|
sk_ca |
70% |
0.18 |
0.18 |
0.21 |
0.22 |
0.25 |
0.31 |
0.23 |
Таблица 11. Количество банков в каждом кластере по годам
2013 |
2014 |
2015 |
2016 |
2017 |
2018 |
Всего |
||
S/L |
14 |
11 |
16 |
13 |
11 |
8 |
31 |
|
S/M |
39 |
27 |
25 |
25 |
20 |
17 |
69 |
|
S/H |
35 |
37 |
33 |
28 |
28 |
23 |
51 |
|
B/L |
42 |
44 |
33 |
28 |
25 |
22 |
67 |
|
B/M |
32 |
41 |
32 |
30 |
27 |
24 |
66 |
|
B/H |
16 |
13 |
11 |
11 |
6 |
4 |
23 |
Для каждого из кластеров S/L, S/M, S/H и группы больших банков (B) велся поиск наилучшей спецификации с учетом нелинейности параметров. В итоге были получены результаты, представленные в таблице 12.
Таблица 12. Результаты оценивания моделей для кластеров банков ***-значимость на уровне 1%
<...Подобные документы
Анализ возможности применения нейронных сетей в оценке вероятности наступления банкротства предприятия в современных условиях хозяйствования. Проблема рисков в экономике. Финансовые коэффициенты, применяемые в российских методиках оценки банкротства.
курсовая работа [451,6 K], добавлен 14.08.2013Методологические основы эконометрики. Проблемы построения эконометрических моделей. Цели эконометрического исследования. Основные этапы эконометрического моделирования. Эконометрические модели парной линейной регрессии и методы оценки их параметров.
контрольная работа [176,4 K], добавлен 17.10.2014Разработка и исследование эконометрических методов с учетом специфики экономических данных и в соответствии с потребностями экономической науки и практики. Применение эконометрических методов и моделей для статистического анализа экономических данных.
реферат [43,1 K], добавлен 10.01.2009Особенности и сущность моделей системной динамики. Характеристика контуров с положительной и отрицательной обратной связью. Моделирование S-образного роста. Разработка модели запаздывания и ее построение. Основные разновидности моделей мировой динамики.
реферат [134,7 K], добавлен 22.02.2013Тесты, с помощью которых можно построить эконометрические модели. Эконометрическое моделирование денежного агрегата М0, в зависимости от валового внутреннего продукта и индекса потребительских цен. Проверка рядов на стационарность и гетероскедастичность.
курсовая работа [814,0 K], добавлен 24.09.2012Разработка проектных решений по информационно-методическому обеспечению исследования в области эконометрического моделирования. Анализ тенденций миграционных процессов в странах ЕС и их зависимость от имеющихся факторов, учитываемых при построении модели.
курсовая работа [2,6 M], добавлен 30.10.2015Принципы и методы построения линейных, нелинейных моделей спроса, применение эконометрических моделей на практике. Эконометрическое моделирование спроса на автомобили в РФ, проверка значимости коэффициентов, автокорреляции, наличия гетероскедастичности.
дипломная работа [3,9 M], добавлен 30.01.2016Основы построения и тестирования адекватности экономических моделей множественной регрессии, проблема их спецификации и последствия ошибок. Методическое и информационное обеспечение множественной регрессии. Числовой пример модели множественной регрессии.
курсовая работа [3,4 M], добавлен 10.02.2014Математическое моделирование как теоретико-экспериментальный метод позновательно-созидательной деятельности, особенности его практического применения. Основные понятия и принципы моделирования. Классификация экономико-математических методов и моделей.
курсовая работа [794,7 K], добавлен 13.09.2011Процедура проведения имитационных экспериментов с моделью исследуемой системы. Этапы имитационного моделирования. Построение концептуальной модели объекта. Верификация и адаптация имитационной модели. Метод Монте-Карло. Моделирование работы отдела банка.
курсовая работа [549,5 K], добавлен 25.09.2011Анализ основных способов построения математической модели. Математическое моделирование социально-экономических процессов как неотъемлемая часть методов экономики, особенности. Общая характеристика примеров построения линейных математических моделей.
курсовая работа [1,3 M], добавлен 23.06.2013Анализ сложных систем. Проведение экономического исследования с применением технологии компьютерного моделирования. Построение блок-схем, маршрутов потоков сообщений. Разработка модели работы автобусного маршрута. Многовариантные расчеты модели.
контрольная работа [53,3 K], добавлен 22.10.2012Расчет вероятности совмещения событий при броске монеты и игральной кости, при поражении цели стрелком согласно теории вероятности. Анализ заданной блок-схемы и определение значения переменной. Пример составления и использования электронных таблиц.
контрольная работа [565,1 K], добавлен 22.03.2013Оценка адекватности эконометрических моделей статистическим данным. Построение доверительных зон регрессий спроса и предложения. Вычисление коэффициента регрессии. Построение производственной мультипликативной регрессии, оценка ее главных параметров.
контрольная работа [1,2 M], добавлен 25.04.2010Теоретический анализ межрегиональных межотраслевых моделей. Сущность модели экономического взаимодействия регионов. Двухрегиональная оптимизация межрегиональной межотраслевой модели регионов А и Б. Моделирование экономического взаимодействия регионов.
курсовая работа [649,0 K], добавлен 04.05.2011Сущность и содержание метода моделирования, понятие модели. Применение математических методов для прогноза и анализа экономических явлений, создания теоретических моделей. Принципиальные черты, характерные для построения экономико-математической модели.
контрольная работа [141,5 K], добавлен 02.02.2013Построение эконометрических моделей и адекватная оценка их параметров для принятия обоснованных экономических решений. Проведение анализа и краткосрочного прогнозирования урожайности зерновых культур в Нижнем Поволжье методом многократного выравнивания.
реферат [51,4 K], добавлен 25.02.2011Динамика распространения безналичных платежей с использованием банковских карт и региональные специфики рынка эквайринга в России. Построение эконометрических моделей для выявления факторов, влияющих на скорость и уровень распространения инноваций.
дипломная работа [1,2 M], добавлен 17.10.2016Российский рынок бензина. Рост цен на бензин. Обоснование возможности применения статистических методов для моделирования и прогнозирования цен на бензин. Обработка результатов. Построение трендовой, регрессионных моделей и прогнозирование с их помощью.
курсовая работа [2,5 M], добавлен 16.04.2008Понятие параметрической идентификации парной линейной эконометрической модели. Критерий Фишера, параметрическая идентификация парной нелинейной регрессии. Прогнозирование спроса на продукцию предприятия. Использование в MS Excel функции "Тенденция".
контрольная работа [73,3 K], добавлен 24.03.2010