Байесовский подход при решении скоринговых задач
Теорема Байеса как логическая основа пересмотра суждений в зависимости от действительно происходящих событий. Возможности байесовского подхода для анализа как средства построения скоринговой системы. Нахождение оценок любых рисков. Точность прогноза.
Рубрика | Математика |
Вид | доклад |
Язык | русский |
Дата добавления | 19.10.2013 |
Размер файла | 183,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Байесовский подход при решении скоринговых задач
Название этого направления произошло от теоремы Байеса, которая играет ключевую роль в данной концепции. Она рассматривается как логическая основа пересмотра суждений в зависимости от действительно происходящих событий, т.е. для обучения на базе опыта а, следовательно, постоянной корректировки стратегий управления.
Отметим возможности байесовского подхода для анализа:
- кредитоспособности заёмщика для получения кредита,
- определение приоритетных задач и направлений работы в отношении заёмщика,
- оценка вероятности мошенничества.
Отметим достоинства байесовского подхода как средства построения скоринговой системы:
- использование подхода позволяет избежать проблемы избыточного усложнения модели,
- подход позволяет естественным образом совмещать закономерности, выведенные из данных, и знания, полученные от экспертов,
- подход позволяет легко вносить коррективы в модель на основании опыта один раз в неделю, месяц, квартал, год.
Мы определяем риск как вероятность неуспеха в ситуации неизбежного выбора при наличии необходимой информации.
Для нахождения оценок любых рисков необходимо иметь, прежде всего, информационную базу изучаемого явления и определить показатели, по которым можно судить о вероятности получения неуспеха исследуемого события. Если, например, речь идет о риске кредитования или страхования юридических или физических лиц, то существует ряд методик, учитывающих финансовое состояние и репутацию заёмщиков, позволяющих оценить возможность погашения долга. Эти методики основаны на анализе показателей, характеризующих достаточно полно юридическое или физическое лицо. Эти показатели могут иметь как количественную оценку (например, капитал ?kдолл) или качественную (например, репутация, отношение к своим обязанностям).
Итак, мы имеем перечень показатели того явления, вероятность неуспеха которого мы желаем получить.
Следующий этап - процесс самообучения системы, которую мы предлагаем для анализа вероятности неуспеха события. Под самообучением мы понимаем вычисление байесовских весов каждого показателя. Нахождение весов может быть осуществлено по-разному. Можно находить значение весов на основе опыта работы банка (а также подобных ему банков). Условия погашения кредита, обеспечение страхового риска непогашения ссуды невозврат кредита и т.д. могут быть получены на основе информации, имеющиеся у банка по работе с клиентами в прошлом. Заметим, что самообучение системы происходит на основе статистического материала. Следовательно, нужно иметь достаточное количество (желательно > 30) вариантов ответов потребителей или специалистов, а также вариантов архивных данных для того, чтобы значения весов объективно отражали состояние изучаемого явления.
На основе вектора анкетирования Х= (х1, х2, …хn), где х1, х2, … хn - наименования вопросов, требуется предсказать возможность кредитования заёмщика, или оценить вероятность его мошенничества. Каждая хi, i=1,2,… n, имеет биномиальное распределение. Считается, что сотрудник принадлежит к W1, т.е. той части заёмщиков, которые вовремя погасят кредит; принадлежность же к W2 означает, что сотрудник его не погасит.
После того, как система обучена, мы можем просчитать вероятность неуспеха изучаемого нами события. Например, в случае кредитования - вероятность того, что юридическое или физическое лицо, обратившееся в банк, не выполнит своих обязательств в назначенный срок. Можно посчитать вероятность потери клиента при условии, что услуги не изменяются. Можно также находить вероятности увеличения числа клиентов в случае улучшения обслуживания.
Успешная работа компьютерной программы созданной нами для обработки результатов, полученных в результате проведённых исследований, поможет быстро реагировать на все изменения в поведении заёмщика.
Хочу отметить, что описанный выше подход к нахождению риска может быть осуществлён с использованием специальным образом построенного номографа, который позволяет по сумме байесовских весов легко определять вероятность неуспеха изучаемого события.
Номограф представлен на рис. 1.
Номограф отражает зависимость. P(W2/X) от Z P(W2/X) - вероятность неуспеха, при условии, что ответы X (изучаемого лица), имеются.
Для использования номографа необходимо сложить веса, (т.е. определить величину Z) соответствующие данным X и найти точку на номографе, соответствующую значению суммы. Эта точка будет соответствовать вероятности неуспеха исследуемого события, параметрами которого являются координаты вектора X.
В результате мы получаем инструмент, позволяющий в любых условиях быстро и надежно определять риски без компьютера. При этом байесовские веса показателей, которые меняются со временем, сообщаются.
Пример применения описанной выше методики.
Было опрошено 40 лиц, желающих получить кредит.
Им были заданы следующие вопросы и получены значения весов, которые сведены в таблице 1.
Таблица 1
№№ |
Наименование вопроса |
Ответ |
Вес |
|
1 |
Возраст |
Больше 35 лет |
-0,18 |
|
Меньше 35 лет |
0,43 |
|||
2 |
Характер |
Жизнерадостный |
-0,08 |
|
Угрюмый |
0,25 |
|||
3 |
Внешность |
Аккуратная |
-0,21 |
|
Небрежная |
0,18 |
|||
4 |
Манеры |
Интеллигентные |
-0,10 |
|
Простые |
0,08 |
|||
5 |
Долги |
Есть |
0,23 |
|
Нет |
-0,11 |
|||
6 |
Семейное положение |
Женат |
-0,23 |
|
Холост |
0,26 |
|||
7 |
Отношение к риску |
Взвешенный |
-0,11 |
|
Азартный |
0,16 |
|||
8 |
Образование |
Высшее |
-0,26 |
|
Не высшее |
0,27 |
|||
9 |
Владение недвижимостью |
Да |
-0,31 |
|
Нет |
0,12 |
|||
10 |
Профессиональный опыт |
Есть |
-0,15 |
|
Нет |
0,13 |
|||
11 |
Хобби |
Есть |
-0,08 |
|
Нет |
0,14 |
Логарифм априорной вероятности не выполнения своих обязательств перед банком равен -0,48.
Приведем один из вариантов заполнения таблицы потенциального клиента. Таблица весов была составлена заранее по результатам опросов.
№№ |
Наименование вопроса |
Ответ |
|
1 |
Возраст |
Больше 35 лет |
|
2 |
Характер |
Угрюмый |
|
3 |
Внешность |
Небрежная |
|
4 |
Манеры |
Интеллигентные |
|
5 |
Долги |
Есть |
|
6 |
Семейное положение |
Женат |
|
7 |
Отношение к риску |
Взвешенный |
|
8 |
Образование |
Не высшее |
|
банком равна 0,329 |
Владение недвижимостью |
Нет |
|
10 |
Профессиональный опыт |
Есть |
|
11 |
Хобби |
Нет |
байес риск прогноз скоринговый
Вероятность невыполнения обязательств выбранного клиента перед банком равна 0,46.
На рис. 1 дано изменение вероятности невозврата, в зависимости от вопроса. Начинаем с вероятности 0, 5, ограничились 7-ю вопросами.
Для оценки динамики кредитного счёта заёмщика мы разработали программу, которая позволяет прогнозировать эту динамику.
Это одно из самых интересных и трудных исследований. Существует такое великое множество подходов, что не имеет смысла их перечислять.
Наш подход: обучение модели происходит на основании данных по ретроспективе или экспертных оценок. Общую тенденцию или закономерность находим из известного класса функций (циклические, линейные, мультипликативные, аддитивные и т.д. функции). Нужный нам класс выбирается, исходя из минимума ошибки, которая проверяется по ретроспективе (экспертным оценкам). Кроме того, мнение экспертов о возможном развитии исследуемого процесса может существенно улучшить прогноз.
Точность прогноза 3-5%, колеблется иногда до 10-15%. Все зависит от наличия шумов, которые могут существенно повлиять на прогноз. Если ретроспективный ряд большой, то программа хорошо выделяет регулярные составляющие процесса. При незначительном временном ряде ретроспективы (до 5-8 значений) нужно пользоваться экспоненциальным сглаживанием.
Приведем пример реализации одного из алгоритмов прогнозирования.
На рис. 1 представлено внешний вид главного окна прогнозного модуля.
В данном окне выбирается тип прогнозной функции, по которой будет вычисляться итоговый прогноз, задается количество итерационных приближений к итоговой прогнозной кривой, а так же количество прогнозных точек.
Наш подход: обучение модели происходит на основании данных по ретроспективе или экспертных оценок. Общую тенденцию или закономерность находим из известного класса функций (циклические, линейные, мультипликативные, аддитивные и т.д. функции). Нужный нам класс выбирается, исходя из минимума ошибки, которая проверяется по ретроспективе (экспертным оценкам). Кроме того, мнение экспертов о возможном развитии исследуемого процесса может существенно улучшить прогноз.
Точность прогноза 3-5%, колеблется иногда до 10-15%. Все зависит от наличия шумов, которые могут существенно повлиять на прогноз. Если ретроспективный ряд большой, то программа хорошо выделяет регулярные составляющие процесса. При незначительном временном ряде ретроспективы (до 5-8 значений) нужно пользоваться экспоненциальным сглаживанием.
Размещено на Allbest.ru
...Подобные документы
Выполнение алгебраических преобразований, логическая культура и техника исследования. Основные типы задач с параметрами, нахождение количества решений в зависимости от значения параметра. Основные методы решения задач, методы построения графиков функций.
методичка [88,2 K], добавлен 19.04.2010Применение теоремы Лагранжа при решении задач. Ее использование при решении неравенств и уравнений, при нахождении числа корней некоторого уравнения. Решение задач с использованием условия монотонности. Связи между возрастанием или убыванием функции.
реферат [726,8 K], добавлен 14.03.2013Применение формул и законов теории вероятности при решении задач. Формула Байеса, позволяющая определить вероятность какого-либо события при условии, что произошло другое статистически взаимозависимое с ним событие. Центральная предельная теорема.
курсовая работа [460,7 K], добавлен 04.11.2015Закон больших чисел. Нахождение точечных оценок. Построение неизвестной дисперсии погрешности измерений. Выборочная функция распределения. Теорема Ляпунова и распределение Стьюдента. Вычисление доверительных интервалов. Построение интервальных оценок.
курсовая работа [4,3 M], добавлен 18.12.2011Общая характеристика факультативных занятий по математике, основные формы и методы проведения. Составление календарно-тематического плана факультативного курса по теме: "Применение аппарата математического анализа при решении задач с параметрами".
курсовая работа [662,1 K], добавлен 27.09.2013Опыт со случайным исходом. Статистическая устойчивость. Понятие вероятности. Алгебра событий. Принцип двойственности для событий. Условные вероятности. Формулы сложения и умножения вероятностей. Формула Байеса. Пространство элементарных событий.
реферат [402,7 K], добавлен 03.12.2007Понятие интерполяционного многочлена Лагранжа как многочлена минимальной степени, порядок его построения. Решение и оценка остаточного члена. Нахождение приближающей функции в виде линейной функции, квадратного трехчлена и других элементарных функций.
курсовая работа [141,5 K], добавлен 23.07.2011Теоретико-числовая база построения СОК. Теорема о делении с остатком. Алгоритм Евклида. Китайская теорема об остатках и её роль в представлении чисел в СОК. Модели модулярного представления и параллельной обработки информации. Модульные операции.
дипломная работа [678,3 K], добавлен 24.02.2010Изучение наиболее типичных алгоритмов решения задач, имеющих вероятностный характер. Ознакомление с элементами комбинаторики, теорией урн, формулой Байеса, способами нахождения дискретных, непрерывных случайных величин. Рассмотрение основ алгебры событий.
методичка [543,1 K], добавлен 06.05.2010Порядок составления гипотез и решения задач на вероятность определенных событий. Вычисление вероятности выпадения различных цифр при броске костей. Оценка вероятности правильной работы автомата. Нахождение функции распределения числа попаданий в цель.
контрольная работа [56,6 K], добавлен 27.05.2013Определение и оценка вероятности наступления заданного события. Методика решения задачи, с использованием теоремы сложения и умножения, формулы полной вероятности или Байеса. Применение схемы Бернулли при решении задач. Расчет квадратического отклонения.
практическая работа [55,0 K], добавлен 23.08.2015Элементарная теория сравнений. Диофантовы приближения. Определения и свойства сравнений. Теорема Эйлера, теорема Ферма. Китайская теорема об остатках, ее обобщение Цинь Цзюшао. Применение к решению олимпиадных задач. Применение к открытию сейфа в банке.
курсовая работа [243,5 K], добавлен 29.09.2015Способы решения логических задач типа "Кто есть кто?" методами графов, табличным способом, сопоставлением трех множеств; тактических, истинностных задач, на нахождение пересечения множеств или их объединения. Буквенные ребусы и примеры со звездочками.
курсовая работа [622,2 K], добавлен 15.06.2010Рациональность решения задач с помощью теорем Чевы и Менелая, чем их решение другими способами, например векторным. Доказательство теорем, дополнительное построение. Трудности, связанные с освоением этих теорем, оправданные применением при решении задач.
контрольная работа [388,3 K], добавлен 05.05.2019Формулировка и доказательство теоремы о сложении вероятностей двух несовместных событий. Следствие теоремы в случае, когда события составляют полную группу несовместных событий, и в случае противоположных событий. Примеры вычисления вероятности событий.
презентация [77,5 K], добавлен 01.11.2013Решение задач по определению вероятности событий, ряда и функции распределения с помощью формулы умножения вероятностей. Нахождение константы, математического описания и дисперсии непрерывной случайной величины из функции распределения случайной величины.
контрольная работа [57,3 K], добавлен 07.09.2010Численные методы представляют собой набор алгоритмов, позволяющих получать приближенное (численное) решение математических задач. Два вида погрешностей, возникающих при решении задач. Нахождение нулей функции. Метод половинного деления. Метод хорд.
курс лекций [81,2 K], добавлен 06.03.2009Теорема Піфагора - важливий інструмент геометричних обчислень, її простота, значення; історичні відомості. Теорема Піфагора на площині та у просторі, її стереометричний аналог; цілочислові прямокутні трикутники. Доведення теореми, класифікація задач.
курсовая работа [2,5 M], добавлен 16.05.2011Знакомство со средством Microsoft Excel, внутренняя структура и элементы данной программы, ее функциональные особенности и возможности, особенности использования в решении математических задач. Основы теории вероятностей, ее принципы и главные задачи.
контрольная работа [1,5 M], добавлен 16.11.2013Понятие и математическая сущность квадратного корня, его назначение и методика вычисления. Теоремы, отображающие свойства квадратного коря, их обоснование и доказательство. Применение характеристик квадратных корней в решении геометрических задач.
реферат [132,1 K], добавлен 05.01.2010