Анализ дифференциации дачных (садовых) участков Оренбургской области

Дифференциация дачных участков Оренбургской области с использованием методов кластерного анализа, моделей бинарного выбора и деревьев принятия решений. Использование математического инструментария решения задач кластеризации и классификации участков.

Рубрика Экономико-математическое моделирование
Вид статья
Язык русский
Дата добавления 15.01.2021
Размер файла 147,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Оренбургский государственный университет

Анализ дифференциации дачных (садовых) участков Оренбургской области

Чудинова О.С., кандидат экономических наук, доцент доцент кафедры математических методов и моделей в экономике

Русаков В.Н., студент курс, «Финансово-экономический факультет»

Россия, г. Оренбург

Аннотация

В статье представлены результаты анализа дифференциации дачных (садовых) участков Оренбургской области с использованием методов кластерного анализа, моделей бинарного выбора и деревьев принятия решений. По совокупности показателей, характеризующих коммунальную инфраструктуру и местоположение, осуществлено разбиение дачных (садовых) объединений на два класса. Выработаны рекомендации по использованию математического инструментария решения задач кластеризации и классификации участков.

Ключевые слова: кластеризация, классификация, методы кластерного анализа, деревьев принятия решений, логит-модель бинарного выбора, дачные участки.

Annotation

The article presents the results of the analysis of differentiation of suburban (garden) areas of the Orenburg region using the methods of cluster analysis, binary choice models and decision trees. According to the set of indicators characterizing the municipal infrastructure and location, the division of country (garden) associations into two classes was carried out. Recommendations on the use of mathematical tools for solving problems of clustering and classification of sites are developed.

Key words: clustering, classification, methods of cluster analysis, decision trees, logit model of binary choice, suburban areas.

В последнее десятилетие существенно возрос интерес к дачным (садовым) участкам. Это обусловлено возможностью получения кредита на приобретение загородной недвижимости и прописки в садовых товариществах. Корректный расчет кадастровой стоимости дачных (садовых) участков играет важную роль в совершенствовании хозяйственного управления земельными ресурсами, позволяет адекватно применять систему налогообложения. Одним из важных этапов оценки стоимости является кластеризация участков, результаты которой позволяют учесть при моделировании стоимости пространственную неоднородность данных [1]. Вопросы кластеризации объектов недвижимости в своих работах рассматривали Безруков В.Б., Господчиков Д.В., Пылаева А.В. [2], Гущина А.А. [3]. Однако в этих работах отсутствует систематизация факторов кластеризации, не затрагиваются вопросы классификации новых участков.

Информационной базой исследования послужила информация о ценах сделок и предложений дачных (садовых) участков Оренбургской области за период с 01.01.2016 г. по 31.03.2018 г. Объем выборки составил 1482 участка. После анализа исходных данных на наличие аномальных значений из выборки были исключены 34 участка.

Учитывая информацию о характеристиках земельных участков, содержащуюся в объявлениях о продаже, мнения экспертов в области оценки недвижимости, а также результаты исследования ведущих специалистов [4]- [6] сформирована система показателей, включающая факторы коммунальной инфраструктуры и факторы местоположения (таблица 1). Для разбиения дачных (садовых) объединений на однородные группы определены эталонные участки объединений. В качестве эталонных участков дачных (садовых) объединений рекомендуется выбрать существующие участки, удельная рыночная цена которых ближе к среднеарифметическому значению цены в этом объединении. В итоге было отобрано 228 эталонных участков.

Таблица 1. Система показателей кластеризации дачных (садовых) объединений

Факторы коммунальной инфраструктуры

Факторы местоположения

х1 - наличие объектов торговли (да/нет); х2 - наличие возможности круглогодичного проживания (да/нет); х3 - наличие круглогодичной транспортной доступности (да/нет); х4 - наличие электроснабжения (да/нет); х5 - наличие водоснабжения (да/нет); х6 - наличие газоснабжения (да/нет); х7 - расположение дачного (садового) объединения относительно рекреационной зоны (да/нет);

х8 - наличие факторов, отрицательно влияющих на стоимость объектов недвижимости (да/нет); х9 - наличие факторов, положительно влияющих на стоимость объектов недвижимости (да/нет).

хіо - расстояние до ближайшего водного объекта, км;

хіі - расстояние до дороги, км; хі2 - расстояние до г.

Оренбурга, км;

хіз - расстояние до центра

муниципального образования,

км;

хі4 - расстояние до остановки общественного транспорта, км; хі5 - численность населения муниципального образования, человек.

Кластеризация дачных (садовых) объединений проведена методом к- средних. Для измерения расстояний между объектами использовалась метрика

Говера, которая применима как к количественным, так и к качественным признакам. Количество классов определено на основе дендрограммы, построенной методом Уорда (рисунок 1).

Рисунок 1. Дендрограмма объединения классов методом Уорда

По графику можно сделать вывод о целесообразности разбиения дачных (садовых) объединений на два кластера. Характеристики удельной рыночной цены в каждом классе представлены в таблице 2. Согласно полученным результатам, дачные (садовые) участки, попавшие в первый класс, обладают в среднем наибольшей удельной рыночной ценой по сравнению с участками из второго класса.

Таблица 2. Количество земельные участков и характеристики удельной цены в классах, построенных методом к-средних

Класс

Количество

дачных

(садовых)

объединений,

ед.

Характеристика удельной цены, руб./кв. м.

Минимальн

ое значение

Медиан

а

Средне

Е значен

ие

Максимальн

ое значение

Первый

183

23,10

218,81

283,01

1123,12

Второй

45

6,92

42,81

85,41

388,15

Средние значения и мода факторов кластеризации представлены в таблице 3.

Таблица 3. Средние значения (мода) факторов кластеризации в каждом классе

Признак

1

класс

2

класс

XI - наличие объектов торговли (да -1, нет - 0)

0

0

х2 - наличие возможности круглогодичного проживания (да -1, нет-0);

1

0

х3 - наличие круглогодичной транспортной доступности (да -1, нет-0);

1

0

х4 - наличие электроснабжения (да -1, нет - 0);

1

1

Х5 - наличие водоснабжения (да -1, нет - 0);

0

0

Хб - наличие газоснабжения (да -1, нет - 0);

0

0

х7 - расположение дачного (садового) объединения относительно рекреационной зоны (да -1, нет - 0);

1

1

х8 - наличие факторов, положительно влияющих на стоимость объектов недвижимости (да -1, нет - 0);

0

0

х9 - наличие факторов, отрицательно влияющих на стоимость объектов недвижимости (да -1, нет - 0);

0

0

хю - расстояние до ближайшего водного объекта, км;

1,214

0,431

Х11 - расстояние до дороги, км;

0,248

0,555

х12 - расстояние до г. Оренбурга, км;

12,532

218,91

5

х13 - расстояние до центра муниципального образования, км;

12,117

7,961

х14 - расстояние до остановки общественного транспорта, км;

0,595

1,787

х15 - численность населения муниципального образования, человек

20977

3

99856,

3

Исходя из полученных результатов, первый класс дачных (садовых) объединений можно охарактеризовать как класс с хорошо развитой инфраструктурой, а второй - как класс с плохо развитой инфраструктурой. Для решения задачи классификации дачного (садового) участка, подлежащего оценке и принадлежащего новому дачному (садовому) объединению, построены две модели: логит-модель бинарного выбора и модель в форме дерева принятия решений. Оценка логит-модели имеет вид:

где результативный показатель class принимает значение 1, если дачный (садовый) участок относится к классу с плохо развитой инфраструктурой и 0, если относится к классу с хорошо развитой инфраструктурой.

Логит-модель бинарного выбора является значимой (наблюдаемое значение статистики Вальда составило Wald chi2(9)=47,84; наблюдаемый уровень значимости p < 0,05), псевдо-R2 для модели составил 0,7652.

Построенная логит-модель правильно распознает 95% всех наблюдений, площадь под ROC-кривой составляет 0,98.

В качестве альтернативы логит-модели построены логические правила классификации с использованием деревьев принятия решений [7]. Диаграмма дерева классификации дачных (садовых) объединений, построенная методом CRT в среде RStudio, представлена на рисунке 2. Модель в форме дерева классификации правильно распознает 94,30% всех наблюдений, а площадь под ROC-кривой составляет 0,93.

Построенное дерево классификации имеет 5 терминальных узлов, два из которых прогнозируют принадлежность к первому классу. В построении дерева участвуют только два фактора: численность населения

муниципального образования и расстояние до ближайшего водного объекта. дачный бинарный математический кластеризация

Рисунок 2. Диаграмма дерева классификации дачных (садовых) объединений

Согласно полученной модели дачное (садовое) объединение относится к классу с хорошо развитой инфраструктурой, при выполнении одного из условий:

численность населения муниципального образования (х 15) больше или равна 91 тыс. человек и расстояние до ближайшего водного объекта (х 10) больше или равно 170 м;

численность населения муниципального образования (х15) находится на интервале от 28 тыс. до 29 тыс. человек.

Дачное (садовое) объединение относится к классу с плохо развитой инфраструктурой, при выполнении одного из следующих условий:

1) численность населения муниципального образования (х15) меньше 28 тыс. человек;

численность населения муниципального образования (х15) находится на интервале от 29 тыс. до 91 тыс. человек;

численность населения муниципального образования (х 15) больше 91 тыс. человек и расстояние до ближайшего водного объекта меньше 170 м.

Результаты решения задачи классификации дачных (садовых) участков, полученные с помощью метода, основанного на дереве принятия решения, и на основе логит-модели бинарного выбора, согласуются друг с другом и обладают высокой классификационной точностью. Однако в классификации на основе дерева принятия решения участвует всего 2 признака, а в логит-модели бинарного выбора - 9 признаков. Поэтому, с практической точки зрения удобнее применять модель в форме дерева принятия решений.

В связи с низким дискриминирующим свойством третьего правила отнесения участка к классу с плохо развитой инфраструктурой, решение задачи классификации рекомендуется уточнять с помощью логит-модели бинарного выбора. Проведение классификации с использованием двух моделей позволило добиться повышения точности классификации до 99%.

Таким образом, кластеризацию дачных (садовых) объединений рекомендуется проводить методами кластерного анализа с использованием метрики Говера. Решение вопроса о принадлежности нового дачного (садового) объединения к одному из классов рекомендуется осуществлять на основе логических правил классификации, построенных с помощью деревьев принятия решений (методом CRT), уточняя при необходимости классификацию участков из класса с плохо развитой инфраструктурой с помощью логит-модели бинарного выбора.

Использованные источники

1. Русаков, В.Н. Моделирование стоимости дачных (садовых) участков (на примере Оренбургской области) / В.Н. Русаков, О.С. Чудинова // Сборник материалов Международной молодежной научной конференции: «Студенческие научные общества - экономике регионов». III часть - Оренбург: Издательско-полиграфический комплекс ОГУ, 2018. - С. 165-169.

2. Пылаева, А.В. Вопросы кластеризации в процедуре государственной кадастровой оценки земель садоводческих, огороднических и дачных объединений вне черты поселений / А.В. Пылаева, В.Б. Безруков, Д.В. Господчиков, // Информационный бюллетень Ассоциации служб кадастра. - 2004. - №4. - С. 44-47.

3. Гущина, А.А. Дифференциация регионального рынка жилья на примере Амурской области / А.А. Гущина // Вестник экономической интеграции. - 2012. - № 10 (55). - С. 95-102.

4. Картунен, О.А. Факторы, влияющие на формирование стоимости // Журнал правовых и экономических исследований. - 2014. - №4. - С.133-134.

5. Ротова, Т.В. Специфика рынка земли и факторы, определяющие цену на землю / Т.В. Ротова // Вестник Кубанского государственного университета. - 2012. - № 5. - С. 7-21.

6. Баева, И.А. Формирование кадастровой оценки земель садоводческих, огороднических и дачных товариществ в Тамбовской области / И. А. Баева и др. // Актуальные проблемы рационального использования земельных ресурсов: материалы Всерос. науч.-практ. конф. (17 мая 2017г.). -Лесниково: Кург.ГСХА, 2017. - С.81-84.

7. Груздев, А.В. Прогнозное моделирование в IBM SPSS Statistics, R и Python: метод деревьев решений и случайный лес. - М.:ДМК Пресс, 2018. - 642 с.

Размещено на Allbest.ru

...

Подобные документы

  • Разработка и принятие правильного решения как задачи работы управленческого персонала организации. Деревья решений - один из методов автоматического анализа данных, преимущества их использования и область применения. Построение деревьев классификации.

    контрольная работа [91,6 K], добавлен 08.09.2011

  • Характеристика ипотечного кредитования на примере Брянской области. Обзор математических методов принятия решений: экспертных оценок, последовательных и парных сравнений, анализа иерархий. Разработка программы поиска оптимального ипотечного кредита.

    курсовая работа [1,7 M], добавлен 29.11.2012

  • Изучение на практике современных методов управления и организации производства, совершенствование применения этих методов. Описание ориентированной сети, рассчет показателей сети для принятия управленческих решений. Проблема выбора и оценка поставщика.

    курсовая работа [137,6 K], добавлен 21.08.2010

  • Цели сегментации рынка в маркетинговой деятельности. Сущность кластерного анализа, основные этапы его выполнения. Выбор способа измерения расстояния или меры сходства. Иерархические, неиерархические методы кластеризации. Оценка надежности и достоверности.

    доклад [214,7 K], добавлен 02.11.2009

  • Этапы построения деревьев решений: правило разбиения, остановки и отсечения. Постановка задачи многошагового стохастического выбора в предметной области. Оценка вероятности реализации успешной и неуспешной деятельности в задаче, ее оптимальный путь.

    реферат [188,8 K], добавлен 23.05.2015

  • Построение модели планирования производства. Использование инструментального средства "Поиск решения" для решения задачи линейного программирования. Решение оптимальной задачи, с использованием методов математического анализа и возможностей MathCad.

    лабораторная работа [517,1 K], добавлен 05.02.2014

  • Использование инструментария системного анализа для решения проблем на пути достижения цели - завести аквариум с пираньями. Описание предметной области. Построение дерева целей. Эффективные мероприятия в деревьях мероприятий, сетевой график их реализации.

    курсовая работа [97,3 K], добавлен 07.10.2013

  • Количественное обоснование управленческих решений по улучшению состояния экономических процессов методом математических моделей. Анализ оптимального решения задачи линейного программирования на чувствительность. Понятие многопараметрической оптимизации.

    курсовая работа [4,2 M], добавлен 20.04.2015

  • Построение экономических и математических моделей принятия решений в условиях неопределенности. Общая методология оптимизационных задач, оценка преимуществ выбранного варианта. Двойственность и симплексный метод решения задач линейного программирования.

    курс лекций [496,2 K], добавлен 17.11.2011

  • Повышение надежности метода оценки клиентов для снижения рисков при выдаче кредита путем определения ключевых параметров, влияющих на принятие решения. Использование банком скоринговых моделей на различных этапах оценки клиентов, алгоритм apriori.

    дипломная работа [2,4 M], добавлен 25.07.2015

  • Понятие нулевой и альтернативной гипотез. Обычная процедура принятия решений. Область принятия гипотезы. Гипотетическое распределение, область принятия и распределения в действительности. Области и вероятность совершения ошибки при принятии решения.

    презентация [61,3 K], добавлен 20.01.2015

  • Понятие математического программирования как отрасли математики, являющейся теоретической основой решения задач о нахождении оптимальных решений. Основные этапы нахождения оптимальных решений экономических задач. Примеры задач линейного программирования.

    учебное пособие [2,0 M], добавлен 15.06.2015

  • Теоретические основы экономико-математических методов. Этапы принятия решений. Классификация задач оптимизации. Задачи линейного, нелинейного, выпуклого, квадратичного, целочисленного, параметрического, динамического и стохастического программирования.

    курсовая работа [2,3 M], добавлен 07.05.2013

  • Применение методов оптимизации для решения конкретных производственных, экономических и управленческих задач с использованием количественного экономико-математического моделирования. Решение математической модели изучаемого объекта средствами Excel.

    курсовая работа [3,8 M], добавлен 29.07.2013

  • Решение задач при помощи пакета прикладных программ MatLab. Загрузка в MatLab матриц A и P. Нахождение оптимальной стратегии для заданных матриц с использованием критериев принятия решений в условиях неопределённости Вальда, Гурвица, Лапласа, Сэвиджа.

    лабораторная работа [80,2 K], добавлен 18.03.2015

  • Основные понятия линейной алгебры и выпуклого анализа, применяемые в теории математического программирования. Характеристика графических методов решения задачи линейного программирования, сущность их геометрической интерпретации и основные этапы.

    курсовая работа [609,5 K], добавлен 17.02.2010

  • Основы математического моделирования экономических процессов. Общая характеристика графического и симплексного методов решения прямой и двойственной задач линейного программирования. Особенности формулирования и методика решения транспортной задачи.

    курсовая работа [313,2 K], добавлен 12.11.2010

  • Анализ построенной модели на мультиколлинеарность на основе показателей, характеризующих социально-экономическое развитие городов и районов Оренбургской области. Построение линейной зависимости или корреляции между двумя и более объясняющими переменными.

    лабораторная работа [99,6 K], добавлен 03.02.2015

  • Решение задач линейного программирования с применением алгоритма графического определения показателей и значений, с использованием симплекс-метода. Использование аппарата теории двойственности для экономико-математического анализа оптимального плана ЗЛП.

    контрольная работа [94,6 K], добавлен 23.04.2013

  • Статистические модели принятия решений. Описание моделей с известным распределением вероятностей состояния среды. Рассмотрение простейшей схемы динамического процесса принятия решений. Проведение расчета вероятности произведенной модификации предприятия.

    контрольная работа [383,0 K], добавлен 07.11.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.