Проектирование модели уровня преступности в России
Рассмотрение особенностей моделирования уровня преступности в Российской Федерации. Построение эконометрической модели зависимости уровня преступности от выбранных факторов. Разработка объединенной модели, модели с фиксированными и случайными эффектами.
Рубрика | Экономико-математическое моделирование |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 02.09.2018 |
Размер файла | 1,1 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Пермский филиал федерального государственного автономного образовательного учреждения высшего образования «Национальный исследовательский университет «Высшая школа экономики»
Факультет экономики, менеджмента и бизнес-информатики
Выпускная квалификационная работа
по направлению подготовки 38.03.05 Бизнес-информатика
образовательная программа «Бизнес-информатика»
ПРОЕКТИРОВАНИЕ МОДЕЛИ УРОВНЯ ПРЕСТУПНОСТИ В РОССИИ
Матлашевская Валерия Владимировна
Рецензент д.ф.-м.н., профессор,
заведующий кафедрой высшей
математики ПГНИУ И.Е. Полосков
Руководитель к.ф.-м.н., доцент,
доцент кафедры высшей математики НИУ ВШЭ-Пермь
М.В. Радионова
Пермь, 2018 год
Оглавление
- Введение
- Глава 1. Обзор основных моделей и методой прогнозирования уровня преступности
- 1.1 Обзор основных исследований уровня преступности
- 1.2 Обзор основных моделей на панельных данных
- 1.3 Обзор методов оценки качества моделей на панельных данных
- 1.4 Выводы по первой главе
- Глава 2. Моделирование регионального уровня преступности в России
- 2.1 Исходные данные
- 2.2 Описательные статистики данных
- 2.3 Корреляционный анализ данных
- 2.4 Построение моделей на панельных данных
- 2.5 Выбор наилучшей модели
- 2.6 Выводы по второй главе.
- Глава 3. Проектирование и разработка приложения для прогнозирования регионального уровня преступности
- 3.1 Анализ программного обеспечения
- 3.2 Анализ требований
- 3.3 Проектирование приложения
- 3.4 Разработка приложения
- 3.5 Тестирование показателя уровня преступности
- 3.6. Выводы по третьей главе
- Заключение
- Библиографический список
- Приложение A. Паспорта данных
- Приложение B. Объекты разрабатываемой эконометрической модели
- Приложение C. Pooled модели
Введение
Проблема борьбы с преступностью является одним из самых важных вопросов любого общества. Преступность выступает зеркальным отражением состояния государства, тенденция динамики которого влияет на развитие общества.
Вопрос об уровне преступности и возможности его изучения всегда остро поднимается как в национальных исследованиях, так и в международных. Однако, пункт о выявлении типа зависимости, факторов, их анализ и интерпретация остается малоизученным. На сегодняшний день произведены исследования, которые затрагивают либо эконометрическую составляющего вопроса, либо техническую, но существует недостаток работы, объединяющей и разработку модели зависимости, и проектирование приложение, в области прогнозирования уровня преступности по регионам России .
Так, современные средства автоматизации процессов охватывают различные предметные области от бизнеса до политики, от бытовых функций до международной экономики. Однако, существует пробел в области факторов, влияющих на региональный уровень преступности в РФ.
Актуальность работы заключается в отсутствии на российском рынке адаптированного под широкий круг пользователей приложения, с автоматизированным набором методов, для прогнозирования уровня преступности на основе эконометрических моделей по ключевым параметрам - социального, экономического и психологического характера.
Данная тема поднималась в нескольких зарубежных источниках, в частности в американских, авторами которых является Стивен Левитт. Некоторые из работ Левитта посвящены именно причинам падения уровеня преступности в США в 1990-е [1- 4]. Помимо Левитта, мировому сообществу были представлены такие работы как «Crack and Homicide in New York City: A Case Study in the Epidemiology of Violence» (Paul J. Goldstein, Patricia A. Belucci) [5], которая отражает причину 25% убийств, связанных с наркотиками; «More Guns, More Crime» (Mark Duggan) [6], - зависимость огнестрельного оружия и уровня преступности; «The Impact of Abortion Ban on Socio-Economic Outcomes of Children: Evidence from Romania» (Cristian Pop-Eleches) [7] - о запрете абортов в Румынии и последствиях.
Объектом исследования является региональный уровень преступности в РФ. Предмет исследования - автоматизированные средства анализа детерминант, оказывающих наибольшее влияние на уровень региональной преступности в РФ.
Целью настоящей работы является определение детерминант региональной преступности в России, выявление зависимостей между социально-экономическими факторами и видами преступной деятельности, построение эконометрической модели, а также проектирование и разработка приложения для оценки регионального уровня преступности в Российской Федерации.
Для достижения поставленной цели необходимо решить следующие задачи:
1. Провести теоретический обзор (представлен в первой главе), а именно, провести обзор имеющейся исследований уровня преступности от различных факторов; выявить наиболее значимые факторы, влияющие на уровень преступности; выявить особенности моделирования уровня преступности и наиболее значимые аспекты разработки модели.
2. Построить эконометрическую модель зависимости уровня преступности от выбранных факторов (представлена во второй главе), а именно, провести сбор данных для проведения эконометрического моделирования; построить объединенную (pooled) модель, модель с фиксированными эффектами (fixed effects model), модель со случайными эффектами (random effects model), сравнить модели и выбрать наилучшую из них.
3. Разработать приложения для выявления наиболее значимых факторов, влияющих на уровень преступности (представлено в третьей главе), а именно провести анализ требований, спроектировать и разработать приложение.
Для достижения поставленных задач будут использованы методы эконометрического моделирования такие как идентификация, верификация, спецификация и т.д., а также инструменты для построения модели приложения - программный пакет Gretl; для разработки приложения - интегрированная среда разработки Microsoft Visual Studio, язык программирования C#, язык для графического описания объектного моделирования - UML (Unified Modeling Language).
Информационной базой для проведения исследования являются государственные статистические данные по показателям, находящиеся в открытом доступе. Данные взяты за 2011- 2013 гг. по 83 субъектам Российской Федерации.
В работе широко используются исследования российский и зарубежных авторов, а также интернет-источники, посвященные анализу уровню преступности по средствам эконометрического моделирования.
Работа состоит из введения, трех глав, заключения, используемого списка литературы и приложений.
Глава 1. Обзор основных моделей и методой прогнозирования уровня преступности
Первая глава настоящей работы посвящена обзору литературы, в которой по средствам математических и эконометрических методов рассматриваются факторы, влияющие на уровень преступности. Также в главе будут отражены основные понятия и методы эконометрического анализа, с помощью которых была построена модель зависимости регионального уровня преступности в России.
1.1 Обзор основных исследований уровня преступности
Безопасность человека всегда была одним из важных факторов социального, политического и экономического характеров, которая может быть измерима (как некая количественная величина) в разных единицах по отношению к разным объектам. Так, зачастую уровень безопасности в стране (регионе, городе или в целом в мире) определяется «обратным» уровнем преступности, то есть чем ниже уровень преступности (в сравнении с другим регионом, например), тем безопасность человеческой жизни выше [8-10]. В данном исследовании речь пойдет именно о преступлениях против личности (преступления против жизни и здоровья, свободы, чести и достоинства личности и др.) [11]. Кроме того, в сегодняшние дни существует явная нехватка информационных инструментов для доступа к данным о преступности и их анализа. Такая информация содержится в государственных архивах, базах данных специальных служб, однако, не существует единого хранилища, которое отражало бы совокупные показатели в зависимости от географической локации и времени.
Вопрос о регулировании уровня преступности всегда занимал особое место в сознаниях людей, так, одним из решений проблемы было выявление стимулов, которые «движут» преступниками. Однако, если стимул можно ассоциировать с ответом психологического характера на вопрос «Зачем?» (что является в наибольшей степени субъективной причиной), то максимально приближенным будет понятия «влияющий фактор», которое может выражаться с минимальной эфемерностью [12], тем самым определяя ситуацию в унифицированном формате, в данной работе - в виде эконометрической зависимости.
Основываясь на исследовании экономиста Стивена Левиттах [2] и журналиста Стивена Дабнера, в котором была выявлена и обоснована зависимости уровня преступности в США в 90-е годы от таких факторов, как количество абортов (с соответствующей разницей в годах), ситуацией на рынке наркотиков и огнестрельного оружия, регулирование закона о высшей мере наказания; стоит заметить «нестандартность» выбранных факторов, поскольку большей популярностью в исследованиях пользуются такие социальные и экономические регрессоры, как уровень заработной платы, ВВП, количество безработных и другие. Взяв во внимание пример американских ученых, мною будет проделана аналогичная работа на Российской аудитории, начиная с «нулевых» годах. Однако, несмотря на бульшую изученности в данной области зарубежных специалистов, информационное приложение до настоящего момента остается не разработанным для широкого круга пользователей - обычных граждан, специальных служб, государственных органов.
Кроме исследования Левитта ряд ученных также затрагивал данный вопрос. Кристиан Поп-Элечес [7] отразил ситуацию в Румынии в 1970-х годах, когда Николае Чаушеску стал президентом Социалистической Республики Румынии. В течение своего правления он провел ряд как внутренних, так и внешних изменений для страны, некоторые из них можно было отнести к относительно либеральной политике, а другие имели относительно жесткие условия и санкции. Одним из таких изменений стал запрет абортов по всей стране. Таким образом он хотел повысить уровень рождаемости, вводил стимулы для многодетных родителей: матери, родившие более 5 детей, получали звание «мать-героиня», материальную помощь и еще ряд внушаемых льгот. Были введены и санкции, такие как «налог на воздержание», который выносился не беременным женщинам. Такими стимулами Чаушеску добился быстрого роста нации, однако оно повлекло ряд негативных последствий, одно из которых - высокая смертность населения. Большая часть женщин умирали в процессе «подпольного» аборта, заражения, переливания крови. Однако более значительный эффект проявился, когда дети 70-х выросли. Аналогично гипотезе Левитта Поп-Элечес описывает такую ситуацию, что женщины, которые были вынуждены рожать насильственно, не опекали своих детей в должной мере, кто-то отдавал детей в приюты, кто-то «выбрасывал» на улицу, а кто-то давал минимум: еду и кровать. Дети, лишенный материнской заботы вырастали грубыми и бесчеловечными, они не имели представления о моральных и этических ценностях, и впоследствии становились преступниками от мелких краж до серийных убийств.
В своем эконометрическом исследовании Кристин Поп-Элечес фокусируется на двух основных величинах: уровень образованности и активность на рынке труда родителей. Проведя ряд аналитических задач, автор верифицировал регрессионную модель, в которой дети, рожденные в 1965-1966 годах (до политических изменений) также были включены в выборку. В работе была рассмотрена следующая модель:
,
где outcome - одна из величин уровня образования или рынка рабочей силы; afteri является фиктивным значением (принимает значение, если человек родился после введения политических изменений, 0 - до); - общее влияние по социально-экономическим показателям; - фиктивная переменная (принимает значение, если ребенок родился в период с июня по сентябрь 1967 года, 0 - в других случаях); содержит семейные «фоновые» переменные (образование матери, отца, индикатор пола ребенка и место его рождения).
Результатами его исследования являлась подтвержденная гипотеза о том, что доля женщин, живущих в городской среде, которые родили в период с января по май 1967 года, составила 35%, в то время как 42,2% - с июня по октябрь. Доля матерей, родивших после вступления в силу закона об абортах, имеющих только начальное образование, упало с 49,4% до 44,6%. Однако для женщин со средним образование доля выросла с 47,6% до 52,1%.
Ряд дополнительных исследований показал в итоге, что дети, родившиеся после политических изменений, имели значительно меньшие успехи в учебе и работе. Таким образом в ходе неоднократного научного исследования было доказано, что избыточная рождаемость отрицательно влияла на успехи детей, также в долгосрочной перспективе, такие изменения влияли и на состав женщин. Кроме того, заметно выросла доля смертности новорожденных (увеличилась на 27% с 1966 года), а затем увеличилась еще на 22% [7].
Следующий шаг исследования - выявления зависимости запрета на аборты с уровнем преступности в период с 1991-2000 годов:
,
где - это годовой уровень преступности; и - фиктивные переменные; является индикатором, если ребенок был рожден в 1967-1969 года; аналогично принимает значение, если ребенок был рожден после 1970 года.
Результат такого моделирования выявил, что уровень преступности для группы людей, родившихся в период с 1967-1969, в среднем составлял на 0,12 пунктов ниже, чем для группы людей, родившихся до 1967. Однако массив, содержащий людей, родившихся после 1970, увеличил уровень преступности на 0,3 (по сравнению с 1967-69 группой). Таким образом, люди, родившиеся в период запрета на аборты, имели в будущем более высокие шансы на совершения преступлений по сравнению с другими группами.
Зависимость между уровнем преступности и уровнем безработицы оценивали Йохам Бломквист и Йоаким Вестерлунн [13], взяв во внимание 756 наблюдений по более чем 20 округам Швеции в период с 1975 по 2010 года. Они рассматривали такие виды преступлений как кража со взломом, кража и кража транспортного имущества (угон). В этой работе уровень преступности определяется как количество преступлений на 100 000 единиц населения. Рассмотрев тренды в различных типах преступности, авторы вычислили парные коэффициенты корреляции и рассмотрели модель:
,
где dt - детерминированная составляющая; представляют идиосинкразические ошибки; xi,t - уровень безработицы, который объясняет Yi,t (уровень преступности).
В качестве первого теста проверки модели авторы использовали BSQT подход, тест ADF, критерий BIC. Результаты тестов не приводятся к единому отрицанию на 10% уровне, что говорит о том, что при учете неопределенности в отношение детерминированных величин все ряды можно рассматривать как нестационарные единичные корни.
Так как все три типа уровня преступности являются нестационарными временными рядами с единичными корнями, то гипотезы должны основываться на переменных, демонстрирующих сходное поведение единичного корня. Такое предположение сужает поиски возможных детерминант.
Результатом является значительная и положительная связь между уровнем безработицы и кражи со взломом и угоном, которая была установлена CCE (Common Correlated Effects) методом, который является надежным как для нестационарных данных, так и для поперечной зависимости данных.
Ряд других зарубежных ученных оценивал регрессоры уровня преступности в различных методологиях, моделях, например, основоположников теорий о преступном поведении является Ричард Талер [14]. Он выдвинул гипотезы и в следствие проведения тестов подтвердил их о том, что вероятность поимки преступника обратно пропорциональна длине «пути», необходимого для его поимки, а также аресты могут сдерживать преступность в том, что уровень преступности отрицательно связан с уровнем раскрываемости преступных дел. Опираясь на его теории, данные и методы, такие исследователи как Джонатан Клик и Александр Табаррок [10] в 2005 году получили следующие результаты регрессионного анализа: чем больше офицеров полиции на улицах города, тем ниже уровень преступности в этом регионе. Данные были взяты по округу Колумбии.
Взяв во внимание такой фактор, как количество иммигрантов, Грехем Оусей и Чарис Курбин [15] выдвинули сложную гипотезу о влиянии иммиграции на рынок рабочей силы и впоследствии на уровень преступлений по городу Чикаго.
Питер-Ян Энджелен, Майкл Ландер и Марк ван Эссен [16] расширили своим исследованием область преступности, использовав в своей работе два основных подхода: экономический и социологический; 26 переменных и 3 модели: экономическую, социологическую и смешанную. Получив результаты по моделям в двух вариациях по имущественным преступлениям и преступлениям насильственного характера, авторы сделали следующие выводы:
1. С точки зрения экономической модели, сумма штрафа, назначенная лицу за преступление имущественного характера, не влияет на уровень преступности. Так, можно сделать вывод, что штрафы не оказывают сдерживающего эффекта на преступников.
2. С точки зрения социологической модели, ни уровень образования, ни уровень безработицы не являются критическими регрессорами как для имущественных, так и для насильственных преступлений.
3. С точки зрения смешанной модели, вероятность тюремного заключения или ареста имеет более значительный сдерживающий эффект против совершения преступления.
Касательно отечественных ученных, такие влиятельные экономисты как, Андриенко Ю.В [17]. занимался изучением преступного поведения в России; в его исследовании были изучены такие регрессоры, как: доля населения, злоупотребляющего алкоголем и наркотиками, средний уровень образования, реальный доход, коэффициент Джини (мера неравенства в доходах), уровень безработицы и вектор других индикаторов. Андриенко использовал Обобщенный Метод Моментов (ОММ) с подходящими условиями моментов. Проведя ряд эмпирических исследований и регрессионный анализ, экономист заключил, что правоохранительные органы оказывают сдерживающий эффект на любой вид преступления, а высокое потребление алкоголя увеличивает преступления насильственного характера.
1.2 Обзор основных моделей на панельных данных
Из рассмотренного выше обзора литературы можно сделать вывод, что наилучшими моделями для анализа данных в сфере преступлений и влияющих на них факторов являются эконометрические модели, построенные на панельных данных.
Панельные данные - это такие многомерные данные, включающие объяснение по времени [18], например, данные различных организаций по параметрам численность сотрудников, стоимость капитала, объем активов, и измеримые в течение нескольких лет - таким образом на выходе имеется многомерный массив с данным по трем «измерениям»: фирма, параметр, год. Таким образом, совокупность данных панельного типа описывает наблюдения для одних и тех же выборочных единиц, собранные за ряд времени [19]. Преимущество модель панельных данных перед пространственной выражается в том, что применение повторных данных в разных единицах времени в разрезе на одних и тех же выборочных единиц позволяет специфицировать и оценивать более комплексные и сложные реалистические модели.
Панельные данные объединяют в себе как временные ряды (статистические данные о значении какого-либо параметра за промежуток времени), так и пространственные данные (данные о пространственных единицах и их признаках, являющимися основой геоинформационных систем); поэтому сочетают в себе достоинства этих типов данных [18]. С помощью анализа панельных данных можно строить более адекватные и содержательные модели, которые позволяют изучить истинную причинно-следственную связь между разнообразными переменными, что является невозможным для изучения предметных областей только в рамках временных рядов или пространственных данных.
Преимущества панельных данных заключаются в том, что они позволяются брать во внимание персональную неоднородность объекта [20], поскольку пространственные и временные типы данных не полностью описывают неоднородность объектов, что приводит к смещенным оценкам. Сами же панельные данные содержат большее количество наблюдений, представляя большее количество информации, им присуща большая вариация и меньшая коллинеарность объясняющих факторов. При анализе временных рядов не редко возникает явление мультиколлинеарности. Также панельные данные позволяют изучать закономерности в динамике, в следствии изменения индивидуальных значений описывающих характеристик единиц [21]. Данные панельного типа с меньшими ошибками идентифицируют эффекты, которые сложно определить во временных рядах. В общем, с помощью анализа панельных данных можно построить более сложные и конструктивные поведенческие модели, что также является неоспоримым преимуществом при тестировании модели и построении прогноза.
В общем виде модель панельных данных имеет вид:
где:
y - объясняемая переменная,
x - объясняющая,
N - количество субъектов (индивиды, фирмы, страны и т.п.),
i - номер субъекта,
t - момент времени,
T - крайний момент времени,
и - измеряет частичное влияние на x.
Для анализа таких данных часто используют один из трех основных подходов [22_23]:
1. Объединенная модель панельных данных (Pooled Model);
2. Модель данных с фиксированными эффектами (Fixed Effect Model (FE-модель));
3. Модель данных со случайными эффектами (Random Effect Model (RE-модель)).
Рассмотрим более подробно эти модели.
Pooled-модель это простейшая модель линейной регрессии, которая имеет вид:
где:
y - объясняемая переменная,
x - объясняющая,
N - количество субъектов (индивиды, фирмы, страны и т.п.),
i - номер субъекта,
t - момент времени,
T - крайний момент времени,
и - измеряет частичное влияние на x.
В этой модели иit? и и предполагается, что то есть ошибки независимы и одинаково распределены. Также предполагается, что для любых i,j = 1,…, N, t,s=1,…,T. Так, x является экзогенной переменной, поэтому модели можно считать линейной регрессией, которая удовлетворяет предположениям классической линейной модели, в которой зависимая переменная линейно зависит от всех переменных в тот же момент времени [22], а параметры и может быть рассчитан с помощью метода наименьших квадратов (МНК):
,
где:
y - реальное значения эндогенной переменной,
- расчётное значение эндогенной переменной,
N - количество субъектов (индивиды, фирмы, страны и т.п.),
i - номер субъекта,
t - момент времени,
T - крайний момент времени,
- параметры.
Однако если ошибки uit будут иметь разные дисперсии для разных субъектов, но оставаться при этом независимыми между собой, то МНК-оценки параметров останутся несмещенными, но возникнет смещение дисперсии этих оценок, тогда применяется ВМНК (взвешенный МНК).
Если при анализе данных {yit, xit; i=1,…,N, t=1,…,T} выясняется, что количество субъектов исследования N велико, а количество наблюдений T мало, то применяют методы, предполагающие малость T и направленные на получение наиболее эффективных оценок параметров и коэффициентов [24].
Модель, со скалярной объясняющей переменной, имеет вид:
то есть
где dij=1, если i=j, и dij=0 в остальных случаях.
Здесь ai - неизвестные фиксированные параметры, то есть фиксированные эффекты - fixed effects.
Модель с фиксированными эффектами имеет следующие предположения:
1. Ошибки между собой некоррелированы по i и t;
2. Ошибки некоррелированы с регрессорами xjs при всех i,j,t,s.
Параметры модели могут быть оценены с помощью МНК, в результате будут получены оценки с фиксированными эффектами (fixed effect estimator) [23], имеет вид:
где
- оценка параметра,
CV - (covariance analysis) модель ковариационного анализа.
Выводы, полученные в такой модели, условные по отношению к значениям эффектов, данная интерпретация наиболее уместна будет, если субъектами выступают страны, компании или другие субъекты «с лицами». Эффекты ai показывают наличие у субъекта исследования индивидуальные характеристики, которые не изменяются со временем в течение наблюдения [25].
Главным недостатком модели является тот факт, что она не позволяет идентифицировать переменные, которые не меняются со временем [26], например пол, раса; это объясняется тем, что если несколько регрессоров равны 0, то МНК нельзя применять и, следовательно, FE-модель не актуальна для таких задач.
В отличии от FE-модели, модель со случайными эффектами имеет случайный характер отличий в эффектах объектов. Здесь ai - дифференциальные эффекты (differential effects) [23]. RE-модель имеет вид:
,
где µ- константа, а ai - случайная ошибка, которая для каждого объекта во времени инвариантна.
Модель со случайными эффектами может быть применима, если выполнены следующие условия:
1. Ошибки между собой некоррелированы по i и t;
2. Ошибки некоррелированы с регрессорами xjs при всех i,j,t,s;
3. Ошибки между собой некоррелированы по i и t;
4. Ошибки некоррелированы с регрессорами xjt при всех i,j,t;
5. Ошибки и некоррелированы при всех i,j,t.
RE-модель можно рассматривать как линейную модель, где - ошибки имеет специальную структуру. Для оценки параметров µ и в используют МНК, но так как ошибки из условия (2) не являются гомоскедастичными, используют обобщенный метод наименьших квадратов.
Как и в FE-модели, случайные эффекты также интерпретируют наличие индивидуальных характеристик у субъектов, которые не изменяются со временем в процессе наблюдений [27], но в модели со случайными ошибками они встраиваются в состав ошибки, которая случайна и сходна с классической регрессионной моделью, где наличие случайных ошибок объясняется как недостаточность в модели объясняющих переменных.
В таблице 1.1 дан сравнительный анализ моделей с фиксированными и случайными эффектами [24].
Таблица 1.1. Сравнение FE-модели и RE-модели |
|||
Критерий \ модель |
FE-модель |
RE-модель |
|
Получаемые выводы |
Условные по отношению к значениям эффектов ai. |
Безусловные относительно всех эффектов ai. |
|
Интерпретация |
Наиболее уместна, когда в роли субъектов выступают страны, компании и т.п. |
Для исследователя субъекты обезличины. |
|
Функция ошибок |
Тогда |
Тогда |
1.3 Обзор методов оценки качества моделей на панельных данных
Процесс построения эконометрической модели также включает в себя этап верификации, в ходе которого выполняются проверки на различные гипотезы о качестве оцениваемой модели. Проверке могут подвергать как отдельные факторы модели, так и вся модель целиком, от значимости переменных до их взаимозависимости; ошибки модели также проходят проверку на нормальность распределения.
Для того, чтобы определить, какой тип модели применять к данным: модель с фиксированными эффектами или модель с временными эффектами; необходимо воспользоваться тестом Хаусмана для сравнения этих двух моделей [28].
С помощью теста Хаусмана проверяется гипотеза: H0: E(ai|xit)=0 против альтернативной H1: E(ai|xit)?0. При гипотезе H0 оценки (Generalized Least Squares - Обобщенный МНК), которые соответствуют RE-модели, и оценки , соответствующие FE-модели, состоятельны, а при гипотезе H1 оценки - несостоятельны, оценки - состоятельны.
Статистика критерия Хаусмана
имеет при гипотезе H0 асимптотическое (N>) распределение
Для K регрессоров статистика имеет вид при той же гипотезе:
имеет асимптотическое распределение
В статистке критерия Хаусмана =, и, следовательно, - общая формула дисперсии суммы двух случайных величин [24].
Критерий Бройша - Пагана используется для проверки гипотезы в рамках модели со случайными эффектами H0: , то есть сведение к pooled-модели.
Статистика критерия Бройша - Пагана
при нулевой гипотезе имеет асимптотическое распределение соответсвенно, данная гипотеза отвергается, если значение статистики BP превышает критическое значение [23, 29].
Для проверки гипотезы о значимости регрессоров используется критерий Вальда, который основан на статистике Wald=qF, где F - статистика для проверки данной гипотезы:
Гипотеза H0: ai=0, при тестовой статистике:
где RSS (Residual Sum of Squares) - сумма квадратов регрессионных остатков;
а q - количество линейных ограничений на параметры модели [22].
Статистика Вальда имеет асимптотическое распределение Вычисленные на основе данного распределения наблюдаемые уровни значимости (p-значения) будут свидетельствовать о значимости коэффициентов регрессии.
Кроме вышеописанных методов оценки качества модели применяют также стандартные значения стандартных ошибок и t-статистик (тест Стьюдента) параметров - вероятность значимости коэффициента [22].
t-статистика определяется как:
где - коэффициент регрессии, a - некоторое значение, которому должен соответствовать коэффициент, - стандартная ошибка оценки коэффициента.
Если значение статистики выше критического значения, то разница между коэффициентом регрессии и a является значимой, в противном случае - незначимой, то есть истинный коэффициент очень близок к предполагаемому значению a.
Важным тестом также является тест на мультиколлинеарность - он показывает зависимости регрессов между собой [24]. Для определения возможной мультиколлинеарности строят корреляционную матрицу, в которой рассчитываются значения коэффициентов корреляции между переменными x и y по формуле:
где:
Cov(x,y) - ковариация между x и y,
- выборочные дисперсии,
- выборочные средние из m количества по x и по y,
то x и y линейно зависимы,
то x и y линейно независимы.
Второй этап проверки - показатель VIF. VIF (Variance Inflation Factor) - коэффициент возрастания дисперсии или коэффициент множественной корреляции между одной переменной и остальными [24].
где R2 - коэффициент детерминации.
Если показатель VIF больше 10, то принято считать, что в модели есть мультиколлинеарность. Следующая проверка качества модели будет связана с нормальностью остатков. Для начала стоит понять, что такое остатки, как они влияют на модель и как их можно интерпретировать. Остатки, или же ошибки модели, - это разница между реальным и расчетными значениями:
.
При построении модели МНК или ВМНК получают некоторое уравнение с константой и коэффициентами при регрессорах; если вместо обозначений регрессоров, будут подставлены реальных значений, например, наблюдения 20, то зависимая переменная, полученная таким уравнением (расчетное значение), не будут в точности равна зависимой переменной наблюдения 20 (реальное значение) [30].
Данная разница между значениями и есть ошибка регрессии.
Важно отметить, что ошибки бывают как положительные, так и отрицательные, но при анализе на нормальность используется значение по модулю.
Если остатки имею нормальное распределение:
то принято говорить об их нормальности.
Нормальность остатков говорит о верной спецификации модели, эффективности оценок и надежности на точность дальнейших прогнозов.
Наиболее распространенная статистика - коэффициент детерминации (R2) - служит для оценки качества модели в целом; чем выше значение коэффициента, тем лучше специфицирована модель (R2[0;1]).
Коэффициент рассчитывается по формуле
где - дисперсия случайной ошибки модели.
На практике часто используется скорректированный коэффициент детерминации (R2 adjusted, R2adj), на значение которого не влияет количество факторов в рассматриваемой модели [23]:
где n - количество наблюдений, k - количество параметров.
Скорректированный коэффициент детерминации часто применяется также для сравнения качества моделей с разным количество регрессов, по сколько на значения его показателя не влияет большое количество факторных переменных.
LSDV (least square dummy variable) R2 - это R2для LSDV модели, которая учитывает сам тип панельных данных [24], то есть в такой модели происходит процесс «контролирования» изменения переменной Y от X зависимости от объекта выборки. Within R2 (или «в пределах R2») - является скорректированным R2для модели с фиксированными эффектами.
Для измерения относительного качества модели используют информационные критерии, например Шварца и Акайке [31-32].
Информационный критерий Акайке:
где n - количество наблюдений, k - количество параметров, SSRES - сумма квадратов остатков, рассчитанная по формуле:
,
где - фактические и расчетные значения объясняемой переменной.
Байесовский информационный критерий Шварца:
C помощью таких критериев модели сравниваются между собой, наименьшее значения критерия свидетельствует о более точной спецификации модели [33].
1.4 Выводы по первой главе
Таким образом, в данной главе были рассмотрены работы отечественных и зарубежных авторов, в которых были проанализированы различные методы моделирования, переменные уравнений и подтверждены гипотезы. Обзор основных моделей показал, что для анализа панельных данных лучше использовать pooled модели, модели с фиксированными и случайными эффектами. В качестве детерминант уровня преступности необходимо рассмотреть факторы такие, как численность постоянного населения, количество совершенных преступлений, число абортов, число ВИЧ_инфицированных и наркозависимых, количество проданного алкоголя, число детей, не обучающихся в образовательных организация, количество выпускников, не получивших аттестат, миграционный прирост, количество воспитанников школ_интернатов.
Глава 2. Моделирование регионального уровня преступности в России
Как было рассмотрено в первой главе, основными моделями для анализа уровня преступности являются модели на панельных данных. Основываясь на их особенностях проведения анализа, построим модели, и используя вышеописанные средства выберем наилучшую из них.
Во второй главе настоящего исследования проведено эконометрического моделирование, которое включает в себя процесс сбора данных, их оценки, построение моделей типа pooled, fixed effects и random effects, выбор лучшей из них и обоснование выбора с интерпретацией показателей.
2.1 Исходные данные
В работе были исследованы данные за 3 года с 2011 по 2013 года; такой период выбора данных обусловлен полнотой информации по различным факторам, совпадающих во временных отрезках (источник данных - ЕМИСС Государственная Статистика - fedstat.ru) [34].
В качестве зависимой переменной выступает суммарный уровень преступности по регионам России, в который входят следующие показатели, согласно приведенным статьям уголовного кодекса РФ [35]:
1. Убийство (по ст.105 УК РФ);
2. Умышленное причинение вреда здоровью (по ст.111 УК РФ);
3. Изнасилование (по ст.131 УК РФ);
4. Кража (по ст.158 УК РФ);
5. Грабёж (по ст.161 УК РФ);
6. Разбой (по ст.162 УК РФ);
7. Вымогательство (по ст.163 УК РФ);
8. Хулиганство (по ст.213 УК РФ).
Так как данный показатель покрывает большое количество разных видов преступлений, преступлений против личности в том числе, при получении результатов моделирования можно будет говорить о совокупной единице преступлений. В случае рассмотрения более детального моделирования, можно в качестве выходных параметров модели брать определенный вид преступлений, и на базе новой переменной строить модель и интерпретировать результаты.
На основе анализа, проведенного в первой главе настоящей работы, в качестве объясняющих переменных были выбраны следующие факторы, отображающие наиболее значимое влияние на уровень преступности.
В данном исследовании экзогенными переменными будут выступать:
1. Численность постоянного населения.
2. Число прерываний беременности или абортов.
3. Количество впервые ВИЧ-инфицированных.
4. Численность воспитанников школ-интернатов.
5. Численность детей, не обучающихся в образовательных организациях.
6. Количество проданной алкогольной продукции.
7. Миграционный прирост.
8. Количество впервые больных с диагнозом «наркомания».
9. Численность обучающихся, не получивших аттестат.
Численность постоянного населения измеряется в количестве человек и представляет собой средняя арифметическая из численностей населения на начало и конец соответствующего года. Число прерываний беременности, выраженное в единицах проведенных операций, - это расчетный показатель, зарегистрированный министерством здравоохранения РФ. Количество впервые ВИЧ-инфицированных - это расчетное число, выраженное в количестве человек, зарегистрированное министерством здравоохранения РФ. Численность воспитанников школ-интернатов выражается в количестве детей (чел.), которые в расчётном году остались без попечения родителей. Численность детей, не обучающихся в образовательных организациях - расчетный показатель министерства образования и науки Российской Федерации, отражающий, сколько детей и подростков не получают образовательные услуги в образовательных учреждениях. Количество проданной алкогольной продукции - это тысячи декалитров продукции, которая была продана за расчетный год. Миграционный прирост - это расчетный показатель-арифметическая разница между числом прибывших и числом выбывших за отчетный год, выраженная в количестве человек. Заболеваемость с впервые в жизни установленным диагнозом наркомании - количество пациентов с диагнозом наркомании, зарегистрированное министерством здравоохранения РФ. Численность обучающихся выпускного класса, не получивших аттестат о среднем (полном) общем образовании выражается в количестве человек, зарегистрированная министерством образования и науки Российской Федерации [34].
Все экспортированные переменные имеют паспорта данных, что свидетельствует об их подлинности и актуальности (Приложение A).
В настоящем исследовании рассмотрены все девять экзогенных переменных или регрессоров, однако в финальном уравнении модели могут быть не все из вышеописанных переменных в виду низкого качества данных или внутренней мультиколлинеарности.
При работе с показателями в программных пакетах, необходимо присвоить обозначения для наших величин, представленные в таблице 2.1:
Таблица 2.1. Обозначения показателей |
||
Показатель |
Обозначения |
|
Уровень преступности (ед.) |
crime |
|
Население (чел.) |
popul |
|
Количество абортов (ед.) |
abort |
|
ВИЧ-инфицированные (чел.) |
hiv |
|
Воспитанники школ-интернатов (чел.) |
c_home |
|
Не обучающиеся дети (чел.) |
no_edu |
|
Алкогольная продукция (тыс.дал.) |
alco |
|
Миграционный прирост (чел.) |
net_migr_ |
|
Наркозависимые (чел.) |
drug |
|
Выпускники без аттестата (чел.) |
no_diploma |
Объектами модели выступают такие единицы, которые описываются с помощью переменных в течении какого-либо промежутка времени. При проведении анализа панельных данных объектами могут выступать страны, города, организации и т.д. В настоящей работе объектами будут выступать субъекты Российской Федерации - 83 территориальные единицы верхнего уровня в Российской Федерации в период с 2011 по 2013 года (22 республики, 9 краев, 46 областей, 2 города федерального значения, 1 автономная область и 4 автономных округов), представленные в Приложении B.
Таким образом, в настоящей работе проведено эконометрическое исследование на выявление зависимости между показателями преступности в субъектах Российской Федерации и возможными регрессорами. Данные, полученные с помощью открытой базы национальной статистики, взяты за 3 года (2011-2013 гг.), что говорит об актуальности полученных результатов.
2.2 Описательные статистики данных
В данной работе проведен описательный анализ используемых в моделях данных в срезе по годам. При описательной статистике используются такие параметры, как: среднее значение выборки, стандартная ошибка, медиана, мода, стандартное отклонение, дисперсия выборки, значение эксцесса, коэффициент асимметричности, значения минимума и максимума [36]. Стоит заметить, что при выгрузке данных, некоторые значения в отдельных регионах не были доступны, поэтому их текущее значение равно 0, в результате, мы можем иметь небольшую погрешность в расчете описательной статистики в виду наличия нулевых значений факторов. Показатель среднего значения указывает усредненную величину по всем регионам - он не несет в себе никакой смысловой составляющей, поскольку существует большой разброс в данных среди, например, центрального региона (Московская обл.) и дальневосточного федерального округа (Камчатский край).
Описательный анализ включает расчеты медианы, моды, стандартного отклонения, дисперсии, коэффициентов эксцесса и асимметрии, минимума и максимума.
Медиана - значение, которое разбивает выборку на равные части; ее отличие от среднего значения состоит в том, что медиана - это реальное значения из выборки, которое занимает «серединную» позицию в упорядоченной выборке.
Мода - значение, которое наиболее часто встречается в выборке. При анализе данных по 83 регионам достаточно редко будут попадать повторяющиеся значения, поэтому данные показатель может принимать нулевое значение - те регионы, по которым не было информации, и принимать «0» за наиболее часто встречающееся значение.
Рассеивание величины показывает стандартное отклонение в сравнении с ее математическим ожиданием. Стандартное отклонение несет в себе математический смысл для разведочного анализа.
Дисперсия это стандартное отклонение в квадрате, показывающая на сколько единиц от среднего значения могут отличаться данные.
Коэффициент эксцесса - это показатель остроты распределения величины в выборке. При нормальном распределении коэффициент стремится к нулю, при «приплюснутой» вершине - меньше нуля, а при «острой» - больше нуля.
Коэффициент асимметрии указывает на «сдвиг» вершины: если коэффициент больше нуля, то правый хвост распределения длиннее левого, а если отрицательный, то левый хвост более длинный [21].
Минимум и максимум отражают наибольшее и наименьшее значение по выборке. Данные показатели уже несут в себе еще и социальный смысл, например, можно сказать что наибольшее количество зарегистрированных преступлений в 2012 году в регионе составило 107072 единиц.
В таблице 2.2 представлена описательная статистика по данным за 2011 год.
Таблица 2.2. Описательная статистика данных 2011 года |
||||||||||
Показатель |
Среднее |
Медиана |
Мода |
Стандартное отклонение |
Дисперсия |
Эксцесс |
Асимметричность |
Минимум |
Максимум |
|
Переменная |
||||||||||
crime |
15118,12 |
8963 |
Н/Д |
16516,07 |
272780589 |
14,76 |
3,07 |
333 |
113734 |
|
popul |
1747989 |
1219207 |
Н/Д |
1722173 |
2,96E+12 |
14,02 |
3,06 |
42271 |
11816671 |
|
abort |
12159,9 |
9462 |
Н/Д |
9357,01 |
87553606 |
1,28 |
1,28 |
488 |
44572 |
|
hiv |
36,34 |
23 |
21,8 |
32,84 |
1078,6 |
1,23 |
1,4 |
3 |
138 |
|
c_home |
222,76 |
180 |
0 |
242,39 |
58755,28 |
9,99 |
2,41 |
0 |
1548 |
|
no_edu |
362,06 |
261 |
113 |
342,14 |
117060,37 |
1,96 |
1,48 |
9 |
1627 |
|
alco |
232,84 |
72,11 |
0 |
590,5 |
348689,7 |
38,77 |
5,77 |
0 |
4593,69 |
|
net_migr |
4044,12 |
2470 |
246 |
4479,67 |
20067441 |
5,81 |
2,15 |
45 |
23243 |
|
drug |
14 |
12 |
4 |
8,18 |
66,95 |
-0,24 |
0,64 |
1 |
34 |
Анализ таблицы 2.2 показал, что в 2011 году уровень преступности (crime) варьировался от 333 до 113734 единиц преступлений с медианой 8963 преступления, имея асимметричное распределение. Число совершенных операций по прерыванию беременности (abort) достигло максимального значения в 44572 единицы. Среднее количество проданного алкоголя (alco) составило 232,84 тыс. дал.
В таблице 2.3 приведены описательные статистики данных за 2012 год.
В таблице 2.3 отражено, что в 2012 году уровень преступности (crime) варьировался от 232 до 121519 преступлений в регионах, среднее значение которого равно14255 единиц, распределение асимметричное. Минимальное значение впервые ВИЧ-инфицированных (hiv) составило 4 человека, а максимальное 219 человек. Медиана миграционного прироста (net_migr) составила 2288 человек.
Таблица 2.3. Описательная статистика данных 2012 года |
||||||||||
Показатель |
Среднее |
Медиана |
Мода |
Стандартное отклонение |
Дисперсия |
Эксцесс |
Асимметричность |
Минимум |
Максимум |
|
Переменная |
||||||||||
crime |
14255 |
8251 |
Н/Д |
16601,3 |
275603777 |
20,7 |
3,7 |
232 |
121519 |
|
popul |
1751278 |
1207914 |
Н/Д |
1736702,5 |
3,016E+12 |
14,1 |
3,1 |
42613 |
11918053 |
|
abort |
11516,8 |
8515 |
Н/Д |
9033,7 |
81606862 |
1,2 |
1,3 |
540 |
42314 |
|
hiv |
39,9 |
25 |
11,6 |
37,6 |
1412,5 |
5,7 |
2 |
4 |
219 |
|
c_home |
208,2 |
168 |
0 |
238 |
56646,8 |
10,8 |
2,6 |
0 |
1527 |
|
no_edu |
366,1 |
242 |
66 |
373,4 |
139449,1 |
2,2 |
1,6 |
8 |
1656 |
|
alco |
237,7 |
67,2 |
0 |
646,8 |
418289,4 |
43,7 |
6,1 |
0 |
5186 |
|
net_migr |
3667,3 |
2288 |
1221 |
4515,9 |
20393405 |
7,2 |
2,5 |
-1043 |
24094 |
|
drug |
11,9 |
10 |
12,8 |
7,7 |
59,5 |
0,2 |
0,8 |
0 |
33 |
В таблице 2.4 показаны значения описательной статистики данных 2013 года.
Таблица 2.4. Описательная статистика данных 2012 года |
||||||||||
Показатель |
Среднее |
Медиана |
Мода |
Стандартное отклонение |
Дисперсия |
Эксцесс |
Асимметричность |
Минимум |
Максимум |
|
Переменная |
||||||||||
crime |
13148,54 |
8178 |
Н/Д |
15045,28 |
226360510,3 |
18,05 |
3,44 |
225 |
107072 |
|
popul |
1755195,17 |
1197040 |
Н/Д |
1754055,7 |
3,08E+12 |
14,29 |
3,11 |
42907 |
12043893 |
|
abort |
10860,66 |
8301 |
Н/Д |
8611,2 |
74152820,79 |
1,34 |
1,33 |
471 |
40217 |
|
hiv |
44,42 |
29 |
18,3 |
41,85 |
1751,49 |
3,57 |
1,78 |
3 |
217 |
|
c_home |
189,36 |
148 |
0 |
218,61 |
47790,16 |
12,39 |
2,79 |
0 |
1439 |
|
no_edu |
316,76 |
171 |
280 |
333,15 |
110987,43 |
2,28 |
1,69 |
5 |
1352 |
|
alco |
236,97 |
69,06 |
Н/Д |
735,84 |
541459,34 |
57,73 |
7,2 |
0 |
6276,36 |
|
net_migr |
3660,13 |
2107 |
Н/Д |
5180,91 |
26841865,24 |
20,9 |
3,86 |
-337 |
37039 |
|
drug |
10,28 |
8 |
4,2 |
7,19 |
51,67 |
1,07 |
1,09 |
0 |
36 |
Анализируя таблицу 2.4, можно сделать заключение, что в 2013 году уровень преступности (crime) находился в пределах от 225 до 107072 единицы преступления, с медианой в 8178 единицы, имея асимметричное распределение. Максимальное значение пациентов с диагнозом «наркомания», поставленным впервые (drug), составило 36 человек.
2.3 Корреляционный анализ данных
В статистке корреляционный анализ применяется при обработке статистических данных, с целью изучения взаимосвязей между всеми переменными выборки. Сам коэффициент корреляция показывает наличие взаимосвязи между показателями, то есть сопутствует ли изменения одной величины соответствующим изменением второй величины [24]. Коэффициент принимает значения [_1;1], при стремлении значения коэффициента корреляции к единице - можно заявлять о наличии прямой зависимости переменных друг от друга (часто при попадании величины в промежуток [0,75;1], свидетельствуется о наличие зависимости переменных), так, наличие данной зависимости нечет в себе возможность построения ошибочной модели, поскольку внутри экзогенных переменных заведомо существует внутренняя связь, что может повлиять на дальнейшие показатели адекватности модели. О наличии обратной зависимости будет говорить значения коэффициента из промежутка [-1;-0,75], то есть при увеличении первой переменной на одну единицу, вторая переменная будет уменьшаться на одну единицу, соответственно. Если же коэффициент корреляции стремится к нулю, то можно говорить об отсутствии зависимости.
В таблице 2.5 представлена корреляционную матрицу для экзогенных данных.
Таблица 2.5. Корреляционная матрица |
||||||||||
popul |
abort |
hiv |
c_home |
no_edu |
alco |
net_migr |
drug |
no_dipl |
||
popul |
1 |
|||||||||
abort |
0,77 |
1 |
||||||||
hiv |
0,35 |
0,6 |
1 |
|||||||
c_home |
0,27 |
0,38 |
0,38 |
1 |
||||||
no_edu |
0,3 |
0,51 |
0,3 |
0,3 |
1 |
|||||
alco |
0,69 |
0,28 |
0,09 |
0,11 |
-0,01 |
1 |
... |
Подобные документы
Проектирование регрессионной модели по панельным данным. Скрытые переменные и индивидуальные эффекты. Расчет коэффициентов однонаправленной модели с фиксированными эффектами по панельным данным в MS Excel. Выбор переменных для построения данной регрессии.
курсовая работа [2,3 M], добавлен 26.08.2013Построение эконометрической модели, описывающей линейную зависимость результативного признака факторов, входящих в нее, методом матрицы. Проверка ее на адекватность по критерию Фишера. Определение дисперсии, ковариации, корреляции и детерминации.
контрольная работа [180,5 K], добавлен 03.12.2014Краткая характеристика СПК "Слава". Спецификация модели рентабельности собственного капитала. Оценка параметров модели и влияние мультиколлинеарности факторов. Построение аддитивной модели временного ряда уровня рентабельности собственного капитала.
курсовая работа [1,0 M], добавлен 29.08.2015Построение и анализ однофакторной и многофакторной эконометрической модели. Вычисление парных и частичных коэффициентов корреляции. Проверка адекватности модели по критерию Фишера. Исследование наличия мультиколлениарности по алгоритму Феррара-Глобера.
контрольная работа [172,4 K], добавлен 28.05.2010Сущность экономико-математической модели, ее идентификация и определение достаточной структуры для моделирования. Построение уравнения регрессии. Синтез и построение модели с учетом ее особенностей и математической спецификации. Верификация модели.
контрольная работа [73,9 K], добавлен 23.01.2009Анализ и выявление значимых факторов, влияющих на объект. Построение эконометрической модели затрат предприятия для обоснований принимаемых решений. Исследование трендов временных рядов. Оценка главных параметров качества эконометрической модели.
курсовая работа [821,1 K], добавлен 21.11.2013Сферы применения имитационного моделирования для выбора оптимальных стратегий. Оптимизация уровня запасов и построение модели управления. Построение имитационной модели и анализ при стратегии оптимального размера заказа и периодической проверки.
контрольная работа [57,5 K], добавлен 23.11.2012Процесс построения и анализа эконометрической модели в пакете Econometric Views. Составление, расчет и анализ существующей проблемы. Проверка адекватности модели реальной ситуации на числовых данных в среде Eviews. Построение регрессионного уравнения.
курсовая работа [1,3 M], добавлен 17.02.2014Построение уравнения регрессии, учитывающего взаимодействия факторов, проверка полученной модели на адекватность. Построение математической модели и нахождение численных значений параметров этой модели. Вычисление коэффициентов линейной модели.
курсовая работа [1005,0 K], добавлен 07.08.2013Публикация данных: источники информации и влияние факторов на деятельность. Статистическая автокоррелированность ряда и проверка ее порядков, статистика Дарбина–Уотсона. Регрессионные зависимости и леммы эконометрической модели, доверительный интервал.
практическая работа [327,4 K], добавлен 15.03.2009Эконометрическое исследование признаков деятельности предприятий: доля расходов на закупку товаров, среднедневная заработная плата одного работающего. Построение линейного графика регрессионной зависимости между показателями, оценка адекватности модели.
контрольная работа [93,3 K], добавлен 14.12.2011Статические и динамические модели. Анализ имитационных систем моделирования. Система моделирования "AnyLogic". Основные виды имитационного моделирования. Непрерывные, дискретные и гибридные модели. Построение модели кредитного банка и ее анализ.
дипломная работа [3,5 M], добавлен 24.06.2015Ознакомление с основами модели простой регрессии. Рассмотрение основных элементов эконометрической модели. Характеристика оценок коэффициентов уравнения регрессии. Построение доверительных интервалов. Автокорреляция и гетероскедастичность остатков.
лекция [347,3 K], добавлен 23.12.2014Построение эконометрической модели спроса в виде уравнений парной и множественной регрессии. Отбор факторов для построения функции потребления. Расчет коэффициентов корреляции и детерминации, проверка правильности выбранных факторов и формы связи.
контрольная работа [523,7 K], добавлен 18.08.2010Процедура проведения имитационных экспериментов с моделью исследуемой системы. Этапы имитационного моделирования. Построение концептуальной модели объекта. Верификация и адаптация имитационной модели. Метод Монте-Карло. Моделирование работы отдела банка.
курсовая работа [549,5 K], добавлен 25.09.2011Исследование особенностей разработки и построения модели социально-экономической системы. Характеристика основных этапов процесса имитации. Экспериментирование с использованием имитационной модели. Организационные аспекты имитационного моделирования.
реферат [192,1 K], добавлен 15.06.2015Построение качественной и адекватной эконометрической модели по методу наименьших квадратов и ее анализ на наличие автокорреляции, мультиколлинеарности, гетероскедастичности с применением статистики Дарвина-Уотсона, тестов Парка и Голдфелда-Квандта.
курсовая работа [434,0 K], добавлен 04.12.2013Исследование причин возникновения, последствий и основных видов безработицы. Моделирование и прогнозирование численности безработных в Российской Федерации. Определение доли экономически активного населения. Построение регрессионной модели безработицы.
курсовая работа [203,8 K], добавлен 31.03.2015Построение описательной экономической модели. Матрица корреляций между исходными статистическими признаками. Оценка параметров модели. Определение и графическое изображение регрессионной зависимости между показателями. Оценка адекватности модели.
контрольная работа [215,8 K], добавлен 13.10.2011Выбор факторных признаков для двухфакторной модели с помощью корреляционного анализа. Расчет коэффициентов регрессии, корреляции и эластичности. Построение модели линейной регрессии производительности труда от факторов фондо- и энерговооруженности.
задача [142,0 K], добавлен 20.03.2010