Классификационный алгоритм решения задачи коррекции социально-экономических показателей в условиях нерепрезентативных выборок
Мониторинг социально-экономических показателей в разрезе субъектов РФ. Фильтрация и коррекция собираемых статистических данных, особенно в случае малых нерепрезентативных выборок. Использование методов структурно-классификационного анализа данных.
Рубрика | Экономика и экономическая теория |
Вид | статья |
Язык | русский |
Дата добавления | 02.11.2018 |
Размер файла | 37,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Классификационный алгоритм решения задачи коррекции социально-экономических показателей в условиях нерепрезентативных выборок
Ю.А. Дорофеюк
ИПУ РАН, Москва, Россия
Ключевым инструментом для анализа экономического развития страны является мониторинг социально-экономических показателей в разрезе субъектов РФ. Главная проблема при решении данной задачи - фильтрация и коррекция собираемых статистических данных, особенно в случае малых нерепрезентативных выборок. В работе предложен новый метод сглаживания для малых выборок, позволяющий получать достаточно точные оценки, не уменьшая оперативность мониторинга. Он основан на использовании методов структурно-классификацион-ного анализа данных [1,2].
социальный экономический показатель статистический
1. Постановка задачи
В настоящее время по вопросам экономической активности (ЭА), занятости и безработицы ежемесячно опрашивается около 69 тыс. человек в возрасте 15-72 года (0,06% населения данного возраста). При проведении выборочных обследований населения по проблемам занятости применяется модель независимых месячных выборок в рамках года [3]. Для большинства регионов достоверно оценить ежемесячный уровень безработицы (УБ) по выборочным данным не удаётся. Результаты мониторинга нуждаются в коррекции (сглаживании).
Простейшим методом сглаживания является метод скользящего среднего (МСС) [4]. При его применении полученная выборка достаточно представительна, кривая довольно гладкая. Но для расчёта значения скользящего среднего за текущий месяц необходимы данные выборочного обследования за следующий месяц. Необходимо разработать такой метод сглаживания, который не имел бы этого недостатка.
2. Метод группировки регионов
Идея предлагаемого метода группировки регионов (МГР) состоит в объединении выборок в нескольких регионах, полученных в одном месяце, близких по динамике исследуемого показателя, в одну выборку для повышения надежности оценки показателя. МГР описан как метод оценки УБ в i-м регионе в k-ом месяце (этот регион и месяц называются расчётными). Метод включает 4 этапа:
1. Производится сглаживание помесячных данных обследования, для чего используется МСС.
2. Формируется группа регионов, близких к расчётному, по динамике УБ; выборки вошедших в эту группу регионов объединяются. Полученная группа регионов рассматривается как один виртуальный регион (ВР), ассоциируемый с расчётным регионом;
3. На базе объединённой выборки ВР с помощью процедуры масштабирования находится искомая оценка УБ для расчётного региона по состоянию на расчётный месяц.
4. Производится сезонное сглаживание временного ряда оценок УБ, полученного на третьем этапе.
Алгоритм формирования виртуального региона. Для формирования ВР используются данные обследований за 14 месяцев (расчётный месяц и предыдущие 13 месяцев). Формирование указанной группы регионов производится с помощью адаптированного к рассматриваемой задаче алгоритма эталонной автоматической классификации динамических объектов [2]. На каждом шаге алгоритма в группу (ВР) добавляется регион, наиболее близкий (в описанном ниже смысле) к расчётному. Регионам присваиваются номера в том порядке, в котором они вводятся в ВР: расчётному региону присваивается номер 1 и т.д. Рассмотрим (i+1)-й шаг алгоритма. К началу этого шага ВР включает i регионов и представлена следующей информацией:
а) Временной ряд значений скользящего среднего УБ в расчётном регионе за 12 месяцев, предшествующих расчётному месяцу . Месяцы нумеруются в порядке естественного хода времени. Далее этот временной ряд будем называть эталоном.
б) Временной ряд значений числа безработных в ВР за 12 месяцев
где - значение числа безработных в ВР в p-ом месяце, где - значение числа безработных в p-ом месяце для k-го региона из этого ВР.
в) Временной ряд значений численности ЭА населения в ВР:
Здесь - значение численности ЭА населения в ВР в p-м месяце, где - значение численности ЭА населения в p-м месяце для k-го региона из этого ВР.
г) Временной ряд значений УБ в ВР за 12 месяцев
где .
д) Коэффициент корреляции между временным рядом значений УБ в сформированном к (i+1)-му шагу ВР и эталоном .
На (i+1)-м шаге алгоритма из всех ещё не вошедших в группу регионов выбирается такой k-й регион, добавление которого к группе доставляет максимум коэффициенту корреляции : , где , - временной ряд УБ в сформированном на (i+1)-м шаге ВР в результате добавления к нему k-го региона. Если (коэффициент корреляции после включения в ВР выбранного k-го региона не уменьшился), то этот регион вводится в ВР, ему присваивается номер (i+1) и алгоритм переходит к следующему шагу. Если , то работа алгоритма заканчивается.
Процедура масштабирования. Хотя кривая УБ в ВР по форме почти не отличается от кривой скользящего среднего для расчётного региона, она обычно смещена относительно первой кривой и может отличаться также и масштабом. Это объясняется тем, что в качестве меры близости временных рядов используется значение коэффициента корреляции; смещение на константу и изменение масштаба не меняет его значения. Таким образом, в ВР могут включаться регионы, близкие к расчётному региону по характеру сезонных изменений УБ, но заметно отличающиеся по абсолютной величине этого показателя.
Цель процедуры масштабирования - с помощью линейного преобразования кривой УБ в группе так совместить её с кривой скользящего среднего для расчетного региона, чтобы сумма квадратов разностей между этими кривыми по всем месяцам была минимальной. Обозначим через - вектор значений УБ в ВР за 12 месяцев; - вектор значений скользящего среднего УБ для расчетного региона. Требуется найти такие константы и линейной регрессии на чтобы выполнялось условие:
Эта задача решается с помощью стандартной процедуры метода наименьших квадратов.
Сезонное сглаживание. Производится сезонное сглаживание полученного на третьем этапе временного ряда УБ (выделение тренда и сезонной составляющей). Так как ежемесячные обследования безработицы проводятся с августа 2009г. и к настоящему времени в наличии имеется только 16 точек временного ряда, то по крайней мере до конца 2012г., единственным надёжным способом сезонного сглаживания останется линейное сглаживание (нахождение линейного тренда). Поиск тренда в классе нелинейных функций требует намного более длинного временного ряда.
Пусть - временной ряд оценок УБ за прошедшие 12 месяцев, включая расчётный месяц. Тогда линейный тренд имеет вид
где , i - номер месяца временного ряда, а коэффициенты и находятся с помощью стандартной процедуры линейной регрессии из условия:
Величина принимается в качестве «трендового» значения, а величина - в качестве сезонной составляющей УБ в расчётном месяце.
3. Результаты экспериментальных расчетов
Для проверки эффективности МГР были проведены расчёты оценок УБ за сентябрь 2010г. по всем регионам РФ и проведено сравнение этих оценок с оценками, полученными МСС. Получены следующие выводы:
1. Оценки УБ, полученные МСС и МГР, очень близки.
2. Ошибки МСС - это ошибки интерполяции. Ошибки МГР связаны с неоднородностью выборки. Факт, что при разных источниках ошибок результаты получаются практически одинаковые, означает, что каждый из этих методов дает достоверные оценки УБ.
3. МГР имеет решающее преимущество: он позволяет получать оценки УБ сразу же после получения данных выборочного обследования.
Литература
1. Бауман Е.В., Дорофеюк А.А. Классификационный анализ данных // Труды Международной конференции по проблемам управления. Том 1. - М.: СИНТЕГ, 1999. - С. 62-67.
2. Бауман Е.В., Дорофеюк А.А., Дорофеюк Ю.А. Методы динамического структурного анализа многомерных объектов. / Четвертая международная конференция по проблемам управления (МКПУ-IV): Сборник трудов. ? М.: ИПУ РАН, 2009. - С. 338-343.
3. Дорофеюк А.А., Дорофеюк Ю.А., Лайкам К.Э.,Чернявский А.Л. Методология структурно-классификационной коррекции квазистационарных временных рядов в задачах статистического и социально-экономического мониторинга. // Материалы Четвертой международной конференции MLSD'10. Том II. М.: ИПУ РАН, 2010.
4. Дж. Бокс, Г.Дженкинс Анализ временных рядов. // Прогноз и управление. М.: Изд. «Мир», 1974. -406 с.
Размещено на Allbest.ru
...Подобные документы
Анализ обобщающих показателей и закономерностей социально-экономических явлений и процессов в конкретных условиях места и времени. Описание количественной стороны массовых социально-экономических явлений, отражаемых посредством показателей статистики.
контрольная работа [761,6 K], добавлен 22.01.2015Предварительная обработка статистических данных финансово-экономических показателей с помощью двухмерной модели корреляционного анализа. Прогнозирование финансово-экономических показателей на основе качественной оценки регрессионной линейной модели.
лабораторная работа [244,9 K], добавлен 24.11.2010Понятие экономического анализа как науки, его сущность, предмет, общая характеристика методов и социально-экономическая эффективность. Основные группы эконометрических методов анализа и обработки данных. Факторный анализ экономических данных предприятия.
реферат [44,7 K], добавлен 04.03.2010Качественный и количественный анализ ресурсов социально–экономических процессов предприятия на основе статистических данных. Использование компьютерных программ для анализа эффективности экономических процессов. Пути оптимизации производственного цикла.
курсовая работа [895,9 K], добавлен 01.11.2014Теоретико-методологические основы методов и принципов социально-экономического планирования и прогнозирования. Анализ и прогнозирование социально-экономических процессов МО Улан-Удэ. Прогноз основных показателей социально-экономических процессов.
курсовая работа [180,6 K], добавлен 04.12.2013Основные положения факторного анализа. Принципы и модели дисперсионного анализа, его роль и место в статистических исследованиях. Особенности применения дисперсионного анализа при исследовании социально-экономических показателей по Республике Беларусь.
курсовая работа [762,4 K], добавлен 01.07.2014- Использование корреляционно-регрессионного анализа для обработки экономических статистических данных
Роль корреляцонно-регрессионного анализа в обработке экономических данных. Корреляционно-регрессионный анализ и его возможности. Предпосылки корреляционного и регрессионного анализа. Пакет анализа Microsoft Excel.
курсовая работа [68,4 K], добавлен 11.06.2002 Сущность статистического изучения социально-экономических явлений. Группировка данных статистических наблюдений в анализе производства зерновых культур, изучение средних характеристик и показателей вариации. Использование рядов динамики и метода индекса.
курсовая работа [172,2 K], добавлен 13.03.2014Система статистических показателей состава персонала. Методы корреляционно-регрессионного анализа в обработке экономических данных. Моделирование методов по показателям финансовой отчетности ЗАО "Зеленстрой", прогнозирование по показателям отчетности.
курсовая работа [1001,2 K], добавлен 09.07.2014Характеристика основных экономических показателей производства. Обзор современных методов экономического анализа. Расчет плановых значений основных экономических показателей. Анализ основных экономических показателей производства продукции (затвора).
курсовая работа [410,9 K], добавлен 18.09.2010Статистика в медицине как один из инструментов анализа экспериментальных данных и клинических наблюдений. Понятие количественных (числовых) данных. Выборки численных переменных. Виды критериев для независимых выборок, особенности их использования.
презентация [750,1 K], добавлен 16.10.2016Априорный анализ исходных статистических данных на примере предприятия автомобильного транспорта Тюменской области. Оценка однородности и характера распределения совокупности данных. Моделирование и интерпретация связи социально-экономических явлений.
курсовая работа [393,3 K], добавлен 07.03.2011Проведение экспериментального статистического исследования социально-экономических явлений и процессов Смоленской области на основе заданных показателей. Построение статистических графиков, рядов распределения, вариационных рядов, их обобщение и оценка.
курсовая работа [786,2 K], добавлен 15.03.2011Составление прогноза показателей производственно-хозяйственной деятельности, определение точности прогнозов, линейные функции. Использование статистических методов анализа, базирующихся на сборе и обработке данных, при описании и анализе информации.
практическая работа [59,2 K], добавлен 16.09.2010Математические методы систематизации и использования статистических данных для научных и практических выводов. Формирование закономерностей массовых социально-экономических процессов. Толкование экономических явлений посредством закона больших чисел.
контрольная работа [19,5 K], добавлен 28.10.2010Дискриминантный анализ как раздел многомерного статистического анализа. Дискриминантный анализ при нормальном законе распределения показателей. Применение дискриминантного анализа при наличии двух обучающих выборок. Решение задачи в системе statistika.
курсовая работа [140,3 K], добавлен 21.01.2011Система экономических показателей и их роль в анализе. Информационная база анализа хозяйственной деятельности. Оценка финансово-экономических показателей как проблема идентификации кризисного состояния предприятия. Плановые затраты, расчет прибыли.
курсовая работа [86,3 K], добавлен 30.09.2013Определение главных задач предприятия и характеристика методов анализа на примере предприятия. Анализ выполнения плана объемных показателей предприятия в разрезе ритмичности производства при ухудшении анализируемых показателей. Метод элиминирования.
контрольная работа [121,8 K], добавлен 28.01.2009Социально-экономическая система как целостная совокупность взаимосвязанных и взаимодействующих социальных и экономических институтов (субъектов) и отношений по поводу обмена и потребления товаров и услуг, анализ особенностей формирования и развития.
курсовая работа [196,2 K], добавлен 25.06.2013Структура, содержание и оформление курсовой работы. Методические указания по проведению экономического анализа. Порядок выполнения, алгоритм, формулы для решения сквозной задачи по расчету экономических показателей деятельности промышленного предприятия.
методичка [74,0 K], добавлен 15.03.2011