Формирование электронной демографии как эффективного инструмента социальных исследований и мониторинга данных о населении

Распространение цифровых технологий и стремительный рост числа пользователей интернета как причина формирования и сбора больших объемов демографических данных. Факторы, позволяющие использовать статистическую информацию из государственных реестров.

Рубрика Социология и обществознание
Вид статья
Язык русский
Дата добавления 10.08.2020
Размер файла 329,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

Размещено на http://www.allbest.ru

Формирование электронной демографии как эффективного инструмента социальных исследований и мониторинга данных о населении

Алгулиев Р., Алыгулиев Р., Юсифов Ф., Алекперова И.

Аннотация

Статья посвящена формированию электронной демографической (э-демографической) системы на основе единого государственного реестра для проведения демографических исследований. В эпоху цифровых технологий возникают новые источники данных для исследования демографического поведения. Данные реестра населения, используемые для демографических исследований, сегодня все же достаточно ограничены. Поэтому создание основанной на едином государственном реестре э-демографической системы для эффективных демографических исследований, а также анализа не только реестра населения, но и других государственных реестров, представляет актуальность. В работе изучается международный опыт использования демографических характеристик данных, накопленных в реестре населения. Практика показывает, что, хотя данные реестра населения в настоящее время применяются в демографических иссле-дованиях, подходов к использованию данных других государственных реестров и созданию э-демографической системы не существует. Авторами предлагается концепция построения э-демографической системы на основе единого государственного реестра, действующей независимо от функций э-государства. Представлены преимущества технологий Big Data, OLAP, ETL для анализа демографических данных. Система позволяет лучше понять демографические процессы и способствует проведению более глубоких исследований на разных уровнях - от социальной демографии до географии населения и от миграционных процессов до медицинской демографии.

Ключевые слова: электронное государство; электронная демография; демографические показатели; миграция; электронные реестры; реестр населения.

Распространение цифровых технологий и стремительный рост числа пользователей интернета привели к формированию и сбору больших объемов демографических данных. Новые источники информации и большие данные представляют важность с точки зрения анализа демографических характеристик и предоставляют широкие возможности. Анализ литературы показывает, что в последние годы проводились многочисленные исследования, важные для выявления демографического поведения, характеристик и изучения новых источников информации (Billari et al. 2013; Poulain &Herm, 2013; Zagheni & Weber, 2015; Yildiz et al. 2017; Zagheni, 2017; Cesare et al. 2018; Gil-Clavel & Zagheni, 2019).

Ряд публикаций посвящен вопросам использования данных, накопленных в реестре населения, в качестве нового источника данных для демографических исследований и статистики (см., например: Андриченко, Мещерякова, 2012; Prins, 2017; Careja &Bevelander, 2018). В целях ведения демографической статистики национальные статистические управления осуществили ряд инициатив по трансферу демографических данных из реестров населения (Poulain &Herm, 2013; Prins, 2017; Careja & Bevelander, 2018). Хотя история реестров населения восходит к Древнему Китаю, их создание в централизованном порядке началось со второй половины XX в. Реестр населения менее известен и задокументирован, чем другая демографическая информация (акты гражданского состояния, перепись населения, опросы и т.д.). Если обратить внимание на мировую практику, то реестры населения распространены во многих развитых европейских странах (Poulain &Herm, 2013; Prins, 2017; Alburez-Gutierrez et al. 2019). Данные реестра населения в статистических исследованиях имеют большое значение для оценки численности и социально-демографической структуры населения в определенный момент времени, а также оценки и анализа изменений численности населения и его отдельных показателей.

В настоящее время постепенное внедрение и расширение возможностей этих реестров полностью изменило способ использования демографической статистики. В целом, можно отметить, что эффективность реестров населения увеличивается из-за постоянного доступа пользователей к базе данных, и создаются условия для устранения возможных ошибок.

Действующие каналы обратной связи в отношениях между гражданами и государством помогут минимизировать ошибки в будущем.

Несмотря на то, что частично расширены возможности для демографического анализа и реестр предоставляет биографические данные о жизненном цикле человека и событиях, эти данные весьма ограничены. С этой точки зрения анализ других государственных регистраторов, а не только населения, т.е. создание э-демографической системы, является актуальной проблемой. Формирование э-демографической системы позволяет лучше понять демографические процессы, проводить более глубокие исследования на разных уровнях и в разных разделах - от социальной демографии до географии населения и медицинской демографии. Хотя данные, собранные в отдельных реестрах, являются структурированными, для демографических исследований в различных срезах очень важен анализ больших данных.

Практика показывает: несмотря на то, что данные демографических исследований в настоящее время применяются в реестре населения, единой системы использования данных из других государственных реестров нет. В настоящей статье авторы предлагают разработанные ими концептуальные основы формирования такой единой э-демографической системы. Подход основан на создании э-демографической системы на платформе электронного государства (э-государства). Важно учитывать, что могут быть предложены разные модели э-демографии в зависимости от опыта стран, структуры правительства, национальных приоритетов, стратегии построения э-государства и интеграции электронных систем.

В международной практике структурно представлены две модели э-государства; в некоторой литературе их называют западной и восточной моделями (Черемных, Яковлев, 2017). В первой, западной, модели сначала создается платформа э-государства, а все государственные реестры постепенно интегрируются в нее. Эта модель распространена в странах Западной Европы, США, Южной Корее, Эстонии и др. Во второй модели - восточной - отдельные государственные реестры интегрируются, функционируют или переносятся на портал э-государства. Эту модель применяет ряд стран СНГ, в том числе и Азербайджан, развивающиеся страны.

Опыт показывает, что создание второй модели с использованием отдельных платформ и различного программного обеспечения вызывает проблемы: например, проблемы интеграции, безопасности, невозможности использования личных идентификационных номеров для всех реестров. Принимая во внимание опыт работы первой модели, авторы статьи предлагают концептуальную модель э-демографической системы на основе единого государственного реестра. Они полагают, что, когда речь идет о платформе э-государства, в системе следует учитывать все данные, собранные в едином реестре граждан, даже те, которые могут считаться незначительными. Описанная концептуальная модель основана на анализе данных государственного реестра и не связана напрямую с функциями э-государства.

Авторы, рассматривая тему создания э-демографической системы для проведения демографических исследований на платформе э-государства, провели сравнительный анализ международного опыта в области демографических исследований, изучили вопросы интеграции государственных реестров и подходы к использованию новых источников информации.

Для изучения демографических характеристик исследуются структурные принципы применения данных реестра населения, а также системы э-демографии. Показаны возможности применения методов анализа больших данных и технологий OLAP, ETL в демографических исследованиях.

Исторически термин «демография» был впервые упомянут в XIX в. и означает науку о народонаселении. Демография как наука тесно связана с другими научными дисциплинами; пересечение этих наук рождает такие направления, как историческая демография, экономическая демография, социальная демография, этническая демография, география населения, медицинская демография, демография семьи, образовательная демография, военная демография, демография миграции и т.д.

Отношения между демографией и другими социальными науками позволяют анализировать демографические процессы, понимать причины и прогнозировать развитие общества. Демография исследует закономерности событий и процессов на основе социальных, экономических, культурных, биологических и географических проблем, возникающих в структуре, местоположении, миграции и динамике населения. Другими словами, демография - это междисциплинарная область исследований, изучающая зависимость возрастной структуры, национального и этнического составов, географического положения населения, числа граждан, миграций, количества рождений и смертей от социально-экономических, исторических и других факторов (Борисов, 2001; Mehr, 2017). Связь демографии с другими науками позволила провести более глубокий анализ демографических процессов, их причин и прогнозирование тенденций.

На протяжении многих лет для получения информации о населении, его демографических, экономических и социальных характеристиках проводили переписи (Shryock et al., 1980). Но информация, собранная при переписи населения, имела статистическую значимость только на конкретную дату или период. Многие факторы, такие как миграция, в определенное время не учитывались.

Сегодня развитие цифровых технологий, глобальное распространение интернета, появление интернета вещей, устройств слежения, умных часов и планшетов, популярность социальных сетей радикально изменили образ жизни людей, открыли новые источники персональных данных и новые возможности для решения социальных и экономических вопросов. Научное направление, которое мы можем назвать наукой данных или цифровой демографией, - это инновационный инструмент для всех наук, дающий возможность обмена знаниями с другими областями науки в среде больших данных (Zagheni&Weber, 2015; Zagheni, 2017).

Э-демография является ядром э-государства. Она позволяет изучать влияние цифровых технологий на демографическое поведение и привлекать новые источники данных для более тщательного изучения демографических процессов. Следует отметить, что э-демография имеет потенциал для исследований во многих областях: социальная демография, география населения и т.д. С помощью э-демографии можно исследовать различные важные вопросы, например, как социальные сети могут отражаться на поведении людей, как новые технологии воздействуют на отношения между поколениями или как онлайн-знакомства влияют на заключение брака и т.д. (Zagheni&Weber, 2015).

Развитие интернета и цифровая революция радикально изменили практику исследований. Теперь каждый может собирать данные в разных формах и даже пользоваться приложениями мобильных телефонов для контроля состояния здоровья. Этот процесс, с одной стороны, полностью децентрализован, но с другой - привлечение новых источников, централизованный сбор, хранение и обработка персональных данных должны осуществляться через э-демографическую систему.

Вики-технологии в демографических исследованиях. Точно так же платформа «Википедия» и многие проекты, созданные по технологии вики и основанные на данных профессиональных ученых, служат для получения знаний и являются революционной формой массового сотрудничества или коллективного интеллекта. Вики-технологии позволяют свободно размещать информацию о себе и своих близких на веб-странице, а также хранить информацию о том, кто и когда редактировал информацию. Эта функция помогает отслеживать демографические изменения с течением времени. Например, проводились исследования пожизненных отношений между родителями и детьми, а также супругами, в которых использовались данные, собранные на веб-сайте WikiTree(см.: Fire&Elovici, 2015).

Роль цифровых данных в демографических исследованиях.В литературе существуют различные подходы к применению цифровых данных для исследования демографических характеристик. Например, использование интернет-данных для исследования потенциала рождаемости все еще находится на начальной стадии, но считается, что в ближайшем будущем будут достигнуты обнадеживающие результаты. Работы в этой области проводятся путем изучения систем опросов и демографического поведения, а также посредством мониторинга (Zagheni&Weber, 2015; Zagheni, 2017).

Директор Института демографических исследований имени Макса Планка, характеризуя э-демографию, отметил: «Динамика численности населения, связанная с миграцией, старением и отношениями между поколениями, происходит на фоне так называемой цифровой революции. Глобальное распространение интернета, социальных сетей, смартфонов и всевозможных устройств слежения, а также увеличение вычислительной мощности революционизируют как нашу жизнь, так и социальные науки» (Zagheni, 2018, веб-стр.). Он считает, что э-демография, используя все персональные данные (даже на первый взгляд незначительные), в силах измерять и прогнозировать демографические изменения, а также по оценке последствий цифровой революции определять демографическое поведение граждан.

Система э-демографии даст возможность эффективнее решать проблемы потребностей населения и четко определять стратегические аспекты будущего экономического и социального развития. Включение онлайн-регистрации и мониторинга поможет минимизировать время для принятия управленческих решений, в целом повысить эффективность управления в правительстве и муниципалитетах и сократить время, затрачиваемое на предоставление государственных услуг. Кроме того, э-демографическая система подготовит почву для ликвидации традиционной переписи: отпадет необходимость проводить онлайн-переписи и различные социально-демографические исследования на государственном (макроуровень), региональном (мезоуровень) и индивидуальном уровнях (микроуровень).

E. Загхени и И. Вебер (Zagheni&Weber, 2015) изучали возможности и проблемы демографических исследований на основе интернет-данных и разработали методику получения неструктурированных данных, генерируемых на платформе социальной сети с применением методов интеллектуального анализа данных (webdatamining).

Д. Албурез-Гутиеррез с соавторами (Alburez-Gutierrez et al., 2019) рассматривают новые источники для исследования населения в цифровую эпоху, подчеркивая важность цифровых и библиометрических баз данных, цифровых следов в социальных сетях и интернета вещей как новых источников для демографических исследований. Они обсуждают технические и этические проблемы, возникающие в связи с этими источниками, а также возможности, предоставляемые для изучения традиционной и цифровой демографической динамики во всем мире.

Во многих странах гражданам рекомендуется для снижения риска использовать различные устройства слежения. Через устройства слежения ежедневная информация о здоровье граждан, часах досуга, времени, проведенном за просмотром телевизора, собирается и передается в базу данных соответствующих организаций (Gangietal, 2012; Redondietal, 2013). Несмотря на то, что цифровые данные, накопленные в устройствах слежения, подвергаются опасности захвата персональных данных, они могут помочь эффективнее определять плотность, уровень благосостояния населения или экономический рост. Они раскрывают атрибуты индивидуального уровня: пол, день рождения, образование, семейные и социальные отношения, интересы. Все это может быть использовано для получения социально-демографических оценок для разных групп населения. Анализ этих цифровых данных по любой комбинации атрибутов может помочь более детализированно описать демографические тенденции общества, дать оценку демографии в определенных государствах (Качагина, 2016).

Социальные сети и демографические исследования. Использование интернета как источника данных для лучшего понимания демографических процессов является одной из наиболее важных задач, стоящих перед государством. Другая важная задача заключается в том, как с помощью информационных технологий управлять миграционными потоками и интеграцией мигрантов в условиях современных социально-политических процессов и растущей угрозы внезапных кризисов и потрясений. В э-демографии в качестве источника данных для демографических исследований в основном берутся популярные интернет-проекты - Facebook, Google, Twitter, Yandex и т.д. На основе данных, собранных в аналитических системах этих проектов, можно уточнить демографические характеристики многих стран. Отдельные компании также эффективно используют демографические данные, собираемые в виртуальных сетях, для повышения коэффициентов конверсии и сбора необходимых характеристик пользователей. Например, практически каждый рекламодатель Facebook ориентируется на пользователей по возрасту, доходу, интересам, времени занятости и полу. Эти параметры необходимы для углубленного анализа демографии.

Все большее количество географических данных, доступных в интернете, стало большим преимуществом для исследований миграции. Работы с различными открытыми виртуальными проектами, включая Flickr, Twitter, проекты Google (GoogleLatitude, GoogleMapsи т.д.), Facebook, Wikipedia, Yahoo, полученные с помощью этих проектов виртуальные карты, изображения, видеофайлы дают возможность изучить маршруты путешествий, миграции или информацию о географическом местоположении населения или отдельных групп (Gangietal, 2012; Redondietal, 2013; Качагина, 2016;Zagheni, 2018).

В большинстве случаев традиционные источники данных демографических исследований включают архивы переписей, данные о здоровье населения, статистику заболеваний и т.д. В качестве основного источника цифровых демографических исследований используются веб-браузеры, поисковые запросы, данные социальных сетей, данные, аккумулированные в государственных реестрах (электронные услуги, удовлетворенность граждан, отзывы о взаимоотношениях правительства и граждан и т.д.). Анализ больших данных, собранных в вышеупомянутых источниках, позволит эффективно проводить демографические исследования, получать знания о демографическом поведении населения и прогнозировать социально-демографические процессы. Так, Дж. Гинсберг с соавторами (J.Ginsbergetal., 2008), анализируя веб-запросы в Google, пришли к выводу, что эти запросы очень полезны и необходимы для мониторинга симптомов гриппа и выявления потенциальной эпидемии (Ginsbergetal., 2008).

Однако, несмотря на то, что мнения многих ученых о полезности использования веб-запросов в социальных исследованиях совпадают, время от времени результаты анализов веб-запросов приводят аналитиков к неверным оценкам ситуации. Обычно это происходит, когда меняется содержание отношений между поиском, новостями и поведением (Ginsbergetal., 2008; Lazer, 2014). Данные из социальных сетей используются для выявления географического и экономического положения граждан, природной среды, в которой они живут, и для других целей. Основываясь на этой информации, социально-экономическое положение населения и тенденции миграции изучаются индивидуально и на государственном уровне (DeChoudhuryetal., 2010; Ferrari&Mamei, 2011).

Одно из основных направлений демографических исследований - изучение миграции. Интернет-ресурсы значительно расширили доступ к информации о географическом местоположении. Маршруты путешествий и краткосрочные смены места жительства устанавливаются по разным источникам, включая изображения и информацию о географическом местоположении на Flickr, Twitterи Google Latitude (Ferrari&Mamei, 2011; Ferrarietal., 2011; Noulasetal, 2011).

Ф. Биллари и соавторы (2013) (Billarietal., 2013) в своих исследованиях доказали, что, используя запросы «беременность» или «роды», можно с помощью Googleпрогнозировать потенциал рождаемости и даты рождения на несколько месяцев вперед. Наиболее значимым результатом этого исследования является то, что, наряду с традиционными источниками, использование данных из новых источников, таких как веб-поисковики, может увеличить точность прогнозирования демографической модели (см.: Billarietal., 2013).

В работе Д. Йилдиз и соавторов (Yildizetal., 2017) исследована проблема использования данных Twitterдля демографических исследований. Авторы постарались ответить на вопросы, как данные из социальных сетей могут охватить большое количество людей и какова лучшая практика для оценки демографической информации из данных Twitter.Они провели эксперимент, в ходе которого было задействовано 979 992 единицы твитов географических местоположений, отправленных 22 356 уникальными пользователями в Юго-Восточной Англии. Демографические характеристики пользователей Twitter оценивались с помощью краудсорсинговой платформы Crowd Flower и программного обеспечения для распознавания изображений Face++.

Полученные данные о возрасте, поле и географическом местоположении позволили исследователям обобщить результаты Twitter, применить их для всего населения. В исследовании Cesareetal. (2018) изучаются преимущества и недостатки использования цифровых следов в демографических исследованиях. Рассматриваются методологические возможности для решения проблем, связанных с цифровым анализом данных следа. Показывается, что существует большой потенциал для обнаружения важных сведений из неструктурированных данных большого объема с применением научных методов анализа данных, а также анализа цифровых следов подгрупп населения с использованием арсенала традиционных демографических методов.

В работе С. Гиль-Клавель и Е. Загхени(Gil-Clavel &Zagheni, 2019) исследовалась демография пользователей Facebookпо всему миру. Для этого были взяты данные с рекламной платформы Facebook. Изучалось, как пользователи Facebookразличаются по возрасту и полу, как размер сетей дружбы варьируется по этим параметрам, а также были определены демографические характеристики отдельных подгрупп пользователей социальных сетей. Полученные авторами данные позволяют по-новому взглянуть на гендерное неравенство в онлайн-среде, на некоторые нюансы демографических различий при внедрении и использовании цифровых технологий.

Большие данные в демографических исследованиях. Сегодня сотовая связь, сетевые данные помогают в определении перемещений внутри страны или причин миграции, а также в выявлении закономерностей демографических процессов в регионе. В последние годы использование больших данных в демографических исследованиях возросло (см.: Billari &Zagheni, 2017). В будущем интеллектуальный анализ больших данных, собранных в среде э-государства, государственных реестрах и базах данных отдельных компаний, обеспечит целый ряд значимых и более глубоких демографических исследований (Blumenstock, 2012; Deville et al., 2014).

Система э-демографии в среде э-государства содержит и объединяет информацию о метеорологических, демографических процессах, индивидуальные профили, сведения об обеспечении репродуктивного здоровья населения, о контроле за снижением заболеваемости и смертности, данные об условиях жизни населения, проведении непрерывной переписи, об исследовании миграции, о развитии кадрового и научного потенциалов в сфере э-государства. В контексте демографии устойчивость и развитие общества означают оптимальный рост населения и выбор наилучшего метода управления обществом. Демография может оцениваться по странам, регионам и областям. С этой точки зрения демографические исследования могут проводиться на государственном, региональном и индивидуальном уровнях (Ferrari &Mamei, 2011; Ferrari et al., 2011; Noulas et al., 2011; Кача-гина, 2016).

Электронные реестры и формирование э-демографии. Формирование национального э-государства в различных странах основано на реформировании всей системы государственного управления. Основная цель - соответствовать государственному управлению и повышению эффективности государственного управления за счет применения ИКТ, так как государственная администрация хочет иметь информационные системы, отвечающие таким требованиям, как прозрачность, гибкость, конкурентоспособность, ответственность за результаты, активное взаимодействие с гражданским обществом. Естественно, что при использовании государственных электронных ресурсов (э-ресурсов) учитываются и другие факторы, влияющие на весь характер общественно-политических, социальных, экономических, культурных и демографических отношений. Одним из наиболее важных компонентов э-государства является э-демография. Исследование проблем, связанных с демографической ситуацией, сбор демографических показателей и работа по формированию индикаторов играют важную роль в повышении эффективности услуг э-государства.

Э-демография, будучи одной из составляющих демографической науки о законах воспроизводства населения, изучает то, как биологические характеристики и поведение людей влияют на развитие общества. Получение точной информации о демографической ситуации в соседних государствах - важная задача в сфере информационной безопасности каждого государства. При анализе демографической ситуации учитывается демографическая структура населения, т.е. его распределение по группам таких признаков, как национальность, возраст, пол, семейное положение, а также уровни старения населения, рождаемости, смертности и т.д. Направления исследований в э-демографии показаны на Рисунке 1.

Рисунок 1. Направления исследований в э-демографии

Работы по созданию реестра населения в разных странах были начаты еще в 1970-х гг. Хотя отдельные информационные системы и были созданы, но по разным причинам, а главное, из-за отсутствия необходимого уровня информационных технологий стало невозможным создание единого реестра (UN Global Pulse'sprojects; Андриченко, Мещерякова, 2012).

С 1960-х гг. централизованные реестры населения используются в скандинавских странах, а с 1990-х гг. - во многих Прибалтийских странах и странах Центральной Европы (см:Poulain &Herm, 2013). Реестр населения - это прежде всего административный инструмент, и уже затем инструмент сбора статистических данных.

В европейских странах был предпринят ряд оригинальных инициатив по трансферу национальными статистическими системами управления демографических данных из административных источников, особенно из реестров населения. Таким образом, реестр населения вместо отдельного анализа демографических событий по одному человеку позволяет связать все данные и получить доступ к статистике для всего населения. Например, если рассмотреть опыт стран Северной Европы и Прибалтики, удостоверение личности родителей будет считаться одним из регистрационных данных при условии, что они указаны в вашем свидетельстве о рождении. Вся эта информация может быть использована для идентификации ядер семейств и для формирования статистических таблиц, которые их разъясняют. В Таблице 1 приведены персональные характеристики, которые передаются из реестра населения в статистические управления в некоторых европейских странах (Poulain&Herm, 2013).

Табл. 1

Личный идентификатор (PIN)

Рождение

Пол

Гражданство

Данные об этническом происхождении

Образование

Прочие идентификаторы

Супруг (а)

Отец

Мать

Дания

+

+

+

+

-

-

+

+

+

Эстония

+

+

+

+

+

+

+

+

+

Венгрия

-

+

+

+

-

-

-

-

-

Латвия

+

+

+

+

+

-

+

+

+

Нидерланды

+

+

+

+

-

-

+

+

+

Норвегия

+

+

+

+

-

-

+

+

+

Польша

+

+

+

+

-

+

-

-

-

Словения

+

+

+

+

-

-

-

-

-

Испания

-

+

+

+

-

-

-

-

-

Швеция

+

+

+

+

-

-

+

+

+

Анализ публикаций результатов проведенных исследований показывает, что основной целью реестра населения является получение точной идентификации каждого человека. Реестр населения также предоставляет агрегированные данные о населении, позволяет осуществлять и регулировать в более широком спектре политику государственного управления и планирования. Кроме того, если система допускает непрерывную регистрацию изменений адреса в режиме онлайн, то она может считаться основным источником информации о миграции.

В принципе, функционирование и важность системы не подлежит сомнению после устранения начальных ошибок и упущений в реестрах (любая административная ошибка может быть исправлена без строгого соблюдения норм закона) и проблем общения между администраторами реестра и специалистами, проводящими статистический анализ. С другой стороны, как местные, так и государственные органы заинтересованы в статусе лиц, зарегистрированных в реестре населения. Как правило, одним из самых больших недостатков в реестрах населения и самым слабым компонентом является неспособность населения своевременно предоставлять обновленную информацию.

Например, в нидерландской практике в целях обеспечения обновления и поддержания реестров в актуальном состоянии, а также повышения ответственности граждан, на своевременно не предоставивших информацию в местные органы исполнительной власти налагается штраф в размере 325 евро (Prince, 2017). Однако пробелы допускаются в любом случае, независимо от уделенного внимания и проведенных проверок, и иногда этот процесс периодически повторяется из-за ошибок отдельных лиц или соответствующих органов. Практика показывает, что ошибки чаще встречаются в динамических личных данных, а в документированной информации (место и дата рождения, семейное положение и т.д.) риск допущения ошибок ограничен.

В настоящее время во многих развитых странах власти работают над созданием социальных реестров. В последние годы активизировались работы по формированию единого регистра населения. Например, в Российской Федерации к 2025 г. будет создан единый реестр населения (Чу-диновских, 2018; Реестр населения, 2018). Информация обо всех людях, живущих в стране, будет собираться и обновляться в режиме онлайн в регистре населения. Во время переписи населения к 2020 г. граждане смогут свободно заполнять свои анкеты и предоставлять их на портал государственных услуг. С момента рождения человека вся информация о нем будет включена в реестр. В целом реестр будет иметь всю информацию, доступную властям, и обмен информацией между государственными органами и гражданами будет осуществляться в режиме онлайн (Реестр населения, 2018).

Применение реестра населения требует использования индивидуального идентификационного номера (PersonalIdentificationNumber, PIN) для физических лиц. Во многих случаях эти PINопределяются до внедрения реестра. Основная цель применения единого кодового номера состояла в том, чтобы устранить дублирование при расчете, улучшить координацию между различными государственными реестрами и усовершенствовать процедуры сбора налогов. В настоящее время уникальные идентификационные номера требуются во всех странах, в которых имеется реестр населения, и этот номер используется для обновления анонимных персональных данных.

С помощью современных цифровых технологий для точного определения демографической ситуации и прогнозирования используются не только данные из архивов переписи, но также данные из социальных сетей, в которых собираются персональные данные граждан (архивы медицинских учреждений, банков, страховых компаний и т.д.). Основные источники э-демографических исследований включают поисковые запросы через веб браузеры, данные, собранные в государственных реестрах и об э-услугах, отзывы о взаимоотношениях правительства и граждан, удовлетворенность граждан и т.д. Анализ этих больших данных, агрегированных в вышеупомянутых источниках, позволит сформировать новые идеи о демографическом поведении, завершить существующие исследования и получить новые знания в области демографии.

Исторически государственные органы были монополистами в сборе данных, переписи, управлении, административных записях и анализе информации о социально-экономическом положении населения. Основным преимуществом демографов в скандинавских странах, Бельгии и Нидерландах было использование индивидуальных регистрационных данных в демографических исследованиях для расширения и подключения индивидуальных регистраций и других реестров (Lyngstad & Skard hamar, 2011).

Масштаб использования больших данных для демографических исследований растет. Для демографического благополучия, реализации эффективной демографической политики нужно в первую очередь развивать исследования по демографии, применяя современные информационные технологии, которые вместе формируют среду э-демографии. Среда э-демографии позволит проводить мониторинг статистики населения и анализировать различные демографические процессы на интегрированных электронных реестрах (э-реестрах), входящих в портал э-государства. Для управления демографическими процессами важно сформировать э-демографическую среду посредством современных информационных технологий. Формирование э-демографии поможет решить следующие вопросы:

1. Формирование интегрированной базы данных для э-государства.

2. Формирование демографических показателей для интеграционных и миграционных процессов.

3. Модернизация законодательства в области миграции в соответствии с международными нормами и подготовка миграционного реестра в соответствии с требованиями э-демографической системы.

4. Оценка демографической ситуации, системы мониторинга и прогнозирования с подробным анализом.

5. Анализ демографических процессов для изучения демографических характеристик, обеспечения гендерного баланса и формирования индивидуального профиля.

6. Оценка и мониторинг демографической ситуации, детальный анализ систем прогнозирования.

7. Защита экологического баланса и окружающей среды.

8. Расширение системы цифровой медицины, улучшение работы и укрепление материально-технической базы учреждений здравоохранения и т.д.

Для эффективного решения вышеперечисленных задач необходимо разработать единую национальную э-демографическую систему. Формирование э-демографической системы поможет построению единого информационного демографического пространства, создаст дополнительные возможности для анализа демографических процессов и тем самым будет способствовать обеспечению репродуктивного здоровья населения, улучшению условий его жизни, укреплению института семьи, решению миграционных вопросов и развитию кадрового и научного потенциалов в демографической сфере.

Для прогнозирования демографических процессов часто применяются подходы, основанные на моделировании (Courgeauetal., 2016). При этом основное внимание уделяется моделированию конкретных групп населения и развитию мощных связей с эмпирическими данными из социальных сетей (Henderson, 2012; Weber&State, 2017). Моделирование в э-демографии может помочь обойти это ограничение, упрощая использование вычислительных моделей для генерации сценариев. Моделирование может применяться также для изучения пространства параметров, в котором они работают, а также для того, как различные сценарии могут влиять на поведение индивидуума и отдельных групп.

Реализация э-демографической политики считается неотъемлемой частью системы э-государства и требует создания систем анализа демографических процессов и реестров для оценки существующих демографических ситуаций.

Развитие э-государства гарантирует, что традиционный процесс переписи будет заменен интеллектуальной системой, основанной на большой базе данных, собранных в государственных реестрах. Онлайн-регистрация и управление мониторингом помогут минимизировать время принятия решений, что в целом позволит правительствам и муниципалитетам повысить эффективность управления и сократить время, затрачиваемое на предоставление государственных услуг. Такая система также имеет решающее значение для управления демографическими процессами, принятия решений и прогнозирования.

Отметим, что различные э-демографические модели могут быть предложены в зависимости от стратегий построения э-государства стран. В статье предлагается концептуальное построение э-демографической системы на основе единого государственного реестра. Мы считаем, что если речь идет о платформе э-государства, тогда все государственные реестры должны быть интегрированы, и в этом случае все данные, собранные в едином реестре, будут играть важную роль в демографических исследованиях.

Если мы рассмотрим архитектуру э-демографической системы на примере Азербайджана, то увидим, что э-государство более совместимо с восточной моделью. Учитывая, что в настоящее время в стране действует портал э-государства, в него постепенно интегрируются отдельные государственные реестры. В этом случае после процесса интеграции государственных реестров или формирования единого государственного реестра может быть предложено создание э-демографической системы на его основе.

Концептуальная модель системы э-демографии показана на Рисунке 2. Информационной базой данных для анализа демографии служат следующие данные:

1. Данные переписи населения.

2. Данные из реестров разных учреждений (банковские отчеты, учетные листы, истории болезни и т.д.).

3. Данные из аналитических систем, проводящих статистический учет и анализ демографических событий, таких как рождение, браки и разводы, смерти, миграции.

4. Данные из социальных сетей.

5. Данные из специальных систем слежения и др.

В соответствии со стратегией долгосрочного развития, э-реестры будут созданы и интегрированы в э-демографическую систему для контроля гендерного баланса и комплексного развития людских ресурсов.

Процесс обработки данных в системе э-демографии состоит из четырех этапов (как показано на Рисунке 2):

1. Определение реестров данных и сбор данных.

2. Формирование кубов.

3. Анализ данных.

4. Извлечение данных для принятия решений.

Данные анализируются в разных реестрах на основе PIN,и таким образом формируется облако каждого человека. Отдельные облака могут быть объединены в соответствии с различными критериями (образование, медицина, миграция и т.д.). Данные в реестрах - большие данные (bigdata) и PIN- позволят связать значительное количество записей и обнаружить их взаимосвязь.

Система PINбыла впервые введена в скандинавских странах: Швеции (1947), Норвегии (1961), Финляндии (1964) (статистика на основе регистров, 2008; Чудиновских, 2018).

Рисунок 2. Концептуальная модель системы э-демографии

Один из ключевых факторов, позволяющих статистически использовать данные, собранные в государственном реестре, - наличие единой системы идентификации или единого идентификационного номера для различных источников и ресурсов. В отсутствие единой системы идентификации трудно интегрировать и объединять различные реестры. В связи с этим можно проводить статистический анализ на основе данных, собранных в реестрах. В качестве минимального требования имеется в виду наличие единого идентификационного номера для отдельных реестров.

Единая система регистрации населения имеет большое практическое значение. Реестры данных считаются эффективным средством сбора и мониторинга информации о населении. Основным преимуществом таких реестров является то, что они не имеют конкретной цели и, следовательно, предоставляют информацию обо всех жителях, проживающих в стране, без исключения. Согласно Заявлению ООН по населению и социальной статистике, в 2008 г. в странах Северной Европы личный идентификационный номер стал применяться почти во всех реестрах, используемых для статистики (Чудиновских, 2018). Для других реестров, в том числе коммерческого, адресного, жилья и т.д., была применена единая система идентификации. В настоящее время применяемые технологии и существующая система позволяют в кратчайшие сроки координировать все доступные государственные реестры. Как отмечается в докладе ООН, одной из причин успешного развития административных регистраций в странах Северной Европы стало то, что население этих стран было небольшим, компактным и однородным. В крупных странах создание административных реестров на государственном уровне казалось более проблематичным из-за технических, организационных и других ограничений. В настоящее время платформа э-государства, которая успешно внедряется в различных странах, имеет широкие возможности и инструменты для интеграции реестров, создания единой инфраструктуры (Статистика на основе регистров, 2008; Чудиновских, 2018).

Методы анализа больших данных

Для демографических анализов могут быть использованы различные методы, такие как:

- статистический анализ данных. Применение математических и статистических методов для анализа демографических данных. В настоящее время эта область широко распространена и используется большинством научного сообщества;

- анализ графов. Изучение графов, которые представляют собой математические структуры, используемые для моделирования парных отношений между объектами. Граф содержит вершины, представляющие объекты, а также ребра, которые изображают отношения между узлами (Diestel, 2000);

- интеллектуальный анализ данных. Это процесс обнаружения скрытой информации (знания) и значимых структур из больших баз данных. В основном используются алгоритмы кластеризации, классификации и прогнозирования. В частности, это может помочь обнаружить, описать и предсказать связи или тенденции между данными (Poltavtseva, Pechenkin, 2017);

- OLAP Это технология, использующая информацию в хранилищах данных. OLAPпозволяет проводить многомерный анализ данных путем построения кубов. Через эти кубы метод обеспечивает визуализацию и быстрый анализ больших данных для принятия решений (Chaudhuri, Dayal, 1997).

Объем, многообразие и скорость обработки данных порождают спрос на аналитическую онлайн-обработку данных - OLAP. OLAP - это система анализа многомерных данных, которая обеспечивает быстрый анализ для принятия решений. Хранилища данных (Data Warehouse) и OLAP являются одними из устоявшихся технологий для обработки и анализа структурированных данных, но с быстрым распространением информационных сетей требования к этим технологиям непрерывно возрастают. Сегодня OLAP используется в управлении разнородными информационными сетями. Система может быть полезна для мониторинга, просмотра и анализа разных типов веб-контента и структуры сетей в режиме онлайн (Loudcher et al., 2015).

Для решения задачи требуется построить OLAP-куб. Предварительная подготовка аналитических кубов позволяет оператору, принимающему решение, сосредоточить внимание на аналитическом процессе с кубом: поворот, детализация, свертывание. Ячейки куба являются аналитическими мерами. Мера куба представляет собой числовую характеристику анализируемого процесса, набор измерений образует ось куба. Количество и содержание кубов зависят от количества решаемых задач. Такой подход приводит к иррациональной группировке мер и измерений. В то же время существует ряд проблем, связанных с анализом неструктурированных больших данных (BigData), взятых из отдельных источников. Для загрузки из разных источников и консолидации больших данных предлагается в системах э-демографии применять технологию ETL (Extract, Transform, Load- извлечение, преобразование, загрузка). ETLвыполняет следующие задачи (см.:Gutiйrrez-Batista et al., 2015):

1. Извлечение данных. На этом этапе данные собираются из разных реестров и затем копируются в хранилище данных.

2. Преобразование данных в соответствующую форму. Данные консолидируются.

3. Загрузка данных. ETL выполняет перенос данных из реестров в хранилище данных и для слияния данных.

ETL может работать как с временными, так и постоянными данными, в зависимости от варианта использования. Данные, предназначенные для анализа, используются для построения OLAP-кубов. Благодаря стандартизации к технологии хранилища данных можно подключать интерфейсные инструменты различных реестров, что удобно для всестороннего анализа больших объемов данных, генерируемых через интернет. Хранилище данных содержит данные в агрегированном виде, т.е. исходные данные агрегируют до определенного уровня детализации. Но анализ данных в режиме реального времени накладывает дополнительные требования на предлагаемую систему. Представленная архитектура многоуровневой системы дает возможность за счет оптимизации загрузки новых данных обеспечить анализ в реальном времени. Хотя анализируемые данные довольно динамичны, сам процесс анализа интерактивный и должен учитывать неограниченные сценарии «что, если». Это включает изменение отношений данных или обновление значений для определения, как различные изменения повлияют на демографию.

Э-демографическая система на платформе э-государства может быть разделена на различные секторы, такие как социальное страхование, медицина, миграция и т.д. Так можно анализировать демографические процессы эффективнее и быстрее. Со временем после полной интеграции в платформу э-государства э-реестры будут преобразованы в виртуальные облака. Следует отметить, что э-демографическая система будет сформирована на платформе э-государства и наряду с онлайн-переписью обеспечит условия для проведения различных социально-демографических исследований: точного определения статистики населения, онлайн-мониторинга, углубленного анализа демографических процессов и выявления демографических проблем в обществе.

Демографическая безопасность общества и развитие человеческих ресурсов - ключевые стратегические аспекты любого государства. Создание э-демографических систем и механизмов для достижения прогнозирования человеческих ресурсов и выявления рисков в формировании э-государства поможет построить научно обоснованную и эффективную э-государственную систему и определить стратегические направления экономического и социального развития страны.

Реализация эффективной демографической политики в стране воспринимается как неотъемлемая часть системы э-государства и требует эффективного использования реестров и систем для оценки, анализа и принятия действенных решений в существующей демографической ситуации. На демографические процессы, помимо миграции, рождаемости или смертности, также влияют разные социально-экономические ситуации. Авторами определены перспективные направления исследований в области демографии и предложена концептуальная модель э-демографической системы для управления демографическими процессами.

Создание единого регистра населения позволит отменить традиционные переписи, осуществлять онлайн-перепись и мониторинг населения на основе анализа данных, собранных в государственном реестре. Можно отметить, что, если речь идет о платформе э-государства, все государственные реестры должны быть интегрированы, и все данные, собранные в реестре, сыграют важную роль в демографических исследованиях. В рассматриваемом подходе э-демографическая система формируется на основе единого государственного реестра и действует независимо от функций э-государства.

Демографическая безопасность и развитие человеческих ресурсов - ключевые стратегические аспекты развития стран. Э-демографическая система как основной компонент государства позволит точно определить статистику населения, проводить онлайн-мониторинги, глубокий анализ демографических процессов и выявлять проблемы, связанные с демографией. Создание э-демографических систем и механизмов для достижения целей при прогнозировании человеческих ресурсов и выявлении рисков в процессе развития э-государства поможет сформировать всеобъемлющую, научно обоснованную и эффективную систему мер, определить стратегические направления будущего экономического и социального развития. Изучение демографических процессов, формирование систем э-реестра и комплексных условий для стабилизации уровня развития населения можно эффективно использовать в системах принятия решений по обеспечению общественного прогресса и социально-экономического развития страны, тем самым способствуя увеличению численности и качества трудоспособного населения. В статье описаны преимущества применения технологий Big Data, OLAP, ETL для анализа демографических данных. Учитывая актуальность темы, с целью проведения различных глубоких демографических анализов интеллектуальный анализ больших данных, собранных в социальных сетях и государственных реестрах, будет рассмотрен в дальнейших исследованиях.

Литература

статистический цифровой демографический

1. Андриченко Л.В., Мещерякова М.А. Информационные регистры как эффективное средство сбора и мониторинга данных о населении // Журнал российского права. - 2012. - № 8. - С. 16-40.

2. Борисов В.А. Демография. - М.: Издательский дом NOTABENE, 2001. URL: http:// www.sociologos.ru/upload/File/Methods/Demography_Borisov.pdf(дата обращения: 15.03.2019).

3. Качагина О.В. Основы демографии: основы теории и практические задания: Учебное пособие. - Ульяновск: УлГУ, 2016.

4. Реестр населения. В России будет создан реестр населения // Российская газета. - Федеральный выпуск № 122 (7585). URL: https://rg.ru/2018/06/06/v-rossii-budet-sozdan- reestr-naseleniia.html(дата обращения: 26.03.2019).

5. Статистика на основе регистров. Статистика на основе регистров в североевропейских странах. Обзор передовых методик с уделением основного внимания статистике населения и социальной статистике / ООН, Европ.экон. комис. - Нью-Йорк; Женева: ООН, 2008. - VI.

6. Черемных В.Ю., Яковлев Л.С. Электронное правительство: модели и перспективы // Вестник Поволжского института управления. - 2017. - Т. 17. - № 1. - С. 68-74.

7. Чудиновских О. Большие данные и статистика миграции // Вопросы статистики. - 2018. - Т. 25. - № 2. - С. 48-56.

8. Alburez-Gutierrez D., Aref S., Gil-Clavel S. and et al. Demography in the Digital Era: New Data Sources for Population Research. In: Arbia G., Peluso S., Pini A., Rivellini G. (eds.), Book of short Papers SIS2019. Pearson. 2019. DOI: https://osf.io/preprints/socarxiv/24jp7/

9. Billari F., D'Amuri F., Marcucci J. Forecasting births using google. Annual Meeting of the Population Association of America, New Orleans, LA.17. 2013.

10. Billari F., Zagheni E. Big data and population processes: a revolution? In: Petrucci A., Verde R. (eds.) Statistics and Data Science: new challenges, new generations. Proceedings of the Conference of the Italian Statistical Society. Firenze University Press. 28-30 June, Florence (Italy). 2017. P. 167-178.

11. Blumenstock J.E. Inferring patterns of internal migration from mobile phone call records: evidence from Rwanda // Information Technology for Development. 2012. Vol. 18. No. 2. P. 107-125.

12. Careja R., Bevelander P. Using population registers for migration and integration research: examples from Denmark and Sweden // Comparative Migration Studies. 2018. Vol. 6. No. 1. P. 6-19.

13. Cesare N., Lee H., McCormick T. and et al. Promises and Pitfalls of Using Digital Traces for Demographic Research // Demography. 2018. Vol. 55. No. 5. P. 1979-1999.

14. Chaudhuri S., Dayal U. An overview of data warehousing and OLAP technology // ACM SIGMOD. 1997. Vol. 26. No. 1. P. 65-74.

15. CourgeauВ.,Bijak J., Franck R., Silverman E. Model-Based Demography: Towards a Research Agenda // Agent-Based Modelling in Population Studies. 2016. Vol. 48. P. 29-51.

16. De Choudhury M., Feldman M., Amer-Yahia S., Golbandi N., Lempel R., Yu. C. Automatic construction of travel itineraries using social breadcrumbs. In: Proceedings of the 21st ACM Conference on Hypertext and Hypermedia. ACM. 2010. P. 35-44.

...

Подобные документы

  • Изучение аудитории интернет-пользователей на основе статистических данных, построение их портрета и социально-демографических характеристик. Анализ исследований, проведенных в среде мобильного Интернета. Специфические черты российского пользователя.

    курсовая работа [551,5 K], добавлен 20.11.2015

  • Цель и задачи демографии. Теоретические основы изучения воспроизводства населения. Источники информации о населении и демографических процессах. Численность, рост, размещение, естественное и механическое движение населения их динамика в г. Волгограде.

    курсовая работа [40,3 K], добавлен 02.06.2013

  • Использование информационно-коммуникационных технологий, чтобы предоставить гражданам информацию о социальных услугах, доступ обществу к политическим процессам и стратегическому выбору. Модели электронного правительства и развитие электронной демократии.

    реферат [23,5 K], добавлен 20.08.2014

  • Первичные демографические данные: переписи населения, единовременные наблюдения, социально–демографические выборочные обследования. Формы получения данных о демографических событиях. Расчет коэффициентов рождаемости, смертности, естественного прироста.

    контрольная работа [9,9 K], добавлен 05.04.2009

  • Предмет и структура демографии, ее категории и взаимосвязь с науками. Основные источники данных о населении. Показатели численности населения, рождаемости, смертности. Население мира в 20 в. и в начале 21 в. Демографические проблемы и прогнозы для России.

    контрольная работа [46,0 K], добавлен 15.12.2010

  • Возникновение и популярность социальных сетей среди пользователей интернета, их положительные и отрицательные стороны. Причины формирования и механизмы работы зависимости от социальных сетей. Блокирование доступа образовательными и офисными учреждениями.

    реферат [27,0 K], добавлен 04.01.2011

  • Теоретические аспекты демографии. Репродуктивные установки в предметном поле социологии. Исследование рождаемости методом качественного анализа, её главные факторы. Формирование концепций демографического знания и продуктивной социальной политики РФ.

    дипломная работа [630,8 K], добавлен 16.07.2017

  • Интервью - распространенный метод сбора информации в социологии. Сбор данных методом формализованного интервью называют анкетированием. Он подразумевает стремление к максимальной стандартизации и унификации процедур сбора данных, их обработки и анализа.

    контрольная работа [13,3 K], добавлен 29.12.2008

  • Количественные приемы сбора социологических данных. Проведение социометрических исследований в малой общественной группе. Практика использования методов изучения в работе современного руководителя. Качественные способы сбора социологической информации.

    реферат [56,2 K], добавлен 06.11.2011

  • Содержание этногеографии и демографии - наук о населении. Анализ динамики изменения численности населения мира. Выявление доли экономически развитых и развивающихся стран в мировом населении. Основные типы воспроизводства населения разных стран.

    презентация [229,0 K], добавлен 01.12.2010

  • Понятие и содержание социальных технологий, их классификация по различным признакам, разновидности и отличительные признаки. Специфика формирования и реализации глобальных, региональных, локальных, инновационных, информационных социальных технологий.

    реферат [11,1 K], добавлен 10.08.2010

  • Сущность организационных отношений в государственных организациях и факторы, влияющие на их формирование, организационные основания построения, принципы разработки. Современное состояние данных отношений в РФ и рекомендации по их совершенствованию.

    курсовая работа [39,1 K], добавлен 06.02.2015

  • Выработка механизмов, оказывающих направленное влияние на формирование эффективных способов общественного развития. Методология научных исследований, социально-экономические и политические процессы как объект социальных исследований, типология моделей.

    контрольная работа [44,0 K], добавлен 05.04.2010

  • Анализ современного состояния России в демографическом аспекте: статистические данные о миграции, депопуляции, смертности и продолжительности жизни населения. Определение факторов влияния на рост рождаемости: репродуктивное здоровье, рост числа абортов.

    курсовая работа [189,2 K], добавлен 20.04.2010

  • Понятие и факторы формирования гражданского общества. Особенности взаимоотношений интернет-технологий с институтами гражданского общества. Программа социологического исследования на тему "Роль Интернета в обществе в понимании различных поколений".

    курсовая работа [47,5 K], добавлен 13.10.2014

  • Сущность демографических событий рождений и смертей, изменяющих численность населения естественным путем. Общие коэффициенты естественного движения и сокращение численности населения. Результаты исследований в области демографии и естественный прирост.

    контрольная работа [187,5 K], добавлен 25.03.2009

  • Сбор социологических данных. Диалектика общего, особенного и единичного. Качественные и количественные методы социологических исследований. Обработка полученных данных. Анализ социальной действительности. Механизм адаптации людей к социальным изменениям.

    реферат [26,8 K], добавлен 27.01.2013

  • Изучение возникновения демографической науки и истории формирования ее знаний. Рассмотрение методов описания, анализа и прогноза демографических структур. Характеристика одного из главных процессов репродукции общества - воспроизводства населения.

    реферат [25,0 K], добавлен 17.01.2012

  • Обзор методов проведения эмпирических исследований социально-экономических и политических процессов. Особенности анализа документов как метода проведения социологических исследований. Специфика методики массового опроса, эксперимента и наблюдения.

    курсовая работа [78,7 K], добавлен 31.01.2014

  • Роль больших социальных групп. Особенности конфликта, неравенство как источник конфликта, его основные признаки. Koнфликты переходного периода в России. Связь между материальными и идеальными интересами и религиозным сознанием различных групп по Веберу.

    реферат [30,0 K], добавлен 12.03.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.