Создание приложения на базе хранилища данных по анализу экономических показателей регионов России
Особенность сбора и обработки макроэкономических показателей регионов Российской Федерации. Реализация технологии ETL на базе табличной структуры. Разработка пользовательского интерфейса к хранилищу данных. Характеристика проектирования доступа к сайту.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 30.09.2016 |
Размер файла | 1,3 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Содержание
Введение
Глава 1. Анализ экономических показателей регионов России
1.1 Анализ источников данных
1.2 Обзор экономических показателей
Глава 2. Технологии сбора и обработки макроэкономических показателей регионов России
2.1 Реализация технологии ETL на базе табличной структуры
2.2 Разработка структуры хранилища данных
Глава 3. Разработка пользовательского интерфейса к хранилищу данных
3.1 Проектирование доступа к сайту
Заключение
Список литературы
Приложения
Введение
Проектирование аналитического приложения для хранилища данных экономических показателей регионов Российской Федерации стало главной темой данной работы. Создаваться оно будет для общего использования, любой человек при необходимости сможет обратиться к этой программе, с целью получить нужные ему статистические данные по экономической деятельности субъектов Российской Федерации.
В нашей стране на сегодняшний день насчитывается 85 регионов. Каждый из них ведет собственную экономическую политику, имеет свои особенности и присущие только этому региону черты. Именно поэтому экономические показатели субъектов нашей страны зачастую очень сильно отличаются друг от друга. Для того чтобы четче прослеживать разницу, а также сильные и слабые стороны экономической деятельности каждого региона и проектировалось данное приложение.
Целью данной работы стало создание приложения на базе хранилища данных, предоставляющее определенным группам пользователей качественный, удобный и корректно функционирующий сервис по анализу экономических показателей Регионов Российской Федерации.
Достижение поставленной цели предполагало решение следующих задач:
1) Найти необходимые данные по экономической статистике всех регионов России;
2) Согласно найденным данным, реализовать технологию ETL (extract, transform, load) на базе табличной структуры;
3) Разработать хранилище данных;
4) Спроектировать приложение в соответствии со структурой хранилища.
Разработка приложения будет производиться в четыре этапа. В первую очередь поиск необходимых данных с экономической статистикой по регионам России. Наиболее правильным вариантом в данном случае представляется воспользоваться информацией расположенной на порталах государственных ведомств, в данном случае - с портала федеральной службы государственной статистики. Затем вся необходимая информация с этого портала будет представлена в удобном виде в специально созданных таблицах в Microsoft Excel. После того, как все данные будут в необходимом виде представлены в таблицах, будет проектироваться хранилище данных. В него данные будут загружаться в соответствии с годами. После того, как хранилище будет сформировано, будет спроектировано уже само приложение. В него будут добавлены возможности авторизации при входе, добавления и удаления колонок (в которых будут представлены показатели) и строк (регионы), фильтровать по значению, переключения между годами и построения аналитических графиков.
Данное приложение может быть полезным сразу для нескольких категорий людей. Во-первых, экономистам. Для них это приложение будет, прежде всего, полезно тем, что позволит проводить им качественную аналитическую работу с меньшими затратами а также составлять определенные экономические прогнозы, ссылаясь на имеющиеся данные. Во-вторых, это может быть полезно предпринимателям. Руководители компаний, принимая решение об открытии филиалов в том или ином регионе, после ознакомления с данной таблицей смогут точнее оценить целесообразность данного решения. Кроме того, приложение может быть полезно руководству регионов, поскольку у них будет возможность сравнивать свою экономическую деятельность с прошлыми периодами, а также сопоставлять свой регион с другими, оценивать, в чем они являются успешным регионом, а в чем необходимо прибавить в будущем.
Глава 1. Анализ экономических показателей регионов России
1.1 Анализ источников данных
Экономическая эффективность - один из ключевых показателей деятельности любого государства. На сегодняшний день в мировой экономике имеется определенная группа стран, которая производит 75% валового мирового продукта и создает основную часть экономического и научно-технического потенциала мира. Россию, как правило, к данной категории стран не относят, так как экономические показатели нашей страны зачастую оставляют желать лучшего. Однако нам как жителям этой страны, конечно, хотелось бы видеть ее в списке тех, кто ежегодно показывает высокие темпы роста экономики.
По своим размерам наша страна занимает первое место в мире. На её территории расположены 85 субъектов федерации. У каждого из них есть свои особенности, которые оказывают непосредственное влияние на экономическую деятельность региона. Площадь территории, географическое расположение, климатические условия, численность населения - все это, безусловно, оказывает прямое влияние на экономику любого региона. Экономическое состояние государства в целом определяется на основе экономических показателей всех его регионов. Именно поэтому для России крайне важно отслеживать экономические показатели каждого отдельно взятого региона, поскольку это дает возможность определять сильные и слабые стороны их экономики, направления, которые необходимо в регионе развивать.
На сегодняшний день такие данные предоставляются федеральной службой государственной статистики. Данное ведомство занимается непосредственным сбором всей необходимой информации и представляет её в общем виде на своих ресурсах. Конечно, это во многом упрощает задачу поиска и сбора подобной информации. Однако для проведения анализа этих показателей, сравнения их друг с другом, а также сравнении во времени, данные отчеты не совсем удобны. Если экономисту потребуется проводить исследование по тем или иным критериям, по конкретным регионам и конкретным показателям, то у него может уйти много времени на представление данного отчета в необходимом ему виде и дальнейшую его обработку. Для решения данной проблемы и будет разрабатываться специальное приложение, которое позволит более эффективно производить анализ имеющихся экономических показателей регионов.
Приложение, содержащее в себе определенный набор данных, как правило, имеет собственный источник, откуда данные были загружены. Чем лучше источник данных, с которыми будет осуществляться работа, тем точнее потом будут результаты проводимых анализов.
Для того чтобы спроектировать приложение, содержащее статистическую информацию по регионам Российской Федерации, необходимо собрать данные за определенный период по каждому из них. На сегодняшний день не так много ресурсов предоставляют информацию сразу по всем регионам нашей страны. В качестве источника данных для своей работы я выбрал публикации, расположенные на сайте федеральной службы государственной статистики. В работах, которые приводятся на порталах данного ведомства, имеется множество статистической информации, отражающей явления и процессы, произошедшие в экономической и социальной жизни России. При подготовке соответствующих отчетов были использованы данные, получаемые органами государственной статистики от предприятий, организаций, населения в ходе проведения статистических наблюдений, переписей, выборочных обследований, данные министерств и ведомств Российской Федерации, а также информация, получаемая от организаций, которые проводят обследования, опросы по сбору сведений экономического и социального характера.
Для своей работы я взял отчет, содержащий социально-экономические показатели по каждому из регионов нашей страны. Среди этих показателей содержится сразу несколько других подгрупп, которые по-своему описывают деятельность региона и приводят по определенным критериям все необходимые статистические данные. Так как мне необходимо в работе будет отразить самые важные показатели каждого из регионов, то самым правильным вариантом, на мой взгляд, было взять данные из следующего отчета: Основные характеристики субъектов Российской Федерации. По каждому из регионов страны были просчитаны соответствующие значения по ряду экономических показателей, указаны величины, в которых происходило измерение а также дата, если измерения были четко привязаны к временному периоду.
Помимо выбора самого состава необходимого источника данных, важно было также определить его временные рамки. Данные, представленные на портале федеральной службы государственной статистики, рассчитываются ежегодно, и формируются соответственно в формате годовых отчетов. Всего данное ведомство предлагает к ознакомлению статистические данные по регионам России за последние 14 лет. Так как анализ необходимо проводить сразу по нескольким отчетностям, то и выбрать для включения в разработку нужно более одного годового отчета. Конечно, в приложении могут присутствовать все 14 лет, за которые была рассчитана статистика по экономической деятельности регионов.
Однако на сегодняшний день это не является первостепенной задачей, поскольку важно, прежде всего, спроектировать удобную и понятную пользователю программу, в которой удобно было бы работать со всеми статистическими данными. Поэтому для разработки данного приложения в качестве источников данных я выбрал статистику за три последних года: 2013, 2014 и 2015. Все имеющиеся данные по ним на сегодняшний день являются наиболее актуальными. На рисунке 1.1 представлены данные, расположенные на портале федеральной службы статистики.
Рис 1.1 Фрагмент исходных данных
1.2 Обзор экономических показателей
В столбцах общих таблиц были представлены непосредственно экономические показатели. Именно они позволяют провести анализ экономического состояния региона и могут говорить о том, в каком направлении движется экономика. Показатели, представленные в таблицах, являются ключевыми для оценки экономической деятельности любого региона. Всего в работе будет использоваться 18 экономических показателей. Далее несколько слов необходимо сказать о том, почему именно они включены в список определяющих.
Прежде всего, необходимо включить в работу такой показатель как площадь территории региона. Всем хорошо известен тот факт, что Россия обладает самой большой территорией в мире. На ней проживает огромное количество народов и поселений. Именно с этими двумя факторами и связано то, что регионы нашей страны могут сильно отличаться друг от друга по своим размерам, ведь исторически территория региона образовывалась в зависимости от границ, в которых проживали его народы. Например, взглянув на карту России, представленную на рисунке 1.2, можно сравнить размеры республик Саха и Ингушетия.
Рис 1.2 Карта Российской Федерации
Конечно, регионы, имеющие большую площадь, имеют больше возможностей для развития различных отраслей экономики. Однако в данном случае необходимо понимать, что многое может также зависеть от климатических условий. Например, территория Чукотского автономного округа в разы превышает территорию Краснодарского края. Но из-за климатических условий экономика южного региона гораздо лучше развита. Это также имеет непосредственное отношение к населению региона. Именно этот показатель стал вторым, используемым в разработке приложения. Если вернуться к предыдущему примеру, несмотря на то, что территория Чукотки превышает территорию Краснодарского края в 10 раз, населения там проживает практически в 100 раз меньше.
Следующим шагом в определении необходимых экономических показателей стала общественная деятельность. Так, в первую очередь, следует отдельно выделить число занятых в экономике. Это очень важный экономический показатель, так как чем больше людей участвуют в экономике, тем она эффективней в регионе. После расчета среднего числа занятых людей, необходимо вычислить среднемесячный доход в регионе. Это, в свою очередь, позволит более точно судить об экономическом состоянии региона, поскольку на сегодняшний день сегодня во многих субъектах России с низким уровнем экономического развития средний доход населения значительно отличается от регионов, где экономическая ситуация лучше. После расчета среднего дохода населения, будет рассчитан отдельно показатель средних потребительских расходов. Потребительские расходы, в свою очередь, наряду с доходами влияют на уровень деловой активности в регионе в целом. При расчете средних доходов и расходов необходимо отметить уровень средней заработной платы. Есть регионы, где уровень заработной платы населения значительно выше, чем во всех остальных в нашей стране. В связи с этим, в течение прошлого столетия мы наблюдали процесс урбанизации, который продолжается и сегодня.
Описывая различные экономические показатели, необходимо упомянуть валовый региональный продукт. Это основной показатель экономической деятельности региона в целом. Чем больше значение валового регионального продукта, тем более эффективным является экономическая политика в этом субъекте. Благодаря этому показателю правительство страны может определить, какие регионы наиболее развиты, а где необходимо поднимать уровень экономического развития. Основные средства в экономике (по полной учетной стоимости, на конец года), также были рассмотрены отдельно в этой работе, чтобы отдельно выделить более развитые регионы.
Как уже было сказано ранее, территориальное расположение региона является одним из важных факторов, оказывающим непосредственное влияние на экономику. Чем больше площадь субъекта федерации, тем больше разнообразие природных ресурсов в нем. Именно поэтому добыча полезных ископаемых является ключевым показателем не только для отдельных регионов, но и для всей нашей страны в целом. Учитывая эти факторы, добыча полезных ископаемых была вынесена в таблице как отдельный экономический показатель. В свою очередь, добыча ископаемых способствует развитию обрабатывающих производств в регионе. В местах, богатых природными ресурсами в качестве важного фактора может быть производство и распределение электроэнергии, газа и воды. Все это оказывает положительное влияние на уровень валового регионального продукта и уровень экономической ситуации в регионе в целом.
Но не только добыча полезных ископаемых является ключевым экономическим фактором для богатых природными ресурсами регионов. В течение многих веков в нашей стране большое внимание всегда уделялось сельскому хозяйству. В настоящее время некоторые регионы по-прежнему показывают достаточно высокий уровень развития сельского хозяйства и являются основными поставщиками многих сельскохозяйственных продуктов, как внутри страны, так и за рубеж. При этом общий объем произведенной сельскохозяйственной продукции является основным показателем того, насколько эффективно используются природные возможности в регионе. Два основных направления сельского хозяйства: растениеводство и животноводство будут также отражены среди экономических показателей, для того чтобы показать на что делается основной акцент в сельском хозяйстве каждого отдельно взятого региона.
Важным фактором в развитии экономики региона является строительство новых домов. Этот показатель также находит свое отражение в этой работе, и оказывает непосредственное влияние на благосостояние региона. Таким образом, ввод в эксплуатацию общей площади жилых домов будет представлен сразу после сельскохозяйственных показателей.
Еще одной важной частью экономического анализа является расчет оборота розничной торговли. Этот показатель демонстрирует, насколько активны рынки в каждом регионе. Чем выше уровень розничной торговли в регионе, тем выше уровень его экономического развития.
Последние экономические показатели, которые будут представлены в этой работе это финансовые факторы. Первый из них представляет собой сальдированный финансовый результат деятельности организаций. Он представляет собой разницу между прибылью и убытками компаний в регионе и, следовательно, может иметь отрицательное значение. Еще одним финансовым показателем являются инвестиции в основной капитал. Его значение является самой высоким в ??тех регионах, где высокий уровень валового регионального продукта.
В результате проведенного анализа источников данных было установлено, что все необходимые экономические показатели были наиболее качественно представлены на сайте федеральной службы государственной статистики. На соответствующем портале они выкладываются в различных форматах. По итогам анализа необходимых для включения в работу данных, были отобраны 18 экономических показателей. Именно по ним и будет приводиться статистика по каждому субъекту федерации.
Глава 2. Технологии сбора и обработки макроэкономических показателей регионов России
2.1 Реализация технологии ETL на базе табличной структуры
Для разработки приложения необходимо сделать схему, в соответствии с которой оно будет реализовываться. В ней должны быть отражены все основные этапы проектирования сайта, предоставляющего пользователям возможности проведения аналитической работы с экономическими показателями. Всего в нее будет входить четыре основных этапа: определение источника данных, разработка табличной структуры, опираясь на технологии ETL, разработка хранилища данных и проектирование самого web-приложения. Выглядит эта схема следующим образом:
Рис 2.1 Этапы разработки приложения
Описание источника данных было произведено в предыдущей главе, поэтому теперь необходимо перейти к разработке таблиц на основе технологии ETL.
ETL - один из основных процессов по работе с хранилищами данных. Аббревиатура ETL получена по первым трем буквам основных этапов данного процесса - extract, transform, load. Три перечисленные стадии процесса ETL: извлечение данных из внешних источников, их трансформация и очистка и последующая загрузка в хранилище данных. С точки зрения данного процесса архитектуру создаваемого хранилища данных также можно описать в виде трех компонентов: источник данных, промежуточная область (вспомогательные таблицы, временно созданные для организации процесса выгрузки) и само хранилище данных, в которое они и будут в итоге помещены.
Источник данных был проанализирован в Главе 1. Данные, выложенные на сайте федеральной службы государственной статистики, были крайне востребованы в данной работе. Однако форматы, в которых они там были выложены, заметно отличались друг от друга. Изначально они вообще предоставлялись ведомством в печатном виде, однако с середины прошлого десятилетия начали выкладываться в интернете. В 2014 году выпуск печатных изданий прекратился, и теперь всю статистику можно найти только на их сайте. На сегодняшний день данные предоставляются в текстовых файлах (MS Word), в таблицах (MS Excel) или списком на сайте.
Все они для наглядности будут приведены в Приложениях № 1-3 к данной работе.
Ввиду того, что форматов с исходными данными несколько, появляется необходимость в реализации второго этапа ETL - создании вспомогательных таблиц, в которых данные будут приводиться в формализованном виде, готовые к дальнейшей загрузке в хранилище. Именно об этом этапе и пойдет речь далее.
Первым делом вся необходимая информация была отображена в таблицах Microsoft Excel, поскольку изначально они были представлены в неудобном для обработки виде. Загрузка данных в Excel позволяет проводить экономико-статистические расчеты и использовать графические инструменты.
Аналогично была сформирована и таблица с показателями за два других года - 2014 и 2015.
Далее хотелось бы несколько слов сказать о формировании строк в данной таблице. Как видно из рисунка 2.2, каждая отдельная строка представляет в таблице показатели по каждому региону России. Всего в нашей стране на сегодняшний день насчитывается 85 субъектов федерации. Отдельно стоит отметить, что Крым и Севастополь вошли в состав России только в 2014-м году, поэтому для них показатели были приведены только для последнего года.
Каждый регион в свою очередь входит с состав одного из 8 федеральных округов: Центрального, Северо-Западного, Южного, Северо-Кавказского, Приволжского, Уральского, Сибирского и Дальневосточного. Отдельно на сегодняшний день выделяют Крымский федеральный округ, который по своим размерам, числу жителей и количеству входящих в него субъектов федерации уступает всем остальным округам в несколько раз.
Необходимо также отметить, что отдельно были просчитаны показатели для 4-х автономных округов, входящих в состав России. Несмотря на то, что каждый из них в свою очередь входит в состав другого субъекта федерации, их доля в экономике региона довольно значима. Для городов федерального значения Москва и Санкт-Петербург все показатели также были просчитаны. Некоторые из показателей в официальной статистике по этим городам отсутствовали, в таких случаях в соответствующих ячейках ставился прочерк.
Представив все экономические показатели, которые будут задействованы в разработке приложения, можно для наглядности сформировать таблицу с их перечнем. На рисунке 2.4 изображен фрагмент таблицы «Показатели», которая была создана отдельно для отображения непосредственно перечня экономических показателей, используемых в работе.:
Рис 2.4 Фрагмент таблицы Показатели
В общей таблице «Регионы», фрагмент которой был приведен на рисунке 1.1, экономические показатели были размещены в столбцах, в отличие от таблицы «Показатели». Это было сделано с той целью, чтобы пользователю было удобнее их просматривать, информация отображалась нагляднее, и не приходилось долго искать необходимое значение. Для каждого субъекта федерации были приведены значения по каждому из экономических показателей.
Те показатели, которые использовались при разработке данного приложения, очень важны для полноценного проведения анализа. Конечно, они не единственные определяют экономическое благосостояние регионов. Есть еще огромное множество различных макроэкономических показателей, которые после проведения специальных расчетов могут показать, как функционирует экономика. Однако здесь необходимо отметить, что в данную работу были включены самые основные экономические показатели. На основании многих из них рассчитываются более сложные формулы, выводятся специальные значения. Имея информацию по приведенным в таблице показателям, экономист может приступить к проведению анализа экономической деятельности за тот или иной период, спрогнозировать, на чем необходимо будет в будущем сделать акцент и дальнейшие направления для развития экономики в регионе.
Показатели, приведенные в таблицах, могут пригодиться для работы специалистов не только общего плана. Их можно использовать для проведения различных типов анализа: территориального, финансового, динамики населения, использования природных ресурсов и многих других.
Все представленные выше таблицы были сохранены в общей книге в Microsoft Excel. Каждая из таблиц представлена на отдельном листе с соответствующим названием, поэтому при работе найти необходимую не составит какого-либо труда.
После проектирования всех необходимых таблиц в Microsoft Excel можно перейти к третьему этапу процесса ETL - разработке хранилища данных. пользовательский интерфейс хранилище сайт
2.2 Разработка структуры хранилища данных
Проектирование структуры является неотъемлемой частью процесса создания хранилища данных. После того, как все искомые данные были отражены в таблицах, необходимо определить, каким образом они будут представлены в базе данных и как они будут между собой соотноситься.
Хранилищe данных - этo предметно-ориентированная, информационная база данных, специально разработанная и предназначенная для подготовки отчетов и бизнес-анализа. От обычных баз данных хранилища отличаются прежде всего своим назначением и устройством. Обычно хранилища данных содержат в себе информацию, позволяющую проводить анализ различных деловых операций. Помимо этого, зачастую они доступны только для чтения. Данные в них накапливаются постепенно и со временем не изменяются. Для формирования самого хранилища необходимо, прежде всего, создать саму базу данных, в которой будут отражены все данные, приведенные в таблицах в предыдущей главе.
Самым важным элементом базы данных будет являться таблица «Регионы», в которой были приведены значения по каждому из экономических показателей для всех регионов Российской Федерации. Она будет представлять итоговые значения по всем субъектам и показателям, аналогично таблице, созданной в Microsoft Excel.
Как правило, структура хранилища данных отличается от структуры обычных баз данных, поскольку она денормализована и может допускать избыточность данных. Основными составляющими структуры хранилища данных выступают таблица фактов и таблицы прочих измерений. Таблица фактов - основная таблица хранилища данных. Она содержит совокупность сведений об объектах или событиях, которые в дальнейшем будут анализироваться. В моей случаем таблицей фактов выступает таблица «Регионы», так как в ней отражены все значения по каждому показателю для каждого субъекта РФ. Остальные таблицы (округа, показатели) будут представлять таблицы измерений.
Самой важной частью базы данных будет являться таблица фактов, в которой будут отражены значения того или иного макроэкономического показателя для каждого из регионов нашей страны. Каждый из регионов России должен иметь свой уникальный номер, и для этого необходимо будет создание отдельной таблицы со списком регионов, с указанием кода региона и его названия. Аналогично необходимо поступить и с таблицей, отражающей список годов, поскольку их при разработке использовалось несколько. Также в отдельной таблице нужно будет представить аналогичным способом и сами макроэкономические показатели. Помимо этих таблиц, отдельно будут разрабатываться таблицы со списком пользователей, которые будут иметь доступ к работе с проектируемым приложением и список доступных действий с ним, который напрямую будет зависеть от того, какой из пользователей вошел в систему.
Наиболее удобным в данном случае является выбор структуры хранилища данных типа звезда. То есть ряд таблиц, содержащих в себе какие-то данные, образует одну итоговую таблицу, в которой будет отражаться вся основная информация.
На рисунке 2.5схематично изображена та структура, по которой разрабатывалась база данных:
Рис 2.5 Схема
Всего в схеме отображено 6 ключевых элементов проектируемой базы данных. Ключевой, безусловно, является таблица со значением показателей регионов по годам. Именно к ней привязаны все остальные.
Для разработки необходимой базы данных я использовал систему управления базами данных MySQL. На сегодняшний день ее разработку и поддержку осуществляет корпорация Oracle. Данная СУБД была выбрана, так как она достаточно высокоэффективна и обладает высокой надежностью, что очень важно на сегодняшний день. Она также очень эффективная для реализации малых и средних приложений, что как раз таки важно для этой работы. MySQL способна управлять очень большими базами данных. Это может играть определяющую роль при работе с хранилищами данных, поскольку в них, как правило, содержится большое количество информации.
Далее нужно сказать несколько слов о самой базе данных. Проектируется она на основании тех таблиц, которые были сформированы согласно процессу ETL в MS Excel. Это означает, что в базе будут существовать таблицы посвященные показателям, годам, регионам, в каждой из которых будет создано свое ключевое поле. Все они будут связаны с главной таблицей значений.
Помимо этого, каждая таблица была также отдельно проработана. Как видно из, основной таблицей является RegionValues - таблица значений, так называемая таблица фактов. Именно к ней будут привязаны практически все оставшиеся таблицы. Для того чтобы корректно реализовать работу этой таблицы, необходимо было указать все типы связей для ключевых полей таблиц прочих измерений.
В таблице указано имя и тип данных, указаны ключевые поля и тип связи, длина и комментарий. Все остальные таблицы представлены похожим образом, для наглядности они будут приведены в приложениях № 4-5.
В этой главе была описана сущность ETL процесса, основы которого и были использованы при разработке этого приложения. На основании определенного в Главе 1 источника данных, были сконструированы промежуточные таблицы, в которых данные представлялись в формализованном виде и подготавливались к загрузке в хранилище. После того, как все они в соответствующем виде были отображены в табличном виде, проектировалось само хранилище данных. Прежде всего, была сконструирована схема, по которой и реализовывалась база данных. После определения структуры, были приведены фрагменты спроектированного хранилища данных.
Глава 3. Разработка пользовательского интерфейса к хранилищу данных
3.1 Проектирование доступа к сайту
После того, как согласно процессу ETL были описаны используемые источники данных, спроектированы таблицы в Microsoft Excel и разработано хранилище данных, можно переходить к этапу разработки самого приложения.
Приложение получило название - EmAwE Business Engine. Сайт, на котором оно расположено - http://regstat.emawe.ru/. Разрабатывалось оно на языке PHP. Это довольно практичный язык, который помогает быстро и эффективно решать поставленную задачу. Основными его достоинствами можно считать традиционность, простоту, эффективность, безопасность, гибкость. Далее я начну рассказывать непосредственно обо всех тех вещах, которые были реализованы в приложении.
Самым первым этапом в реализации приложения послужила регистрация пользователя. Регистрация на сайте, при входе, чаще всего нужна владельцам сайтов, желающим получить информацию о посетителях своего ресурса. Это также позволяет особо проработать вопрос реализации отдельных возможностей сайта. При переходе на сайт с приложением будет открываться окно, предлагающее пользователю войти в систему. Для этого сайт попросит ввести логин и пароль. На рисунке 3.1 приведено окно, всплывающее при переходе на сайт.
При разработке приложения мною было реализовано три варианта входа в систему: первый - доступ с правами администратора, второй - доступ с правами просмотра, третий - доступ с правами редактирования. Каждый из трех доступов был задуман с конкретными целями. Доступ с правами администратора необходим программистам и владельцам сайта для оценки функционирования системы, устранения неполадок и ее дальнейшей доработки и совершенствования. Доступ с правами просмотра создан для людей, желающих только ознакомиться с данной системой, узнать, что она делает и как работает. Наконец, третий доступ был сделан для той категории людей, которая владея статистической информацией, могла бы вносить корректировки в таблицу, править значения, колонки и прочее. Теперь я бы хотел остановиться на каждом из трех доступов поподробнее.
Доступ с правами администратора.
Данный вид доступа к системе реализован для того, чтобы отслеживать корректное функционирование приложения, устранять проблемы, а также добавлять в приложение новые объекты. Для входа в систему с правами администратора необходимо ввести соответствующие логин и пароль.
Введя эти данные при входе в систему, мы увидим следующее:
Расположенное наверху поле администрирования является ключевым элементом данного входа в систему. Оно позволяет полностью контролировать работу приложения. В администрирование входит два основных элемента: управление пользователями и управление таблицей. Однако исключительным правом администратора в данном случае является именно управление посетителями сайта. Именно администратор определяет возможности доступа к системе, а также выдает соответствующие логин и пароль.
При переходе в управление пользователями появляется следующее окно, в формате небольшой таблицы. В самой первой колонке указывается имя пользователя, затем логин и пароль для него. Для пароля существует функция замены (при нажатии на значок ключа). Затем идет колонка с разрешением доступа пользователю к работе с таблицей.
Права пользователей были также указаны в этой таблице. Для администратора, безусловно, имеется доступ ко всем возможностям системы. Для режима просмотра нет доступа к управлению пользователями, изменению данных и изменению колонок. Для режима редактирования нет доступа только к управлению пользователями.
Помимо этого, у администратора есть возможность добавлять и удалять пользователей. Для удаления необходимо нажать красный значок корзины в правом столбце. Для добавления пользователя создана специальная кнопка в правом верхнем углу. При ее нажатии появляется следующее окно:
Рис 3.4 Добавление пользователя
В данной форме администратор может указать имя пользователя, его логин и пароль. Стоит отметить, что подобное окно всплывает при нажатии кнопки изменения пароля (синий значок ключа), однако первые два поля в таких случаях уже будут заполнены. При нажатии кнопки «Сохранить» новый пользователь будет добавлен в таблицу.
Управления пользователями является основной уникальной возможностью администратора. Остальными возможностями наделяются пользователи в режиме редактирования.
Доступ с правами редактирования.
Данный доступ будет предоставляться всем тем людям, кто будет производить непосредственную работу с приложением. Это могут быть, прежде всего, экономисты, владеющие какими-то новыми статистическими данными, которые отличаются от представленных в таблице. Для входа с данного профиля необходимо ввести логин editable и пароль testP2ss. После входа появится аналогичная картинка, как при входе с администратора (рис. 3.2). Однако в разделе администрирование уже не будет возможности управления пользователями, а только управление таблицей. На рисунке 3.5 показана возможность управления колонками таблицы:
Рис 3.5 Настройка колонок
В настройках колонок существует возможность удалять имеющиеся и добавлять новые путем нажатия специальных кнопок в правом столбце. Для колонок можно изменять номера позиций, и тогда их расположение в таблице поменяется. Помимо этого можно изменять и названия самих колонок, для этого необходимо просто нажать на соответствующее название, и в появляющейся специальной строке изменить его.
Помимо этого в настройках таблицы имеется также возможность изменять и сами регионы. Для них также имеется возможность удаления и добавления. Это может быть использовано для включения или исключения из аналитической работы определенных регионов. Если название региона необходимо изменить, это можно сделать аналогично колонкам, нажав на нужное и поменяв его в соответствующей строке.
Помимо перечисленных выше возможностей настройки таблицы, в режиме редактирования также можно изменять и сами данные. При открытии статистики и выводе соответствующей таблицы можно, нажав на необходимое значение, изменить его.
Все остальные возможности таблицы доступны также в режиме просмотра. Именно о нем далее и пойдет речь.
Доступ с правами просмотра.
Данный режим может быть предоставлен любому желающему ознакомиться с основными экономическими показателями в данном приложении. Если человеку необходимо будет узнать о статистике региона за тот или иной год, сравнить его с другими, то такой режим будет как раз для него. Для входа в режим просмотра необходимо ввести логин viewtable и пароль testP2ss. После входа в данном режиме, появившаяся таблица будет уже несколько отличаться от той, которая была в предыдущих режимах. У пользователя будет отсутствовать возможность нажатия на конкретные значения, а также полностью будет отсутствовать возможность администрирования. Вот как выглядит таблица в режиме просмотра:
После описания всех трех режимов доступа для работы с приложением, можно перейти непосредственно к писанию функций, которые являются основными при работе с приложением. Одной из таких функций является возможность представления данных по конкретному году. Выбор года возможен в правом верхнем углу. На сегодняшний день было добавлено три последних года, однако конечно, при желании, можно добавить и более ранние.
Каждый новый год могут добавлять пользователи, имеющие право доступа с редактированием. При необходимости, они могут добавлять в приложение сразу несколько годов, а затем заполнять их имеющимися статистическими данными. Чем больше в приложение будет добавлено годов, тем объемней может быть анализ и тем больше может быть людей, заинтересованных в работе с ним.
Выводя данные по нужному году, аналитик может продолжать работу с таблицей в необходимом ему ключе. Прежде всего, еще на этапе проектирования базы данных, в системе была прописана иерархия, согласно которой приложение может выводить информацию. Это крайне важный этап при создании любого приложения, поскольку каждый конкретный вид данных можно отнести к какому-то другому, более крупному типу. В данном случае каждый из регионов принадлежит к одному из федеральных округов. Соответственно, в приложении была реализована возможность сворачивать и разворачивать таблицу, для того чтобы пользователю было удобнее искать данные и проводить аналитическую работу.
Сумма показателей каждого из регионов составляет общий показатель округа. Сумма показателей всех округов представляет общую экономическую статистику для России в целом.
На рисунке 3.13 представлена реализация иерархической структуры в приложении:
Рис 3.13 Иерархия
Помимо отработанной структуры иерархии, переключения по годам, в таблицу была добавлена возможность фильтра данных. Фильтрация данных является быстрым и простым способом найти определенное подмножество данных и работать с ним в таблице. В отфильтрованных данных отображаются только строки, соответствующие заданному условию, а ненужные строки скрываются.
В данном приложении добавлена возможность проводить фильтрацию по отдельным экономическим показателям. Как видно из рисунков выше, под строкой с названием показателей имеется специальная строчка с ячейками, где можно прописать значения, по которым будет работать фильтр. Данная возможность добавлена для всех без исключения регионов.
Процесс фильтрации запрограммирован следующим образом: при введении значения в соответствующую ячейку, на экран будут выводиться только те данные, которые превышают введенное значение. Это позволит аналитикам определить, какие субъекты Российской Федерации показали в том или ином году наивысшие показатели.
Для того, чтобы провести фильтрацию, необходимо заполнить необходимую ячейку в строке под названиями показателей и нажать кнопку «Обновить», расположенную в правом верхнем углу.
На рисунке 3.14 представлена таблица, в которой отображены отфильтрованные данные:
Рис 3.14 Фильтрация
Очень важной деталью для аналитика в процессе работы может послужить отсутствие лишней информации. Если в приложении присутствует большое число строк и столбцов, то у него может занять достаточное количество времени поиск необходимых значений. И если строки можно иерархически сворачивать и разворачивать, то для столбцов возможность настройки была добавлена отдельно. При нажатии специальной кнопки в правом верхнем углу, перед пользователем появляется специальное окно, в котором галочками можно отметить те показатели, которые нужны ему будут в работе. Если же он не желает видеть какие-то из них, то соответственно данную галочку необходимо убрать. Выглядит это следующим образом:
Все перечисленные выше функции приложения были разработаны для качественного отображения и работы со статистикой. Однако, безусловно, ни один анализ не проводится без оценки экономических показателей в динамике, то есть с течением определенного количества времени. В данном случае это относится к изменению статистики регионов по годам. Это должно быть крайне важной функцией, поскольку именно анализ в динамике позволит определять темпы роста или упадка по конкретным экономическим показателям в конкретных регионах. В свою очередь, это будет важно для экономистов, поскольку, обладая подобной информацией, они смогут оценивать эффективность данной экономической политики в регионе, а также делать определенные прогнозы на следующие года.
В процессе работы пользователю может понадобиться проанализировать один конкретный показатель по конкретному региону России. Для этого перейдя в специальное поле «Динамика» необходимо в двух специальных строках с соответствующими названиями выбрать необходимый для анализа показатель и регион.
Для строк с указанием показателя и региона были специально разработаны списки, позволяющие пользователю нажав на стрелку с правой стороны строки увидеть перед собой перечень всех регионов, включая также округа и страну в целом, либо перечень экономических показателей. Причем для случая с показателями, была проработана возможность выбирать только из тех, которые были выбраны пользователем в настройках колонок. Это заметно упростит аналитическую работу, поскольку не придется тратить время на поиски нужного показателя среди большого их количества.
После заполнения соответствующих строк: выбора показателя и региона, в приложении выстраивается график, который наглядно отображает ситуацию в течение трех лет. Реализовано это было следующим образом: по горизонтали указывался год, за который рассчитывалось значение, по вертикали - сам показатель. Диаграмма имела стандартный вид столбикового графика. Масштаб для значения показателей рассчитывался автоматически, поскольку для разных показателей были разные разбросы статистических данных. В связи с этим, чтобы графики нагляднее отображали информацию, и была реализована функция автоматического подбора интервала.
Рядом с графиком проектируется специальная таблица, которая выводит информацию по указанному пользователем запросу. Для соответствующего показателя по заданному региону приводятся данные по каждому году, параллельно отображая изменение в соответствии с предыдущим. Так как с каждым годом значение показателя может как увеличиваться, так и уменьшаться, то соответственно и значения изменений в таблице могут выводиться как с положительным знаком, так и с отрицательным.
Конечно, далеко не по всем показателям можно наблюдать подобную картину. Чаще всего на графике прослеживается либо тенденция к росту (например, со средними доходами населения) , либо тенденция к спаду (например, число жителей во многих регионах) . Однако есть также и показатели, которые с течением времени в регионах могут оставаться неизменными (площадь территории).
В главе 3 были подробно описанные все созданные в процессе разработки приложения группы пользователей. Было сказано о том, какими правами наделен администратор и какие действия могут осуществлять ряд пользователей, наделенный правами редактирования. Помимо этого, были описаны все основные функции, реализованные в приложении, которые доступны абсолютно всем. В частности, речь шла о реализованной иерархии, фильтрации и о возможностях различных настроек таблицы.
Заключение
В результате выполнения данной работы было спроектировано приложение, позволяющее более эффективно анализировать экономическую статистику регионов Российской Федерации. В отличие от простых таблиц с данными, оно позволяет экономистам конструировать выводимую информацию таким образом, чтобы затраты времени на поиск и анализ данных были наименьшими. Помимо всего прочего приложение по запросам пользователей строит графики, которые показывают динамику экономических показателей с течением времени.
В процессе работы был выполнен ряд поставленных задач. Прежде всего, был определен и проанализирован источник данных, которым стал портал федеральной службы государственной статистики. Данные, полученные оттуда, в полной мере отразили все основные экономические характеристики каждого из регионов нашей страны. Далее, на основе процесса ETL была разработана табличная структура, в которой найденные данные были отражены в корректном и удобном для дальнейшей работы формате. После создания таблиц, была разработана структура хранилища и произведена загрузка туда всех формализованных табличных данных. Ну и наконец, было разработано само web-приложение. В его работу было включено сразу несколько функций, упрощающих работу экономистов и аналитиков в разы. Это, в частности, были возможности настройки столбцов для наиболее удобного отображения информации, реализация функции фильтрации значений показателей для поиска конкретных значений, возможность увидеть статистику по различным годам и проработанная иерархия, позволяющая оценить суммарные значения показателей для федеральных округов и всей страны в целом.
Созданное приложение может быть полезно нескольким категориям людей. Оно может использоваться как для анализа и выводов по экономической деятельности регионов в уже прошедшее время, так и для прогнозов на будущие года. Приложение в удобной форме предоставляет всю имеющуюся статистику, поэтому любому человеку, кто с толкнется с необходимостью сравнить экономическую эффективность тех или иных регионов оно может помочь.
Еще одной очень важной особенностью данного приложения является его предрасположенность к дальнейшей модернизации. В частности, в приложение могут быть добавлены новые экономические показатели, новые года, загружены новые данные. Более того, если появится необходимость, можно будет провести более глобальную модернизацию и добавить в приложение схожую статистическую информацию по другим странам, а затем и по регионам добавленных стран, за счет более детальной проработки иерархии.
В целом, на мой взгляд, это приложение будет крайне полезным для тех специалистов, кому необходимо произвести качественный сравнительный анализ по экономической деятельности регионов нашей страны, сделать соответствующие выводы и содействовать установлению наиболее эффективной экономической политики во всех субъектах Российской Федерации, тем самым повысив общий уровень экономики страны в целом.
Список литературы
1. Росстат, Регионы России. Социально-экономические показатели, 2014
2. Герасимов Н.А. Разработка многомерного хранилища данных для комплексного анализа стран мира, 2014
3. Герасимов Н.А. Практикум по разработке диалоговых систем и баз данных в WEB-среде, 2005
4. Корчагин Ю.А., Экономика регионов России
5. Магомедов М.Д., Алексейчева Е.Ю., Еделев Д.А. Экономическая география и регионалистика, 2014
6. Бреусова А.Г. Региональная финансовая политика, 2011
7. Lou Agosta, The Essential Guide to Data Warehousing
8. Герасимов Н.А., Гурьянкина Е.Е., К вопросу организации web-портала для анализа макроэкономических показателей, 2011
9. Eric Sperley, The Enterprise Data Warehouse
10. Люк Веллинг, Лаура Томсон, Разработка веб-приложений с помощью PHP и MySQL, 2010
11. Регионы России. Основные социально-экономические показатели регионов России. 2012
12. Тенденции развития регионов России: социально-экономический анализ
13. Проблема сдвигов в региональной структуре экономики России, Аналитический доклад, 2013
14. Движение регионов России к инновационной экономике, 2006
15. Андреев А.В., Борисова Л.М., Плучевская Э.В. Региональная экономика, 2012
16. Август Кинг, Методология регионов России
17. Косов Н.С. Основы макроэкономического анализа
18. Donald M. Atwater: Macroeconomic analysis of Interest Rates
19. Altug S., Jagit S.C., Nolan C. Dynamic macroeconomic analysis, Paperback, 2003
20. Bernard Baumohl, The Secrets of Economic Indicators
Приложения
Приложение 1
Исходные данные в формате таблицы на сайте
Приложение 2
Исходные данные в формате Microsoft Word
Приложение 3
Исходные данные в формате Microsoft Excel
Приложение 4
Таблица со списком показателей
Размещено на Allbest.ru
...Подобные документы
Особенности проектирования программы на языке С++ для обработки данных из таблиц базы данных. Основные функции программы, создание концептуальной модели базы данных и диаграммы классов, разработка интерфейса пользователя и запросов к базе данных.
курсовая работа [2,1 M], добавлен 08.06.2012Требование к структуре данных в базе, описание ее вида, содержание объектов. Используемые форматы данных. Алгоритмы и их особенности. Функциональное описание разработки. Описание пользовательского интерфейса. Контрольные примеры, временные характеристики.
курсовая работа [1,5 M], добавлен 06.04.2016Разработка программного продукта - приложения, позволяющего заносить данные анкетирования в базу данных MS SQL. Описание логики работы приложения, особенности пользовательского интерфейса. Формы просмотра анкет, описание процедур и функций программы.
курсовая работа [1,2 M], добавлен 16.08.2012Разработка вычислительной структуры, реализующей заданный набор операций для обработки запросов в реляционной базе данных (БД). Описание общей структуры системы с машиной баз данных. Разработка схем исполнительных процессоров и алгоритмов их операций.
реферат [140,3 K], добавлен 27.10.2010Разработка приложения, позволяющего автоматизировать документооборот предприятия по списанию основных средств. Мероприятия по защите и обеспечению целостности базы данных. Разработка клиентского приложения. Запросы к базе данных, руководство пользователя.
курсовая работа [700,0 K], добавлен 14.01.2015Анализ существующих технологий создания web-приложений. Разработка сетевой технологии публикации и обработки информации о детях в детском саде №176 "Белочка" с помощью JSP-страниц и сервлетов с использованием JDBC-драйвера для доступа к базе данных.
курсовая работа [3,8 M], добавлен 18.12.2011Построение информационно-логической модели базы данных. Корректировка данных средствами запросов. Проектирование алгоритмов обработки данных. Реализация пользовательского интерфейса средствами форм. Разработка запросов для корректировки и выборки данных.
курсовая работа [680,9 K], добавлен 19.10.2010Разработка базы данных и приложения для автоматизации ведения кадрового учёта предприятия. Формирование таблицы анкетных данных. Разработка графического интерфейса пользователя клиентских приложений. Возможность подключения к удаленной базе данных.
дипломная работа [47,6 K], добавлен 17.02.2009Этапы проектирования базы данных, определение целей и содержание таблиц. Добавление данных и создание других объектов базы данных. Даталогическая модель: структуризация, нормализация, схемы данных. Порядок, принципы создания пользовательского интерфейса.
курсовая работа [1,3 M], добавлен 26.03.2013Разработка клиент-серверного приложения, позволяющего взаимодействовать друг с другом с использованием доступа к базам данных. Проектирование связи сервера с базой данных с помощью технологии ODBC. Разработка интерфейса программы, ее тестирование.
курсовая работа [352,0 K], добавлен 24.08.2016Описание входной и выходной документации. Требования к интерфейсу Windows-приложения и информационной базе. Разработка алгоритмов обработки данных и SQL-запросов к базе данных. Язык программирования Object Pascal и среда Delphi. Используемая СУБД.
дипломная работа [228,7 K], добавлен 25.11.2007- Разработка геоинформационного программного обеспечения на базе открытых продуктов для целей кадастра
Исследование современных геоинформационных технологий, анализ их преимуществ и недостатков. Проектирование структуры базы данных, приложения и интерфейса проекта. Программная реализация геоинформационной системы и оценка ее экономической эффективности.
дипломная работа [3,2 M], добавлен 21.06.2012 Разработка и программная реализация сайта и базы данных, наполнение базы данных тестовой информацией о товарах. Инструментальные средства создания сайта. Организация тестирования сайта, модуль визуализации интерфейса. Создание запросов в базе данных SQL.
курсовая работа [1,4 M], добавлен 24.12.2012Выбор программных и аппаратных средств для создания базы данных. Описание структуры программы. Описание разработки приложения. Подключение к базе данных, выполняемое с помощью компонента ADOConnectio. Создание средств защиты информации в программе.
курсовая работа [2,1 M], добавлен 16.02.2015Анализ создания виртуального окружения для разработки. Установка фреймворка Flask. Особенность настройки аутентификации и привилегий. Создание Python-файла и написание в нем простого веб-приложения. Запуск и проверка работоспособности приложения.
лабораторная работа [2,1 M], добавлен 28.11.2021Технология разработки пользовательского интерфейса в среде Delphi. Создание таблицы, меню, форм для ввода и редактирования данных. Принципы организации меню как элемента интерфейса пользователя. Реализация сортировки, фильтрации, вычислений в таблице.
курсовая работа [1,6 M], добавлен 13.11.2012Обзор технологической платформы для разработки клиентского веб-интерфейса. Выбор платформы базы данных, языка разработки, фреймворка на стороне сервера и клиента. Создание схемы данных MySQL. Работа пользователя и оператора с программным продуктом.
курсовая работа [4,1 M], добавлен 17.07.2012Теоретические основы создания баз данных в Visual Foxpro 9.0. Описание программы, использование ее команд. Создание табличной базы данных, отношений между таблицами в многотабличной базе данных больных в больнице. Редактирование табличного отчета.
курсовая работа [681,2 K], добавлен 19.12.2013Этапы проектирования базы данных. Определение цели создания. Присвоение ключевых полей. Добавление данных и создание других объектов. Инфологическая и даталогическая модель. База данных "Прокат видеодисков". Создание пользовательского интерфейса.
курсовая работа [2,3 M], добавлен 24.10.2014База данных для ЗАО "ФК "Зенит", предназначенная для хранения и обработки данных о работниках клуба, его бюджете и результатах участия в соревнованиях. Разработка предварительных отношений и пользовательского интерфейса. Структура таблиц базы данных.
курсовая работа [4,4 M], добавлен 10.12.2011