Технологии, используемые в проектировании баз данных в информационных системах

Создание хранилищ данных как трудоемкий и длительный процесс. Общая характеристика технологий, используемых в проектировании баз данных в информационных системах. Рассмотрение особенностей реализации концепции хранилища данных, анализ основных принципов.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 25.07.2018
Размер файла 17,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Технологии, используемые в проектировании баз данных в информационных системах

Создание хранилищ данных - трудоемкий и длительный процесс. Наряду с хранилищами данных существуют и часто используются компаниями витрины данных (Data Mart), называемые также киосками данных. Такие системы создаются для отдельных подразделений компаний или для обеспечения отдельных видов деятельности. Объемы данных и требования к вычислительным ресурсам в витринах данных существенно меньше по сравнению с хранилищами. Витрины данных могут строиться как независимо, так и на основе хранилищ данных компании. Хранилища данных имеют двухуровневую или трехуровневую архитектуру. В двухуровневых хранилищах на верхнем уровне поддерживается объединенная информация. На нижнем уровне - различные источники баз данных. В трехуровневой архитектуре предусматривается поддержка витрин данных для отдельных подразделений компании над ее единым хранилищем.

База данных- совокупность взаимосвязанных, хранящихся вместе данных, при наличии такой минимальной избыточности, которая допускает их использование оптимальным образом для одного или нескольких приложений (определение Мартина). Данные запоминаются так, чтобы они были независимы от программ, использующих эти данные. Для добавления новых или модификации существующих данных, а также поиска данных в БД применяется СУБД. Данные структурируются таким образом, чтобы была обеспечена возможность дальнейшего наращивания приложений. Говорят, что система содержит совокупность баз данных, если эти базы данных структурно полностью самостоятельны. Естественно, что первоначально источником исходной информации для проведения анализа служили данные, хранящиеся в традиционных OLTP-системах. Вместе с тем по мере развития средств и методов анализа и переполнения данными этих систем подобный способ получения аналитической информации становился все менее и менее эффективным. Основные причины этого заключаются в том, что:

· во-первых, подобные системы зачастую вообще не обеспечивают возможность получения необходимых данных, так как организация данных в OLTP-системах в целом не ориентирована на решение аналитических задач;

· во-вторых, для решения многих аналитических задач требуется обработка значительных объемов информации по достаточно сложным алгоритмам, что в рамках OLTP-системы приводит к существенным затратам вычислительных ресурсов;

· в-третьих, реализация аналитических приложений с использованием баз данных OLTP-систем мешает оперативной обработке транзакционных задач, при этом заметно снижается производительность системы и повышается стоимость ее сопровождения, поскольку для задач анализа зачастую требуются исторические сведения за достаточно длительный период.

Указанные причины обусловили необходимость появления новых подходов к организации хранения и обработки информации, которые обеспечивали бы оперативное решение аналитических задач по различным запросам пользователей - специалистов управления.

Первыми в начале 90-х годов прошлого века с данной проблемой столкнулись крупные западные корпорации, которые обнаружили, что в результате накопления в БД огромных объемов информации существенно снижается эффективность работы системы в целом. Выход из создавшейся ситуаций был найден У. Инмоном - специалистом по организации корпоративных БД. Именно он предложил принципиально новый подход к организации хранения информации, названный им хранилищем данных (Data Warehouse).

В настоящее время под хранилищем данных понимается предметно-ориентированный, интегрированный, поддерживающий хронологию набор данных, являющийся единственным источником информации, необходимой для анализа и принятия управленческих решений.

В основе реализации концепции хранилища данных лежат следующие основные принципы:

· подразделяются наборы данных, используемые в системах оперативной обработки данных (OLTP-системах), и наборы данных, применяемые в аналитических системах (OLAP-системах) для поддержки принятия управленческих решений (DSS - Decision Support System);

· перед помещением данных в хранилище они проверяются на непротиворечивость, приводятся к единой системе понятий и единым форматам представления и определенным образом структурируются и обобщаются;

· по мере «устаревания» данные из хранилища не удаляются, как это обычно принято в традиционных БД при их актуализации, а их обновленные значения добавляются к уже имеющимся данным;

· структура хранилища организуется так, чтобы обеспечивалось быстрое и эффективное извлечение необходимой информации (данные могут заранее агрегироваться по наиболее часто используемым аналитическим разрезам);

· помимо данных в хранилище содержатся также и метаданные (т.е. данные о хранящихся данных) - своего рода «досье», отражающее различные сведения о хранящейся управленческой информации и расширяющее возможности ее аналитической обработки. Метаданные характеризуют источник информации, дату ее формирования, дату занесения в хранилище, пользователей информации и т.п.

Понятие «хранилище данных» определяет лишь концепцию организации хранения данных и практически не регламентирует характер и способы (технологии) их использования на практике, поэтому могут встречаться различные варианты их реализации в зависимости от целей создания.

Хранилища данных - это информационный фундамент, на котором строятся OLAP-приложения. Главной особенностью программных средств OLAP-систем является обеспечение оперативного анализа данных, содержащихся в хранилище, причем они ориентированы на их использование любыми специалистами по управлению - непрофессионалами в области компьютерных технологий: руководителями различных служб и отделов. Имея в своем распоряжении гибкие механизмы манипулирования данными, визуального отображения этих процессов и результатов их реализации, специалист по управлению, используя свои знания, опыт и интуицию, может самостоятельно устанавливать различные закономерности в поведении элементов анализируемой системы, сопоставлять различные показатели, выявлять качественно новые, скрытые до этого взаимосвязи между ними.

Что касается результатов проводимого с помощью OLAP-технологий анализа, то особо следует выделить задачи, связанные с интеллектуальным анализом данных, главными целями которого являются обеспечение поиска функциональных и логических закономерностей в отношении накопленной информации, а также построение моделей и правил, объясняющих и/или прогнозирующих эти закономерности. В этом плане OLAP-технологии представляют собой определенный шаг в реализации систем искусственного интеллекта. Основное отличие OLAP-технологий от систем искусственного интеллекта заключается в том, что они позволяют не моделировать естественный интеллект человека, а лишь расширять его способности, используя возможности современных компьютеров и хранилищ данных. Вместе с тем в настоящее время технологии интеллектуального анализа данных (Data Mining) становятся все более актуальными, так как пользователь можно получать не только новые данные, но и новые знания.

Особое место среди информационных технологий, связанных с интеллектуальным анализом данных, отводится технологиям, обеспечивающим решение неформализованных или слабоформализованных задач. Традиционно для решения задач подобного характера используются два подхода: экспертные системы и нейросетевые технологии (нейросети).

Экспертные системы представляют собой разновидность систем искусственного интеллекта, т.е. систем, имитирующих посредством компьютера интеллектуальные способности человека в конкретных прикладных областях его деятельности с учетом накопленных знаний относительно этой прикладной области и формализованных правил получения на их основе новых знаний.

В отличие от экспертных систем нейросетевые технологии при решении неформализованных (или слабоформализованных) задач не требуют знания правил вывода. Для работы нейросети необходимо выполнить ее предварительное «обучение» на достаточном количестве исходных примеров. Такое «обучение» осуществляется в целях настройки функционирования адаптивной системы нейросети для решения задач с заданной степенью достоверности. Данный процесс повторяется до тех пор, пока суммарная погрешность реакции сети на всем множестве исходных значений не достигнет приемлемого уровня. После этого считается, что «обученная» нейросеть способна генерировать идеальные (с ее точки зрения) решения поставленной задачи на основе неизвестных входных данных, но имеющих ту же природу, что и множество данных, с использованием которых осуществлялось ее «обучение».

Если внедрение информационных технологий для анализа данных на основе OLAP-систем и систем искусственного интеллекта обеспечивает расширение круга функциональных задач управления, реализация которых с помощью компьютеров составляет информационную основу для принятия обоснованных бизнес-решений, то автоматизация документооборота и делопроизводства - это прежде всего средство повышения эффективности административно-управленческой деятельности аппарата управления за счет так называемых внутренних резервов.

Из-за большого объема данных в хранилищах одной из основных проблем создания хранилищ является обеспечение высокой производительности обработки запросов. Запросы в хранилище отличаются высоким уровнем сложности.

Создание хранилищ данных - трудоемкий и длительный процесс. Наряду с хранилищами данных существуют и часто используются компаниями витрины данных (Data Mart), называемые также киосками данных. Такие системы создаются для отдельных подразделений компаний или для обеспечения отдельных видов деятельности. Объемы данных и требования к вычислительным ресурсам в витринах данных существенно меньше по сравнению с хранилищами. Витрины данных могут строиться как независимо, так и на основе хранилищ данных компании. Хранилища данных имеют двухуровневую или трехуровневую архитектуру. В двухуровневых хранилищах на верхнем уровне поддерживается объединенная информация. На нижнем уровне - различные источники баз данных. В трехуровневой архитектуре предусматривается поддержка витрин данных для отдельных подразделений компании над ее единым хранилищем.

хранилище информационный проектирование

Список литературы

1.Шарафутдинов А.Г. Информационные технологии в бухгалтерском учете [Текст] / А.Г. Шарафутдинов , У.С. Николаева // Экономика и социум. - 2014 г. - № 2-5 (11). - С. 468-470.

2.Магафуров К.Б., Ямилов Н.Х., Иванов С.Е.,Шарафутдинов А.Г., ТЕОРЕТИЧЕСКИЕ ОСНОВЫ РАЗВИТИЯ СЕЛЬСКОГО ХОЗЯЙСТВА КАК ОТКРЫТОЙ САМООРГАНИЗУЮЩЕЙ СИСТЕМЫ [Текст]:МСХ РФ, Башкирский государственный аграрный университет. Уфа, 2003. В сборнике: Пути повышения эффективности АПК в условиях вступления России в ВТО материалы международной научно-практической конференции (к XIII международной специализированной выставке "АГРО-2003"). 2003. С. 129-131.

Размещено на Allbest.ru

...

Подобные документы

  • Понимание хранилища данных, его ключевые особенности. Основные типы хранилищ данных. Главные неудобства размерного подхода. Обработка информации, аналитическая обработка и добыча данных. Интерактивная аналитическая обработка данных в реальном времени.

    реферат [849,7 K], добавлен 16.12.2016

  • Формы представляемой информации. Основные типы используемой модели данных. Уровни информационных процессов. Поиск информации и поиск данных. Сетевое хранилище данных. Проблемы разработки и сопровождения хранилищ данных. Технологии обработки данных.

    лекция [15,5 K], добавлен 19.08.2013

  • Определение многомерной модели данных для удовлетворения основных информационных потребностей предприятия. Экстракция, загрузка и перенос данных из различных источников данных. Разработка собственных ETL–систем. Оптимизация работы хранилища данных.

    презентация [9,1 M], добавлен 25.09.2013

  • Концепции хранилищ данных для анализа и их составляющие: интеграции и согласования данных из различных источников, разделения наборов данных для систем обработки транзакций и поддержки принятия решений. Архитектура баз для хранилищ и витрины данных.

    реферат [1,3 M], добавлен 25.03.2013

  • Правовое регулирование защиты персональных данных. Общий принцип построения соответствующей системы. Разработка основных положений по охране личных документов. Подбор требований по обеспечению безопасности персональных данных в информационных системах.

    дипломная работа [1,3 M], добавлен 01.07.2011

  • Принципы построения и основные компоненты хранилищ данных, общая характеристика основных требований к ним по Р. Кинболлу. Понятие и виды баз данных. Методика проектирования комплекса задач автоматизации учета по счету 02 "Амортизация основных средств".

    контрольная работа [27,8 K], добавлен 12.11.2010

  • Информационные и автоматизированные системы управления технологическими процессами на промышленных предприятиях. Базы данных в автоматизированных системах управления. Системы планирования ресурсов предприятия, сбора и аналитической обработки данных.

    контрольная работа [486,7 K], добавлен 29.10.2013

  • Совершенствование технологий записи и хранения данных. Специфика современных требований к переработке информационных данных. Концепция шаблонов, отражающих фрагменты многоаспектных взаимоотношений в данных в основе современной технологии Data Mining.

    контрольная работа [565,6 K], добавлен 02.09.2010

  • Понятие администрирования баз данных, функции и роли администраторов. Управление целостностью данных в системах управления базами данных, буферизация, транзакция, журнализация. Управление безопасностью в системах, источники нарушения целостности данных.

    курсовая работа [164,7 K], добавлен 15.07.2012

  • Модели данных в управлении базами данных. Концептуальные модели данных. Роль баз данных в информационных системах. Реляционная модель данных. Определение предметной области. Построение модели базы данных для информационной системы "Домашние животные".

    курсовая работа [1,9 M], добавлен 19.04.2011

  • Рассмотрение OLAP-средств: классификация витрин и хранилищ информации, понятие куба данных. Архитектура системы поддержки принятия решений. Программная реализация системы "Abitura". Создание Web-отчета с использованием технологий Reporting Services.

    курсовая работа [2,7 M], добавлен 05.12.2012

  • Осмысление и переработка информационных данных, которые используются для решения управленческих задач. Общая схема информационной системы, ввод данных, их обработка, хранение и распределение полученной информации. Характеристики информационных систем.

    контрольная работа [59,8 K], добавлен 03.10.2010

  • Методы построения хранилища данных на основе информационной системы реального коммерческого предприятия. Основные аналитические задачи, для решения которых планируется внедрение хранилищ данных. Загрузка процессоров на серверах. Схемы хранения данных.

    контрольная работа [401,0 K], добавлен 31.05.2013

  • Разработка структуры реляционной базы данных для информационной системы "Распределение учебной нагрузки". Требования к информации, надежности, составу и параметрам технических средств. Нормализация информационных объектов, логическая модель данных.

    курсовая работа [2,3 M], добавлен 03.05.2015

  • Система управление базами данных, реляционная модель. Принципы взаимодействия между клиентскими и серверными частями. Трехуровневая модель технологии "клиент-сервер". Фрактальные методы сжатия больших объемов данных. Анализ концепции хранилища данных.

    курс лекций [265,0 K], добавлен 05.06.2009

  • Методы и средства защиты информационных данных. Защита от несанкционированного доступа к информации. Особенности защиты компьютерных систем методами криптографии. Критерии оценки безопасности информационных компьютерных технологий в европейских странах.

    контрольная работа [40,2 K], добавлен 06.08.2010

  • Понятие информации, автоматизированных информационных систем и банка данных. Общая характеристика описательной модели предметной области, концептуальной модели и реляционной модели данных. Анализ принципов построения и этапы проектирования базы данных.

    курсовая работа [1,7 M], добавлен 18.01.2012

  • Анализ предметной области, концептуальных требований и информационных потребностей к разрабатываемой базе данных студентов. Выбор информационных объектов и проектирование информационной структуры. Создание таблиц, отчетов, запросов на выборку и форм.

    курсовая работа [69,4 K], добавлен 18.11.2010

  • Архитектура и технология функционирования системы. Извлечение, преобразование и загрузка данных. Oracle Database для реализации хранилища данных. Создание структуры хранилища. Механизм работы системы с точки зрения пользователя и с точки зрения платформы.

    курсовая работа [2,2 M], добавлен 22.02.2013

  • Использование средств вычислительной техники в информационных системах. Программно-аппаратные средства, обеспечивающие сбор, обработку и выдачу информации. Модели данных - списки (таблицы), реляционные базы данных, иерархические и сетевые структуры.

    реферат [105,1 K], добавлен 08.11.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.