Проблемы разработки и эксплуатации информационных хранилищ

Назначение и свойства информационного хранилища, его компоненты. Сравнение систем OLTP и хранилищ данных. Современные дата-центры. требования к безопасности данных. Разработка интегрированного набора программных продуктов и сервисов управления данными.

Рубрика Программирование, компьютеры и кибернетика
Вид контрольная работа
Язык русский
Дата добавления 22.05.2015
Размер файла 46,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

27

Размещено на http://www.allbest.ru/

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

«КУБАНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»

(ФГБОУ ВПО «КубГУ»)

Кафедра общего, стратегического, информационного менеджмента и бизнес - процессов

КУРСОВАЯ РАБОТА

ПРОБЛЕМЫ РАЗРАБОТКИ И ЭКСПЛУАТАЦИИ ИНФОРМАЦИОННЫХ ХРАНИЛИЩ

Работу выполнила Алексеева Валерия Сергеевна

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

1. Теоретические сведения и проблемы разработки и эксплуатации информационных хранилищ

1.1 Назначение и свойства информационного хранилища

1.2 Компоненты информационного хранилища

1.3 Современные свойства разработки и эксплуатации информационных хранилищ

2. Решение и реализация проблем разработки и эксплуатации информационных хранилищ

2.1 Проблемы разработки и эксплуатации

2.2 Подходы к решению проблем разработки и эксплуатации информационных хранилищ

2.3 Использование информационных хранилищ

  • ЗАКЛЮЧЕНИЕ
  • СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
  • ВВЕДЕНИЕ
  • Современный мир уже не представляется без информационных хранилищ, так как они позволяют собрать в едином месте всю информацию, которая может понадобиться управляющему при принятии решения. Ответственным за принятие корпоративных решений, необходимо иметь доступ ко всем данным организации независимо от их расположения. Для таких задач, как:
  • ѕ Выполнение полного анализа деятельности организации;
  • ѕ Определения ее деловых показателей;
  • ѕ Выяснения характеристик существующего спроса
  • ѕ Тенденций изменения спроса
  • Необходимо иметь доступ не только к текущим данным, но и к ранее накопленным данным. Для упрощения подобного анализа было создано хранилище данных (data warehouse).
  • Источниками данных для информационного хранилища служат в первую очередь данные из разрозненных транзакционных и учетных информационных систем, основанных на различных реляционных СУБД, которые обслуживают повседневную бизнес-деятельность. Источниками необходимой информации могут быть также газеты, радио, телевидение, интернет и любые другие. При этом предполагается, что данные предварительно должны быть приведены к единым стандартам, очищены от противоречий, структурированы и обобщены с требуемым уровнем детализации.
  • Данная тема курсовой является актуальной, так как в наше время необходимы программы, которые будут полностью автоматизированы.
  • Информационные хранилища служат исключительно для обработки и анализа информации, поэтому проектируются они таким образом, чтобы время выполнения запросов к ним было минимальным.
  • Большой вклад в развитии теории информационных хранилищ внесли зарубежные исследователи: Б. Девлин, У. Инмон, Р. Кимпбалл,
    М. Росс, Э. Спирли.
  • Объектом данной курсовой работы является исследование разработки и эксплуатации информационных хранилищ.
  • Предметом курсовой разрешение задач и вопросов относительно структуры и функционирования информационных хранилищ, анализ и разработка алгоритма их выполнения.
  • Целью теоретической части курсовой работы является раскрытие в полной мере понятия и предназначения информационных хранилищ и анализ существующих проблем в данной сфере, выявление плюсов и минусов информационных хранилищ, а также специфики и всех системообразующих, определить важность разработки и эксплуатации информационных хранилищ.
  • В ходе работы в теоретической части мы ставим перед собой такие задачи:
  • – Изучение общих теоретических сведений об информационных хранилищах;
  • – Анализ свойств и компонентов информационного хранилища;
  • – Ознакомление с понятием интеграции данных;
  • – Выявление преимуществ и недостатков информационных хранилищ;
  • – Анализ существующих моделей функционирования информационных хранилищ;
  • – Разработка мероприятий по совершенствованию и решению существующих недостатков хранилищ данных.
  • Структура курсовой работы обусловлена целью и задачами исследования и включает в себя: введение, два раздела с подразделами, заключение и список использованных источников.
  • Во введении рассматривается обоснование выбранной темы, ее актуальность, объект и предмет исследования, а также цель.
  • В первом разделе рассматривается понятие информационных хранилищ и базовая информация о них, проанализированы свойства и компоненты. Выявлено назначение хранилищ данных.
  • Во втором разделе рассматриваются существующие преимущества и недостатки. Также анализ по реализации решения проблем.
  • 1. Теоретические сведения и проблемы разработки и эксплуатации информационных хранилищ
  • 1.1 Назначение и свойства информационного хранилища
  • Информационное хранилище -- является местом хранения данных какой-либо организации, которое используется для упрощения принятия управленческих решений. Информационное хранилище включает в себя не только данные, но также инструменты, различные мероприятия, обучение, персонал и другие ресурсы, облегчающие получение информации и делающее ее более понятной и доступной для лиц, принимающих решения. Назначение информационного хранилища состоит в увеличении ценности информационных активов предприятия [2].
  • Задача информационного хранилища состоит в том, чтоб хранить выдержки из рабочих данных и предоставлять их в любое удобное время и в любом удобном формате. Под выдержками можно понимать файлы из базы данных, отсканированные документы, записи, фотографии и другие документы. Информационные хранилища используются для хранения, комбинирования, агрегирования, преобразования и доставки данных пользователям с помощью средств анализа и принятия решений [4].
  • Таблица 1 - Функции и назначение информационных хранилищ [8]
  • Функции информационных хранилищ

    сбор, организация, подготовка данных для анализа в виде постоянно наращиваемой базы данных

    анализ, как элемент принятия решений

    Назначение информационного хранилища

    интеграция данных в масштабе бизнес-процессов

    функционально-стоимостной анализ эффективности бизнес-процессов

    сложные аналитические запросы в разрезах: виды услуг, клиенты, регионы, технологии

    анализ данных в динамике и в сравнении с показателями отрасли

    • Рисунок 1 - Свойства хранилищ данных [3].
    • Предметная ориентация. Для системы поддержки принятия решений требуются «исторические» данные, к примеру - факты продаж за определенные интервалы времени. Хорошо спроектированные структуры данных информационного хранилища отражают развитие всех направлений бизнеса компании во времени [1].
    • Интегрированность данных. Данные в информационное хранилище поступают из различных источников, где они могут иметь различные имена, атрибуты, единицы измерения и способы кодировки. После загрузки в DW (Информационную систему) данные очищаются от индивидуальных признаков, приводятся к общему виду. С этого момента они представляются пользователю в виде единого информационного пространства [6].
    • Инвариантность во времени. В OLTP- истинность данных гарантирована только в момент чтения, поскольку уже в следующее мгновение они могут измениться в результате очередной транзакции. Важным отличием информационных хранилищ от OLTP-систем является то, что данные в них сохраняют свою истинность в любой момент процесса чтения [8].
    • Стабильность информации. В OLTP-системах записи могут регулярно добавляться, удаляться и редактироваться. В DW-системах, как следует из требования временной инвариантности, однажды загруженные данные теоретически никогда не меняются. По отношению к ним возможны только две операции: начальная загрузка и чтение (доступ). Это и определяет специфику проектирования структуры базы данных для информационных хранилищ. Если при создании OLTP-систем разработчики должны учитывать такие моменты, как откаты транзакций после сбоя сервера, борьба с взаимными блокировками процессов (deadlocks), сохранение целостности данных, то для DW данные проблемы не столь актуальны - перед разработчиками стоят другие задачи, связанные, например, с обеспечением высокой скорости доступа к данным.
    • Минимизация избыточности информации. Поскольку информация в информационное хранилище загружается из OLTP-систем, может возникнуть проблема чрезмерной избыточности данных. Основными средствами минимизации информации являются каталогизация и классификация [8].
    • Сравним систему OLTP и хранилище данных:
    • Рисунок 2 - Сравнение систем OLTP и хранилищ данных.
    • На основании вышеизложенного можно выделить основную цель информационного хранилища, она будет заключаться в создании всех значимых для управления данных в стандартизированной форме, которая будет являться пригодной для анализа и создания необходимых отчетов в конкретной организации.
    • 1.2 Компоненты информационного хранилищ
    • Источником данных для информационного хранилища служит рабочая база данных. Следовательно, в информационном хранилище должны быть средства для извлечения и хранения данных.
    • Термином «компонент» как правило, обозначают составляющую часть чего-либо. В данном случае выделим основные компоненты Информационных хранилищ:
    • ѕ ПО промежуточного слоя. Обеспечивает сетевой доступ и доступ к БД. Сюда можно отнести сетевые и коммуникационные протоколы, драйверы, системы обмена сообщениями и др.
    • ѕ Транзакционные БД и внешние источники информации. Базы данных исторически предназначались для эффективной обработки структур данных в относительно небольшом числе четко определенных транзакций.
    • ѕ Уровень доступа к данным. Относящееся сюда ПО может обеспечивает общение конкретных пользователей с информационным хранилищем и загрузку требуемых данных из транзакционных систем.
    • ѕ Загрузка и предварительная обработка. Этот уровень включает в себя набор средств для загрузки данных из БД и внешних источников. Данная функция выполняется в сочетании с дополнительной обработкой: проверкой данных на чистоту, консолидацией, форматированием, фильтрацией и др.
    • ѕ Информационное хранилище. Представляет собой ядро всей системы - один или несколько серверов БД.
    • ѕ Метаданные - играют роль справочника, содержащего сведения об источниках первичных данных, алгоритмах обработки, которым данные были подвергнуты, и т. д.
    • ѕ Уровень информационного доступа. Обеспечивает непосредственное общение пользователя с данным Хранилища посредством стандартных систем манипулирования, анализа и предоставления данных типа MS Excel, FoxPro и др.
    • ѕ Уровень управления (администрирования). Отслеживает выполнение процедур, необходимых для обновления информационного хранилища или поддержания его состояния [5].
    • 1.3 Современные свойства разработки и эксплуатации информационных хранилищ
    • При создании хранилища данных невозможно использовать готовое решение. Необходимо уделить серьезное внимание не только процессу проектирования самого хранилища как сложного информационно-вычислительного комплекса, но и задачам внесения изменений в действующую инфраструктуру, существующие информационно-коммуникационные системы, имеющиеся потоки данных. Отдельное внимание стоит уделить вопросам обеспечения надежности, безопасности хранилища, защитить его как от внешних угроз, так и от халатности администраторов и пользователей.
    • К современным информационным хранилищам можно отнести дата-центры. В классическом понимании дата-центр означает технологическую площадку, которая предназначена для размещения оборудования и подключения к высокоскоростным каналам связи, хранение и обработку информации [1].
    • В зависимости от назначения современные дата-центры условно можно поделить на корпоративные, которые работают в рамках конкретной организации, корпорации или ведомства, и коммерческие, предоставляющие профессиональные сервисы сторонним пользователям на коммерческих условиях.
    • Дата-центр может функционировать как отдельная организационная структура и оказывать всем структурам корпорации услуги по хранению и доступу к информации, а также предоставлять различные информационно-вычислительные сервисы. Идея дата-центра, создающегося на базе ВЦ РАН, заключается в комбинированном подходе, когда соответствующие услуги и сервисы могут предоставляться не только научным подразделениям РАН, но и всему научно-образовательному сообществу. Кроме того, каждый дата-центр имеет собственный набор услуг - уникальный в своем роде.
    • Как известно, этапы жизненного цикла включают: проектирование, разработку, реализацию, эксплуатацию, модернизацию и развитие. Нарушение свойств доверия на этапах жизненного цикла приводит к возможности нарушения свойств защищенности (доступности, конфиденциальности и целостности) информации на текущем или следующем этапе жизненного цикла доверенной системы. Таким образом, среди требований к современной информационно-вычислительной системе сегодня выделяют:
    • ѕ высокую техническую надежность и доступность ресурсов;
    • ѕ резервирование и катастрофоустойчивость;
    • ѕ удаленное надежное хранение данных;
    • ѕ расширяемость и масштабируемость с сохранением свойств доверия;
    • ѕ стабильность предоставления сервисов, изоляцию пользователей от данных;
    • ѕ аудит и подконтрольность ресурсов и вычислительного процесса в целом;
    • ѕ управляемость системы, переход к управлению безопасностью через управление пользовательскими процессами.
    • В настоящее время в области исследований информационных хранилищ значительное внимание стало уделяться поддержанию работоспособности информационно-вычислительных комплексов и обеспечению их управляемости, оптимизации информационных процессов, а также возможности осуществления технического аудита информационно-вычислительной системы. Также важным становится необходимость соответствия той целевой функции, для реализации которой она создается. В этом случае естественным является рассмотрение архитектуры системы и всего ее жизненного цикла, начиная с формулирования корректной, непротиворечивой целевой функции, заданной в терминах системного анализа целостности компонентов и связей между ними [3].
    • 2 Решение и реализация проблем разработки и эксплуатации информационных хранилищ
    • 2.1 Проблемы разработки и эксплуатации
    • Зачастую, говоря о информационных хранилищах, упоминаются лишь положительные стороны, в результате чего о них могло возникнуть впечатление как о идеальном средстве для принятия управленческих решений. На деле же реализация описанных нами возможностей является весьма сложной задачей. В этой связи существует несколько важных проблем, которые предстоит решить [3]:
    • ѕ Недооценка ресурсов, необходимых для загрузки данных;
    • ѕ Скрытые проблемы источников данных;
    • ѕ Отсутствие требуемых данных в имеющихся архивах;
    • ѕ Повышение требований конечных пользователей;
    • ѕ Унификация данных;
    • ѕ Высокие требования к ресурсам;
    • ѕ Владение данными;
    • ѕ Сложное сопровождение;
    • ѕ Долговременный характер проектов;
    • ѕ Сложности интеграции.
    • Если информационное хранилище предоставляет недостоверные данные, то ясно, что такое хранилище является бесполезным, если не вредным. Дело заключается не только в качестве данных, которые информационное хранилище извлекает из своих источников. Информация из источника данных может быть достоверной на момент извлечения, но при объединении между собой данных, не согласованных по времени или типу (домену), можно нечаянно внести ошибки.
    • Для решения этой проблемы должны создаваться метаданные, описывающие временные характеристики и домены исходных данных. Эти метаданные должны быть легко доступными для пользователей информационного хранилища, а пользователей необходимо научить уделять серьезное внимание этим вопросам [6].
    • Интеграция данных является серьезной проблемой, связанной с информационными хранилищами. Модели различных продуктов и категорий продуктов, как правило, различаются. СУБД оперируют таблицами, средства OLAP -- кубами, программы обработки электронных таблиц -- электронными таблицами, пакеты финансового планирования -- планами и т.д. В результате пользовательские интерфейсы этих продуктов оказываются непохожими. Обучение пользователей работе с нескольким продуктами, принадлежащими к различным категориям, может потребовать существенных затрат, и зачастую у самих пользователей на это нет ни времени, ни желания.
    • Проблема интеграции данных включает в себя следующие проблемы реализации информационного хранилища: (Рис.1)
    • Рисунок 3 - Проблемы реализации информационного хранилища [4].
    • Неоднородность программной среды. Информационное хранилище практически никогда не создается на пустом месте. Почти всегда конечное решение будет разнородным, т.е. в нем будут использоваться автономно разработанные программные средства. Прежде всего это касается формирования интегрированного согласованного набора данных, которые могут поступать из разнородных баз данных, электронных архивов, публичных и коммерческих электронных каталогов, справочников, статистических сборников. При построении хранилища данных приходится решать задачу построения единой, согласованно функционирующей информационной системы на основе неоднородных программных средств и решений. При выборе средств реализации хранилища данных приходится учитывать множество факторов, включающих уровень совместимости различных программных компонентов, легкость их освоения и использования, эффективность функционирования и т.д.
    • Распределенный характер организации. В концепции хранилища данных предопределено то, что операционная аналитическая обработка может выполняться в любом узле сети независимо от места расположения основного хранилища. Хотя при аналитической обработке данные только читаются, и потребность в синхронизации отсутствует, для достижения эффективности необходимо поддерживать репликацию данных в разных узлах сети.
    • Повышение требований к безопасности данных. Собранная вместе согласованная информация об истории развития корпорации, ее успехах и неудачах, о взаимоотношениях с поставщиками и заказчиками, об истории и состоянии рынка дает возможность анализа прошлой и текущей деятельности корпорации и построения прогнозов для будущего. Эта информация настолько ценна для корпорации, что нельзя допустить возможности ее утечки (на самом деле, если хранилище данных одной корпорации попадет в руки аналитиков другой корпорации, то все аналитические прогнозы первой корпорации сразу станут неверными). В системах, основанных на информационных хранилищах, оказывается недостаточной защита данных в стиле языка SQL, которую обеспечивают обычные коммерческие СУБД. Для обеспечения должного уровня защиты доступ к данным должен контролироваться не только на уровне таблиц и их столбцов, но и на уровне отдельных строк. Приходится также решать вопросы аутентификации пользователей, защиты данных при их перемещении в хранилище данных из оперативных баз данных и внешних источников, защиты данных при их передаче по сети [3].
    • Необходимость наличия многоуровневых справочников метаданных. Если роль метаданных (обычно содержащихся в таблицах-каталогах) в оперативных информационных системах достаточно ограничена, то для OLAP-систем наличие развитых метаданных и средств их предоставления конечным пользователям является одним из основных условий успешной реализации. Например, прежде, чем менеджер корпорации задаст системе свой вопрос, он должен понять, какая информация имеется, насколько она актуальна, можно ли ей доверять, сколько времени может занять формирование ответа и т.д [8].
    • Отсутствие средств управления данными информационного хранилища. Хотя есть множество продуктов и средств, предназначенных для извлечения информации из источников данных, и множество ориентированных на конечного пользователя средств анализа данных и создания запросов и отчетов, на настоящий момент наблюдается отсутствие средств управления самим информационным хранилищем. Если бы информационное хранилище состояло только из выдержек из реляционных баз данных, а проблемы различия временных характеристик и доменов могли быть разрешены путем обучения и четкого определения процедур, задача управления ресурсами информационного хранилища была бы под силу коммерческим СУБД. В большинстве случаев, однако, это не так.
    • Большая часть информационных хранилищ содержит выдержки не только из баз данных, но также из файлов, электронных таблиц, изображений и внешних источников данных. Поэтому управлять ресурсами информационного хранилища средствами одной только коммерческой СУБД невозможно, и организации, создающие информационное хранилище, вынуждены разрабатывать собственное программное обеспечение. Обычно ядром такого программного обеспечения является СУБД, а штатный персонал информационного хранилища осуществляет реализацию дополнительных возможностей и функций, необходимых для управления ресурсами хранилища [2].
    • Другая, сходная проблема касается управления метаданными. Лишь в немногих СУБД возможности словарей данных отвечают потребностям информационного хранилища в сфере управления метаданными. Как уже говорилось, пользователям необходимо знать не только то, что содержится в информационном хранилище, но и происхождение данных, их временные характеристики, домены, предположения, сделанные при извлечении данных, и т. д. Персоналу информационного хранилища необходимо разрабатывать собственное программное обеспечение управления метаданными, дополняющее возможности СУБД и других средств управления словарями данных.
    • Разработка программного обеспечения управления данными является сложным и дорогостоящим делом. Созданное программное обеспечение должно поддерживаться. Производители программ извлечения и анализа данных постоянно совершенствуют свои продукты, и для поддержки новых интерфейсов придется вносить изменения в собственное программное обеспечение. Более того, будут меняться и требования пользователей, что приведет к необходимости создания новых программ, которые нужно будет затем интегрировать в программное обеспечение управления информационным хранилищем [2].
    • 2.2 Подходы к решению проблем разработки и эксплуатации информационных хранилищ
    • Компания IBM. Решение компании называется A Data Warehouse Plus. Целью компании является обеспечение интегрированного набора программных продуктов и сервисов, основанных на единой архитектуре. Основой информационных хранилищ является семейство СУБД DB2. Преимуществом IBM является то, что данные, которые нужно извлечь из оперативной базы данных и поместить в хранилище данных, находятся в системах IBM. Поэтому естественная тесная интеграция программных продуктов [4].а
    • Предлагаются три решения для информационных хранилищ:
    • Изолированная витрина данных. Предназначена для решения отдельных задач вне связи с общим хранилищем корпорации.
    • Зависимая витрина данных. Аналогична изолированной витрине данных, но источники данных находятся под централизованным контролем.
    • Глобальное хранилище данных. Корпоративное хранилище данных, которое полностью централизовано контролируется и управляется. Глобальное хранилище данных может храниться централизовано или состоять из нескольких распределенных в сети рынков данных.
    • Oracle. Решение компании в области информационных хранилищ основывается на двух факторах:
    • – широкий ассортимент продуктов самой компании;
    • – деятельность партнеров в рамках программы Warehouse Technology Initiative.
    • Возможности Oracle в области хранилищ данных базируются на следующих составляющих:
    • – наличие реляционной СУБД Oracle 11, которая постоянно совершенствуется для лучшего удовлетворения потребностей хранилищ данных;
    • – существование набора готовых приложений, обеспечивающих возможности разработки хранилища данных;
    • – высокий технологический потенциал компании в области анализа данных;
    • – доступность ряда продуктов, производимых другими компаниями.
    • Hewlett Packard. Все работы выполняются на базе программы OpenWarehouse. Функционирование этой программы может реализовать работу информационных хранилищ на основе компьютером HP, именно в этих компьютерах основой является Unix-платформы и программный продукт Intelligent Warehouse, являющийся аппаратом для управления информационными хранилищами. Основа построения хранилищ данных, предлагаемая HP, оставляет свободу выбора реляционной СУБД, средств реинжиниринга и т.д.
    • NCR. Работа компании устремлена на разрешение проблем корпораций, которые затрудняются как в сфере работы с поддержкой принятия решений, так и в системе аналитической обработки данных предприятия и быстрым доступом к информации. Предлагаемая архитектура называется Enterprise Information Factory и основывается на опыте использования системы управления базами данных Teradata и связанных с ней методах параллельной обработки.
    • Informix Software. Основная цель компании - расширение рынка для собственного продукта под названием On-Line Dinamic Parallel Server.
    • Данная архитектура информационного хранилища основана на 4 технологиях, а именно:
    • ѕ реляционные базы данных,
    • ѕ программном обеспечении для управления хранилищем данных, средствах доступа к данным
    • ѕ платформа открытых систем.
    • Три последних компонента разрабатываются партнерами компании. После выхода Универсального Сервера, основанного на объектно-реляционном подходе, можно ожидать, что и он будет использоваться для построения хранилищ данных.
    • SAS Institute. Данная компания уверенно считает что нашла идеальное решение для информационных хранилищ. Подход основан на следующем:
    • Реализация доступа к данным и возможность извлечения их из всевозможных ИХ ( реляционных, и нереляционных);
    • – преобразование данных и манипулирование ими с использованием 4GL;
    • – наличие сервера многомерных баз данных;
    • – большой набор методов и средств для аналитической обработки и статистического анализа.
    • Sybase. Стратегия компании в области хранилищ данных основывается на разработанной ей архитектуре Warehouse WORKS. В основе подхода находится реляционная СУБД Sybase System 11, средство для подключения и доступа к базам данных OmniCONNECT и средство разработки приложений PowerBuilder. Компания продолжает совершенствовать свою СУБД для лучшего удовлетворения потребностей хранилищ данных (например, введена побитная индексация).
    • Software AG. Деятельность компании в области хранилищ данных происходит в рамках программы Open Data Warehouse Initiative. Программа базируется на основных продуктах компании ADABAS и Natural 4GL, собственных и приобретенных средствах извлечения и анализа данных, средстве управления хранилищем данных SourcePoint. SourcePoint позволяет автоматизировать процесс извлечения и пересылки данных, а также их загрузки в хранилище данных.
    • На сегодняшний день эти компании представили наиболее реализуемые и доступные решения существующих проблем и улучшение имеющейся структуры информационных хранилищ.
    • 2.3 Использование информационных хранилищ
    • Рассмотрим варианты реализации информационных хранилищ:
    • Виртуальное хранилище данных. В его основе - хранилище метаданных, которые описывают источники информации (БД транзакционных систем, внешние файлы и др.), SQL-запросы для их считывания и процедуры обработки и предоставления информации. Непосредственный доступ к последним обеспечивает ПО промежуточного слоя. В этом случае избыточность данных нулевая. Конечные пользователи фактически работают с транзакционными системами напрямую со всеми вытекающими отсюда плюсами (доступ к "живым" данным в реальном времени) и минусами (интенсивный сетевой трафик, снижение производительности OLTP-систем и реальная угроза их работоспособности вследствие неудачных действий пользователей-аналитиков).
    • Витрина данных (Data Mart) по своему исходному определению - это набор тематически связанных баз данных, которые содержат информацию, относящуюся к отдельным аспектам деятельности корпорации. По сути дела, витрина данных - это облегченный вариант хранилища данных, содержащий только тематически объединенные данные. Целевая база данных максимально приближена к конечному пользователю и может содержать тематически ориентированные агрегатные данные. Витрина данных, естественно, существенно меньше по объему, чем корпоративное хранилище данных, и для его реализации не требуется особо мощная вычислительная техника.
    • Глобальное хранилище данных. В последнее время все более популярной становится идея совместить концепции хранилища и витрины данных в одной реализации и использовать хранилище данных в качестве единственного источника интегрированных данных для всех витрин данных. Тогда естественной становится такая трехуровневая архитектура системы [6] (Рис. 4):
    • Рисунок 4ё - Трехуровневая архитектура системы информационного хранилища
    • На первом уровне реализуется корпоративное хранилище данных на основе одной из развитых современных реляционных СУБД. Это хранилище интегрированных в основном детализированных данных. Реляционные СУБД обеспечивают эффективное хранение и управление данными очень большого объема, но не слишком хорошо соответствуют потребностям OLAP-систем, в частности, в связи с требованием многомерного представления данных.
    • На втором уровне поддерживаются витрины данных на основе многомерной системы управления базами данных). Такие СУБД почти идеально подходят для целей разработки OLAP-систем, но пока не позволяют хранить сверхбольшие объемы данных (предельный размер многомерной базы данных составляет 10-40 Гбайт). В данном случае это и не требуется, поскольку речь идет о витринах данных. Заметим, что витрина данных не обязательно должна быть полностью сформирована. Она может содержать ссылки на хранилище данных и добирать оттуда информацию по мере поступления запросов. Конечно, это несколько увеличивает время отклика, но зато снимает проблему ограниченного объема многомерной базы данных.
    • Наконец, на третьем уровне находятся клиентские рабочие места конечных пользователей, на которых устанавливаются средства оперативного анализа данных.

    Подводя итог, можно сделать вывод что, информационные хранилища на данный момент времени являются незаменимой структурой, как и любая система имеют свои плюсы и минусы, но все идет к тому, что течением времени IT технологии позволят сделать эту систему если не идеальной, то близкой к этому. Ведь в наше время информация, ее использование и хранение является наиболее важной темой, и этому уделяется рчень много внимания.

    ЗАКЛЮЧЕНИЕ

    Проведенный анализ в области изучения разработки и эксплуатации информационных хранилищ позволяет сделать следующие выводы:

    ѕ Применение информационного хранилища в какой-либо организационной структуре значительно облегчает задачу поиска и получения нужной информации.

    ѕ В настоящее время, все больше внимания уделяется доступности информационных хранилищ не только для крупных предприятий, но и я для единичных пользователей.

    ѕ В структуре информационных хранилищ существует несколько важных проблем, а именно: безопасность данных, большие затраты на ПО, управление огромными потоками информации.

    ѕ Основным преимуществом информационных хранилищ можно считать значительное упрощение работы с различными данными, а также с принятием управленческих решений в различных отраслях бизнеса.

    Информационные потоки увеличиваются с каждым днем, и наша жизнь уже не представляется возможной без информационных хранилищ, важным аспектом является приведение информационных хранилищ к доступному виду не только для крупных организаций, но и для различных мелких предприятий, а также единичных пользователей.

    В процессе написания данной курсовой работы был произведен обзор информации в учебниках, а также интернет-источниках.

    В ходе работы был произведен обзор информации из учебников и интернет-источников об информационных хранилищах. Также были рассмотрены основные вопросы по теоретической части темы.

    Цели курсовой работы достигнуты. Все поставленные задачи решены

    Все внимание сейчас стоит уделить имеющимся недочетам в системе информационных хранилищ, и сделать ее максимально доступной, но в тоже время безопасной. Только так можно обеспечить стабильный рост и развитие данной сферы.

    СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

    информационный хранилище программный

    1 Блюттман К. Анализ данных в Access. Сборник рецептов. 1-е издание / К. Блюттман , У. Фриз . - М.: , 2013. 352с.

    2 Диго С.М. Базы данных: проектирование и использование: учебник. Рекомендовано Министерством образования и науки Российской Федерации в качестве учебника для студентов высших учебных заведений, обучающихся по специальности "Прикладная информатика (по областям)" / С.М. Диго. - М.: Мир, 2011. 592 c.

    3 Фуфаев Э.В. Разработка и эксплуатация удаленных баз данных: учебник для студ. сред. проф. образования / Э. В. Фуфаев, Д. Э. Фуфаев. - М.: Издательский центр «Академия», 2012. 256с.

    4 Введение в OLAP: часть 2. Хранилища данных [Электронный ресурс] / OLAP.ru. URL: http://www.olap.ru/basic/olap_intro2.asp (дата обращения 5.05.2015).

    5 Обзор возможностей применения ведущих СУБД для построения хранилищ данных [Электронный ресурс] / ЦИТФорум. URL: http://citforum.ru/database/kbd98/glava15.shtml (дата обращения 6.05.2015)

    6 Реализации хранилищ данных [Электронный ресурс] / StatSoft Russia. URL: http://www.spc-consulting.ru/solution/database3.htm (дата обращения: 6.05.2015).

    7 Сбор и хранение данных [Электронный ресурс] / StatSoft Russia. URL: http://www.spc-consulting.ru/solution/database.htm (дата обращения: 6.05.2015).

    8 Хранилище данных [Электронный ресурс] / ВикипедиЯ. URL: http://ru.wikipedia.org/wiki/Хранилище_данных (дата обращения 6.05.2015).

    Размещено на Allbest.ru

    ...

Подобные документы

  • Понятие и функциональное назначение информационного хранилища, свойства и компоненты. Проблемы интеграции данных, принципы организации хранилищ. Проектирование и анализ реляционной базы данных "Салона красоты" методом нормальных форм и "сущность-связь".

    курсовая работа [573,5 K], добавлен 21.02.2015

  • Концепции хранилищ данных для анализа и их составляющие: интеграции и согласования данных из различных источников, разделения наборов данных для систем обработки транзакций и поддержки принятия решений. Архитектура баз для хранилищ и витрины данных.

    реферат [1,3 M], добавлен 25.03.2013

  • Формы представляемой информации. Основные типы используемой модели данных. Уровни информационных процессов. Поиск информации и поиск данных. Сетевое хранилище данных. Проблемы разработки и сопровождения хранилищ данных. Технологии обработки данных.

    лекция [15,5 K], добавлен 19.08.2013

  • Определение многомерной модели данных для удовлетворения основных информационных потребностей предприятия. Экстракция, загрузка и перенос данных из различных источников данных. Разработка собственных ETL–систем. Оптимизация работы хранилища данных.

    презентация [9,1 M], добавлен 25.09.2013

  • Понимание хранилища данных, его ключевые особенности. Основные типы хранилищ данных. Главные неудобства размерного подхода. Обработка информации, аналитическая обработка и добыча данных. Интерактивная аналитическая обработка данных в реальном времени.

    реферат [849,7 K], добавлен 16.12.2016

  • Принципы построения и основные компоненты хранилищ данных, общая характеристика основных требований к ним по Р. Кинболлу. Понятие и виды баз данных. Методика проектирования комплекса задач автоматизации учета по счету 02 "Амортизация основных средств".

    контрольная работа [27,8 K], добавлен 12.11.2010

  • Методы построения хранилища данных на основе информационной системы реального коммерческого предприятия. Основные аналитические задачи, для решения которых планируется внедрение хранилищ данных. Загрузка процессоров на серверах. Схемы хранения данных.

    контрольная работа [401,0 K], добавлен 31.05.2013

  • Назначение хранилищ данных. Архитектура SAP BW. Построение аналитической отчетности на основе OLAP-кубов в системе SAP BW. Основные различия между хранилищем данных и системой OLTP. Обзор функциональных сфер BEx. Создание запроса в BEx Query Designer.

    курсовая работа [1019,1 K], добавлен 24.12.2012

  • Хранилище данных, принципы организации. Процессы работы с данными. OLAP-структура, технические аспекты многомерного хранения данных. Integration Services, заполнение хранилищ и витрин данных. Возможности систем с использованием технологий Microsoft.

    курсовая работа [1,0 M], добавлен 05.12.2012

  • Определение базы данных и банков данных. Компоненты банка данных. Основные требования к технологии интегрированного хранения и обработки данных. Система управления и модели организации доступа к базам данных. Разработка приложений и администрирование.

    презентация [17,1 K], добавлен 19.08.2013

  • Понятие и структура банка данных. Основные структурные элементы базы данных. Система управления базами данных. Преимущества централизации управления данными. Понятие информационного объекта. Современные технологии, используемые в работе с данными.

    курсовая работа [1,8 M], добавлен 02.07.2011

  • Разработка программного обеспечения для анализа полученных из хранилища данных. Система SAS Enterprise Miner и система Weka. Расчёт капитальных затрат на создание ПМК для анализа полученных из хранилища данных с использованием библиотеки XELOPES.

    дипломная работа [1,4 M], добавлен 07.06.2012

  • Общее понятие и признаки классификации информационных систем. Типы архитектур построения информационных систем. Основные компоненты и свойства базы данных. Основные отличия файловых систем и систем баз данных. Архитектура клиент-сервер и ее пользователи.

    презентация [203,1 K], добавлен 22.01.2016

  • Изучение общих понятий теории систем и системного анализа. Методика построения объектных репозиториев открытых информационных систем. Принципы восприятия визуальной информации. Средства визуального моделирования рабочих процессов по интеграции данных.

    курсовая работа [195,1 K], добавлен 04.06.2015

  • Организация, состав, структура внутримашинного информационного обеспечения. Сети хранилищ данных и базы знаний – перспектива развития ИО в управлении организации. Системы автоматизации коллективной работы над документами. Назначение экспертных систем.

    контрольная работа [28,8 K], добавлен 24.05.2012

  • Типичные "единичные" объемы данных. Проект Sun и InternetArchive в одном контейнере. Ограничения вычислительных систем, веб-приложений. Поиск закономерностей в данных. Модель предсказания вектора покупательской активности. Проектирования хранилищ данных.

    презентация [533,8 K], добавлен 18.01.2014

  • Анализ информационных задач и круга пользователей системы. Разработка базы данных в Microsoft SQL Server 2008, сановные требования к ней, внутренняя структура и взаимосвязь отдельных компонентов. Формирование интегрированного информационного приложения.

    курсовая работа [623,5 K], добавлен 24.03.2015

  • Сущность разработки и построения хранилища данных в цепочке локальных сетей. Его типичная структура. Особенности организации хранения информации. Алгоритм действия системы ROLAP и его сравнение с алгоритмом многомерных систем управления базами данных.

    курсовая работа [743,1 K], добавлен 23.01.2015

  • Обзор программных средств для создания информационных систем. Анализ деятельности предприятия и задач, подлежащих автоматизации. Проектирование содержания и структуры веб-сайта, его программная реализация. Обеспечение безопасности при передаче данных.

    дипломная работа [3,1 M], добавлен 21.01.2012

  • Анализ деятельности маркетингового агентства. Типы программного обеспечения, которые используются при реализации хранилищ данных. Концептуальная модель – описание предметной области, для которой создается хранилище, ее сущностей и связей между ними.

    дипломная работа [1,6 M], добавлен 10.09.2017

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.