Объектная модель темпорально многомерных данных и ее реализация средствами реляционной системы управления базами данных

Основная характеристика иерархических измерений в многомерной модели. Изучение формулы трансформации одного измерения. Проведение исследования структуры базы данных. Особенность преобразования куба данных одной структурной версии в структуру другой.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 15.08.2020
Размер файла 178,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Объектная модель темпорально многомерных данных и ее реализация средствами реляционной СУБД

Спандерашвили Д.В.

Классическая многомерная модель данных представляет собой многомерный куб с определенным количеством измерений [6][4]. Каждое измерение состоит из элементов измерений, которые определяют состав ребер куба. Ячейка в таком многомерном кубе определяется вектором, содержащим по одному элементу каждого измерения. Для удобства структурирования элементов измерений их организуют в иерархические структуры. При функционировании такой модели в элементах измерений и в самих измерениях с течением времени могут происходить изменения. Все эти изменения должны быть учтены, так как анализ может охватывать состояния системы как до, так и после модификаций. Несмотря на удаление или изменение элемента информация о его предыдущих значениях должна оставаться в системе и участвовать в анализе. Отслеживание подобных модификаций в рамках классической многомерной модели не представляется возможным, следовательно, требуется построение модели, предоставляющей возможности для отслеживания модификаций многомерных данных во времени, т.е. темпорально-многомерной модели.

Иерархические измерения в многомерной модели могут претерпевать три типа модификаций. Первый тип модификаций ? это модификации в самих измерениях: база данный куб многомерный

добавление нового измерения;

удаление измерения;

изменение параметров измерения.

Второй тип модификаций, это модификации в элементах измерений:

добавление элемента измерения;

удаление элемента измерения;

изменение параметров элемента измерения;

объединение элементов измерений;

дробление элементов измерений.

Третий тип модификаций ? это модификации в иерархических связях между элементами измерений:

добавление иерархической связи;

удаление иерархической связи.

Классическая многомерная модель данных при реализации на основе реляционной СУБД представляет собой таблицу фактов с внешними ключами к таблицам измерений. Такая структура БД не предполагает отслеживания описанных модификаций [1][5].

Необходимы следующие расширения многомерной модели:

Временное расширение: многомерные данные должны быть маркированными во времени с тем, чтобы они представляли достоверные данные в определенный момент времени. Каждый элемент модели, в котором могут произойти описанные модификации, должен иметь два временных параметра, характеризующих время начала и конца его валидности [2].

Структурные версии: если существуют временные штампы, то появляется необходимость в том, чтобы система работала с разными версиями структур - структурными версиями. При истечении времени валидности какого-либо элемента модели происходит изменение структуры многомерного куба, следовательно, возникает новая структура и, соответственно, структурная версия.

Функции трансформации: необходимо поддерживать функцию трансформирования данных из одной структурной версии в другую.

Для поддержки темпоральности в многомерной структуре данных необходимо ввести следующие понятия:

Хрон - обычно одно из измерений в модели определяет время. Мельчайший член измерения «время» является хроном [1]. Временная ось определяется через последовательность хронов. Хрон можно определить как «неделимый временной промежуток фиксированной минимальной продолжительности» [2].

Временной интервал - измерение является последовательностью членов (вершин графа) и иерархических связей между ними (ребра графа), таким образом полученный граф является деревом, представляющим иерархическую структуру измерения. Чтобы надлежащим образом передать время актуальности такой системы , каждая вершина и ребро графа должны иметь временной интервал [TS,TE], определяющий время действительности ребра или вершины. TS - является началом временного интервала, а TE его окончанием[1].

Структурные версии идентифицируются временем её валидности, в течение которого не происходят изменения в структуре измерений. Однако анализ данных зачастую охватывает период, покрывающий время валидности нескольких структурных версий. В этих случаях необходимо применять механизм трансформации данных одной структурной версии к другой. На концептуальном уровне можно представить многомерный куб каждой структурной версии и связи между элементами измерений различных структурных версий посредством матриц трансформации, в которых по горизонтали и вертикали откладываются элементы измерений между которыми необходимо установить соответствие, а на пересечении строк и столбцов выставляются коэффициенты трансформации - w.

Пусть SVi - структурная версия с N измерениями. Каждое измерение Dn состоит из набора , который представляет все элементы нулевого уровня этого измерения. Эту структурную версию можно представить как матрицу. Так, например, структурная версия одномерного куба будет представлять вектор, а 3-х мерного матрицу, элементы которой, являются векторами.

Можно определить следующую формулу трансформации одного измерения:

,

где - C`D`n - двумерная матрица, представляющая собой развертку куба данных структурной версии SV2, такую, что по горизонтали располагаются элементы измерения D`n, а по вертикали все возможные комбинации элементов остальных измерений;

- аналогичная развертка для куба данных структурной версии SV1;

- матрица трансформации элементов измерения Dn структурной версии SV1 в элементы измерения D`n структурной версии SV2.

Преобразование всего куба данных из SV1 в SV2 можно описать следующей формулой:

,

где - куб данных в структурной версии SV1;

- куб данных в структурной версии SV2;

- двумерная матрица, представляющая собой развертку куба данных структурной версии SV2, такую, что по горизонтали располагаются элементы измерения D`n, а по вертикали все возможные комбинации элементов остальных измерений;

- матрица трансформации элементов измерения D`n структурной версии SV2 в элементы измерения Dn структурной версии SV1;

Для реализации описанной темпорально-многомерной модели предлагается следующая объектная модель, изображенная на рисунке 1.

Модель представлена следующими классами:

DataWarehouse - класс хранилища данных, который представляет собой совокупность всех структурных версий модели. Данный класс реализует функцию transform, которая в качестве входных параметров принимает SV1 - структурную версию, в которой происходит рассмотрение данных, и SV2 - структурную версию, куб данных которой должен быть приведен к SV1.

StructureVersion - класс структурной версии;

TransFunc - класс функции трансформации;

Dimension - класс измерения;

Рисунок 2 - UML темпорально-многомерной модели

DimensionMember - класс конкретного элемента измерения;

Cell - класс ячейки данных, ячейка должна содержать числовое значение и координаты ячейки в кубе данных, т.е. вектор[3], содержащий по одному элементу каждого измерения. Так как в многомерной модели могут происходить модификации, ведущие к изменению размерности куба данных, то класс Cell должен поддерживать произвольную размерность координаты ячейки;

Cube - класс совокупности ячеек данных;

UDA - класс, представляющий собой произвольный параметр;

SetOfUDAs - класс набора произвольных параметров, которые могут использоваться в любом классе модели.

Для реализации темпорально-многомерной модели необходимо наличие базы данных, позволяющей реализовать все функции, описанные выше. Рассмотрим реализацию данной UML модели, транслировав ее в структуру базы данных, получаем ER диаграмму, представленную на рисунке 2.

Рисунок 3 - ERD темпорально-многомерной модели

Структура базы данных представлена следующими сущностями:

Cell - сущность представляющая куб данных, посредством совокупности ячеек;

Relcelldimm - сущность, определяющая координаты ячейки. В структуру данной сущность заложен механизм произвольного количества координат ячейки данных, что достигнуто путем отведения под координаты произвольного количества пар «идентификатор ячейки» - “идентификатор элемента измерения”;

Dimm - сущность элемента измерения;

Reldimdim - сущность принадлежности элемента измерения конкретному измерению;

Reldimdimm - сущность, отражающая иерархические связи между элементами измерения;

Dim - сущность измерения;

Reltfdim - сущность принадлежности функции трансформации двум измерениям;

Tf - сущность функции трансформации. Каждая сущность Tf задает весовой коэффициент трансформации между двумя элементами измерений, а также набор из двух измерений и двух структурных версий;

Reltfsv - сущность принадлежности функции трансформации двум структурным версиям;

Sv - сущность структурной версии.

Приведенная структура базы данных полностью поддерживает модификации в измерениях, описанные выше; это подтверждено опытным путем на построенной экспериментальной базе данных, которая реализует приведенную ERD.

В результате проведенного исследования вопросов построения темпорально-многомерной модели получена формула (1) преобразования куба данных одной структурной версии в структуру другой, построена объектная модель, представленная на рисунке 1, произведена трансляция этой модели в структуру реляционной базы данных, ER диаграмма которой представлена на рисунке 2. Также выполнена реализация модели на основе СУБД PostgeSQL. Полученные результаты могут найти применение при построении хранилищ данных компаний различного профиля деятельности.

Литература

1. Chamoni P. and Stock S. Temporal Structures in Data Warehouse//Data Warehousing and knowledge discovery. - 1999. P. 353-358

2. Jensen C.S., Dyreson C.E. Glossary of Temporal Database Concepts", Springer-Verlag A consensus,1998, pp. 367-405

A. Kurz,"Data Warehousing-Enabling Tachnology", MITP-Verlag, Bonn, 1999

B. Liu X.Wang,"A Data Model for Supporting On-Line Analytical Processing",ACM, CIKM, 1996

3. P. Vassiliadis, T.Sellis,"A Survey of Logical Models for OLAP Databases", SIGMOD records, 1999

Размещено на Allbest.ru

...

Подобные документы

  • Особенности разработки инфологической модели и создание структуры реляционной базы данных. Основы проектирования базы данных. Разработка таблиц, форм, запросов для вывода информации о соответствующей модели. Работа с базами данных и их объектами.

    курсовая работа [981,4 K], добавлен 05.11.2011

  • Базы данных с двумерными файлами и реляционные системы управления базами данных (СУБД). Создание базы данных и обработка запросов к ним с помощью СУБД. Основные типы баз данных. Базовые понятия реляционных баз данных. Фундаментальные свойства отношений.

    реферат [57,1 K], добавлен 20.12.2010

  • Базы данных и их использование в вычислительной технике. Особенности и основная конструктивная единица сетевой модели данных. Иерархическая модель, объекты предметной области. Реляционная модель, ее наглядность, представление данных в табличной форме.

    реферат [115,8 K], добавлен 19.12.2011

  • Реализация приложения "Книжный магазин" средствами систем управления базами данных. Проектирование структуры базы данных, определение сущности и атрибутов. Логическое проектирование базы данных и реализация базы данных в СУБД Microsoft Office Access.

    курсовая работа [7,8 M], добавлен 13.02.2023

  • Понятие базы данных, модели данных. Классификация баз данных. Системы управления базами данных. Этапы, подходы к проектированию базы данных. Разработка базы данных, которая позволит автоматизировать ведение документации, необходимой для деятельности ДЮСШ.

    курсовая работа [1,7 M], добавлен 04.06.2015

  • Основные типичные системы управления базами данных. Способы описания взаимодействий между объектами и атрибутами. Структурная и управляющая части иерархической модели базы данных. Представление связей, операции над данными в иерархической модели.

    реферат [30,5 K], добавлен 22.02.2011

  • Сущность и характеристика типов моделей данных: иерархическая, сетевая и реляционная. Базовые понятия реляционной модели данных. Атрибуты, схема отношения базы данных. Условия целостности данных. Связи между таблицами. Общие представления о модели данных.

    курсовая работа [36,1 K], добавлен 29.01.2011

  • Определенная логическая структура данных, которые хранятся в базе данных. Основные модели данных. Элементы реляционной модели данных. Пример использования внешних ключей. Основные требования, предъявляемые к отношениям реляционной модели данных.

    презентация [11,7 K], добавлен 14.10.2013

  • Современные системы управления базами данных (СУБД). Анализ иерархической модели данных. Реляционная модель данных. Постреляционная модель данных как расширенная реляционная модель, снимающая ограничение неделимости данных, хранящихся в записях таблиц.

    научная работа [871,7 K], добавлен 08.06.2010

  • Базы данных - важнейшая составная часть информационных систем. Проектирование базы данных на примере предметной области "Оргтехника". Сбор информации о предметной области. Построение информационно-логической модели данных. Разработка логической структуры.

    курсовая работа [318,6 K], добавлен 24.12.2014

  • Модели данных в управлении базами данных. Концептуальные модели данных. Роль баз данных в информационных системах. Реляционная модель данных. Определение предметной области. Построение модели базы данных для информационной системы "Домашние животные".

    курсовая работа [1,9 M], добавлен 19.04.2011

  • Разработка базы данных с информацией о сотрудниках, товарах, со справочником типов товаров средствами системы управления базами данных MySQL с помощью SQL-запросов. Разработка инфологической модели предметной области. Структура таблиц, полей базы данных.

    контрольная работа [648,7 K], добавлен 13.04.2012

  • Понятие базы данных, её структура. Общие принципы хранения информации. Краткая характеристика особенностей иерархической, сетевой и реляционной модели организации данных. Structured Query Language: понятие, состав. Составление таблиц в Microsoft Access.

    лекция [202,8 K], добавлен 25.06.2013

  • Освоение сервисной системы управления базами данных Microsoft SQL. Разработка базы данных "Служба АТС" в среде Microsoft SQL Server Management Studio и создание запросов на языке SQL. Апробация инфологической модели "сущность - связь" базы данных.

    курсовая работа [2,9 M], добавлен 29.06.2015

  • Алгоритмы обработки массивов данных. Система управления базами данных. Реляционная модель данных. Представление информации в виде таблицы. Система управления базами данных реляционного типа. Графический многооконный интерфейс.

    контрольная работа [2,8 M], добавлен 07.01.2007

  • Логическая организация данных, файловая модель. Сетевые, иерархические и реляционные модели данных. Системы управления базами данных, их определения и основные понятия. История, тенденции развития, классификация СУБД, свойства и технология использования.

    дипломная работа [51,3 K], добавлен 26.07.2009

  • Модели данных как формальный аппарат для описания информационных потребностей пользователей. Структура информационной базы. Типы взаимосвязей. Разработка логической структуры базы для хранения данных о пяти поставщиках. Детализация реляционной модели.

    презентация [28,9 K], добавлен 07.12.2013

  • Системы управления базами данных в медицине. Основные идеи, которые лежат в основе концепции базы данных. Требования, предъявляемые к базам данных и системе управления базами данных. Архитектура информационной системы, организованной с помощью базы данных

    реферат [122,5 K], добавлен 11.01.2010

  • Виды и функции системы управления базами данных Microsoft Access. Иерархическая, сетевая, реляционная модель описания баз данных. Основные понятия таблицы базы данных. Особенности создания объектов базы данных, основные формы. Доступ к Internet в Access.

    контрольная работа [19,8 K], добавлен 08.01.2011

  • Преимущества и недостатки роботизированной сварки. Характеристика видов систем управления базами данных. Информационная модель сварочного робота, системы управления роботом сварочных клещей. Критерии выбора робота и структура запроса на выборку.

    курсовая работа [3,3 M], добавлен 22.12.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.