Моделирование OLAP куба: загрузка данных в гиперкуб
Построение срезов гиперкуба: определение координат для записей таблицы и определение записей, имеющих конкретные координаты. Преобразование данных плоской таблицы к внутреннему представлению. Изучение основы использования и проектирования баз данных.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 16.04.2022 |
Размер файла | 437,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
МОДЕЛИРОВАНИЕ OLAP КУБА: ЗАГРУЗКА ДАННЫХ В ГИПЕРКУБ
Азарян Магдалина Андраниковна, студент магистратуры
курс, институт Цифрового развития Северо-Кавказского федерального университета
Россия, г. Ставрополь Насырова Бахтыгуль Халитовна, студент магистратуры курс, институт Цифрового развития Северо-Кавказского федерального университета
Россия, г. Ставрополь Казарян Джемма Манвеловна, старший преподаватель Северо-Восточного государственного университета
Россия, г. Магадан Таволжанова Олеся Андреевна, студент
курс, институт Цифрового развития Северо-Кавказского федерального университета Россия, г. Ставрополь
Аннотация
В статье рассматривается первый этап моделирования OLAP куба, а именно загрузка данных в гиперкуб. Подробно на примерах описываются все шаги для построения срезов гиперкуба. Также описан механизм объединения элементов разных таблиц между собой.
Ключевые слова: OLAP куб, реляционные базы данных, гиперкуб, преагрегирование данных, факты, измерения.
Annotation
The article deals with the first stage of modeling an OLAP cube, namely, loading data into a hypercube. All the steps for constructing hypercube slices are described in detail with examples. The mechanism for combining elements of different tables with each other is also described.
Key words: OLAP cube, relational databases, hypercube, data preaggregation, facts, dimensions.
При моделировании OLAP куба первым этапом работы системы будет загрузка данных и преобразование их во внутренний формат. Для OLAP системы колонки таблицы могут быть либо фактами, либо измерениями [3]. При этом логика работы с этими колонками будет разная. В гиперкубе измерения фактически являются осями, а значения измерений - координатами на этих осях. При этом куб будет заполнен сильно неравномерно - будут сочетания координат, которым не будут соответствовать никакие записи и будут сочетания, которым соответствует несколько записей в исходной таблице, причем первая ситуация встречается чаще, то есть куб будет похож на вселенную - пустое пространство, в отдельных местах которого встречаются скопления точек (фактов).
Таким образом, если мы при начальной загрузке данных произведем преагрегирование данных, то есть объединим записи, которые имеют одинаковые значения измерений, рассчитав при этом предварительные агрегированные значения фактов, то в дальнейшем нам придется работать с меньшим количеством записей, что повысит скорость работы и уменьшит требования к объему оперативной памяти [4].
Для построения срезов гиперкуба нам необходимы следующие возможности - определение координат (фактически значения измерений) для записей таблицы, а также определение записей, имеющих конкретные координаты (значения измерений) [1]. Рассмотрим каким образом можно реализовать эти возможности.
Для хранения гиперкуба проще всего использовать базу данных своего внутреннего формата. Схематически преобразования можно представить следующим образом:
Рисунок 1. Преобразование данных плоской таблицы к внутреннему представлению
То есть вместо одной таблицы мы получили нормализованную базу данных. Вообще-то нормализация снижает скорость работы системы, могут сказать специалисты по базам данных, и в этом они будут безусловно правы, в случае, когда нам надо получить значения для элементов. Но все дело в том, что нам эти значения на этапе построения среза вообще не нужны. Как уже было сказано выше, нас интересуют только координаты в нашем гиперкубе, поэтому определим координаты для значений измерений. Самым простым будет перенумеровать значения элементов. Для того, чтобы в пределах одного измерения нумерация была однозначной, предварительно отсортируем списки значений измерений в алфавитном порядке. Кроме того, перенумеруем и факты, причем факты преагрегированные. Получим следующую схему:
Рисунок 2. Проиндексированные данные измерений и фактов
Теперь осталось только связать элементы разных таблиц между собой. В теории реляционных баз данных это осуществляется при помощи специальных промежуточных таблиц [2]. Нам достаточно каждой записи в таблицах измерений поставить в соответствие список, элементами которого будут номера фактов, при формировании которых использовались эти измерения (то есть определить все факты, имеющие одинаковое значение координаты, описываемой этим измерением). Для фактов соответственно каждой записи поставим в соответствие значения координат, по которым она расположена в гиперкубе. В дальнейшем везде под координатами записи в гиперкубе будут пониматься номера соответствующих записей в таблицах значений измерений. Тогда для нашего гипотетического примера получим следующий набор, определяющий внутреннее представление гиперкуба:
Рисунок 3. Внутреннее представление гиперкуба
гиперкуб таблица координата проектирование
Такое будет у нас внутреннее представление гиперкуба. Так как мы делаем его не для реляционной базы данных, то в качестве полей связи значений измерений используются просто поля переменной длины (в РБД такое сделать мы бы не смогли, так как там количество колонок таблицы определено заранее).
Использованные источники
1. Илюшечкин В.М., Основы использования и проектирования баз данных / В.М. Илюшечкин. - Москва.: Высшее образование, 2011. - 213 с.
2. Цыганов А.А., Управление данными / А.А. Цыганов, А.В. Кузовкин, Б.А. Щукин. - Москва.: Academia (Академпресс), 2010. - 256 с.
3. Многомерная модель [Электронный ресурс]. (дата обращения 23.01.2022).
4. Словарь поOLAP [Электронный ресурс]. (дата обращения 30.11.2019) (дата обращения 15.01.2022).
Размещено на Allbest.ru
...Подобные документы
Структура таблицы и типы данных. Ввод данных в ячейки таблицы. Создание запросов на выборку, удаление, обновление и добавление записей, на создание таблицы. Основное различие между отчетами и формами, их назначение. Создание отчетов для базы данных.
курсовая работа [1,9 M], добавлен 17.06.2014Построение систем анализа данных. Построение алгоритмов проектирования OLAP-куба и создание запросов к построенной сводной таблице. OLAP-технология многомерного анализа данных. Обеспечение пользователей информацией для принятия управленческих решений.
курсовая работа [1,3 M], добавлен 19.09.2008Проектирование структуры базы данных. Конструирование структуры будущих таблиц баз данных, основные приемы их заполнения и редактирования. Простая сортировка значений таблицы. Поиск записей по образцу. Как правильно сохранить и загрузить базу данных.
практическая работа [4,4 M], добавлен 02.04.2009Создание базы данных, выполнение поиска, изменение и удаление записей, обработка, проектирование и обмен данными. Определение формул для вычисляемой части базы данных. Заполнение таблицы с помощью Мастера форм. Формы представления и анализ информации.
учебное пособие [5,0 M], добавлен 12.08.2009Создание базы данных. Поиск, изменение и удаление записей. Обработка и обмен данными. Проектирование базы данных. Определение формул для вычисляемой части базы. Редактирование полей и записей. Формы представления информации, содержащейся в базе данных.
курсовая работа [67,0 K], добавлен 23.02.2009Одномерные и многомерные массивы, их инициализация. Создание новой базы данных "Пицца". Сортировка записей по стоимости заказа. Сохранение БД во внешний файл. Загрузка данных для принятия их к учету из файла. Редактирование записей в базе данных.
контрольная работа [1,2 M], добавлен 20.09.2012Синтаксис, типы данных, используемые в базе данных MySQL. Создание и удаление базы данных, создание таблицы и удаление таблицы, изменение ее свойств. Переименование, вставка и удаление столбцов, изменение их свойств. Обновление и поиск записей в таблице.
лабораторная работа [641,7 K], добавлен 04.03.2010Построение банков данных. Инструментальные средства баз данных Borland. Принцип работы и архитектура баз данных в Delphi. Навигационный способ доступа к базам данных: операции с таблицей, сортировка и перемещение по набору данных, фильтрация записей.
курсовая работа [642,7 K], добавлен 06.02.2014Основа концепции OLAP (On-Line Analytical Processing) – оперативной аналитической обработки данных, особенности ее использования на клиенте и на сервере. Общие характеристика основных требования к OLAP-системам, а также способов хранения данных в них.
реферат [24,3 K], добавлен 12.10.2010Назначение языка SQL. Операторы манипулирования данными. Группировка записей, объединение таблиц, многотабличные и вложенные запросы. Добавление, удаление, определение и обновление данных. Типы данных языка SQL. Методики проектирования, ER-моделирование.
реферат [84,8 K], добавлен 15.12.2015Понятия банка и базы данных, ее компоненты. Многоуровневые модели предметной области, их представление в базе данных. Идентификация объектов и записей. Способы обращения к записям или отдельным элементам данных, их поиск. Определение структуры данных.
контрольная работа [39,6 K], добавлен 10.04.2010Составление таблицы согласно образцу в программе MS Excel. Создание данных таблицы базы данных. Введение формул в программе MS Excel. Установление связи между таблицами. Создание запроса на выборку данных из одной таблицы с помощью мастер запросов.
контрольная работа [4,0 M], добавлен 17.04.2016Создание базы данных и описание программы "Учебная база данных", предназначенной для группировки сведений об учениках. Характеристика функциональных возможностей программы: добавление записей в базу, редактирование, удаление записей и сортировка данных.
курсовая работа [1,2 M], добавлен 25.04.2011Средства первичной обработки данных MS Excel. Сортировка связанных областей. Виды поиска: по формату; по содержанию. Главные средства фильтрации. Использование форм в поиске записей. Целостная обработка данных таблицы на примере телефонного справочника.
курсовая работа [426,1 K], добавлен 29.11.2010Диаграммы ER-экземпляров и ER-типа. Моделирование предметной области. Условия применения сущностей. Список таблиц базы данных. Фрагменты окон MS Access. Схема данных, содержание таблиц. Пример заполнения таблицы "материально-ответственные лица".
курсовая работа [2,6 M], добавлен 22.02.2016Описание предметной области, определение функциональных требований к системе и построение диаграммы потока данных. Построение модели "сущность-связь", описание сущностей и атрибутов модели. Построение реляционной базы данных и описание ее таблицы.
курсовая работа [624,5 K], добавлен 30.05.2019Использование электронной таблицы как базы данных. Сортировка и фильтрация данных в Microsoft Excel 97. Сортировка - это упорядочение данных по возрастанию или по убыванию. При фильтрации базы отображаются только записи, обладающие нужными свойствами.
реферат [6,6 K], добавлен 17.11.2002Сущности и функциональные зависимости базы данных. Атрибуты и связи. Таблицы базы данных. Построение ER-диаграммы. Организация ввода и корректировки данных. Реляционная схема базы данных. Реализация запросов, получение отчетов. Защита базы данных.
курсовая работа [2,4 M], добавлен 06.02.2016Изучение работы баз данных - систематизированного набора записей и файлов, имеющих специальное предназначение. Характеристика СУБД, которые хранят и обрабатывают информацию на основе реляционной модели управления данными. Возможности Microsoft Access.
реферат [699,7 K], добавлен 26.03.2010Создание базы данных с помощью приложения Microsoft Access. Вспомогательные таблицы Город, Стадион, Матч, Клуб, Контакты. Связывание ключевых полей таблиц. Ввод, просмотр и редактирование записей. Технологии, реализующие объектно-ориентированный подход.
курсовая работа [366,4 K], добавлен 27.12.2014