Модели данных
Современные информационные системы, основанные на концепции интеграции данных. Развитие средств мультимедиа, вычислительных сетей и передачи по ним аудио– и видеообъектов. Структура данных, ограничения целостности и операции манипулирования данными.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 19.08.2013 |
Размер файла | 25,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ТЕМА: «МОДЕЛИ ДАННЫХ»
Вариант №2
Современные информационные системы (ИС), основанные на концепции интеграции данных, характеризуются огромными объёмами хранимых данных. Совокупность взаимосвязанных данных, которые характеризуются возможностью использования для большого количества приложений, возможностью быстрого получения и модификации необходимой информации - это и есть база данных. Возможность применения баз данных для многих прикладных программ пользователя упрощает реализацию комплексных запросов, снижает избыточность хранимых данных и повышает эффективность использования информационной технологии. Минимальная избыточность и возможность быстрой модификации позволяет поддерживать данные на одинаковом уровне актуальности.
Основой любой базы данных являются модели данных. Модели баз данных базируются на современном подходе к обработке информации, состоящей в том, что структуры данных обладают относительной устойчивостью. Действительно, темпы объектов предприятия, для управления которым создаётся информационная технология, если и изменяются во времени, то достаточно редко, а это приводит к тому, что и структура данных для этих объектов достаточно стабильна. Поэтому возможно построение информационной базы с постоянной структурой и изменяемыми значениями данных. Каноническая структура информационной базы, отображающая в структурированном виде информационную модель предметной области, позволяет сформулировать логические записи, их элементы и взаимосвязи между ними. Взаимосвязи могут быть типизированы по следующим основным видам:
· «один к одному», когда одна запись может быть связана только с одной записью;
· «один ко многим», когда одна запись взаимодействует со многими другими;
· «многие ко многим», когда одна и та же запись может входить в отношения со многими другими записями в различных вариантах.
Рассмотрим такую простую задачу: необходимо разработать логическую структуру БД для хранения данных о трёх поставщиках: П1, П2, П3, которые могут поставлять товары: Т1, Т2, Т3 в следующих комбинациях: поставщик П1 - все три вида товаров, поставщик П2 - товары Т1, Т3, поставщик П3 - товары Т2 и Т3. Построим логическую модель БД, основанную на иерархическом подходе. Иерархическая структура представляет совокупность элементов, связанных между собой по определённым правилам. Объекты, связанные иерархическими отношениями, образуют ориентированный граф (перевёрнутое дерево). К основным понятиям иерархической структуры относятся: уровень, элемент (узел), связь. Узел - это совокупность атрибутов данных, описывающих некоторый объект. Каждый узел на более низком уровне связан только с одним узлом, находящимся на более высоком уровне. Иерархическое дерево имеет только одну вершину (корень дерева), не подчинённую никакой другой вершине и находящуюся на самом верхнем (первом) уровне. Зависимые (подчинённые) узлы находятся на втором, третьем и т. д. уровнях. Количество деревьев в базе данных определяется числом корневых записей. К каждой записи базы данных существует только один (иерархический) путь от корневой записи.
Итак, основываясь на этом, построим логическую модель БД, основанную на иерархической модели. На верхнем, первом уровне, находится информация об объекте «поставщики» (П), на втором - о конкретных поставщиках П1, П2, П3, на нижнем, третьем, уровне - о товарах, которые могут поставлять конкретные поставщики.
П
П1 П2 П3
Т1 Т2 Т3 Т1 Т3 Т2 Т3
В иерархической модели должно соблюдаться правило: каждый порождённый узел не может иметь больше одного порождённого узла (только одна входящая стрелка); в структуре может быть только один непорождённый узел (без входящей стрелки) - корень. Узлы, не имеющие входных стрелок, носят название листьев. Узел интегрируется как запись. Для поиска необходимой записи нужно двигаться от корня к листьям, т.е. сверху вниз, что значительно упрощает доступ.
Достоинство иерархической модели данных состоит в том, что она позволяет описать их структуру, как на логическом, так и на физическом уровне. Недостатками данной модели является жёсткая фиксированность взаимосвязей между элементами данных, вследствие чего любые изменения
связей требуют изменения структуры, а также жёсткая зависимость физической и логической организации данных. Быстрота доступа в иерархической модели достигнута за счёт потери информационной гибкости
( за один проход по дереву невозможно, например, получить информацию о том, какие поставщики поставляют, скажем, товар Т1). Указанные недостатки ограничивают применение иерархической модели. В иерархической модели используется вид связи между элементами данных « один ко многим».
Если применяется взаимосвязь « многие ко многим», то приходят сетевые модели данных. В сетевой модели при тех же основных понятиях (уровень, узел, связь) каждый элемент может быть связан с любым другим элементом. На следующем рисунке изображена сетевая модель базы данных в виде диаграммы связей:
П1 П2 П3
Т1 Т2 Т3
В диаграмме указаны независимые (основные) типы данных П1, П2, П3, т.е. информация о поставщиках, и зависимые - информация о товарах Т1, Т2, Т3. В сетевой модели допустимы любые связи между записями и отсутствует ограничение на число обратных связей. Но должно соблюдаться
одно правило: связь включает основную и зависимую записи.
Сетевая модель данных даёт наглядную картину реальной действительности и претендует на то, что может быть естественным образом отражена в долговременной памяти ИС. Ещё пример сетевой модели:
Деталь Материал
Шифр Наименование Масса Шифр Наименование ГОСТ
детали детали материала материала
Операция Норма на деталь
Номер Характеристика Норма Единицы
операции операции измерения
Каждый узел сети соответствует элементу данных, отображающему группу однородных объектов реального мира. Тогда в реальной сети или, как говорят, экземпляре сети в каждом узле будет находиться индентификатор соответствующего объекта, например, шифр детали. На самом деле представлять и рисовать сеть на таком уровне детализации достаточно трудно. Поэтому в вершинах сети обычно стоят целые записи, состоящие из совокупности индентификаторов. Например, в вершине сети, имеющей имя деталь фактически стоит запись (сегмент), состоящий из полей цифр детали, наименование детали и масса детали.
Достоинство сетевой модели БД - большая информационная гибкость посравнению с иерархической моделью. Однако сохраняется общий для обеих моделей недостаток - достаточно жёсткая структура, что препятствует развитию информационной базы системы управления.
При необходимости частой реорганизации информационной базы (например, при использовании настраиваемых базовых информационных технологий) применяют наиболее совершенную модель БД - реляционную, в которой отсутствуют различия между объектами и взаимосвязями.
Учитывая широкое применение реляционных моделей баз данных в информационных технологиях (особенно экономических), дадим более подробное описание этой модели.
Понятие реляционный (с английского - отношение) связано с разработками известного американского специалиста в области систем баз данных Э.Кодда. Основы реляционной модели базы данных были опубликованы Э.Коддом в 1970 году. Эти идеи оказали широкое влияние на технологию баз данных во всех её аспектах, а также и на другие области информационных технологий (например, искусственный интеллект и обработку текстов на естественных языках). При работе с реляционными моделями используется как математическая терминология, так и терминология, исторически принятая в сфере обработки данных. Для того, чтобы не возникло разночтений, следует привести основные формальные термины и соответствующие им неформальные эквиваленты:
Формальный реляционный термин |
Неформальный эквивалент |
|
Отношение |
Таблица |
|
Кортеж |
Запись, строка |
|
Атрибут |
Поле, столбец |
Реляционная модель характеризуется простотой структуры данных, удобным для пользователя табличным представлением и возможностью использования формального аппарата алгебры отношений и реляционного исчисления для обработки данных. Каждая реляционная таблица обладает следующими свойствами:
· каждый элемент таблицы - один элемент данных;
· все столбцы в таблице однородные, т. е. все элементы в столбце имеют одинаковый тип (числовой, символьный и т. д.) и длину;
· каждый столбец имеет уникальное имя;
· одинаковые строки в таблице отсутствуют;
· порядок следования строк и столбцов может быть произвольным.
Для приведённой выше задачи о поставщиках и товарах логическая структура реляционной БД будет содержать три таблицы (отношения): R1, R2, R3, состоящие соответственно из записей о поставщиках, о товарах и о поставках товаров поставщиками:
П1 |
|
П2 |
|
П3 |
|
Т1 |
|
Т2 |
|
Т3 |
R3 (поставка товаров)
П1 |
Т1 |
|
П1 |
Т2 |
|
П1 |
Т3 |
|
П2 |
Т1 |
|
П2 |
Т3 |
|
П3 |
Т2 |
|
П3 |
Т3 |
Если детализировать записи приведённого примера, то получим структуру БД, изображённую на следующем рисунке:
R1 (поставщики)
Номер поставщика |
Фамилия |
Рейтинг |
Город |
|
П1 |
Иванов |
20 |
Москва |
|
П2 |
Петров |
10 |
Курск |
|
П3 |
Сидоров |
30 |
Краснодар |
R2 (товары)
Номер товара |
Название |
Масса |
Цвет |
|
Т1 |
Гайка |
12 |
Красный |
|
Т2 |
Болт |
17 |
Зелёный |
|
Т3 |
Шайба |
5 |
Голубой |
R2 (поставка товара)
Номер поставщика |
Номер детали |
Количество |
|
П1 |
Т1 |
300 |
|
П1 |
Т2 |
200 |
|
П1 |
Т3 |
400 |
|
П2 |
Т1 |
300 |
|
П2 |
Т3 |
400 |
|
П3 |
Т2 |
200 |
|
П3 |
Т3 |
300 |
Таблица R1 представляет поставщиков. Каждый поставщик имеет номер, уникальный для этого поставщика, фамилию (естественно, неуникальную), значение рейтинга и местонахождение (город).
Таблица R2 описывает виды товаров. Каждый товар имеет уникальный номер, название, вес и цвет.
В таблице R3 отражена поставка товаров. Она служит для того, чтобы связать между собой две другие таблицы. Например, первая строка этой таблицы связывает определённого поставщика из таблицы R1 (поставщика П1) с определённым товаром из таблицы R2 (с товаром Т1). Иными словами, она представляет поставку товаров вида Т1 поставщиком по фамилии П1, и объём поставки, равный 300 штук. Таким образом, для каждой поставки имеется номер поставщика, номер товара и количество товара.
Из приведённых на рисунке таблиц следует:
· все значения данных являются атомарными, т. е. в каждой таблице на пересечении строки и столбца всегда имеется в точности одно значение данных и никогда не бывает множества значений.
· Полное информационное содержание базы данных представляется в виде явных значений данных. Такой метод представления - единственный, имеющийся в распоряжении реляционной базы данных. В частности, не существует каких - либо связей и указателей, соединяющих одну таблицу с другой. Так таблица R3 отражает связь таблиц R1 и R2.
Рассмотрим подробнее реляционную структуру данных. Наименьшей единицей данных в реляционной модели является отдельное значение данных. Такие значения рассматриваются как атомарные, т. е. неразложимые, когда речь идёт о данной модели. Доменами называют множество подобных значений одного и того же типа. Например, домен номеров поставщиков - это множество допустимых номеров поставщиков, домен объёмов поставки - множество целых, больше нуля и меньше, например 10.000. Таким образом, домены представляют собой пульс значений, из которых берутся фактические значения, появляющиеся в атрибутах. Смысл доменов заключается следующем, если значения двух атрибутов берутся из одного домена, то имеют смысл их сравнения, а следовательно, и соединение, объединение и т. д. Если же значения атрибутов берутся из разных доменов, то всякие их сравнения лишены смысла. Домены по природе своей являются в большей степени понятиями концептуальными и могут храниться или не храниться в базе данных как фактическое множество знаний. Но они должны специфицироваться как часть определения базы данных, и определение каждого атрибута должно включать ссылку на соответствующий домен во избежании каких - либо двусмысленностей.
Главный элемент реляционной структуры - отношение. Когда мы изображаем отношение в виде таблицы, мы просто используем удобный способ представления отношения на бумаге. Таблица и отношение в действительности не одно и то же. Дело в том, что при изображении таблицы мы явно или не явно упорядочиваем расположение атрибутов и кортежей, хотя отношение - это математическое множество, а множество в математике не обладает каким - либо упорядочением. Число атрибутов в отношении называется степенью отношения. Число кортежей в отношении называется кардинальным числом отношения. Кардинальное число отношения изменяется во времени (кортеж может быть добавлен или удалён) в отличие от его степени.
А как манипулируют реляционными данными? Виды действий (манипуляций) над данными в реляционной модели представляют собой множество операций, получивших в совокупности название реляционной алгебры. Каждая операция реляционной алгебры использует одно или два отношения в качестве операндов и создаёт в результате некоторое новое отношение. Э.Ф. Коддом были определены 8 таких операций в каждой, объединённых в 2 группы по 4 - операции в каждой.
Первая группа - традиционные теоретико - множественные операции.
Объединением двух отношений А и В называется множество всех кортежей принадлежащих либо А, либо В, либо им обоим.
Пересечением двух отношений А и В называется множество из которых принадлежит как А, так В.
Разностью между двумя отношениями А и В называется множество всех кортежей, каждый из которых принадлежит А и не принадлежит В.
Декартовым произведением двух отношений А и В называется множество всех кортежей t таких, что t является конкатенацией (соединение в цепочки) некоторого а, принадлежащего А, и какого - либо кортежа в, принадлежащего В.
Вторая группа - специальные реляционные операции:
Селекция Проекция
А А
Соединение Деление
Операция селекция. Пусть theta представляет собой любой достижимый оператор сравнения скаляров, например =, ?, ?, ? и т. д. Theta - селекцией отношения А по атрибутам х и у называется множество всех кортежей t из А, таких, что истенен предикат t. x. theta t. y. Атрибуты х и у должны быть определены на одном и том же домене, и для этого домена оператор theta должен иметь смысл. Вместо атрибута у может быть задана константа (например, выбрать из платёжной ведомости записи о сотрудниках, имеющих зарплату 10 000 рублей). Таким образом, оператор theta - селекции позволит получить «горизонтальные» подмножества заданного отношения, т.е. подмножества таких картежей заданного отношения для которых выполняется поставленное условие.
Операция проекция позволяет получить «вертикальное» подмножество заданного отношения, т.е. такое подмножество, которое получается выбором специфицированных (определённых) атрибутов с последующим исключением, если это необходимо, избыточных дубликатов кортежей, состоящих из значений выбранных атрибутов.
При операции соединения результат эквисоединения должен включать два идентичных атрибута. Если один из этих атрибутов исключается, что можно осуществить с помощью проекции, результат называется естественным соединением.
Операция деления в простейшей форме делит отношение степени два (делимое) на отношение степени один (делитель) и создаёт (продуцирует) результирующее отношение степени один (частное). Пусть делимое А имеет атрибуты х и у, а делитель В - атрибут у. Атрибуты А. у и В. у должны быть определены на одном домене. Результатом деления А на В является отношение с с единственным атрибутом х, таким, что каждое значение х этого атрибута С. х появляется как значение А. х, а пара значение (х,у)входит в А для всех значений у, входящих в В. Другими словами, кортеж включается в результирующее отношение С только в том случае, если его декартово произведение с отношением В содержит отношение А.
Из восьми рассмотренных реляционных операций 5 являются базовыми: селекция, проекция, декартово произведение, объединение и разность. Остальные 3 операции могут быть определены через базовые. Например, естественное соединение может быть выражено как проекция селекции декартова произведения. Назначение реляционной операции присваивания состоит в том, чтобы сохранить значение какого - либо алгебраического выражения.
Операции реляционной модели данных дают возможность произвольно манипулировать отношениями, позволяя обновить БД, а также выбирать подмножества хранимых данных и представлять их в нужном виде.
В последние годы всё большее признание и развитие получает объектная модель баз данных, толчок к появлению которой дали объектно - ориентированное программирование (ООП) и использование компьютера для обработки и представления практически всех форм информации, воспринимаемых человеком. ООП в отличие от структурного делает акцент не на программные структуры, а на объекты. Объектом называют почти всё, что представляет интерес для решения поставленной задачи на компьютере. При ООП создают необходимые объекты и описывают действия с ними и их реакцию на действия пользователя. Если создан и определён достаточно большой выбор объектов, то написание программы будет состоять в том, чтобы включить в неё и связать объекты, обеспечивающие выполнение необходимых функций.
Объект - достаточно крупный блок функционально взаимосвязанных данных, при извлечении которого из ОБД включаются процедуры преобразования и отображения данных по программам, входящим в состав объекта. Типы и структуры данных, из которых состоит объект, могут быть различным у разных объектов и создаваться самим программистом на основе стандартных типов данных используемого языка программирования. Создание объектов - весьма трудоёмкая программистская работа. Поэтому для облегчения труда прикладных программистов системными программистами созданы программы и развиваются системы программирования, поддерживающие ООП. В этих системах упорядочены и унифицированы многие процедуры создания объектов, разработаны шаблоны (классы) для описания методов и свойств объектов и т. д.
Объектная модель данных ещё не имеет строгой теоретической основы (как, например, реляционная), что затрудняет их создание и использование. Однако развитие средств мультимедиа, вычислительных сетей и передачи по ним аудио- и видеообъектов заставляет интенсифицировать поиски в направлениях как создания теории, так и практической реализации объектной модели данных.
Итак, модель данных является ядром любой базы данных. Модель данных представляет собой множество структур данных, ограничений целостности и операций манипулирования данными. С помощью модели данных могут быть представлены объекты предметной области и взаимосвязи между ними.
Используемая литература
информационный система данные вычислительный
1. Информатика, под редакцией профессора Н.В. Макаровой. Изд. Финансы и статистика, Москва, 1999г., стр. 561 -568.
2. В.А. Острейковский. Информатика. Изд. Высшая школа, Москва, 2000г., стр. 230 - 233.
3. Автоматизированные информационные технологии в экономике под редакцией И.Т. Трубилина. Изд. Финансы и статистика, Москва, 2000г., стр. 141 - 158.
Размещено на Allbest.ru
...Подобные документы
Анализ реляционных баз данных и способов манипулирования ими. Основные понятия баз данных, архитектура СУБД, модели данных. Модель сущность-связь, характеристика связей, классификация сущностей, структура первичных и внешних ключей, целостности данных.
курсовая работа [166,6 K], добавлен 18.07.2012Модель данных как совокупность структур данных и операций их обработки. Иерархическая, сетевая и реляционная модели данных, их основные преимущества и недостатки. Операции над данными, определенные для каждой из моделей, ограничения целостности.
реферат [128,4 K], добавлен 16.02.2012Объекты модели хранения данных базы данных ORACLE. Взаимосвязь между логическими структурами. Средства манипулирования данными языка SQL, данными языка SQL. Структура выполнения простейших запросов. Формирование критерия отбора. Сортировка данных.
презентация [120,1 K], добавлен 14.02.2014Рассмотрение особенностей структурной и целостной частей реляционной модели базы данных, их функции. Знакомство с основными этапами разработки стратегии поддержания ссылочной целостности. Общая характеристика способов манипулирования реляционными данными.
курсовая работа [565,8 K], добавлен 25.04.2013Преимущества и недостатки иерархической модели данных. Целостная часть реляционной модели данных. Базовые требования целостности сущностей и по ссылкам. Ограничения целостности сущности и по ссылкам. Аксиомы Армстронга, аномалии обновления и их виды.
контрольная работа [262,3 K], добавлен 05.02.2011Основы работ с базами данных. Некоторые сведения о типах данных. Интерфейс БД. Текстовые, сетевые, реляционные базы данных. Проектирование баз данных. Анализ предметной области и запросов к БД. Выбор языка манипулирования данными.
курсовая работа [43,4 K], добавлен 06.10.2006Функциональные зависимости и нормализация отношений. Ограничения целостности данных. Описание таблиц на языке SQL. Интерфейс пользователя и надёжность программ обработки данных. Обработка данных с помощью запросов. Работа с данными из внешних источников.
дипломная работа [1,6 M], добавлен 25.04.2015Структура и функции системы управления базами данных (СУБД). Управление хранением данных и доступом к ним. Защита и поддержка целостности данных. Надежность хранения данных во внешней памяти. Классификация СУБД по способу доступа к базе данных.
презентация [3,7 M], добавлен 05.06.2014Внутренний язык СУБД для работы с данными. Результат компиляции DDL-операторов. Описание DML-языка, содержащего набор операторов для поддержки основных операций манипулирования содержащимися в базе данными. Организация данных и управление доступом в SQL.
лекция [131,0 K], добавлен 19.08.2013Основные типичные системы управления базами данных. Способы описания взаимодействий между объектами и атрибутами. Структурная и управляющая части иерархической модели базы данных. Представление связей, операции над данными в иерархической модели.
реферат [30,5 K], добавлен 22.02.2011Назначение и классификация компьютерных сетей. Распределенная обработка данных. Классификация и структура вычислительных сетей. Характеристика процесса передачи данных. Способы передачи цифровой информации. Основные формы взаимодействия абонентских ЭВМ.
контрольная работа [36,8 K], добавлен 21.09.2011Понятие и структура банка данных. Основные структурные элементы базы данных. Система управления базами данных. Преимущества централизации управления данными. Понятие информационного объекта. Современные технологии, используемые в работе с данными.
курсовая работа [1,8 M], добавлен 02.07.2011Современные информационные системы, их цели и структура. Основные функции баз данных. Иерархические, сетевые, реляционные, централизованные и распределенные модели баз данных. Понятие системы управления БД. Файл-серверные и клиент-серверные СУБД.
контрольная работа [21,0 K], добавлен 10.02.2011Изучение функций автоматизированных банков данных. Общие принципы описания, хранения и манипулирования данными. Анализ требований к базам данных. Файл-серверная и клиент-серверная архитектура БД. Преимущества введения системы управления базами данных.
презентация [91,5 K], добавлен 13.08.2013Концепции хранилищ данных для анализа и их составляющие: интеграции и согласования данных из различных источников, разделения наборов данных для систем обработки транзакций и поддержки принятия решений. Архитектура баз для хранилищ и витрины данных.
реферат [1,3 M], добавлен 25.03.2013Понятие и классификация систем передачи данных. Характеристика беспроводных систем передачи данных. Особенности проводных систем передачи данных: оптико-волоконных и волоконно-коаксиальных систем, витой пары, проводов. Оценка производителей аппаратуры.
курсовая работа [993,0 K], добавлен 04.03.2010Периоды применения средств вычислительной техники. Переход к новому поколению электронно-вычислительных машин. Системы, основанные на знаниях. Экспертные системы и искусственный интеллект. Этапы обработки данных на ЭВМ. Иерархическая структура знания.
презентация [170,6 K], добавлен 14.08.2013Сущность и характеристика типов моделей данных: иерархическая, сетевая и реляционная. Базовые понятия реляционной модели данных. Атрибуты, схема отношения базы данных. Условия целостности данных. Связи между таблицами. Общие представления о модели данных.
курсовая работа [36,1 K], добавлен 29.01.2011Определение базы данных и банков данных. Компоненты банка данных. Основные требования к технологии интегрированного хранения и обработки данных. Система управления и модели организации доступа к базам данных. Разработка приложений и администрирование.
презентация [17,1 K], добавлен 19.08.2013Рассмотрение совокупности программ и языковых средств (специальных языков описания и манипулирования данными), предназначенных для создания, ведения и использования баз данных. Определение языков общения. Исследование принципов построения банка данных.
реферат [56,9 K], добавлен 07.08.2017