Управление жизненным циклом информационных систем

Введение в банки данных: определение, преимущества, предпосылки широкого использования. Базовые понятия реляционного подхода к организации баз данных. Фундаментальные свойства отношений. Переносимость информационных систем и международные стандарты.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 30.11.2016
Размер файла 207,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Управление жизненным циклом информационных систем

Содержание

1. Введение в банки данных: определение, преимущества, предпосылки широкого использования. Требования к банкам данных. Компоненты банка данных и пользователи банка данных

1.1 Компоненты банка данных

1.2 Пользователи банков данных

2. Классификация баз данных

3. Этапы проектирования баз данных

4. Инфологическое моделирование. Требования, предъявляемые к инфологической модели. Построение модели "объект-свойство-отношение"

5. Даталогическое проектирование

6. Модели данных. Иерархическая и сетевая модель

7. Реляционные базы данных. Базовые понятия реляционного подхода к организации баз данных. Фундаментальные свойства отношений. Реляционная модель данных: аспекты реляционного подхода, целостность сущностей и ссылок

8. Нормализация и денормализация отношений

9. Переносимость и ннтероперабельность информационных систем и международные стандарты. Язык реляционных запросов SQL. Типы данных

10. Современные модели данных. Тенденции, направления исследования и разработок СУБД

11. Многопользовательские системы обработки информации. Средства защиты данных

1. Введение в банки данных: определение, преимущества, предпосылки широкого использования. Требования к банкам данных. Компоненты банка данных и пользователи банка данных

Современной формой организации хранения и доступа к информации является Банк данных (БнД). Банк данных -- это система специальным образом организованных данных (баз данных), программных, технических, языковых, организационно-методических средств, предназначенных для обеспечения централизованного накопления и коллективного многоцелевого использования данных".

Банк данных является сложной системой, включающей в себя все обеспечивающие подсистемы, необходимые для функционирования любой системы автоматизированной обработки данных.

В этом определении обозначены и основные отличительные особенности банков данных. Прежде всего это то, что базы данных создаются обычно не для решения какой-либо одной задачи для одного пользователя, а для многоцелевого использования.

Другой отличительной особенностью банков данных является наличие специальных языковых и программных средств, облегчающих для пользователей выполнение всех операций, связанных с организацией хранения данных, их корректировки и доступа к ним. Такая совокупность языковых и программных средств называется системой управления базой данных(СУБД).

Преимущества БнД. Особенности "банковской" организации данных определяют их основные преимущества перед "небанковской" организацией.

Наличие единого целостного отображения определенной части реального мира позволяет обеспечить непротиворечивость и целостность информации, возможность обращаться к ней не только при решении заранее предопределенных задач, но и с нерегламентированными запросами. Интегрированное хранение сокращает избыточность хранимых данных, что приводит к сокращению затрат не только на создание и хранение данных, но и на поддержание их в актуальном состоянии. Использование БнД при правильной его организации должно существенно изменить деятельность организации, где он внедряется, привести к сокращению документооборота, форм документов, перераспределению функций между сотрудниками.

Централизованное управление данными также дает целый ряд преимуществ. Освобождение от этих функций всех пользователей, кроме администраторов БД, не только приводит к сокращению трудоемкости создания системы и снижению требований к остальным участникам функционирования БнД, но и повышает качество разработок, так как вопросами организации данных занимается небольшое число профессионалов в этой области. Большинство систем управления базами данных обеспечивает высокое качество выполнения функций по управлению данными.

Банки данных обеспечивают возможность более полной реализации принципа независимости прикладных программ от данных, чем это возможно при организации локальных файлов.

Предпосылки широкого использования БнД. К числу предпосылок применения относятся следующие:

объекты реального мира находятся в сложной взаимосвязи между собой. информационное отражение должно представлять единое взаимосвязанное целое;

информационные потребности различных пользователей существенно пересекаются, что делает целесообразным использование единых баз данных и обеспечение доступа к ним разных пользователей;

функции создания и ведения информационного фонда и предоставления нужных данных являются универсальными, общими при решении разнообразных задач. Создание специализированных программных средств для управления данными приводит к повышению уровня выполнения функций и сокращению трудоемкости создания ИС;

современный уровень развития технического и программного обеспечения, а также теории и практики построения информационных систем позволяют создавать эффективные БнД.

Требования к БнД. Особенности "банковской" организации данных позволяют сформулировать основные требования, предъявляемые к БнД:

адекватность отображения предметной области (полнота, целостность и непротиворечивость данных, актуальность информации);

возможность взаимодействия пользователей разных категорий и в разных режимах, обеспечение высокой эффективности доступа для разных приложений;

дружелюбность интерфейсов и малое время на освоение системы, особенно для конечных пользователей;

обеспечение секретности и конфиденциальности для некоторой части данных; определение групп пользователей и их полномочий;

обеспечение взаимной независимости программ и данных;

обеспечение надежности функционирования БнД; защита данных от случайного и преднамеренного разрушения; возможность быстрого и полного восстановления данных в случае их разрушения.

1.1 Компоненты банка данных

Состав банка данных. Банк данных является сложной человеко-машинной системой, включающей в свой состав различные взаимосвязанные и взаимозависимые компоненты (рис.1).

Информационная компонента. Ядром БнД является база данных.

База данных -- это поименованная совокупность взаимосвязанных данных, находящихся под управлением СУБД.

Рис.1 Компоненты банка данных

Описания баз данных часто называют схемой. Кроме того, в БнД могут присутствовать описания отдельных частей баз данных с точки зрения отдельных пользователей -- подсхемы.

Кроме описания баз данных в состав метаинформации, хранимой в БнД, может включаться информация о предметной области, необходимая для проектирования системы, о пользователях БнД, о проектных решениях и некоторая другая информация.

Центральное хранилище метаинформации называется словарем данных(словарь-справочник, энциклопедия, репозиторий).

Роль словарной системы особенно возрастает при использовании средств автоматизированного проектирования информационных систем. Для большинства из них репозиторий является ядром всей системы.

К банкам данных не относятся немашинные документы, служащие источниками информации, вводимой в БД, файлы входной и выходной информации, архивные файлы, выходные документы.

Однако многие СУБД включают в свой состав языковые средства для описания этих компонентов. В этом случае сами описания, используемые в процессе функционирования БнД, будут входить в его состав.

1.2 Пользователи банков данных

Категории пользователей. С банком данных в процессе его создания и функционирования взаимодействуют пользователи разных категорий.

Основной категорией пользователей являются так называемые конечные пользователи, т.е. те пользователи, для нужд которых и создается банк данных. В зависимости от особенностей создаваемого банка данных круг его конечных пользователей может существенно различаться. Это могут быть случайные пользователи, обращающиеся к базе данных время от времени, а могут быть и регулярные пользователи. Конечные пользователи могут отличаться друг от друга и степенью владения вычислительной техникой.

От конечных пользователей не должно требоваться каких-то специальных знаний в области вычислительной техники и языковых средств.

Администраторы банка тоже являются специфическими пользователями БнД. Обычно они обращаются к БнД не за информацией о предметной области, а к метаинформации, а также используют ресурсы БнД для выполнения своих функций.

В зависимости от сложности и объема банка данных, от особенностей используемой СУБД служба администрации банка данных может различаться как по составу и квалификации специалистов, так и по количеству работающих в этой службе.

Основными функциями администраторов базы данных являются:

анализ предметной области;

проектирование структуры базы данных;

задание ограничений целостности при описании структуры базы данных и процедур обработки БД;

первоначальная загрузка и ведение базы данных;

защита данных;

обеспечение восстановления БД: разработка программно-технических средств восстановления БД, организация ведения системных журналов;

анализ обращений пользователей к базе данных: сбор статистики обращений пользователей к БД, анализ причин безуспешных обращений к БД;

анализ эффективности функционирования БнД и развитие системы;

работа с пользователями;

подготовка и поддержание системных программных средств;

Выбор или создание методики проектирования БД.

2. Классификация баз данных

Банки данных являются сложными системами, и их классификация может быть произведена по разным признакам. Одни из признаков классификации и соответственно классификационные группировки относятся к банку данных в целом, другие -- к отдельным его компонентам, третьи могут быть отнесены как к отдельному компоненту, так и к нескольким компонентам или банку в целом.

Центральной компонентой банка данных является база данных, и большинство классификационных признаков относится именно к ней.

По форме представления информации различают видео- и аудиосистемы, а также системы мультимедиа. Эта классификация в основном показывает, в каком виде информация из баз данных выдается пользователям: в виде изображения, звука или дается возможность использования разных форм отображения информации. Пока наибольшее практическое использование находят базы данных, содержащие обычные символьные данные. Эти базы даных, в свою очередь, могут быть разделены на неструктурированные, частично структурированные и структурированные. К неструктурированным БД могут быть отнесены базы, организованные в виде семантических сетей. Частично структурированными можно считать базы данных в виде обычного текста или гипертекстовые системы.

Структурированные БД, в свою очередь, по типу используемой модели делятся на иерархические, сетевые, реляционные, смешанные и мультимодельные. Наибольшее коммерческое использование в настоящее время имеют реляционные системы. Классификация по типу модели распространяется не только на базы данных, но и на СУБД и даже на банк данных в целом.

По типу хранимой информации БД делятся на документальные, фактографические и лексикографические. Среди документальных баз различают библиографические, реферативные и полнотекстовые. К лексикографическим базам данных относятся различные словари (классификаторы, многоязычные словари, словари основ слов и т.п.).

По характеру организации хранения данных и обращения к ним различают локальные (персональные), общие (интегрированные) и распределенные базы данных.

Базы данных могут классифицироваться по охвату предметной области. Причем эта классификация, в свою очередь, может производиться по разным признакам: по территориальному (всемирный, страна, город или какой-либо регион), временному (год, месяц, с начала века и т.п.), ведомственному, проблемному.

Классификация СУБД.

По языкам общения СУБД делятся на открытые, замкнутые и смешанные. Открытые системы -- это системы, в которых для обращения к базам данных используются универсальные языки программирования (используются редко). Замкнутые системы имеют собственные языки общения с пользователями БнД.

По числу уровней в архитектуре различают одноуровневые, двухуровневые, трехуровневые системы. В принципе возможно выделение и большего числа уровней. Под архитектурным уровнем СУБД понимают функциональный компонент, механизмы которого служат для поддержки некоторого уровня абстракции данных (логический и физический уровень, а также "взгляд" пользователя -- внешний уровень).

По выполняемым функциям СУБД делятся на информационные и операционные. Информационные СУБД позволяют организовать хранение информации и доступ к ней. Операционные СУБД выполняют достаточно сложную обработку, например, автоматически позволяют получать показатели, не хранящиеся непосредственно в базе данных, могут изменять алгоритмы обработки и т.д.

По сфере возможного применения различают универсальные и специализированные, обычно проблемно-ориен-тированные СУБД.

СУБД поддерживают разные типы данных. Набор типов данных, допустимых в разных СУБД, различен. В настоящее время наблюдается тенденция к расширению числа используемых типов данных. Кроме того, ряд СУБД позволяет разработчику добавлять новые типы данных и новые операции над этими данными. Такие системы называются расширяемыми системами баз данных (РСБД).

Новым направлением в развитии программного обеспечения банков данных являются генераторы системы базы данных. Они позволяют разработчику строить собственную СУБД нового типа без полного переписывания программного кода из заготовок.

Типовая организация современной СУБД. Организация типичной СУБД и состав ее компонентов соответствует рассмотренному набору функций. Логически в современной реляционной СУБД можно выделить ядро СУБД (часто его называют Data Base Engine), компилятор языка БД (обычно SQL), подсистему поддержки времени выполнения, набор утилит.

Ядро СУБД отвечает за управление данными во внешней памяти, управление буферами оперативной памяти, управление транзакциями и журнализацию. Соответственно, можно выделить такие компоненты ядра как менеджер данных, менеджер буферов, менеджер транзакций и менеджер журнала. Функции этих компонентов взаимосвязаны.

Ядро СУБД обладает собственным интерфейсом, недоступным пользователям напрямую и используемым в программах, производимых компилятором SQL (или в подсистеме поддержки выполнения таких программ) и утилитах БД. Ядро СУБД является основной резидентной частью СУБД. При использовании архитектуры "клиент-сервер" ядро является основной составляющей серверной части системы.

Основной функцией компилятора языка БД является компиляция операторов языка БД в некоторую выполняемую программу. Основной проблемой реляционных СУБД является то, что языки этих систем (а это, как правило, SQL) являются непроцедурными, т.е. в операторе такого языка специфицируется некоторое действие над БД, но эта спецификация не является процедурой, а лишь описывает в некоторой форме условия совершения желаемого действия.

В отдельные утилиты БД обычно выделяют такие процедуры, которые слишком накладно выполнять с использованием языка БД, например, загрузка и выгрузка БД, сбор статистики, глобальная проверка целостности БД и т.д. Утилиты программируются с использованием интерфейса ядра СУБД, а иногда даже с проникновением внутрь ядра.

3. Этапы проектирования баз данных

В базе данных отражается информация об определенной предметной области. Предметной областью (ПО) называется часть реального мира, представляющая интерес для данного исследования (использования). В автоматизированных информационных системах отражение предметной области представлено моделями данных нескольких уровней. Число уровней моделей будет зависеть от особенностей СУБД. Даталогическая модель базы данных (ДЛМ) является моделью логического уровня и представляет собой отображение логических связей между элементами данных безотносительно к их содержанию и среде хранения. Эта модель строится в терминах информационных единиц, допустимых в той конкретной СУБД. Этап создания ДЛМ называется даталогическим проектированием. Описание логической структуры базы данных на языке СУБД называется схемой.

Физическая модель БД. Для привязки ДЛМ к среде хранения используется модель данных физического уровня (физическая модель). Эта модель определяет используемые запоминающие устройства, способы физической организации данных в среде хранения. Модель физического уровня также строится с учетом возможностей, предоставляемых СУБД. Описание физической структуры базы данных называется схемой хранения. Соответствующий этап проектирования БД называется физическим проектированием.

СУБД обладают разными возможностями по физической организации данных, в связи с чем сложность и трудоемкость физического проектирования, набор выполняемых шагов различаются для конкретных систем. К числу работ, выполняемых на этапе физического проектирования, относятся: выбор типа носителя, способа организации данных, методов доступа, определение размеров физического блока, управление размещением данных на внешнем носителе, управление свободной памятью, определение целесообразности сжатия данных и используемых методов сжатия, оценка физической модели данных.

К физическому проектированию относятся и проблемы, связанные с буферизацией (определение числа и размеров буферов, используемых при передаче данных из внешней памяти во внутреннюю, закрепление файлов за буферами).

Внешняя модель. В некоторых СУБД, помимо описания общей логической структуры базы данных, имеется возможность описать логическую структуру БД с точки зрения конкретного пользователя. Такая модель называется внешней, а ее описание называется подсхемой. Если СУБД "поддерживает" схему, схему хранения и подсхему, то она является СУБД с трехуровневой архитектурой.

Внешняя модель не всегда является точным подмножеством схемы. Некоторые СУБД допускают различия в типах данных, определенных в схеме и подсхеме, и обеспечивают их преобразование, допускается различный логический порядок следования элементов в схеме и подсхеме, введение в подсхему виртуальных полей и т.д.

Инфологическая модель предметной области. Чтобы спроектировать структуру базы данных, необходима исходная информация о предметной области. Информация, требуемая для проектирования БД, мало зависит от особенностей СУБД. Для проектирования информационной системы с "небанковской" организацией обычно требуется та же информация.

В базе данных отображается какая-то часть реального мира. Поэтому, прежде чем начинать проектирование базы данных, необходимо как следует разобраться, как функционирует предметная область, для отображения которой создается БД.

Предметная область должна быть предварительно описана. Для этого в принципе может использоваться и естественный язык, но его применение

имеет много недостатков, основным из них являются громоздкость описания и неоднозначность его трактовки. Поэтому обычно для этих целей используют искусственные формализованные языковые средства.

Описание предметной области, выполненное с использованием специальных языковых средств, без ориентации на используемые в дальнейшем программные и технические средства, называется инфологической моделью предметной области (ИЛМ). Инфологическая модель должна строиться вне зависимости от того, будет ли в дальнейшем использоваться какая-либо СУБД или другие программные средства для реализации создаваемой информационной системы.

Инфологическая модель предметной области строится первой.

Затем на ее основе строится даталогическая модель. Физическая и внешняя модели после этого могут строиться в любой последовательности, в том числе и параллельно.

При этом возможны два вида возвратов: первый тип обусловлен необходимостью пересмотра результата проектирования, второй тип вызван необходимостью уточнения предыдущей модели (обычно инфологической) с целью получения дополнительной информации для проектирования или при выявлении противоречий в модели.

4. Инфологическое моделирование. Требования, предъявляемые к инфологической модели. Построение модели "объект-свойство-отношение"

Требования, предъявляемые к инфологической модели.

Требование адекватного отображения предметной области. В связи с этим язык для представления ИЛМ должен обладать достаточными выразительными возможностями для отображения явлений, имеющих место в предметной области. ИЛМ должна быть непротиворечивой. Не должна допускаться неоднозначная трактовка модели. ИЛМ является конечной, что обеспечивается четким ограничением предметной области. ИЛМ должна в связи с этим обладать свойством легкой расширяемости, обеспечивающим ввод новых данных (удаление)без изменения ранее определенных. Должна обеспечиваться возможность композиции и декомпозиции модели. Кроме того, она является ядром системы проектирования.

Компоненты инфологической модели.

Центральной компонентой инфологической модели является описание объектов предметной области и связей между ними (ER-модель).

Размещено на http://www.allbest.ru/

Рис.4 Компоненты инфологической модели

Построение модели "объект--свойство--отношение"

Для описания ИЛМ используются как языки аналитического типа, так и графические средства. Графическое представление является наиболее наглядным и простым для восприятия и анализа, поэтому в дальнейшем изложении используется именно графическим способом отображения модели <объект -- свойство -- отношение>.

В предметной области в процессе ее обследования и анализа выделяют классы объектов. Классом объектов называют совокупность объектов, обладающих одинаковым набором свойств. Объекты могут быть реальными, а могут быть и абстрактными. При отражении в информационной системе каждый объект представляется своим идентификатором, который отличает один объект от другого, а каждый класс объектов представляется именем этого класса. Каждому классу объектов в инфологической модели присваивается уникальное имя.

При описании предметной области надо отразить связи между объектом и характеризующими его свойствами. Это изображается просто в виде линии, соединяющей обозначение объекта и его свойств. Связь между объектом и его свойством может быть различной. Объект может обладать только одним значением какого-то свойства. Такие свойства называются единичными. Для других свойств возможно существование одновременно нескольких значений у одного объекта, такое свойство называется множественным. Некоторые свойства являются постоянными, их значение не может измениться с течением времени (статические свойства). Те свойства, значение которых может изменяться со временем -- динамические.

Другой характеристикой связи между объектом и его свойством является признак того, присутствует ли это свойство у всех объектов данного класса либо отсутствует у некоторых объектов. Такие свойства называют условными. Иногда в инфологической модели бывает полезно ввести понятие "Составное Свойство". Различают несколько разновидностей объектов. Прежде всего, это простые и сложные объекты.

Объект называется простым, если он рассматривается как неделимый. Сложный объект представляет собой объединение других объектов, простых или сложных, также отображаемых в информационной системе. Понятия простой и сложный объект является относительным. Можно выделить несколько разновидностей сложных объектов: составные объекты, обобщенные объекты и агрегированные объекты.

Составной объект соответствует отображению отношения "Целое -- часть.

Обобщенный объект отражает наличие связи "Род -- вид" между объектами предметной области. Как "родовой" объект, так и "видовые" объекты могут обладать определенным набором свойств.

5. Даталогическое проектирование

Исходные данные для даталогического проектирования. Прежде чем приступить к построению даталогической модели, необходимо детально изучить особенности СУБД, определить факторы, влияющие на выбор проектного решения, ознакомиться с существующими методиками проектирования, а также провести анализ имеющихся средств автоматизации проектирования, возможности и целесообразности их использования.

Результат даталогического проектирования. Конечным результатом ДлП-я является описание логической структуры базы данных на ЯОД. Если проектирование выполняется "вручную", то сначала строится схематическое графическое изображение структуры б.д. Спроектировать логическую структуру базы данных означает определить все информационные единицы и связи между ними, задать их имена.

Определение состава базы данных. Прежде чем строить ДлМ, необходимо решить какая информация будет храниться в БД. Существуют разные подходы к определению состава показателей, которые должны храниться в БД. Согласно одному из них в БД должны храниться только исходные показатели, все производные показатели должны быть получены расчетным путем в момент реализации запроса. Такой подход имеет очевидные достоинства:

1. простота и однозначность в принятии решения "что хранить"

2. отсутствие неявного дублирования информации.

3. потенциальная возможность получить любой расчетный показатель. При принятии решения о хранении расчетных показателей принимается во внимание несколько факторов.

Введение искусственных идентификаторов. При отображении объекта в файл базы данных идентификатор объекта будет являться полем этого файла, причем в большинстве случаев ключевым полем.

Особенности даталогических моделей.

В базах данных со структурированными моделями следует различать внутризаписную и межзаписную структуры. Внутризаписная структура может быть либо линейной, либо иерархической. При линейной структуре запись состоит из простых эелементов, которые следуют один за другим, т.е. структура записи является нормализованной. В случае иерархической внутризаписной структуры в состав записи могут входить не только простые, но и составные компоненты.

Иерархическая структура записи может быть многоуровневой. По своей структуре записи могут быть с постоянным и переменным составом. Другой характеристикой записи является тип ее длины. По этому признаку различают записи с фиксированной, переменной и неопределенной длиной. Основными характеристиками поля являются его тип и длина. Большинство современных СУБД, кроме привычных полей символьного и числового типа, используют поля типа даты, логических полей, полей денежного типа. Некоторые системы позволяют вводить определяемые пользователем типы полей.

Размещено на http://www.allbest.ru/

Внутризаписная структура. Традиционное деление СУБД по типу модели данных на реляционные, иерархические и сетевые основывается на характере связей между записями. В классических иерархических моделях имеется один файл, который является входом в структуру. Остальные файлы связаны друг с другом таким образом, что каждый из них, за исключением корневой вершины, имеет ровно одну исходную вершину ("родитель") и любое число подчиненных вершин ("детей"). Между записью файла-родителя и записями порожденного файла имеется отношение 1:М (как частный случай может быть и отношение 1:1). Использование иерархической модели целесообразно в тех случаях, когда для ряда объектов предметной области можно выделить общие свойства.

В сетевых моделях, если на нее не накладывается никаких ограничений, в принципе любой файл может быть точкой входа в систему, каждый из файлов может быть связан с произвольным числом других файлов, и между записями связанных файлов могут быть любые отношения (1:1, 1:М, М:М). Во многих сетевых СУБД не поддерживается непосредственно отношение М:М. В таких моделях каждая связь между парой файлов определяется отдельно, и для каждой из них одни файл в этой паре объявляется "владельцем", а другой - "членом". Отношение между записью-владельцем и записями-членами - 1:М.

Реляционная модель - единственная модель, основанная на хорошо проработанной теории.

В реляционной модели объекты и взаимосвязи между ними представляются в виде набора взаимосвязанных таблиц. Каждая таблица имеет свое собственное имя и представляет один информационный объект. Связи между файлами в реляционной модели в явном виде могут не описываться. Они устанавливаются динамически в момент обработки данных по равенству значений соответствующих полей. В реляционных моделях структура записи должна быть линейной.

6. Модели данных. Иерархическая и сетевая модель

Ш Ядром любой базы данных является модель данных, которая определяет взаимосвязь данных на логическом уровне.

Ш С помощью модели данных могут быть представлены объекты предметной области, взаимосвязи между ними.

Ш Модель данных -- совокупность структур данных и операций их обработки Иерархическая модель данных

Иерархическая модель данных является наиболее простой среди всех даталогических моделей. Основными информационными единицами в иерархической модели являются: база данных (БД), сегмент и поле. Поле данных определяется как минимальная, неделимая единица данных, доступная пользователю с помощью СУБД.

Сегмент в терминологии Американской Ассоциации по базам данных называется записью, при этом в рамках иерархической модели определяются два понятия: тип сегмента или тип записи и экземпляр сегмента или экземпляр записи.

Тип сегмента -- это поименованная совокупность типов элементов данных, в него входящих. Экземпляр сегмента образуется из конкретных значений полей или элементов данных, в него входящих. Каждый тип сегмента в рамках иерархической модели образует некоторый набор однородных записей. Для возможности различия отдельных записей в данном наборе каждый тип сегмента должен иметь ключ или набор ключевых атрибутов (полей, элементов данных). Ключом называется набор элементов данных, однозначно идентифицирующих экземпляр сегмента. В иерархической модели сегменты объединяются в ориентированный древовидный граф. При этом полагают, что направленные ребра графа отражают иерархические связи между сегментами: каждому экземпляру сегмента, стоящему выше по иерархии и соединенному с данным типом сегмента, соответствует несколько (множество) экземпляров данного (подчиненного) типа сегмента. Тип сегмента, находящийся на более высоком уровне иерархии, называется логически исходным по отношению к типам сегментов, соединенным с данным направленными иерархическими ребрами, которые в свою очередь называются логически подчиненными по отношению к этому типу сегмента. Иногда исходные сегменты называют сегментами-предками, а подчиненные сегменты называют сегментами-потомками.

Рис. 3.1. Пример иерархических связей между сегментами

На концептуальном уровне определяется понятие схемы БД в терминологии иерархической модели.

Схема иерархической БД представляет собой совокупность отдельных деревьев, каждое дерево в рамках модели называется физической базой данных. Каждая физическая БД удовлетворяет следующим иерархическим ограничениям:

в каждой физической БД существует один корневой сегмент, то есть сегмент, у которого нет логически исходного (родительского) типа сегмента;

каждый логически исходный сегмент может быть связан с произвольным числом логически подчиненных сегментов;

каждый логически подчиненный сегмент может быть связан только с одним логически исходным (родительским) сегментом.

Очень важно понимать различие между сегментом и типом сегмента --сегмент является экземпляром типа сегмента.

Между экземплярами сегментов также существуют иерархические связи.

Каждый тип сегмента может иметь множество соответствующих ему экземпляров. Между экземплярами сегментов также существуют иерархические связи.

На рис представлены 2 экземпляра иерархического дерева соответствующей структуры.

Экземпляры-потомки одного типа, связанные с одним экземпляром сегмента-предка, называют "близнецами". Набор всех экземпляров сегментов, подчиненных одному экземпляру корневого сегмента, называется физической записью. Количество экземпляров-потомков может быть разным для разных экземпляров родительских сегментов, поэтому в общем случае физические записи имеют разную длину. Физические записи в иерархической модели различаются по длине и структуре.

Язык описания данных иерархической модели

В рамках иерархической модели выделяют языковые средства описания данных (DDL, Data Definition Language) и средства манипулирования данными (DML, Data Manipulation Language).

При работе с иерархической моделью каждая программа, пользователь или приложение определяет свою внешнюю модель. Внешняя модель представляет собой совокупность поддеревьев для физических баз данных, с которыми работает данный пользователь. Каждый подграф внешней модели в обязательном порядке должен содержать корневой тип сегмента соответствующей физической базы данных концептуальной модели.

Представление внешней модели называется логической базой данных и определяется совокупностью блоков связи данного приложения с физическими БД, входящими в концептуальную схему БД. Блок связи -- PCB, program communication bloc -- описывает связь с одной физической БД

Сетевая модель данных

Остановимся на понятии сетевой структуры, положенной в основу сетевой модели данных. Отношения, когда порожденный элемент имеет более одного исходного, описываются в виде сетевой структуры. В такой структуре любой элемент может быть связан с любым другим элементом.

Как и в случае иерархической модели, сетевую структуру можно описать в терминах исходных и порождаемых узлов, а также представить ее таким образом, чтобы порожденные узлы располагались ниже исходных. При рассмотрении некоторых сетевых структур можно говорить об уровнях.

В сетевых моделях, если на нее не накладывается никаких ограничений, в принципе любой файл может быть точкой входа в систему, каждый из файлов может быть связан с произвольным числом других файлов, и между записями связанных файлов могут быть любые отношения (1:1, 1:М, М:М). Во многих сетевых СУБД не поддерживается непосредственно отношение М:М. В таких моделях каждая связь между парой файлов определяется отдельно, и для каждой из них одни файл в этой паре объявляется "владельцем", а другой - "членом". Отношение между записью-владельцем и записями-членами - 1:М.

БД с сетевой структурой состоит из нескольких областей. Каждая область состоит из записей, которые состоят из полей. Объединение записей в логическую структуру возможно не только по областям, но и с помощью наборов данных. По существу набор данных - это поименованное двухуровневое дерево, которое является основой для построения многоуровневых деревьев. Сама база данных состоит из некоторой совокупности наборов данных. Набор данных - это экземпляр поименованной совокупности записей. Каждый тип набора представляет собой отношение между двумя или несколькими типами записей. Для каждого набора данных один тип записи может быть объявлен владельцем, а один или несколько типов других записей - членами набора.

Набор данных имеет следующие свойства:

Набор данных есть поименованная совокупность связанных записей.

В каждом экземпляре набора данных имеется только один экземпляр записи владельца.

Экземпляр набора может содержать 0,1 или несколько записей-членов.

Набор данных считается пустым, если ни один экземпляр записи-члена не связан с соответствующим экземпляром записи владельца.

Экземпляр набора данных связан с записью владельца.

Тип набора предполагает логическую взаимосвязь 1:M между владельцем и членом набора.

Необходимо различать тип и экземпляр набора. Определенный экземпляр типа записи-члена не может одновременно принадлежать более чем одному экземпляру типа записи-владельца. Уникальность владельца типа набора является обязательным элементом сетевой модели данных. С этой точки зрения иерархическая модель является частным случаем сетевой модели данных.

В некоторых определениях сетевой модели допускаются связи типа "многие-ко-многим", но требование бинарности связи остается в силе.

Для моделирования представления данных в сетевой модели используются следующие элементы данных:

простое поле (элемент данных) - наименьшая единица структуры данных, имеет уникальное имя, размер и тип;

множественное поле (агрегат данных, периодическая группа) - поименованная совокупность простых полей или агрегатов;

запись (группа данных) - поименованный агрегат, который не входит в состав никакого другого агрегата и представляет сущность ПО БД (тип записи);

групповое отношение (связь, набор) - иерархическое отношение между различными записями (графическое представление группового отношения в сетевой модели называется диаграммой Бахмана);

БД - совокупность записей различного типа, объединенная системой групповых отношений различной направленности.

7. Реляционные базы данных. Базовые понятия реляционного подхода к организации баз данных. Фундаментальные свойства отношений. Реляционная модель данных: аспекты реляционного подхода, целостность сущностей и ссылок

Реляционные базы данных и системы управления реляционными базами данных являются наиболее распространенными в настоящее время.

Достоинства реляционного подхода: наличие небольшого набора абстракций; наличие простого и в то же время мощного математического аппарата; возможность ненавигационного манипулирования данными без необходимости знания конкретной физической организации баз данных во внешней памяти.

Недостатки: ограниченность при использовании в нетрадиционных областях, в которых требуются предельно сложные структуры данных; невозможность адекватного отражения семантики предметной области.

Общие понятия реляционного подхода к организации БД. Основные концепции и термины

Базовые понятия реляционных баз данных. Реляционная база данных -- это тело связанной информации, сохраняемой в двумерных таблицах.

Тип данных. Обычно в реляционных БД допускается хранение символьных, числовых данных, битовых строк, специализированных числовых данных, а также специальных "темпоральных" данных (дата, время, временной интервал).

Домен. В самом общем виде домен определяется заданием некоторого базового типа данных, к которому относятся элементы домена, и произвольного логического выражения, применяемого к элементу типа данных. Если вычисление этого логического выражения дает результат "истина", то элемент данных является элементом домена.

Атрибут представляет собой элемент данных. Для элемента данных используются также термины "колонка", "столбец", "поле". Столбцы обязательно именуются уникальными именами. Схема отношения -- это именованное множество пар {имя атрибута, имя домена. Степень или "арность" схемы отношения определяет мощность этого множества.

Схема БД (в структурном смысле) -- это набор именованных схем отношений.

Кортеж -- это набор именованных значений заданного типа.

Отношение (таблица) -- это множество кортежей, соответствующих одной схеме отношения. Иногда, чтобы не путаться, говорят "отношение-схема" и "отношение-экземпляр", иногда схему отношения называют заголовком отношения, а отношение как набор кортежей -- телом отношения. Реляционную базу данных можно представить как набор отношений, имена которых совпадают с именами схем отношений в схеме БД.

Фундаментальные свойства отношений следуют из приведенных ранее определений.

Отсутствие кортежей-дубликатов. Из этого свойства вытекает наличие у каждого отношения так называемого первичного ключа -- набора атрибутов, значения которых однозначно определяют кортеж отношения.

Однако при формальном определении первичного ключа требуется обеспечение его минимальности.

Отсутствие упорядоченности кортежей. Это свойство является следствием определения отношения-экземпляра как множества кортежей

Отсутствие упорядоченности атрибутов. Атрибуты отношений не упорядочены, поскольку по определению схема отношения есть множество пар {имя атрибута, имя домена

Атомарность значений атрибутов. Значения всех атрибутов являются атомарными. Это следует из определения домена как потенциального множества значений простого типа данных, т.е. среди значений домена не могут содержаться множества значений (отношения).

Реляционная модель данных (Дейт) состоит из трех частей, описывающих разные аспекты реляционного подхода: структурной части, манипуляционной части и целостной части. В структурной части модели фиксируется, что единственной структурой данных, используемой в реляционных БД, является нормализованное n-арное отношение.

В манипуляционной части модели утверждаются два фундаментальных механизма манипулирования реляционными БД -- реляционная алгебра и реляционное исчисление. Первый механизм базируется в основном на классической теории множеств (с некоторыми уточнениями), а второй -- на классическом логическом аппарате исчисления предикатов первого порядка. В целостной части реляционной модели данных фиксируются два базовых требования целостности, которые должны поддерживаться в любой реляционной СУБД.

Первое требование называется требованием целостности сущностей. Объекту или сущности реального мира в реляционных БД соответствуют кортежи отношений. Любое отношение должно обладать первичным ключом. Второе требование называется требованием целостности по ссылкам и является несколько более сложным. Атрибут называется внешним ключом, поскольку его значения однозначно характеризуют сущности, представленные кортежами некоторого другого отношения.

Для соблюдения целостности сущности достаточно гарантировать отсутствие в любом отношении кортежей с одним и тем же значением первичного ключа.

В манипуляционной составляющей определяются два базовых механизма манипулирования реляционными данными -- основанная на теории множеств реляционная алгебра и базирующееся на математической логике (точнее, на исчислении предикатов первого порядка) реляционное исчисление. Два вида реляционного исчисления -- исчисление доменов и исчисление предикатов. Все эти механизмы обладают одним важным свойством: они замкнуты относительно понятия отношения. Это означает, что выражения реляционной алгебры и формулы реляционного исчисления определяются над отношениями реляционных БД и результатом вычисления также являются отношения.

Механизмы реляционной алгебры и реляционного исчисления эквивалентны, т.е. для любого допустимого выражения реляционной алгебры можно построить эквивалентную формулу реляционного исчисления и наоборот. Запрос, представленный на языке реляционной алгебры, может быть вычислен на основе вычисления элементарных алгебраических операций с учетом их старшинства и возможного наличия скобок.

Для формулы реляционного исчисления однозначная интерпретация, вообще говоря, отсутствует. Формула только устанавливает условия, которым должны удовлетворять кортежи результирующего отношения. Поэтому языки реляционного исчисления являются более непроцедурными или декларативными.

8. Нормализация и денормализация отношений

Нормализация представляет собой процесс дальнейшего совершенствования реляционной модели. Она выполняется после создания приближенной модели и предназначена для повышения уровня ее структурной организации. В основе нормализации лежит определенный математический аппарат, базирующийся на концепции функциональной зависимости- Один столбец или множество столбцов Y функционально зависят от одного столбца из множества столбцов X, если данное множество значений для X определяет единственное множество значений для У. реляционный информационный международный стандарт

"У функционально зависит от X" <=> "X определяет Y" XY.

Наиболее очевидным примером может быть первичный ключ таблицы реляционной модели, который однозначно определяет строку этой таблицы; однако могут существовать и другие зависимости, в которые не входят первичные ключи. Главная цель нормализации -- избавить реляционную таблицу от зависимостей, не связанных с первичными ключами.

Обеспечение целостности; Данные сохраняют корректность и достоверность, поскольку в результате нормализации они будут сохраняться только в одном месте, т.е. нормализация должна привести к исключению избыточности данных. В противном случае вам придется следить за синхронными изменениями всех копий данных, что потребует включения в систему дополнительно к стандартным средствам СУБД многих весьма сложных прикладных программ.

Создание формальной модели, как можно более независимой от специфики приложения; Нормализация способствует тому, что реляционная модель опирается на данные, а не на процессы их обработки. На практике это означает, что структура базы данных остается неизменной даже при изменении процессов обработки. Требования приложений не должны сказываться на логической структуре базы данных (однако, они должны учитываться при проектировании физической структуры системы).

Снижение требований к объему памяти Непосредственным следствием этого является повышение скорости поиска данных. Если не обращать внимания на внешние ключи, то полная нормализация приводит к исключению избыточности данных в проектируемой системе. Естественно, что избыточность всегда связана с дополнительными объемами памяти для хранения избыточных данных. Кроме того, чем больший массив данных просматривается при поиске нужной информации, тем продолжительней поиск и соответственно тем ниже производительность системы.

1НФ

· Значения в ячейках таблицы д.б. атомарными

· Все записи в столбце д.б. одного типа

· Каждый столбец имеет уникальное имя

· Порядок столбцов в таблице несущественен

· В отношении не м.б. двух одинаковых строк

· Порядок строк не имеет значения

2НФ- - отсутствие частичной зависимости Отношение находится во второй нормальной форме, если все его неключевые атрибуты зависят от всего ключа

Транзитивная зависимость

3НФ- отсутствие транзитивной зависимости Отношение находится в ЗНФ, если оно находится во 2НФ и все его неключевые столбцы зависят только от ключа

Инверсная частичная зависимость

Нормальная форма Бойса-Кодда отсутствие инверсной частичной зависимости Отношение находится в НФБК, если оно находится в 3НФ и ни первичный ключ, ни какая-либо его часть не зависит от неключевого атрибута

Отношение с многозначной зависимостью

4НФ- - отсутствие многозначной зависимости Отношение находится в 4НФ, если оно находится в НФБК и в ней отсутствуют многозначные зависимости

5НФ - отсутствие объединенной зависимости Отношение находится в 5НФ, если оно находится в 4НФ в ней отсутствуют объединенные зависимости (join dependence)

Доменно-ключевая нормальная форма Отношение находится в ДКНФ, если выполнение ограничений на домены и ключи приводит к выполнению всех ограничений

Денормализация

Иногда отношения намеренно оставляют в ненормализованном виде, либо нормализуют, а затем денормализуют. Зачастую это делается для повышения производительности. Всегда, когда необходимо комбинировать данные из двух различных таблиц, СУБД должна выполнять дополнительную работу. В большинстве случаев для этого необходимо как минимум две операции чтения вместо одной.

9. Переносимость и ннтероперабельность информационных систем и международные стандарты. Язык реляционных запросов SQL. Типы данных

Программный продукт должен обладать свойствами легкой переносимости с одной аппаратной платформы на другую. Другим естественным требованием к современным ИС является способность наращивания их возможностей за счет использования дополнительно разработанных, а еще лучше уже существующих программных компонентов. Для этого требуется обеспечение свойства, называемого интероперабельностью. Под этим понимается соблюдение определенных правил или привлечение дополнительных программных средств, обеспечивающих возможность взаимодействия независимо разработанных программных модулей, подсистем или даже функционально завершенных программных систем. Для удовлетворения этих требований уже на стадии проектирования и разработки информационных систем необходимо следовать принципу "открытых систем", т.е. максимально строго придерживаться международных или общепризнанных фактических стандартов во всех необходимых областях.

На сегодняшний день приняты международные стандарты языков Фортран-95, Паскаль, Ада, Си и Си++, SQL/89, SQL/92.

SQL - СТРУКТУРИРОВАННЫЙ ЯЗЫК ЗАПРОСОВ (Structured Query Language).

Стандарт SQL определяется ANSI и в настоящее время принят ISO. С помощью SQL можно создавать таблицы данных; хранить, получать и изменять данные; изменять структуру таблиц; объединять данные и выполнять вычисления; обеспечивать защиту данных.

SQL - непроцедурный язык: серверу базы данных сообщается, что нужно сделать и каким образом. Для обработки запроса сервер базы данных транслирует команды SQL во внутренние процедуры. Команды SQL для удобства работы разделяются на следующие группы:

...

Подобные документы

  • Предмет и основные понятия информационных систем. Базовые стандарты корпоративных информационных систем. Характеристика входящих и исходящих потоков информации. Основные понятия искусственного интеллекта. Обеспечение безопасности информационных систем.

    курс лекций [295,6 K], добавлен 11.11.2014

  • Общее понятие и признаки классификации информационных систем. Типы архитектур построения информационных систем. Основные компоненты и свойства базы данных. Основные отличия файловых систем и систем баз данных. Архитектура клиент-сервер и ее пользователи.

    презентация [203,1 K], добавлен 22.01.2016

  • Жизненный цикл информационных систем, методологии и технологии их проектирования. Уровень целеполагания и задач организации, классификация информационных систем. Стандарты кодирования, ошибки программирования. Уровни тестирования информационных систем.

    презентация [490,2 K], добавлен 29.01.2023

  • Базы данных с двумерными файлами и реляционные системы управления базами данных (СУБД). Создание базы данных и обработка запросов к ним с помощью СУБД. Основные типы баз данных. Базовые понятия реляционных баз данных. Фундаментальные свойства отношений.

    реферат [57,1 K], добавлен 20.12.2010

  • Подходы к классификации ИС, виды архитектур. Этапы развития и базовые стандарты ИС, обеспечивающие взаимоувязывание производственных процессов и их финансовых результатов. Перспективные направления использования информационных технологий в экономике.

    курс лекций [114,7 K], добавлен 26.03.2017

  • Реализация задачи использования методики SDLC (управление жизненным циклом разработки программного обеспечения) при внедрении реальной системы информационных технологий. Описание проекта внедрения системы автоматической регистрации участников выставок.

    реферат [585,1 K], добавлен 10.09.2010

  • Осмысление и переработка информационных данных, которые используются для решения управленческих задач. Общая схема информационной системы, ввод данных, их обработка, хранение и распределение полученной информации. Характеристики информационных систем.

    контрольная работа [59,8 K], добавлен 03.10.2010

  • Основные понятия базы данных и систем управления базами данных. Типы данных, с которыми работают базы Microsoft Access. Классификация СУБД и их основные характеристики. Постреляционные базы данных. Тенденции в мире современных информационных систем.

    курсовая работа [46,7 K], добавлен 28.01.2014

  • Понятие информационных технологий, этапы их развития, составляющие и основные виды. Особенности информационных технологий обработки данных и экспертных систем. Методология использования информационной технологии. Преимущества компьютерных технологий.

    курсовая работа [46,4 K], добавлен 16.09.2011

  • Термины "логический" и "физический" как отражение различия аспектов представления данных. Методы доступа к записям в файлах. Структура систем управления базами данных. Отличительные особенности обработки данных, характерные для файловых систем и СУБД.

    лекция [169,7 K], добавлен 19.08.2013

  • Понятие, модели и назначение информационных систем. Функциональное моделирование ИС. Диаграмма потоков данных. Декомпозиция процессов и миниспецификации. Реализация макета системы средствами MS SQL Server 2005. Создание базы данных. Скалярные функции.

    курсовая работа [1,0 M], добавлен 16.09.2012

  • Области применения и реализации информационных систем. Анализ использования Web-технологий. Создание физической и логической модели данных. Проектирование информационных систем с Web-доступом. Функции Института Искусств и Информационных Технологий.

    дипломная работа [3,8 M], добавлен 23.09.2013

  • Определение понятия структур данных. Рассмотрение информации и ее представления в памяти. Особенности непозиционных и позиционных систем счисления. Классификация структур данных, операции над ними. Структурность данных и технология программирования.

    презентация [359,3 K], добавлен 20.05.2015

  • Определение понятия "система". История развития и особенности современных информационных систем. Основные этапы развития автоматизированной информационной системы. Использование отечественных и международных стандартов в области информационных систем.

    презентация [843,9 K], добавлен 14.10.2013

  • Определения теории баз данных (БД). Элементы приложения информационных систем. Реляционные модели данных. Задача систем управления распределенными базами данных. Средства параллельной обработки запросов. Использование БД при проведении инвентаризации.

    курсовая работа [518,9 K], добавлен 01.05.2015

  • Методологии разработки информационных систем в отечественной и зарубежной литературе. Государственные и международные стандарты в области разработки программного обеспечения. Разработка фрагмента информационной системы "Учебно-методический ресурс".

    курсовая работа [364,6 K], добавлен 28.05.2009

  • Определение многомерной модели данных для удовлетворения основных информационных потребностей предприятия. Экстракция, загрузка и перенос данных из различных источников данных. Разработка собственных ETL–систем. Оптимизация работы хранилища данных.

    презентация [9,1 M], добавлен 25.09.2013

  • Основные области проектирования информационных систем: базы данных, программы (выполнение к запросам данных), топология сети, конфигурации аппаратных средств. Модели жизненного цикла программного обеспечения. Этапы проектирования информационной системы.

    реферат [36,1 K], добавлен 29.04.2010

  • Особенности управления информацией в экономике. Понятие и функции системы управления базами данных, использование стандартного реляционного языка запросов. Средства организации баз данных и работа с ними. Системы управления базами данных в экономике.

    контрольная работа [19,9 K], добавлен 16.11.2010

  • Характерные черты информационных систем обработки информации (баз данных). Предметная область базы данных. Состояние объектов и их взаимосвязей. Основные модели данных, связывание таблиц. Потенциальные ключи отношений. Языки запросов SQL и QBE.

    реферат [131,7 K], добавлен 20.10.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.