История развития технологии баз данных

Ранняя эпоха и зарождение технологий баз данных. Сущность автоматизированной (механизированной) обработки, история ее создания. Характеристика файловой системы, описание ее структурных элементов. Перспективы развития систем управления базами данных.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 27.11.2013
Размер файла 40,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

«История развития технологии баз данных»

Содержание

Введение

Глава 1. Ранняя эпоха и зарождение технологий баз данных

1.1 Автоматизированная (механизированная) обработка

1.2. Файловые системы

1.3 Ранние СУБД

Глава 2. Современная эпоха и перспективы развития

2.1 Эпоха персональных компьютеров

2.2 Централизованные и распределенные базы данных

2.3 Перспективы развития систем управления базами данных

Заключение

Библиографический список

база автоматизированный обработка управление

Введение

Сложность современной технологии баз данных явилась результатом развития в течение нескольких десятилетий способов обработки данных и управления информацией. Подталкиваемая, с одной стороны, нуждами и требованиями менеджмента и ограниченная, с другой стороны, возможностями технологии, обработка данных развивалась от примитивных методов пятидесятых годов к сложным интегрированным системам сегодняшнего дня. Трудно представить себе современный мир информационных технологий без использования баз данных. Практически все системы в той или иной степени связаны с функциями долговременного хранения и обработки информации.

Потребности менеджмента росли параллельно с развитием технологии. Первые системы обработки данных выполняли лишь канцелярскую работу, сокращая количество бумаг. Более современные системы перешли к накоплению и управлению информацией, рассматриваемой сегодня как жизненно важный ресурс компании.

Фактически информация становится фактором, определяющим эффективность любой сферы деятельности. Увеличились информационные потоки и повысились требования к скорости обработки данных, и теперь уже большинство операций не может быть выполнено вручную, они требуют применения наиболее перспективных компьютерных технологий. Любые административные решения требуют четкой и точной оценки текущей ситуации и возможных перспектив ее изменения. И если раньше в оценке ситуации участвовало несколько десятков факторов, которые могли быть вычислены вручную, то теперь таких факторов сотни и сотни тысяч, и ситуация меняется не в течение года, а через несколько минут, а обоснованность принимаемых решений требуется большая, потому что и реакция на неправильные решения более серьезная, более быстрая и более мощная, чем раньше. И, конечно, обойтись без информационной модели производства, хранимой в базе данных, в этом случае невозможно.

Технологические изменения всегда были вызваны потребностями бизнеса. Менеджеры примут новую компьютерную систему только в том случае, если ясно увидят, что выгода превышает затраты на нее. И, несмотря на риск и возможные ловушки, во многих случаях действительно получается существенная выгода. Более того, конца процессу пока не видно. Новые технологии, такие, как объектно-ориентированные базы данных и платформа клиент/сервер, решают новые задачи, что должно привести к появлению в будущем более мощных систем.

Глава 1. Ранняя эпоха и зарождение технологий баз данных

1.1 Автоматизированная (механизированная) обработка

Впервые автоматизированная обработка информации появилась приблизительно в 1800 году, когда Джеквард Лум начал производить раскрой ткани по образцам, представленным перфокартами. Позже аналогичная технология использовалась в механических пианино. В 1890 г. Холлерит использовал технологию перфокарт для выполнения переписи населения Соединенных Штатов. Его система содержала запись на перфокарте для каждой семьи. Машины сводили подсчеты в таблицы по жилым кварталам, территориальным и административным округам и штатам. Бизнес Холлерита в конце концов привел к возникновению компании International Business Machines для производства оборудования, для записи данных на карты, сортировки и составления таблиц [2].

К 1955 году у многих компаний имелись целые этажи, предназначенные для хранения перфокарт. На других этажах размещались шеренги перфораторов, сортировщиков и табуляторов. Эти машины программировались путем перемонтирования управляющих панелей, которые управляли некоторыми регистрами-накопителями и выборочно воспроизводили карты на других картах или на бумаге.

Последующие этапы напрямую связаны с вычислительной техникой. С самого начала развития вычислительной техники образовались два основных областей ее использования.

Первая область - применение вычислительной техники для выполнения численных расчетов, которые слишком долго или вообще невозможно производить вручную. Развитие этой области способствовало интенсификации методов численного решения сложных математических задач, появлению языков программирования, ориентированных на удобную запись численных алгоритмов, становлению обратной связи с разработчиками новых архитектур ЭВМ [2]. Характерной особенностью данной области применения вычислительной техники является наличие сложных алгоритмов обработки, которые применяются к простым по структуре данным, объем которых сравнительно невелик.

Вторая область - это использование средств вычислительной техники в автоматических или автоматизированных информационных системах. В самом широком смысле информационная система представляет собой программный комплекс, функции которого состоят в поддержке надежного хранения информации в памяти компьютера, выполнении специфических для данного приложения преобразований информации и/или вычислений, предоставлении пользователям удобного и легко осваиваемого интерфейса.

Такие системы обычно имеют дело с большими объемами информации, имеющей достаточно сложную структуру. Классическими примерами информационных систем являются банковские системы, автоматизированные системы управления предприятиями, системы резервирования авиационных и железнодорожных билетов, и т.д.

Вторая область использования вычислительной техники возникла несколько позже первой. Это связано с тем, что в то время возможности компьютеров по хранению информации были очень ограниченными. Говорить о надежном и долговременном хранении информации можно только при наличии запоминающих устройств, сохраняющих информацию после выключения электрического питания. В начале использовались два вида устройств внешней памяти: магнитные ленты и барабаны. Емкость магнитных лент была достаточно велика, но по своей физической природе они обеспечивали последовательный доступ к данным. Магнитные же барабаны давали возможность произвольного доступа к данным, но имели ограниченный объем хранимой информации.

Эти ограничения не являлись слишком существенными для чисто численных расчетов, даже если программа должна большой объем информации, при программировании можно продумать расположение этой информации во внешней памяти, обеспечивающее эффективное выполнение этой программы. Однако в информационных системах совокупность взаимосвязанных информационных объектов фактически отражает модель объектов реального мира. А потребность пользователей в информации, адекватно отражающей состояние реальных объектов, требует сравнительно быстрой реакции системы на их запросы. И в этом случае наличие сравнительно медленных устройств хранения данных, к которым относятся магнитные ленты и барабаны, было недостаточным.

С появлением магнитных дисков началась история систем управления данными во внешней памяти. До этого каждая прикладная программа, которой требовалось хранить данные во внешней памяти, сама определяла расположение каждой порции данных на магнитной ленте или барабане и выполняла обмены между оперативной памятью и устройствами внешней памяти с помощью программно-аппаратных средств низкого уровня (машинных команд или вызовов соответствующих программ операционной системы). Такой режим работы не позволяет или очень затрудняет поддержание на одном внешнем носителе нескольких архивов долговременно хранимой информации. Кроме того, каждой прикладной программе приходилось решать проблемы именования частей данных и структуризации данных во внешней памяти.

Несмотря на то, что с момента создания ЭВМ индустрия испытывала огромную потребность в хранилищах данных, это направление начало развиваться позже, чем ПО для математических вычислений. Связано это с тем, что первые ЭВМ попросту не имели внешних запоминающих устройств большой емкости. И лишь появление съемных магнитных дисков с подвижными головками, обладавших существенно большей емкостью, чем используемые ранее магнитные барабаны, и обеспечивающих удовлетворительную скорость доступа к данным, ознаменовало начало эры информационных хранилищ.

1.2 Файловые системы

Историческим шагом стал переход к использованию централизованных систем управления файлами. С точки зрения прикладной программы, файл - это именованная область внешней памяти, и которую можно записывать и из которой можно считывать данные. Правила именования файлов, способ доступа к данным, хранящимся в файле, и структура этих данных зависели от конкретной системы управления файлами, типа файла.

Первая развитая файловая система была разработана фирмой IBM для ее серии 360. В этой системе поддерживались как чисто последовательные, так и индексно-последовательные файлы, а реализация во многом опиралась на возможности только появившихся к этому времени контроллеров управления дисковыми устройствами.

Система управления файлами берет на себя распределение внешней памяти, отображение имен файлов в соответствующие адреса во внешней памяти и обеспечение доступа к данным. Такие системы иногда называли файловыми. Несмотря на относительную простоту организации, файловые системы имели ряд недостатков: как избыточность данных, слабый контроль данных, недостаточные возможности управления данными, большие затраты труда программиста. Пользователи видели файл как линейную последовательность записей и могут выполнить над ним ряд стандартных операций: как создать файл, открыть файл, прочитать из файла некоторую запись, записать в файл на место текущей записи новую, добавить новую запись в конец файла. В разных файловых системах эти операции могли несколько отличаться, но общий смысл их был именно таким. Каждая программа, работающая с файлом, должна была иметь у себя внутри структуру данных, соответствующую структуре этого файла. Поэтому при изменении структуры файла требовалось изменять структуру программы, а это требовало новой компиляции. Такая ситуация характеризовалась как зависимость программ от данных.

Для информационных систем характерным является наличие большого числа различных пользователей (программ), каждый из которых имеет свои специфические алгоритмы обработки информации, хранящейся в одних и тех же файлах. Изменение структуры файла, которое было необходимо для одной программы, требовало исправления и перекомпиляции и дополнительной отладки всех остальных программ, работающих с этим же файлом. Это было первым существенным недостатком файловых систем, который явился толчком к созданию новых систем хранения и управления информацией.

Поскольку, файловые системы являются общим хранилищем файлов, принадлежащих, вообще говоря, разным пользователям, системы управления файлами должны обеспечивать авторизацию доступа к файлам. Этот подход состоит в том, что по отношению к каждому зарегистрированному пользователю данной вычислительной системы для каждого существующего файла указываются действия, которые разрешены или запрещены данному пользователю. Существовали попытки реализовать этот подход в полном объеме. Но это вызывало слишком большие накладные расходы как по хранению избыточной информации, так и по использованию этой информации для контроля правомочности доступа.

Поэтому в большинстве современных систем управления файлами применяется подход к защите файлов, впервые реализованный в ОС UNIX. В этой ОС каждому зарегистрированному пользователю соответствует пара целочисленных идентификаторов: идентификатор группы, к которой относится этот пользователь, и его собственный идентификатор в группе. При каждом файле хранится полный идентификатор пользователя, который создал этот файл, и фиксируется, какие действия с файлом может производить его создатель, какие действия с файлом доступны для других пользователей той же группы и что могут делать с файлом пользователи других групп [3]. Для множества файлов, отражающих информационную модель одной предметной области, такой децентрализованный принцип управления доступом вызывал дополнительные трудности. И отсутствие централизованных методов управления доступом к информации послужило еще одной причиной разработки СУБД.

Следующей причиной стала необходимость обеспечения эффективной параллельной работы многих пользователей с одними и теми же файлами. В общем случае системы управления файлами обеспечивали режим многопользовательского доступа, если операционная система поддерживает многопользовательский режим, вполне реальна ситуация, когда два или более пользователя одновременно пытаются работать с одним и тем же файлом. В системах управления файлами обычно применялся следующий подход. В операции открытия файла помимо прочих параметров указывался режим работы (чтение или изменение). Если к моменту выполнения этой операции от имени некоторой программы A файл уже находился в открытом состоянии от имени некоторой другой программы B, причем существующий режим открытия был несовместимым с желаемым режимом, то в зависимости от особенностей системы программе A либо сообщалось о невозможности открытия файла в желаемом режиме, либо она блокировалась до тех пор, пока программа B не выполнит операцию закрытия файла. При подобном способе организации одновременная работа нескольких пользователей, связанная с модификацией данных в файле, либо вообще не реализовывалась, либо была очень замедлена.

Эти недостатки послужили тем толчком, который заставил разработчиков информационных систем предложить новый подход к управлению информацией. Проблемы сопровождения больших систем, основанных на файлах, привели в конце 60-х годов к появлению Системам Управления Базами Данных (СУБД). В основе СУБД лежала простая идея: изъять из программ определение структуры содержимого файла и хранить её вместе с данными в базе данных.

1.3 Ранние СУБД

История развития СУБД насчитывает более 30 лет. Среди первых СУБД наиболее часто использовались три типа систем управления базами данных - основанные на инвертированных списках, иерархические и сетевые. Эти системы активно использовались в течение нескольких десятков лет, некоторые из них применяются до сих пор. Для этих систем накоплены громадные базы данных, и поэтому одной из проблем является их использование совместно с современными системами. К числу наиболее известных и типичных представителей систем, основанных на инвертированных списках, относятся Datacom/DB компании Applied Data Research, Inc. (ADR) и Adabas компании Software AG. Среди иерархических систем наиболее известным и распространенным представителем является Information Management System (IMS) компании IBM, первая версия которой вышла в 1968 году.(1) Надо заметить, что на мэйнфреймах до сих пор используется огромное количество баз данных этого типа, что препятствует переходу на современные БД и новую технику. В 1975 году появился первый стандарт ассоциации по языкам систем обработки данных - Conference of Data System Languages (CODASYL), который определил ряд фундаментальных понятий в теории систем баз данных, которые и до сих пор являются основополагающими для сетевой модели данных.

В дальнейшее развитие теории баз данных большой вклад был сделан американским математиком Э.Ф. Коддом, который является создателем реляционной модели данных. Рассматривая данные с концептуальной, а не физической точки зрения, Кодд предложил еще одну революционную идею. В реляционных системах баз данных целые файлы данных могут обрабатываться одной командой, тогда как в традиционных системах за один раз обрабатывается только одна запись. Подход Кодда чрезвычайно повысил эффективность программирования в базах данных.

Логический подход к данным сделал также возможным создание языков запросов, более доступных для пользователей, не являющихся специалистами по компьютерам. Хотя создать язык, которым могли бы пользоваться все, независимо от опыта работы с компьютером, довольно сложно, однако реляционные языки запросов сделали базы данных доступными для более широкого круга пользователей, чем раньше.

В 1981 году Э. Ф. Кодд получил за создание реляционной модели и реляционной алгебры престижную премию Тьюринга Американской ассоциации по вычислительной технике. Публикация работ Кодда в начале семидесятых вызвала взрыв активности, как среди ученых, так и среди разработчиков коммерческих систем по созданию реляционной системы управления базами данных. Результатом этой деятельности явилось создание во второй половине семидесятых реляционных систем, которые поддерживали такие языки, как Structured Query Language (SQL, язык структурированных запросов), Query Language (Quel, язык запросов) и Query-by-Example (QBE, запросы по образцу)(4) С широким распространением персональных компьютеров в восьмидесятые годы также появились реляционные базы данных для микрокомпьютеров.

Этап развития СУБД связан с организацией баз данных на больших машинах типа IBM 360/370, ЕС-ЭВМ и мини-ЭВМ типа PDP11 (фирмы Digital Equipment Corporation -- DEC), разных моделях HP (фирмы Hewlett Packard). Базы данных хранились во внешней памяти центральной ЭВМ, пользователями этих баз данных были задачи, запускаемые в основном в пакетном режиме. Интерактивный режим доступа обеспечивался с помощью консольных терминалов, которые не обладали собственными вычислительными ресурсами (процессором, внешней памятью) и служили только устройствами ввода-вывода для центральной ЭВМ [5]. Программы доступа к БД писались на различных языках и запускались как обычные числовые программы. Мощные операционные системы обеспечивали возможность условно параллельного выполнения всего множества задач. Эти системы можно было отнести к системам распределенного доступа, потому что база данных была централизованной, хранилась на устройствах внешней памяти одной центральной ЭВМ, а доступ к ней поддерживался от многих пользователей- задач.

Особенности этого этапа развития выражаются в следующем:

Все СУБД базируются на мощных мультипрограммных операционных системах (MVS, SVM, RTE, OSRV, RSX, UNIX), поэтому в основном поддерживается работа с централизованной базой данных в режиме распределенного доступа.

Функции управления распределением ресурсов в основном осуществляются операционной системой (ОС).

Поддерживаются языки низкого уровня манипулирования данными, ориентированные на навигационные методы доступа к данным.

Значительная роль отводится администрированию данных.

Проводятся серьезные работы по обоснованию и формализации реляционной модели данных, и была создана первая система (System R), реализующая идеологию реляционной модели данных.

Проводятся теоретические работы по оптимизации запросов и управлению распределенным доступом к централизованной БД, было введено понятие транзакции.

Результаты научных исследований открыто обсуждаются в печати, идет мощный поток общедоступных публикаций, касающихся всех аспектов теории и практики баз данных, и результаты теоретических исследований активно внедряются в коммерческие СУБД.

Появляются первые языки высокого уровня для работы с реляционной моделью данных. Однако отсутствуют стандарты для этих первых языков.

Первые СУБД могли хранить только текстовую и числовую информацию. О хранении графических, аудио- и видеоданных речь не шла, что было в значительной степени обусловлено недостаточной мощностью самих аппаратных систем. Ранние СУБД не отличались высокой степенью целостности данных. И все же именно опыт создания первых БД позволил впоследствии разработать гораздо более мощные и надежные базы данных, используемые в наши дни с использованием той же самой подсхемы, с которой все начиналось, хотя логическая и физическая схемы абсолютно изменились. Иерархическая структура оказалась очень удобной для хранения данных во многих случаях. Реляционные базы данных продолжают совершенствоваться, и их внутренняя природа значительно меняется, предоставляя пользователям возможность решать все более сложные задачи. В результате можно говорить о возникновении эпохи развитых СУБД.

Глава 2. Современная эпоха и перспективы развития

2.1 Эпоха персональных компьютеров

Персональные компьютеры стремительно ворвались в нашу жизнь и буквально перевернули наше представление о месте и роли вычислительной техники в жизни общества. Теперь компьютеры стали ближе и доступнее каждому пользователю. Исчез благоговейный страх рядовых пользователей перед непонятными и сложными языками программирования. Появилось множество программ, предназначенных для работы неподготовленных пользователей. Эти программы были просты в использовании и интуитивно понятны: это, прежде всего, различные редакторы текстов, электронные таблицы и другие. Простыми и понятными стали операции копирования файлов и перенос информации с одного компьютера на другой, распечатка текстов, таблиц и других документов.

Системные программисты были отодвинуты на второй план. Каждый пользователь мог себя почувствовать полным хозяином этого мощного и удобного устройства, позволяющего автоматизировать многие аспекты деятельности. И, конечно, это сказалось и на работе с базами данных. Появились программы, которые назывались системами управления базами данных и позволяли хранить значительные объемы информации, они имели удобный интерфейс для заполнения данных, встроенные средства для генерации различных отчетов. Эти программы позволяли автоматизировать многие учетные функции, которые раньше велись вручную. Постоянное снижение цен на персональные компьютеры сделало их доступными не только для организаций и фирм, но и для отдельных пользователей. Компьютеры стали инструментом для ведения документации и собственных учетных функций. Это все сыграло как положительную, так и отрицательную роль в области развития баз данных. Кажущаяся простота и доступность персональных компьютеров и их программного обеспечения породила множество дилетантов. Эти разработчики, считая себя знатоками, стали проектировать недолговечные базы данных, которые не учитывали многих особенностей объектов реального мира. Много было создано систем-однодневок, которые не отвечали законам развития и взаимосвязи реальных объектов.

Однако доступность персональных компьютеров заставила пользователей из многих областей знаний, которые ранее не применяли вычислительную технику в своей деятельности, обратиться к ним. И спрос на развитые удобные программы обработки данных заставлял поставщиков программного обеспечения поставлять все новые системы, которые принято называть настольными (desktop) СУБД. Значительная конкуренция среди поставщиков заставляла совершенствовать эти системы, предлагая новые возможности, улучшая интерфейс и быстродействие систем, снижая их стоимость. Наличие на рынке большого числа СУБД, выполняющих сходные функции, потребовало разработки методов экспорта- импорта данных для этих систем и открытия форматов хранения данных.

Но и в этот период появлялись любители, которые вопреки здравому смыслу разрабатывали собственные СУБД, используя стандартные языки программирования. Это был тупиковый вариант, потому что дальнейшее развитие показало, что перенести данные из нестандартных форматов в новые СУБД было гораздо труднее, а в некоторых случаях требовало таких трудозатрат, что легче было бы все разработать заново, но данные все равно надо было переносить на новую более перспективную СУБД. И это тоже было результатом недооценки тех функций, которые должна была выполнять СУБД.

Особенности этого этапа следующие:

Все СУБД были рассчитаны на создание БД в основном с монопольным доступом. И это понятно. Компьютер персональный, он не был подсоединен к сети, и база данных на нем создавалась для работы одного пользователя. В редких случаях предполагалась последовательная работа нескольких пользователей, например, сначала оператор, который вводил бухгалтерские документы, а потом главбух, который определял проводки, соответствующие первичным документам.

Большинство СУБД имели развитый и удобный пользовательский интерфейс, В большинстве существовал интерактивный режим работы с БД, как в рамках описания БД, так и в рамках проектирования запросов. Кроме того, большинство СУБД предлагали развитый и удобный инструментарии для разработки готовых приложений без программирования. Инструментальная среда состояла из готовых элементов приложения в виде шаблонов экранных форм, отчетов, этикеток (Labels), графических конструкторов запросов, которые достаточно просто могли быть собраны в единый комплекс.

Во всех настольных СУБД поддерживался только внешний уровень представления реляционной модели, то есть только внешний табличный вид структур данных.

При наличии высокоуровневых языков манипулирования данными типа реляционной алгебры и SQL в настольных СУБД поддерживались низкоуровневые языки манипулирования данными на уровне отдельных строк таблиц.

В настольных СУБД отсутствовали средства поддержки ссылочной и структурной целостности базы данных. Эти функции должны были выполнять приложения, однако скудость средств разработки приложений иногда не позволяла это сделать, и в этом случае эти функции должны были выполняться пользователем, требуя от него дополнительного контроля при вводе и изменении информации, хранящейся в БД.

Наличие монопольного режима работы фактически привело к вырождению функций администрирования БД и в связи с этим - к отсутствию инструментальных средств администрирования БД.

И, наконец, последняя и в настоящий момент весьма положительная особенность -- это сравнительно скромные требования к аппаратному обеспечению со стороны настольных СУБД. Вполне работоспособные приложения, разработанные, например, на Clipper, работали на PC 286.

Их трудно назвать полноценными СУБД. Яркие представители этого семейства это очень широко использовавшиеся до недавнего времени СУБД dBase (dBase III+, dBase IV), FoxPro, Clipper, Paradox.

2.2 Централизованные и распределенные базы данных

В централизованных БД пользователи тратят очень много времени на поиск информации и доступ к ней. В связи с растущей сложностью и разнообразием данных, представляющих интерес для различных отраслей экономики страны, обеспечение пользователей информацией из одного центра неизбежно становится сложнее.

Уровень технического развития отдельных центров данных потенциально позволяет обеспечить достаточно высокую оперативность обслуживания пользователей. Но при этом требуется много усилий на поддержание актуальности БД.

В нашей стране еще в восьмидесятые годы были созданы оперативные системы централизованного доведения информации до пользователей, например, СИГМА-ОКА (ВНИИГМИ-МЦД), DIALOG (ВИНИТИ) и др. [3]. Эти системы, как правило, были уникальными, удовлетворяли нужды отдельных пользователей. Средства этих систем позволяли обеспечить доступ по выделенным каналам связи через центр коммутации сообщений с выдачей результатов поиска на экран видеотерминала и печатающее устройство. К сожалению, из-за высокой стоимости эксплуатации таких систем, недостаточной надежности каналов связи, сбоев ЭВМ, работающих в этих центрах, от них пришлось отказаться.

По мере роста производительности процессоров и неизбежного усложнения программного обеспечения самостоятельная эксплуатация персонального компьютера становится все сложнее и дороже. Некоторые компании (например, Oracle) объявили о намерении развивать новое направление сбыта своей продукции с помощью аренды программных средств через Интернет. Эта технология позволяет использовать сложное программное обеспечение не на серверах локальной сети компании и не на рабочих станциях пользователей, а в центрах данных, т.е. в области распространения и эксплуатации программного обеспечения остается выгодной централизация обслуживания. Такая же тенденция намечается в области эксплуатации крупных серверов БД.

Таким образом, на каждом этапе развития вычислительной техники и методов обработки должен соблюдаться компромисс между уровнем централизации и децентрализации данных и программного обеспечения.

На первом этапе развития централизованной обработки данных в шестидесятых - начале семидесятых годов были заложены основы сбора данных на технических носителях, создания фондов данных, на втором этапе середина семидесятых - начало восьмидесятых годов - разработка программных средств для научных исследований, на третьем - с середины восьмидесятых годов - создание баз и банков данных. Эти этапы отражают преемственность в развитии системы переработки информации. Решение задач на каждом из них осуществлялось в соответствии с реальным уровнем развития современных методов автоматизированной обработки данных, программного и технического обеспечения и создало предпосылки для перехода к очередному этапу - созданию распределенных БД и удаленной обработки. Централизованный сбор данных позволил сократить трудозатраты на сбор, поиск и систематизацию данных, уменьшить сроки обработки больших массивов данных, увеличить полноту обрабатываемых данных, в т.ч. за счет международного и межведомственного обмена обеспечить одноразовое занесение данных на носитель. Последнее это позволило в восьмидесятых годах обеспечить многие учреждения копиями основных массивов данных на магнитных лентах, без чего переход к следующему этапу был бы невозможен, т.к. не был бы накоплен опыт обработки данных в региональных организациях.

Анализ материалов, характеризующих деятельность организаций, позволяет выделить следующие недостатки и проблемы централизованного создания и обработки БД:

не обеспечивается полное и своевременное поступление и занесение данных на технические носители и в то же время есть дублирование занесения данных в различных организациях (не решен вопрос о рациональном распределении потоков данных при их сборе);

замкнутость фондов данных в пределах одной отрасли привела к различиям в структуре отраслевых и региональных БД, неодинаковой степени автоматизации сбора и обработки данных, различиям в информационно-технологических процессах при решении одинаковых задач;

отсутствие централизованной справочной службы для нескольких родственных отраслей и неодинаковая структура справочно - поискового аппарата;

сведения о данных разобщены по нескольким справочным базам данных;

отсутствует возможность аналитической обработки данных, низка оперативность и своевременность доведения справочной и исходной информации до пользователя;

большинство центров данных не являются составными частями технически согласованной информационной сети, что существенно снижает эффективность их деятельности;

из-за недостаточной координации работ центры разрабатывают программные средства сбора и обработки с дублированием, без учета взаимного обмена данными;

сложилась ситуация, когда при наличии большого числа данных, они не могут быть использованы с достаточной полнотой и в приемлемые сроки при проведении НИР или принятии решений;

при проектировании мало используется типовых проектных решений, различный состав классификаторов, кодификаторов, словарей и методов их ведения, отсутствуют методические материалы по проектированию конкретных приложений, имеется слабая заинтересованность ведомств в необходимости проектирования общей системы, нет методического и проектного руководства со стороны государственных органов;

плохо используется пользователями получаемая информация из-за несовершенства форм представления информации, отсутствия системы критериев, регламентирующих использование данных, слабо автоматизируются методы принятия решений.

Повышение эффективности обеспечения пользователей информацией может быть достигнуто за счет интеграции учреждений в систему распределенных БД.

Распределенные БД имеют следующие основные преимущества по сравнению с централизованной БД: обеспечивается большая надежность работы, хранения копий или частей БД, данные становятся ближе к точкам их использования, что ускоряет обращение к данным и сокращает затраты на их передачу. Кроме того, преимуществами распределенных БД являются неявность адресации и тиражирования, независимость от конфигурации, использование неоднородных СУБД, тиражирование данных, расчленение БД, фрагментация данных [4].

При проектировании распределенных БД используются следующие принципы:

отражение сложившейся организационной структуры системы;

централизация сбора и обработки метаданных и глобальных данных, долговременного хранения данных в ведомственных центрах и децентрализация сбора, занесения текущих данных на технических носителях и обеспечения пользователей;

единство справочной службы сведений о данных во всей системе, с централизацией основных сведений в главном центре данных;

построение БД на основе типовых проектных решений;

единое методическое руководство деятельностью учреждений, занимающихся информационным обеспечением пользователей за счет широкого применения стандартизации и унификации;

применение единой классификации данных;

всемерное использование возможностей международного сотрудничества в области обмена данными, теории и практики обслуживания пользователей;

единство технологических процессов сбора, обработки и распространения данных;

Надежность функционирования - обеспечение сохранности, защиты, безопасности информации;

функциональная целостность - обеспечение функционирования распределенных БД как единого комплекса, позволяющего решать одну сложную задачу и множество справочных запросов;

конструктивная однородность и мобильность (учет новых требований) - сравнительно небольшой набор номенклатуры применяемых технических средств, что создает основу для наращивания мощности распределенных БД;

функциональная модульность - создание типовых функциональных модулей (для статистической обработки, доступа к данным и др.);

способность воспринимать новую информацию и технологические процессы ее переработки без крупной перестройки структуры и изменения функций действующих звеньев.

В организационном плане создание распределенных БД представляет длительный процесс последовательного ввода в действие отдельных ее составных частей. Как по функциям, так и по центрам, очередность включения в систему новых центров данных зависит от реальных условий, сложившихся в региональных учреждениях (наличия опыта работы в области автоматизации и квалифицированных кадров, технической оснащенности, объема и важности запросов).

Для создания такого режима работы необходим правильный выбор протоколов, используемых в телекоммуникационных сетях, выработка стратегии распределения информации в сети, создание справочной службы и соответствующей инфраструктуры сети.

Целью создания распределенных БД является наиболее полное и эффективное обеспечение данными для принятия решений при наименьших затратах труда и материально - технических ресурсов [3]. Для этого необходимо:

обеспечить своевременное и полное поступление качественных данных;

создать распределенные базы данных и метаданных;

разработать средства доступа к данным.

Важнейшими вопросами построения распределенных БД являются методы тиражирования БД между центрами, реализация связей между ними, разработка типовых проектных решений, создание основных блоков со стандартными методами поиска, кодификаторами, форматами хранения данных.

В последние годы появились новые требования к сбору и пополнению БД, оптимальному распределению данных по регионам с целью уменьшения времени отклика, издержек на передачу данных, затрат на хранение, увеличение скорости поиска данных, улучшения работы с метаданными, разработки эффективного выполнения операций по обращению к распределенным данным. Трудно перейти к этапу автоматизации на основе распределенных данных одновременно всем. Элементы централизованной обработки будут существовать еще какое-то время. Только после того как распределенные БД заработают как единый механизм и не в экспериментальном, а в промышленном режиме, произойдет отмирание отдельных функций централизованной обработки данных. Но пока это приводит к дублированию работ по занесению некоторых данных на носителях, различными структурами хранения данных и др. Если устранение различий в структурах данных и используемых СУБД достигается очень большой ценой - полной реконструкцией существующих БД, то лучше разрабатывать программы - конверторы.

Распределенные БД создаются на основе существующих средств регистрации, связи, вычислительной техники и программно-информационных средств. С помощью распределенных БД создается единый технологический процесс сбора, первичной обработки, хранения, статистической обработки, обмена, доведения и использования информации. Они проектируются для выполнения задач двух типов - научных, связанных с накоплением максимально полных БД; производственных, которые сводятся к информационному обеспечению поддержки решений на объектах экономики.

В распределенных БД централизованно хранятся метаданные верхнего уровня (сведения о БД, предоставляемых в общее пользование и по специальному режиму). Исходные данные распределяются среди центров данных, удаленных географически на многие тысячи километров, но связанных коммуникационными линиями. Каждый центр имеет свою собственную базу данных, кроме того, он может обращаться к данным, хранящимся в других центрах. Каждый пользователь обращается в распределенную БД на своем уровне обслуживания, а получает информацию с любого уровня в зависимости от его статуса.

Позволяя каждому центру поддерживать свою собственную БД, получаем быстрый и эффективный доступ к наиболее часто используемым данным. Распределенная БД повышает надежность системы. Если компьютер одного центра выходит из строя, то остальная сеть продолжает работать. Это достигается за счет дублирования данных в разных центрах.

Решающим фактором, определяющим организационную структуру распределенных БД, особенно на начальном этапе создания системы, является отражение в ней сложившейся структуры сбора, обработки и обеспечения пользователей информацией. Центр данных эксплуатирует распределенные БД, взаимодействуя с различными системами в зависимости от уровня управления экономикой (на локальном, региональном, национальном или международном уровнях).

Особенности данного этапа:

Практически все современные СУБД обеспечивают поддержку полной реляционной модели, а именно:

структурной целостности - допустимыми являются только данные, представленные в виде отношений реляционной модели;

языковой целостности, то есть языков манипулирования данными высокого уровня (в основном SQL);

ссылочной целостности, контроля за, соблюдением ссылочной целостности в течение всего времени функционирования системы, и гарантий не возможности со стороны СУБД нарушить эти ограничения,

Большинство современных СУБД рассчитаны на многоплатформенную архитектуру, то есть они могут работать на компьютерах с разной архитектурой и под разными операционными системами, при этом для пользователей доступ к данным, управляемым СУБД на разных платформах, практически неразличим,

Необходимость поддержки многопользовательской работы с базой данных и возможность децентрализованного хранения данных потребовали развития средств администрирования БД с реализацией общей концепции средств защиты данных.

Потребность в новых реализациях вызвала создание серьезных теоретических трудов по оптимизации реализаций распределенных БД и работе с распределенными транзакциями и запросами с внедрением полученных результатов в коммерческие СУБД.

Для того чтобы не потерять клиентов, которые ранее работали на настольных СУБД, практически вес современные СУБД имеют средства подключения клиентских приложений, разработанных с использованием настольных СУБД, и средства экспорта данных из форматов настольных СУБД предыдущего этапа развития.

К этому этапу можно отнести разработку ряда стандартов в рамках языков описания и манипулирования данными (SQL89, SQL92, SQL99) и технологий по обмену данными между различными СУБД, к которым можно отнести и протокол ODBC (Open DataBase Connectivity), предложенный фирмой Microsoft. Представителями СУБД, можно считать MS Access 97 и все современные серверы баз данных Огас1е7.3, 0гас1е 8.4, MS SQL 6.5, MS SQL 7.0, System 10, System 11, Informix, DB2, SQL Base и другие современные серверы баз данных, которых в настоящий момент насчитывается несколько десятков.

2.3 Перспективы развития систем управления базами данных

Этот этап характеризуется появлением новой технологии доступа к данным - интранет. Основное отличие этого подхода от технологии клиент-сервер состоит в том, что отпадает необходимость использования специализированного клиентского программного обеспечения. Для работы с удаленной базой данных используется стандартный браузер Internet, например Microsoft Internet Explorer или Netscape Navigator, и для конечного пользователя процесс обращения к данным происходит аналогично скольжению по Всемирной Паутине. При этом встроенный в загружаемые пользователем HTML-страницы код, написанный обычно на языках Java, Java-script, Perl и других, отслеживает все действия пользователя и транслирует их в низкоуровневые SQL-запросы к базе данных, выполняя, таким образом, ту работу, которой в технологии клиент-сервер занимается клиентская программа. Удобство данного подхода привело к тому, что он стал использоваться не только для удаленного доступа к базам данных, но и для пользователей локальной сети предприятия. Простые задачи обработки данных, не связанные со сложными алгоритмами, требующими согласованного изменения данных во многих взаимосвязанных объектах, достаточно просто и эффективно могут быть построены по данной архитектуре. В этом случае для подключения нового пользователя к возможности использовать данную задачу не требуется установка дополнительного клиентского программного обеспечения. Однако алгоритмически сложные задачи рекомендуется реализовывать в архитектуре «клиент-сервер» с разработкой специального клиентского программного обеспечения.

У каждого из вышеперечисленных подходов к работе с данными есть свои достоинства и свои недостатки, которые и определяют область применения того или иного метода, и в настоящее время все подходы широко используются.

Заключение

Мы рассмотрели развитие технологии баз данных, начиная от первых методов обращения к файлам, и последовательно обсудили основные подходы к обработке данных. В первые годы развития работы с данными, в пятидесятых - начале шестидесятых, последовательный доступ к файлам был правилом. Все данные хранились в файлах последовательного доступа, что заставляло прикладную программу обрабатывать файл целиком. В шестидесятые, когда широко распространились диски с прямым доступом, приобрели популярность файлы произвольного доступа. Этот метод доступа позволяет напрямую обращаться к нужной записи.

По мере того, как компьютерные системы обработки данных приобретали все большее значение, бизнесмены начали понимать, что информация является чрезвычайно ценным корпоративным ресурсом. Они все более ясно осознавали, что данные, необходимые для ответов на многие рабочие вопросы, содержатся в их файлах. Как следствие, они начали требовать создания информационно-управляющих систем, которые использовали бы возможности компьютера для извлечения информации из корпоративных данных. Таким образом, понадобилось создание информационных систем, использующих базы данных, которые обеспечивали бы более эффективный доступ и обработку данных.

В середине шестидесятых появились первые системы управления базами данных, имевшие иерархическую структуру. Эти системы обеспечивали извлечение нескольких записей, связанных с одной записью из другого файла. Спустя короткое время, были разработаны сетевые базы данных, которые поддерживали значительно более сложные отношения между записями из разных файлов. И иерархическая, и сетевая модели требовали использования для связывания данных предопределенных физических указателей.

В 1970 году статья Е.Ф.Кодда о реляционной модели данных произвела революцию в подходе к обработке данных. Кодд призывал обращаться к данным и обрабатывать их только в терминах их логических характеристик. В семидесятые - восьмидесятые годы были разработаны различные реляционные системы, и в настоящее время они лидируют на рынке коммерческих систем. Менее двух десятков лет прошло с этого момента, но стремительное развитие вычислительной техники, изменение ее принципиальной роли в жизни общества, обрушившийся бум персональных ЭВМ и, наконец, появление мощных рабочих станций и сетей ЭВМ повлияло также и на развитие технологии баз данных. Однако необходимо заметить, что все же нет жестких временных ограничений в этих этапах: они плавно переходят один в другой и даже сосуществуют параллельно.

В последние годы в связи с широким распространением недорогих персональных компьютеров были разработаны сетевые методы, позволяющие пользователям совместно использовать ресурсы. Сервер сети обеспечивает доступ к базе данных пользователей персональных компьютеров, что является эффективным разделением труда: сервер извлекает данные, которые клиентская машина обрабатывает и выдает конечному пользователю. Сети, организованные по принципу клиент/сервер, достигли высокого уровня развития, и все более широко распространяются в бизнесе.

На концептуальном уровне информационная система большой организации состоит из оборудования, программного обеспечения, данных и людей. Оборудование включает в себя один или несколько компьютеров, дисководы, терминалы, принтеры, магнитофоны, сетевые соединения и другие физические устройства. Программное обеспечение состоит из СУБД и прикладных программ, которые используют средства СУБД для обращения к данным и их обработки. Данные, представляющие собой записанные факты, важные для организации, физически хранятся на диске; при этом они логически структурированы, что делает доступ к ним простым и эффективным. Люди, как пользователи, так и обслуживающий персонал, совместно работают, определяя характеристики и структуру информационной системы, использующей базы данных и создавая прикладные программы, обеспечивающие информацию, необходимую для успеха компании.

Сегодня деятельность как крупных, так и малых предприятий невозможно представить без использования баз данных, которые составляют фундамент любой информационной системы.

Библиографический список

1. Бойко В.В., Савинков В.М. Проектирование баз данных информационных систем. - М.: Финансы и статистика, 2000

2. Базы данных. Проектирование, реализация, сопровождение. Теория и практика, 2-е изд.: Пер. с англ. Томас Коннолли, Каролина Бегг, Анна Страчан, - М.: Издат.дом. «Вильямс», 2000

3. А. Рубен, А. Горев, С. Макшарипов, Эффективная работа с СУБД - СПб.: Питер, 2001

4. Карпова Т.С. Базы данных: модели, разработка, реализация. - СПб.:Питер, 2001

5. Бойко В.В., Савинков В.М. Проектирование баз данных информационных систем. - М.: Финансы и статистика, 1989

Размещено на Allbest.ru

...

Подобные документы

  • Особенности управления информацией в экономике. Понятие и функции системы управления базами данных, использование стандартного реляционного языка запросов. Средства организации баз данных и работа с ними. Системы управления базами данных в экономике.

    контрольная работа [19,9 K], добавлен 16.11.2010

  • Предпосылки появления и история эволюции баз данных (БД и СУБД). Основные типы развития систем управления базами данных. Особенности и черты Access. Создание и ввод данных в ячейки таблицы. Сортировка и фильтрация. Запрос на выборку, основные связи.

    презентация [1,2 M], добавлен 01.12.2015

  • История создания, понятие, типы и функции системы управления базами данных. Изучение технологии копирования данных средствами устройства их хранения. Процесс разработки алгоритма и программы для нахождения максимального элемента массива А в массиве В.

    отчет по практике [360,4 K], добавлен 08.02.2014

  • История создания и развития информационно-правовых и справочно-правовых систем. Первым разработчиком коммерческой правовой базы данных стало агентство INTRALEX. "Консультант", "Гарант", "Кодекс". Разработка систем управления базами данных в MS Access.

    реферат [636,7 K], добавлен 28.06.2008

  • Тенденция развития систем управления базами данных. Иерархические и сетевые модели СУБД. Основные требования к распределенной базе данных. Обработка распределенных запросов, межоперабельность. Технология тиражирования данных и многозвенная архитектура.

    реферат [118,3 K], добавлен 29.11.2010

  • Логическая организация данных, файловая модель. Сетевые, иерархические и реляционные модели данных. Системы управления базами данных, их определения и основные понятия. История, тенденции развития, классификация СУБД, свойства и технология использования.

    дипломная работа [51,3 K], добавлен 26.07.2009

  • Классификации баз данных по характеру сберегаемой информации, способу хранения данных и структуре их организации. Современные системы управления базами данных и программы для их создания: Microsoft Office Access, Cronos Plus, Base Editor, My SQL.

    презентация [244,3 K], добавлен 03.06.2014

  • Термины "логический" и "физический" как отражение различия аспектов представления данных. Методы доступа к записям в файлах. Структура систем управления базами данных. Отличительные особенности обработки данных, характерные для файловых систем и СУБД.

    лекция [169,7 K], добавлен 19.08.2013

  • Система управления базами данных как составная часть автоматизированного банка данных. Структура и функции системы управления базами данных. Классификация СУБД по способу доступа к базе данных. Язык SQL в системах управления базами данных, СУБД Microsoft.

    реферат [46,4 K], добавлен 01.11.2009

  • Формы представляемой информации. Основные типы используемой модели данных. Уровни информационных процессов. Поиск информации и поиск данных. Сетевое хранилище данных. Проблемы разработки и сопровождения хранилищ данных. Технологии обработки данных.

    лекция [15,5 K], добавлен 19.08.2013

  • Характеристика категорий современных баз данных. Исследование особенностей централизованных и распределенных баз данных. Классификация систем управления базами данных по видам программ и применению. Управление буферами оперативной памяти и транзакциями.

    курсовая работа [45,2 K], добавлен 10.03.2016

  • Современные информационные технологии обработки данных, автоматизированного офиса и баз данных, сетевые интернет-технологии. Работа с системой управления базами данных (СУБД) MS Access, связанными списками MS Excel, текстовым редактором MS Word.

    методичка [5,6 M], добавлен 01.07.2014

  • Основные классифицирующие признаки системы управления базами данных. Модель данных, вид программы и характер ее использования. Средства программирования для профессиональных разработчиков. Организация центров обработки данных в компьютерных сетях.

    презентация [6,8 K], добавлен 14.10.2013

  • Алгоритмы обработки массивов данных. Система управления базами данных. Реляционная модель данных. Представление информации в виде таблицы. Система управления базами данных реляционного типа. Графический многооконный интерфейс.

    контрольная работа [2,8 M], добавлен 07.01.2007

  • История развития и основные направления использования вычислительной техники как в России, так и за рубежом. Понятие, особенности и развитие операционной системы. Содержание и структура файловой системы. Системы управления базами данных и их применение.

    контрольная работа [81,4 K], добавлен 06.04.2011

  • Основные понятия базы данных и систем управления базами данных. Типы данных, с которыми работают базы Microsoft Access. Классификация СУБД и их основные характеристики. Постреляционные базы данных. Тенденции в мире современных информационных систем.

    курсовая работа [46,7 K], добавлен 28.01.2014

  • Краткая характеристика, главные преимущества и область применения MS Access. Базы данных и системы управления базами данных. Описание пошагового создания базы данных, таблиц, форм, запроса и отчета. Особенности и функциональные возможности MS Access.

    курсовая работа [3,4 M], добавлен 23.09.2010

  • История создания компьютерных информационных систем. Развитие системы управления базой данных. Принципы и правила построения и функционирования распределённых баз данных (РБД). Проблемы и особенности РБД. Использование Internet/Intranet технологий.

    курсовая работа [1,1 M], добавлен 06.02.2011

  • Основные функции системы управления базами данных. Комплекс программных и лингвистических средств общего или специального назначения. Условия принятой технологии обработки данных. Управление буферами оперативной памяти. Журнализация и её значение.

    курсовая работа [1,2 M], добавлен 19.01.2012

  • Хранение и обработка данных. Компоненты системы баз данных. Физическая структура данных. Создание таблиц в MS Access. Загрузка данных, запросы к базе данных. Разработка информационной системы с применением системы управления базами данных MS Access.

    курсовая работа [694,0 K], добавлен 17.12.2016

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.