Управление распределенной информацией
Анализ основных принципов распределенной обработки информации. Рассмотрение понятия распределенных баз данных и систем управления, их свойств и возможностей. Описание тенденции развития управления данной информацией и выявление области применения.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 03.12.2013 |
Размер файла | 390,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Курсовая работа
Управление распределенной информацией
2012
Список сокращений
AS - Application Server, сервер приложений.
DBS - DataBase Server, сервер баз данных.
DDB, РБД - Distributed DataBase, Распределенная База Данных.
DDBMS, РСУБД - Distributed Database Management System, Распределенная Система Управления Базами Данных.
ISO - International Standardization Organization
IPC - Inter-Process Communication, межпроцессное взаимодействие.
ODBC - Open DataBase Connectivity.
RDA - Remote Data Access, удаленный доступ к данным.
Содержание
Введение
1. Распределенная обработка данных
1.1 Понятие распределенной обработки
1.2 Цели распределенной обработки данных
1.3 Прозрачность
2. Модель "клиент-сервер"
3. Распределенные базы данных
3.1 Свойства идеальной распределенной базы данных
4. Системы управления распределенной базой данных (РСУБД)
4.1 Функциональные возможности РСУБД
4.2 Типы РСУБД
4.3 Проблемы РСУБД
5. Тенденции развития распределенных систем
6. Применение распределенной базы данных
Заключение
Список источников
Введение
В наше время в области развития коммуникаций были достигнуты значительные результаты (всевозможные мосты, шлюзы, коммуникационное оборудование, протоколы), но проблема "раздробленности" самой информации все еще остается нерешенной. Становление и развитие технологий и моделей управления распределенными информационными ресурсами - вот ключ к наведению мостов между существующими в настоящее время "информационными островами".
Цель работы - анализ управления распределенной информацией и его перспектив.
Объект исследования - управление распределенной информацией.
Предмет исследования - принципы управления распределенной информацией, характеристики распределенных систем баз данных, однородные и неоднородные распределенные системы, проблемы управления распределенной информацией.
Задачи исследования вытекают из поставленной цели:
· проанализировать принципы распределенной обработки информации;
· рассмотреть понятие распределенных баз данных (РБД) и систем управления РБД, их свойства и возможности;
· описать тенденции развития управления распределенной информацией;
· выявить области применения РБД.
1. Распределенная обработка данных
1.1 Понятие распределенной обработки
Термин "распределенная обработка" означает, что разные машины можно соединить в коммуникационную сеть так, что одна задача обработки данных распределяется между несколькими машинами в сети. Термин "параллельная обработка" используется практически с тем же значением, за исключением того, что разные машины с физической точки зрения расположены близко друг к другу в "параллельных" системах. Это вовсе не обязательно в "распределенной" системе, например, они могут быть удалены географически. Связь между различными машинами осуществляется с помощью специального программного обеспечения для управления сетью. Распределенная обработка может быть самой разнообразной и осуществляться на разных уровнях. В одном из простых случаев запускается сервер СУБД на одной машине и клиентское приложение на другой [1].
Распределенная обработка данных, таким образом, представляет собой программу, выполнение которой осуществляется несколькими системами, объединенными в сеть. Как правило, расчетная часть программы выполняется на мощном процессоре, а визуальное отображение выводится на рабочей станции с улучшенной эргономичностью. Разделение опирается на модель "клиент-сервер", которая будет описана ниже.
Распределенная система позволяет скрыть от пользователя аспекты своей внутренней организации, физические места размещения ресурсов, вопросы реализации и взаимодействия процессов, обслуживающих запросы пользователя. Она способна увеличиваться в масштабах путем подключения к системе дополнительных компонентов без принципиального влияния на работу существующих приложений и пользователей.
1.2 Цели распределенной обработки данных
Целью распределенной обработки данных является оптимизация использования ресурсов и упрощение работы пользователя.
1) Оптимизация использования ресурсов.
Термин ресурс, в данном случае используется в самом широком смысле: мощность обработки (процессоры), емкость накопителей (память или диски), графические возможности (2-х или 3-х мерный графический процессор, в сочетании с растровым дисплеем и общей памятью), периферийные устройства вывода на бумажный носитель (принтеры, плоттеры). Эти ресурсы редко бывают собраны на одной машине. Отсюда принцип совместной работы различных систем, используя лучшие качества каждой из них, причем пользователь имеет их в распоряжении при выполнении только одной программы.
2) Упрощение работы пользователя.
Действительно, распределенная обработка данных позволяет:
· повысить эффективность посредством распределения данных и видов обработки между машинами, способными наилучшим образом управлять ими;
· предложить новые возможности, вытекающие из повышения эффективности;
· повысить удобство пользования. Пользователю более нет необходимости разбираться в различных системах и осуществлять перенос файлов.
Основные недостатки этого подхода заключаются в следующем:
· зависимость от характеристик и доступности сети. Программа не сможет работать, если сеть повреждена. Если сеть перегружена, эффективность уменьшается, а время реакции систем увеличивается;
· проблемы безопасности. При использовании нескольких систем увеличивается риск, так как появляется зависимость от наименее надежной машины сети.
C другой стороны, преимущества весьма ощутимы:
· распределение и оптимизация использования ресурсов. Это основная причина внедрения распределенной обработки данных;
· новые функциональные возможности и повышение эффективности при решении задач;
· гибкость и доступность. В случае поломки одной из машин, ее пытаются заменить другой, способной выполнять те же функции [2].
1.3 Прозрачность
Одним из основных свойств распределенных систем является прозрачность. Прозрачностью называется возможность доступа к ресурсам или услугам, не зная их местонахождения. С точки зрения прикладного программирования, речь идет о возможности использования одинаковых примитивов доступа, независимо от местонахождения службы или необходимого ресурса. У пользователя имеется только один прикладной интерфейс, и он видит перед собой только один компьютер. С более концептуальной точки зрения, прозрачность определяется как возможность видеть систему как единый организм, а не как собрание независимых друг от друга объектов.
В "Эталонной модели распределенной обработки информации в открытой системе" Международной организации по стандартизации ISO определены восемь "типов прозрачности", обеспечиваемых в распределенной системе, а именно:
1) Прозрачность доступа (access transparency) скрывает от пользователя детали реализации сетевых протоколов, обеспечивающих связь между удаленными компьютерами. Кроме того, она также предоставляет универсальные средства доступа к данным, хранимым в различных форматах по всей системе;
2) Прозрачность местоположения (location transparency) основана на прозрачности доступа и предназначена для сокрытия физического местоположения ресурсов в распределенной системе от клиента, желающего ими воспользоваться. Распределенная система, в которой реализована прозрачность местоположения, предоставляет доступ к удаленным файлам так, как если бы они являлись локальными;
3) Прозрачность сбоев (failure transparency) представляет собой метод обеспечения отказоустойчивости в распределенных системах. В случае выхода из строя какого-то ресурса либо компьютера сети пользователи сети могут заметить лишь некоторое снижение быстродействия. Прозрачность сбоев обычно реализуется путем репликации (replication) ресурсов либо создания контрольных точек восстановления. При применении репликации система обеспечивает дублирование ресурсов, выполняющих одни и те же функции. Даже если из строя выйдут все копии, кроме одной, распределенная система продолжит свое функционирование. Система, в которой используются контрольные точки, периодически выполняет сохранение информации о состоянии объектов (например, процессов), по которым они могут быть восстановлены, если сбой в распределенной системе приведет к потере этих объектов;
4) Прозрачность репликации (replication transparency) позволяет скрыть от пользователя факт существования нескольких копий того или иного ресурса, доступного в системе. В такой системе доступ к группе реплицированных ресурсов осуществляется аналогично тому, как если бы доступным являлся один-единственный ресурс;
5) Прозрачность постоянства (persistence transparency) скрывает от пользователя информацию о месте хранения ресурса (будь то ОЗУ или дисковый накопитель);
6) Прозрачность транзакций (transaction transparency) позволяет системе добиваться непротиворечивости, скрывая выполнение согласования в группе ресурсов. Транзакции включают запросы к службам (например, доступ к файлам и вызов функций), позволяющие менять состояние системы. Следовательно, транзакции часто требуют создания контрольных точек либо выполнения репликации в целях обеспечения реализации других задач в распределенных системах. Прозрачность транзакций позволяет скрывать от пользователя детали реализации этих служб;
7) Прозрачность миграции (migration transparency);
8) Прозрачность изменения местоположения (relocation transparency).
Прозрачность миграции и прозрачность изменения местоположения скрывают от пользователя все перемещения компонентов системы. Прозрачность миграции маскирует перемещения объекта с одного места в другое в распределенной системе, например, перемещение файла с одного сервера на другой. Прозрачность изменения местоположения маскирует перемещения одного объекта по отношению к другим объектам, с которыми он поддерживает связь [3].
2. Модель "клиент-сервер"
Клиентом называется объект, запрашивающий доступ к службе или ресурсу. Сервер - это объект несущий службу или обладающий ресурсом.
Простейшая схема модели "клиент - сервер" показана на рисунке 1.
Рисунок 1. Модель "клиент-сервер"
Существует, по меньшей мере, три модели "клиент-сервер":
· Модель доступа к удаленным данным (RDA-модель);
· Модель сервера базы данных (DBS-модель);
· Модель сервера приложений (AS-модель).
Первые две являются двухзвенными и не могут рассматриваться в качестве базовой модели распределенной системы. Трехзвенная модель хороша тем, что в ней интерфейс с пользователем полностью независим от компонента обработки данных. Собственно, трехзвенной ее можно считать постольку, поскольку явно выделены:
· компонент интерфейса с пользователем;
· компонент управления данными (и базами данных в том числе),
а между ними расположено программное обеспечение промежуточного слоя (middleware), выполняющее функции управления транзакциями и коммуникациями, транспортировки запросов, управления именами и множество других. Middleware - это главный компонент распределенных систем и, в частности, DDB-систем.
В случае трехзвенной схемы клиент явно запрашивает один из сервисов (предоставляемых прикладным компонентом), передавая ему некоторое сообщение и получает ответ также в виде сообщения. Клиент направляет запрос в информационную шину, ничего не зная о месте расположения сервиса. Имеет место так называемый function shipping (то есть "поставка функций" клиенту). Важно, что для клиента база данных (в том числе и DDB) закрыта слоем сервисов. Более того, он вообще ничего не знает о ее существовании, так как все операции над базой данных выполняются внутри сервисов.
Недостатки модели "клиент-сервер":
· Неработоспособность сервера может сделать неработоспособной всю вычислительную сеть. Неработоспособным сервером следует считать сервер, производительности которого не хватает на обслуживание всех клиентов, а также сервер, находящийся на ремонте, профилактике и т. п.
· Поддержка работы данной системы требует отдельного специалиста -- системного администратора;
· Высокая стоимость оборудования.
3. Распределенные базы данных
Распределенная база данных (РБД) - это совокупность логически взаимосвязанных баз данных, распределенных в компьютерной сети. Система управления распределенной базой данных - это программная система, которая обеспечивает управление распределенной базой данных и прозрачность ее для пользователей.
Различается целый спектр степеней прозрачности - от единой модели базы данных, охватывающей всю предметную область системы со всеми приложениями, которые работают с этой глобальной моделью данных, до распределения, управляемого на основе архитектур клиент-сервер и аппаратного кодирования информации о местоположении данных средствами сервера данных.
Термин "распределенная база данных" - один из наиболее перегруженных в компьютерной лексике. В самом простом понимании этот термин может обозначать некоторое приложение, выполняющееся в одной компьютерной системе и осуществляющее в различные моменты времени доступ к данным нескольких различных удаленных баз данных.
Еще один возможный взгляд на РБД - как на грандиозную конфигурацию мультибаз данных, которая объединяет базы данных, поддерживающие любые модели (унаследованные иерархические и сетевые, а также реляционные и новейшие объектно-ориентированные базы данных) в рамках единой глобальной схемы. Подобная конфигурация должна обеспечивать для всех приложений прозрачный доступ к любым данным независимо от их местоположения и формата.
РБД можно также рассматривать как конфигурацию, где клиентские приложения, выполняющиеся на настольных компьютерах (ПК или рабочих станциях), обращаются к данным из множества баз данных посредством стандартизованного программного обеспечения промежуточного слоя (middleware), такого, как ODBC (Open DataBase Connectivity, API компании Microsoft). Такие РБД функционируют на основе интерфейса удаленного вызова процедур, и не производят самих операций доступа и манипулирования удаленными данными.
Общая схема типичной распределенной базы данных представлена на рисунке 2.
Рисунок 2. РБД
3.1 Свойства идеальной распределенной базы данных
Кристофер Дейт установил 12 свойств идеальной РБД:
· Локальная автономия (local autonomy);
· Независимость узлов (no reliance on central site);
· Непрерывные операции (continuous operation);
· Прозрачность расположения (location independence);
· Прозрачная фрагментация (fragmentation independence);
· Прозрачное тиражирование (replication independence);
· Обработка распределенных запросов (distributed query processing);
· Обработка распределенных транзакций (distributed transaction processing);
· Независимость от оборудования (hardware independence);
· Независимость от операционных систем (operationg system independence);
· Прозрачность сети (network independence);
· Независимость от баз данных (database independence).
Локальная автономия
Это качество означает, что управление данными на каждом из узлов распределенной системы выполняется локально. База данных, расположенная на одном из узлов, является неотъемлемым компонентом распределенной системы. Будучи фрагментом общего пространства данных, она, в то же время функционирует как полноценная локальная база данных; управление ею выполняется локально и независимо от других узлов системы.
Независимость от центрального узла
В идеальной системе все узлы равноправны и независимы, а расположенные на них базы являются равноправными поставщиками данных в общее пространство данных. База данных на каждом из узлов самодостаточна - она включает полный собственный словарь данных и полностью защищена от несанкционированного доступа.
Непрерывные операции
Это качество можно трактовать как возможность непрерывного доступа к данным в рамках DDB вне зависимости от их расположения и вне зависимости от операций, выполняемых на локальных узлах. Это качество можно выразить лозунгом "данные доступны всегда, а операции над ними выполняются непрерывно".
Прозрачность расположения
Это свойство означает полную прозрачность расположения данных. Пользователь, обращающийся к DDB, ничего не должен знать о реальном, физическом размещении данных в узлах информационной системы. Все операции над данными выполняются без учета их местонахождения. Транспортировка запросов к базам данных осуществляется встроенными системными средствами.
Прозрачная фрагментация
Это свойство трактуется как возможность распределенного (то есть на различных узлах) размещения данных, логически представляющих собой единое целое. Существует фрагментация двух типов: горизонтальная и вертикальная. Первая означает хранение строк одной таблицы на различных узлах (фактически, хранение строк одной логической таблицы в нескольких идентичных физических таблицах на различных узлах). Вторая означает распределение столбцов логической таблицы по нескольким узлам.
Прозрачность тиражирования
Тиражирование данных - это асинхронный (в общем случае) процесс переноса изменений объектов исходной базы данных в базы, расположенные на других узлах распределенной системы. В данном контексте прозрачность тиражирования означает возможность переноса изменений между базами данных средствами, невидимыми пользователю распределенной системы. Данное свойство означает, что тиражирование возможно и достигается внутрисистемными средствами.
Обработка распределенных запросов
Это свойство DDB трактуется как возможность выполнения операций выборки над распределенной базой данных, сформулированных в рамках обычного запроса на языке SQL. То есть операцию выборки из DDB можно сформулировать с помощью тех же языковых средств, что и операцию над локальной базой данных.
Обработка распределенных транзакций
Это качество DDB можно трактовать как возможность выполнения операций обновления распределенной базы данных, не разрушающее целостность и согласованность данных. Эта цель достигается применением двухфазного протокола фиксации транзакций (two-phase commit protocol), ставшего фактическим стандартом обработки распределенных транзакций. Его применение гарантирует согласованное изменение данных на нескольких узлах в рамках распределенной (или, как ее еще называют, глобальной) транзакции.
Независимость от оборудования
Это свойство означает, что в качестве узлов распределенной системы могут выступать компьютеры любых моделей и производителей - от мэйнфреймов до "персоналок".
Независимость от операционных систем
Это качество вытекает из предыдущего и означает многообразие операционных систем, управляющих узлами распределенной системы.
Прозрачность сети
Доступ к любым базам данных может осуществляться по сети. Спектр поддерживаемых конкретной СУБД сетевых протоколов не должен быть ограничением системы с распределенными базами данных. Данное качество формулируется максимально широко - в распределенной системе возможны любые сетевые протоколы.
Независимость от баз данных
Это качество означает, что в распределенной системе могут мирно сосуществовать СУБД различных производителей, и возможны операции поиска и обновления в базах данных различных моделей и форматов.
Исходя из определения Дэйта, можно рассматривать DDB как слабосвязанную сетевую структуру, узлы которой представляют собой локальные базы данных. Локальные базы данных автономны, независимы и самоопределены; доступ к ним обеспечиваются СУБД, в общем случае от различных поставщиков. Связи между узлами - это потоки тиражируемых данных. Топология DDB варьируется в широком диапазоне - возможны варианты иерархии, структур типа "звезда" и т.д. В целом топология DDB определяется географией информационной системы и направленностью потоков тиражирования данных [4].
4. Системы управления распределенной базой данных (РСУБД)
распределенный информация управление база
Доступ пользователей к распределенной базе данных и администрирование осуществляется с помощью системы управления распределенной базой данных.
Распределенная СУБД (DDBMS) -- это совокупность программ, предназначенных для управления распределенной базой данных таким образом, чтобы ее распределенность была прозрачна для пользователей. Основная задача распределенной СУБД состоит в обеспечении средств интеграции локальных баз данных, располагающихся в различных узлах компьютерной сети, чтобы пользователь работал со всеми локальными базами как с единой базой данных.
4.1 Функциональные возможности РСУБД
Чтобы считаться распределенной, СУБД должна обладать следующими функциональными возможностями:
· прикладной интерфейс, обеспечивающий взаимодействие с конечным пользователем или прикладными программами, а также с другими СУБД в рамках РБД;
· проверка достоверности при анализе запросов;
· преобразования для выяснения, какие компоненты запроса являются распределенными, а какие локальными;
· оптимизация запроса, гарантирующая выявление лучшей стратегии доступа;
· отображение, позволяющее определить местоположение данных в локальных и удаленных фрагментах;
· интерфейс ввода/вывода, обеспечивающий считывание/запись данных в постоянном месте хранения;
· форматирование, подготавливающее данные для представления их конечному пользователю или для передачи в прикладные программы;
· безопасность;
· резервное копирование, которое гарантирует доступность и восстанавливаемость базы данных в случае аварии;
· управление параллельным вычислением, обеспечивающее одновременный доступ к данным и гарантирующее целостность данных во всех фрагментах базы данных в данной РСУБД;
· управление транзакциями, обеспечивающее переход данных из одного устойчивого состояния в другое.
4.2 Типы РСУБД
Распределенные системы чаще всего классифицируют по двум признакам: по степени однородности и степени автономности. По степени однородности распределенные базы данных классифицируют на гомогенные (однородные) и гетерогенные (неоднородные).
Гомогенная распределенная система баз данных -- это такая система, в которой каждый узел имеет СУБД одного и того же типа. Гетерогенная распределенная система баз данных -- это система, объединяющая несколько различных типов баз данных.
Гетерогенные системы обычно возникают в тех случаях, когда узлы, уже эксплуатирующие свои собственные системы с базами данных, со временем интегрируются в распределенную систему.
По степени автономности РБД классифицируют на базы данных с полным отсутствием локальной автономности и федеративные.
Распределенная СУБД с полным отсутствием локальной автономности имеет единую концептуальную схему данных, единый центр обработки запросов и транзакций, где части единой базы данных распределены по разным компьютерам.
Распределенная СУБД, которая хоть и имеет некоторую общую схему данных, но составлена из полностью автономных СУБД, называется федеративной. Федеративная СУБД может быть составлена из СУБД, поддерживающих различные модели данных, типы, ограничения и языки манипулирования данными [5].
4.3 Проблемы РСУБД
Рассмотрим теперь проблемы реальных распределенных баз данных. Проблемы централизованных СУБД существуют и в распределенных базах данных, однако децентрализация добавляет новые:
а) Какова общая модель данных распределенной системы? Мы должны иметь единую концептуальную схему всей сети. Это обеспечит логическую прозрачность данных для пользователя, в результате чего он сможет формировать запрос ко всей базе, находясь за отдельным терминалом (т. е. как бы работая с централизованной базой данных).
б) Необходима схема, определяющая местонахождение данных в сети. Это обеспечит прозрачность размещения данных, благодаря которой пользователь может не указывать, куда переслать запрос, чтобы получить требуемые данные.
в) Распределенные базы данных могут быть однородными или неоднородными по аппаратным и программным средствам. Проблему неоднородности сравнительно легко решить, если распределенная база является неоднородной по аппаратным средствам, но однородной по программным средствам (одинаковые СУБД в узлах). Если же в узлах распределенной системы используются разные СУБД, необходимы средства преобразования структур данных и языков. Это должно обеспечить прозрачность преобразования в узлах распределенной базы данных.
г) Управление словарями. Для обеспечения всех видов прозрачности в распределенной базе данных нужны программы, управляющие многочисленными справочниками или словарями.
д) Методы выполнения запросов в распределенной базе данных отличаются от аналогичных методов централизованных СУБД, так как отдельные части запроса нужно выполнять в месторасположении соответствующих данных и передавать частичные результаты на другие узлы; при этом должна быть обеспечена координация всех процессов.
е) В распределенной базе данных нужен сложный механизм управления одновременной обработкой, который, в частности, должен обеспечивать синхронизацию при обновлениях информации, это гарантирует непротиворечивость данных.
ж) Развитая методология распределения и размещения данных, включая разбиение, является одним из основных требований к распределенной базе данных. База данных физически распределяется по узлам компьютерной информационной системы при помощи фрагментации и репликации (тиражирования) данных.
5. Тенденции развития распределенных систем
В основе любых технологических потрясений лежит простой экономический расчет: выгодно - невыгодно. В основе нынешней ситуации в развитии распределенных систем также лежит экономическое обоснование - стоимость передачи данных по сети становится меньше стоимости вычислений на клиентской машине и эта тенденция имеет устойчивый характер. Взрывной рост сети Internet, который многие связывают с "демократическими свободами" или развитием новой технологии, имеет в своей основе все то же простое экономическое обоснование - эта технология экономически выгодна. Отсюда проистекают и те изменения в мире технологий, свидетелями которых мы являемся: стремительный рост пропускной способности каналов, присутствие в сети большинства корпораций и масс-медиа, электронная коммерция и банки. На основе этих технологий выросли новые направления бизнеса, а распространенность сети Internet растет темпами, невиданными в отрасли (быстрее телефонии и телевидения).
Однако если присмотреться поближе к этой технологии, то в ней нет ничего революционного, за исключением того, как уже известные решения применены в новой области. Давно известны языки разметки (TeX), протоколы передачи данных (TCP) и удаленных сервисов (NSF, POP), распределенные транзакции (мониторы транзакций), платформопереносимые языки (С, Perl) и т.д.
Весь секрет новых решений в заложенной изначально совместимости, опирающейся на открытые стандарты. Именно поэтому основная битва идет вокруг стандартов, что бы ни декларировали "участники забега". Решения, основанные на стандарте, являются экономически выгодными, т.к. гарантируют возврат инвестиций, что бы ни происходило на рынке.
В то же время сама технология пока достаточно слаба, как и любая технология в начале своего пути. Требования к системным ресурсам не уменьшились. К сожалению, процесс создания и обслуживания распределенных баз данных связан с техническими трудностями, среди которых можно выделить жесткие требования к пропускной способности каналов связи, а также низкую производительность, обусловленную значительными затратами коммуникационных и вычислительных ресурсов при их синхронизации во время выполнения транзакций (особенно при интенсивных обращениях из разных узлов к одному фрагменту) [6].
Ожидается, что в ближайшее время будут функционировать десятки (а может быть и сотни) миллионов БД в различных областях. Из этого следует, что БД должны быть распределенными. Во-первых, это означает, что они должны быть полностью самоустанавливающимися и самоуправляемыми. Во-вторых, взаимодействие между БД должно быть автоматическим и высоконадежным. Но прежде всего это означает, что такая распределенная инфраструктура должна быть очень хорошо сбалансирована.
6. Применение распределенной базы данных
Уже давно возникли новые условия работы для БД: большие объемы информации возникают во многих местах (например, розничная торговля, полиграфическое и другие производства); источником большого количества данных мог быть и центр, но к этим данным требуется быстрый доступ с периферии (географически распределенное производство, работающее по одному графику). К тому же данные могут запрашиваться и центром, и удаленными потребителями в удаленных местах. Имеется большое количество данных, которые используются в срочных запросах, чаще всего местного характера.
Централизованные БД, особенно построенные на классическом подходе, не могли удовлетворить новым требованиям. Быстрое распространение сетей передачи данных, резкое увеличение объема внешней памяти ПК при ее удешевлении в последние годы способствовали широкому внедрению РБД.
К достоинствам РБД относятся:
1. соответствие структуры РБД структуре организаций;
2. гибкое взаимодействие локальных БД;
3. широкие возможности централизации узлов;
4. непосредственный доступ к информации, снижение стоимости передач (за счет уплотнения и концентрации данных);
5. высокие системные характеристики (малое время отклика за счет распараллеливания процессов, высокая надежность);
6. модульная реализация взаимодействия, расширения аппаратных средств, возможность использования объектно-ориентированного подхода в программировании;
7. возможность распределения файлов в соответствии с их активностью;
8. независимые разработки локальных БД через стандартный интерфейс.
Вместе с тем РБД обладают более сложной структурой, что вызывает появление дополнительных проблем (избыточность, несогласованность данных по времени, согласование процессов обновления и запросов, использования телекоммуникационных ресурсов, учет работы дополнительно подсоединенных локальных БД, стандартизация общего интерфейса) согласования работы элементов [7].
В настоящее время РБД используются при создании информационных ресурсов и построении информационных систем различного назначения с использованием Intranet/Internet технологий.
Использование Intranet/Internet технологий при создании информационных ресурсов и построении информационных систем в последнее время стало доминирующим в мировом информационном пространстве по следующим причинам. Эти технологии:
· Позволяют организовать с достаточной простотой для пользователя системы поиска нужной информации;
· Предъявляют минимальные требования, как с технической стороны, так и со стороны программного обеспечения к рабочему месту клиента (клиент работает со стандартным программным обеспечением и единственным требованием является поддержка работы браузера одной из последних версий);
· Поддерживают распределенные системы хранения информации и множественные методы ее хранения;
· Поддерживают работу с практически неограниченным объемом разноплановых данных (текст, графика, изображение, звук, видео, векторные карты и др.);
· Предоставляют технологически простой способ администрирования информационных систем с одного рабочего места;
· Поддерживают удаленные методы редактирования и пополнения информации [6].
Рассмотрим конкретный пример структуры информационной системы крупного коммерческого банка. Схема данной распределенной системы представлена на рисунке 3.
Рисунок 3. Структура информационной системы крупного московского коммерческого банка.
Разработчиками проекта была выбрана архитектура клиент/сервер с использованием монитора транзакций Tuxedo. Общее распределение вычислительной нагрузки следующее: сервер приложений занимается ответственными вычислительными задачами (быстрые транзакции, генерация отчетов, поддержка логической целостности базы данных, реализация алгоритмов обработки данных, баланс загрузки), а приложение на рабочей станции ориентировано на создание максимально дружественного интерфейса.
В соответствии с трехуровневой моделью организации логики приложения в обработке информации участвуют три программные подсистемы.
1. Сервер СУБД на компьютере-сервере.
2. Серверный программный комплекс (сервер приложений), функционирующий на компьютере-сервере. В общем случае этот сервер может не совпадать с сервером, на котором работает сервер СУБД. Серверный комплекс принимает и обрабатывает запросы клиентской программы. В такой схеме серверная программа берет на себя сложную обработку данных, а клиентская -- управляет пользовательским интерфейсом. Серверы приложений работают на Unix-компьютерах и связаны сетевым протоколом TCP/IP с клиентскими компьютерами, работающими под MS Windows.
Такая схема позволяет совместить высокую надежность и эффективность обработки данных, так как отвечающая за работу с данными серверная часть расположена на Unix-платформе с простым и привычным клиентским местом под управлением Windows.
3. Клиентский комплекс, работающий на рабочей станции. Программа-клиент оперирует объектами, например объектом лицевой счет. Обращения к СУБД скрыты в методах классов и осуществляются путем посылки запроса серверной части банковского программного комплекса. На центральном компьютере монитор транзакций принимает запрос, определяет его источник и передает для выполнения конкретному сервисному процессу. Для выполнения запроса этот процесс может обращаться к СУБД, к любым системным ресурсам и к другим программам-сервисам, в том числе находящимся, возможно, на других центральных машинах (например, в другом филиальном кластере) [8].
Заключение
Технология, связанная с использованием распределенных баз данных, в наибольшей степени соответствует организационной человеческой деятельности (информация распределена по месту деятельности людей, и они обмениваются ей в процессе работы) и позволяет наиболее успешно решать важнейшие проблемы ведения баз данных:
· повысить достоверность информации (информация вводится в месте ее порождения лицом, которое лучше всех понимает ее смысловое значение);
· повысить оперативность локальной обработки информации (соответствующие вопросы решаются на локальном компьютере с фрагментом базы данных).
Поэтому очевидно, что задача проектирования, создания и функционирования распределенных баз данных является весьма существенной, активно изучается в настоящее время и будет решаться и далее [9].
В данной работе было рассмотрено понятие распределенной обработки информации и ее цели, а также модели и свойства распределенных систем. Были изучены распределенные базы данных и их основные свойства, распределенные системы управления БД, их возможности и типы. Кроме того, были описаны перспективы развития распределенных систем и приведен пример такой системы. То есть, были выполнены основные задачи данного исследования, а следовательно, и достигнута цель работы.
Список источников
1. Найханова Л.В. Распределенная обработка данных: курс лекций / Л.В. Найханова. - Улан-Уде: Издательство ВСГТУ, 2001. - 122 с.
2. Методы распределенной обработки данных. Основные понятия. [Электронный ресурс] 2012. URL: http://exec.h1.ru/docs/tppcu/3.htm (Дата обращения: 15.12.2012)
3. Храпский С.Ф. Распределенная обработка информации: учебное пособие / С.Ф. Храпский. - Омск: Омский государственный институт сервиса, 2006. - 108 c.
4. Ладыженский Г. Распределенные информационные системы и базы данных: CIT Forum. [Электронный ресурс] 2009. URL:
http://citforum.ru/database/kbd96/45.shtml (Дата обращения: 15.12.2012)
5. Системы управления распределенными базами данных: Лекции по компьютерным информационным технологиям. [Электронный ресурс] 2011. URL: http://www.aboutkit.ru/pris/sistemy-upravleniya-raspredelennymi-bazami-dannyx-ponyatie-funkcionalnye-vozmozhnosti-tipy-preimushhestva-i-nedostatki-sistem-upravleniya-raspredelennymi-bazami-dannyx.html (Дата обращения: 19.12.2012)
6. Распределенные базы данных: База знаний Allbest. [Электронный ресурс] 2011. URL:
http://knowledge.allbest.ru/programming/3c0b65625b2ac78b5c53b89521206d27_0.html (Дата обращения: 22.12.2012)
7. Распределенные базы данных: Базы и банки данных. [Электронный ресурс] 2010. URL: http://www.hi-edu.ru/e-books/xbook099/01/part-013.htm (Дата обращения: 26.12.2012)
8. Тенденции развития систем распределенной обработки данных: Базы данных. [Электронный ресурс] 2012. URL: http://li.romab.ru/intro_db_8.html (Дата обращения: 27.12.2012)
9. Тенденции развития баз данных: Нижегородский государственный университет имени Н.И. Лобачевского. [Электронный ресурс] 2012. URL: http://www.unn.ru/pages/issues/publisher_db/files/43/9.pdf (Дата обращения: 25.12.2012)
Размещено на Allbest.ru
...Подобные документы
Требования, предъявляемые к свойствам систем распределенной обработки информации. Логические слои прикладного программного обеспечения вычислительных систем. Механизмы реализации распределенной обработки информации. Технологии обмена сообщениями.
курсовая работа [506,8 K], добавлен 03.03.2011Характеристики распределенной системы управления базой данных. Уровни представления информации в распределенной базе. Сравнительные характеристики стратегий хранения информации: централизованной, расчленения (фрагментации), дублирования, смешанной.
курсовая работа [1,7 M], добавлен 16.05.2014Анализ видов обеспечения автоматизированных систем предприятия. Средства программирования распределенных систем обработки информации. Изучение особенностей использования технологии распределенных объектов. Эксплуатация программного обеспечения системы.
отчет по практике [486,0 K], добавлен 23.11.2014Тенденция развития систем управления базами данных. Иерархические и сетевые модели СУБД. Основные требования к распределенной базе данных. Обработка распределенных запросов, межоперабельность. Технология тиражирования данных и многозвенная архитектура.
реферат [118,3 K], добавлен 29.11.2010Агентно-ориентированная программная архитектура систем обработки потоковых данных. Обеспечение гибкости и живучести программного обеспечения распределенных информационно-управляющих систем. Спецификации программных комплексов распределенной обработки.
реферат [1,1 M], добавлен 28.11.2015Особенности управления информацией в экономике. Понятие и функции системы управления базами данных, использование стандартного реляционного языка запросов. Средства организации баз данных и работа с ними. Системы управления базами данных в экономике.
контрольная работа [19,9 K], добавлен 16.11.2010Формулировка поставленной задачи при конструировании систем управления для идентификации нестационарных объектов. Изучение основ алгоритмического конструирования системы с неполной информацией. Рассмотрение использования метода адаптивной идентификации.
курсовая работа [110,8 K], добавлен 10.08.2014Анализ структуры распределенной информационной системы и обрабатываемых в ней персональных данных. Выбор основных мер и средств для обеспечения безопасности персональных данных от актуальных угроз. Определение затрат на создание и поддержку проекта.
дипломная работа [5,3 M], добавлен 01.07.2011Основные технологи сбора и передачи данных для получения новой информации о пространственно-временных явлениях в геосистемах. ГИС как инструменты для обработки и управления пространственной информацией, привязанной к некоторой части земной поверхности.
реферат [250,0 K], добавлен 20.12.2011Определение, свойства и характеристики распределенных систем баз данных. Основная задача систем управления ими. Архитектура распределения СУБД. Сравнение технологий файлового сервера и "клиент-сервера". Стратегия распределения данных по узлам сети ЭВМ.
курсовая работа [601,3 K], добавлен 24.05.2015Циклы обмена информацией в режиме прямого доступа к памяти. Управляющие сигналы, формируемые процессором и определяющие моменты времени. Запросы на обмен информацией по прерываниям. Мультиплексирование шин адреса и данных. Протоколы обмена информацией.
лекция [29,0 K], добавлен 02.04.2015Формы представляемой информации. Основные типы используемой модели данных. Уровни информационных процессов. Поиск информации и поиск данных. Сетевое хранилище данных. Проблемы разработки и сопровождения хранилищ данных. Технологии обработки данных.
лекция [15,5 K], добавлен 19.08.2013Определение информационной системы как совокупности технического и программного обеспечения, предназначенного для обеспечения людей необходимой им информацией. Классификация ИС по области применения, степени автоматизации, характеру обработки данных.
реферат [17,8 K], добавлен 06.01.2012Основные виды баз данных. Система управления базами данных. Анализ деятельности и информации, обрабатываемой в поликлинике. Состав таблиц в базе данных и их взаимосвязи. Методика наполнения базы данных информацией. Алгоритм создания базы данных.
курсовая работа [3,1 M], добавлен 17.12.2014Роль электронных систем управления в деятельности предприятий и организаций. Повышение качества основных процессов муниципального управления культуры Нефтеюганского района; разработка электронной системы управления информацией, оценка ее эффективности.
дипломная работа [2,3 M], добавлен 10.03.2012Наиболее значительные области применения средств обработки данных. История создания автоматизированных систем управления в CCCP. Применения отечественных компьютеров в атомной и космической программах СССР, в образовании, медицине, торговле, АПК.
курсовая работа [33,0 K], добавлен 15.03.2011Оценка предметной области: концептуальные требования; выявление информационных объектов и связей между ними; построение базы данных. Описание входных и выходных данных информационной системы "Магазин компьютерной техники". Анализ диаграммы прецедентов.
курсовая работа [294,8 K], добавлен 13.04.2014Современные базы данных – многофункциональные программные системы, работающие в открытой распределенной среде изучении администрирования базы данных. Способы организации внешней памяти баз данных. Системы управления базами данных для хранения информации.
курсовая работа [185,6 K], добавлен 07.12.2010Создание автоматизированных систем управления для предприятий нефтяной и газовой промышленности. Система управления базами данных (СУБД), ее функциональные возможности, уровневая архитектура. Характеристика реляционных, объектных и распределенных СУБД.
курсовая работа [434,7 K], добавлен 20.07.2012Анализ структуры и управления предприятием. Функции, виды деятельности, организационная и информационная модели предприятия, оценка уровня автоматизации. Перспективы развития автоматизированных систем обработки информации и управления на предприятии.
отчет по практике [243,3 K], добавлен 10.09.2012