Системы управления базами данных, применяемы в геоинформационных системах

Система управления реляционными базами данных и математические методы обработки информации. Подключение продуктов к сети интернет и их постоянное обновление. Сбор и обработка экологических данных. Использованием различных моделей представления знаний.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 04.05.2014
Размер файла 36,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Астраханский государственный технический университет

Институт информационных технологий и коммуникаций

Реферат

по предмету: Геоинформационные системы

на тему: Системы управления базами данных применяемы в геоинформационных системах

Выполнил:

Докучаев Денис Дмитриевич

Астрахань 2013

Оглавление

  • Введение
  • 1. Организация и обработка информации в ГИС с применением СУБД
    • 2. Формы представления объектов в геоинформационных системах
    • 3. Модели организации пространственных данных в ГИС
    • 4. Накопление и хранение экологических данных в СУБД
  • 5. Математические методы обработки экологических данных в СУБД
    • 6. Метод максимальной вероятности
    • 7. Проверка достоверности экоданных
    • 8. Виды знания
    • 9. Подход Демпстера- Шафера
    • 10. Статистическая гипотеза
  • 11. Сравнение СУБД для ГИС
  • Заключение
  • Список литературы
  • Введение
  • Сейчас геоинформационные системы (ГИС) широко используются в различных отраслях науки и промышленности. Выгодно выделяет ГИС на фоне других информационных систем возможность в выборе средств создания и объединения баз данных с возможностями их географического анализа и наглядной визуализации в виде разных карт, графиков, диаграмм, прямой привязке друг к другу всех атрибутивных и графических данных.
  • Выбор системы управления базами данных (СУБД) в геоинформационной системе, и в первую очередь, модели данных, т.е. способа цифрового описания пространственных объектов, значительно важнее, чем выбор программного обеспечения. Модель данных определяет многие функциональные возможности ГИС и применимость тех или иных технологий ввода. От модели зависит:

- пространственная точность представления визуальной части информации; информация обработка экология рациональный

- возможность получения качественного картографического материала

- организации контроля цифровых карт.

Модели и форматы данных в ГИС устроены гораздо сложнее, чем в других видах программного обеспечения. Это объясняется тем, что существует необходимость поддерживать связь между атрибутивной и пространственной информацией, а также с тем, что природные объекты (экосистемы) очень разнообразны, т.е. имеют различные геометрические типы, как с четкими границами, так и с нечеткими границами, связанные с характеризующими их числовыми и нечисловыми признаками.

Одной из областей практического применения ГИС технологий и комбинирования СУБД является - экология.

Информатизация экосистем - это практическое применение методов информатики, математических методов и инструментальных средств информационно-коммуникационных технологий (ИКТ) для решения задач сбора, обработки и хранения данных о состояниях экосистем, т.е. экологических данных (экоданных), необходимых для математического моделирования процессов функционирования экосистем. [9]

Ошибки в выборе модели данных могут оказать решающие влияние функционирование ГИС, а также эффективности выполнения проекта с экономической точки зрения. От выбора модели данных напрямую зависит ценность формируемых баз данных географической и атрибутивной информации.

В связи с этим выбор модели данных для создания ГИС и ее дальнейшего эффективного функционирования является актуальной задачей.

Целью реферативной работы явилось изучение моделей баз данных и оценка возможностей их применения и использование систем управления базами данных в экологических геоинформационных системах.

Для достижения данной цели необходимо было решить следующие основные задачи:

-·выделить основные понятия баз данных и систем управления базами данных, используемые в геоинформационных технологиях;

-·рассмотреть основные способы организации и обработки информации в геоинформационных системах;

-·рассмотреть основные возможности применения различных СУБД для представления данных в экологических геоинформационных системах.

1. Организация и обработка информации в ГИС с применением СУБД

ГИС, как и любая другая информационная система, обладает развитыми средствами обработки и анализа входящих данных с целью дальнейшей их реализации в вещественной форме. На первом этапе производится “коллекционирование” как географической (цифровые карты, изображения), так и атрибутивной информации. Собранные данные являются наполнением двух баз данных. Первая база данных (БД) хранит картографические данные, вторая же наполнена информацией описательного характера. На втором этапе система обработки пространственных данных обращается к базам данных для проведения обработки и анализа востребованной информации. При этом весь процесс контролируется системой управления БД (СУБД), с помощью которой можно осуществлять быстрый поиск табличной и статистической информации. Главным результатом работы ГИС являются разнообразные карты. [2]

Для организации связи между географической и атрибутивной информацией используют несколько подходов взаимодействий. Первый подход - геореляционный или, как его еще называют, гибридный. При таком подходе географические и атрибутивные данные организованы по-разному. Между двумя типами данных связь осуществляется посредством идентификатора объекта. Географическая информация хранится отдельно от атрибутивной в своей БД. Атрибутивная информация организована в таблицы под управлением реляционной СУБД. Реляционная модель ориентирована на организацию данных в виде двумерных таблиц. Каждая реляционная таблица представляет собой двумерный массив и обладает следующими свойствами:

- каждый элемент таблицы -- один элемент данных

- все ячейки в столбце таблицы однородные, то есть все элементы в столбце имеют одинаковый тип (числовой, символьный и т. д.)

- каждый столбец имеет уникальное имя

- одинаковые строки в таблице отсутствуют

- порядок следования строк и столбцов может быть произвольным.

Следующий подход называется интегрированным. При этом подходе предусматривается использование средств реляционных СУБД для хранения как пространственной, так и атрибутивной информации. В этом случае ГИС выступает в качестве надстройки над СУБД.

Третий подход называют объектным. Плюсы этого подхода в легкости описания сложных структур данных и взаимоотношений между объектами. Объектный подход позволяет выстраивать иерархические цепочки объектов и решать многочисленные задачи моделирования.

Объектно-реляционный подход, являющийся синтезом первого и третьего подходов. реляционная СУБД (РСУБД), поддерживающая некоторые технологии, реализующие объектно-ориентированный подход: объекты, классы и наследование реализованы в структуре баз данных и языке запросов. Объектно-реляционными СУБД являются, к примеру, широко известные Oracle Database, Informix, DB2, PostgreSQL.

Иерархическая модель данных - представление базы данных в виде древовидной (иерархической) структуры, состоящей из объектов (данных) различных уровней.

Между объектами существуют связи, каждый объект может включать в себя несколько объектов более низкого уровня. Такие объекты находятся в отношении предка (объект более близкий к корню) к потомку (объект более низкого уровня), при этом возможна ситуация, когда объект-предок не имеет потомков или имеет их несколько, тогда как у объекта-потомка обязательно только один предок. Объекты, имеющие общего предка, называются близнецами. [1]

Сетевая СУБД - К основным понятиям сетевой модели базы данных относятся:

Узел -- это совокупность атрибутов данных, описывающих некоторый объект. На схеме иерархического дерева узлы представляются вершинами графа. В сетевой структуре каждый элемент может быть связан с любым другим элементом.

Сетевые базы данных подобны иерархическим, за исключением того, что в них имеются указатели в обоих направлениях, которые соединяют родственную информацию.

Несмотря на то, что эта модель решает некоторые проблемы, связанные с иерархической моделью, выполнение простых запросов остается достаточно сложным процессом.

Также, поскольку логика процедуры выборки данных зависит от физической организации этих данных, то эта модель не является полностью независимой от приложения. Другими словами, если необходимо изменить структуру данных, то нужно изменить и приложение.

Объектно-ориентированная - Эта система управления обрабатывает данные как абстрактные объекты, наделённые свойствами и использующие методы взаимодействия с другими объектами окружающего мира. 11]

2. Формы представления объектов в геоинформационных системах

В ГИС выделяют несколько форм представления объектов:

-·в виде нерегулярной сети точек;

-·в виде регулярной сети точек;

-·в виде изолиний.

Представление в виде нерегулярной сети точек - это произвольно расположенные точечные объекты в качестве атрибутов имеющие какое-то значение в данной точке поля.

Представление в виде регулярной сети точек - это равномерно расположенные в пространстве точки достаточной густоты. Регулярную сеть точек можно получать интерполяцией из нерегулярных либо путем проведения измерений по регулярной сети.

Наиболее распространенной формой представления в картографии является представление изолиниями. Недостатком данного представления является то, что обычно нет никакой информации о поведении объектов, находящихся между изолиниями. Данный способ представления является не самым удобным для анализа. [3]

3. Модели организации пространственных данных в ГИС

Самой распространенной моделью организации данных является слоевая модель. Суть модели в том, что осуществляется деление объектов на тематические слои и объекты, принадлежащие одному слою. Получается так, что объекты отдельного слоя сохраняются в отдельный файл, имеют свою систему идентификаторов, к которой можно обращаться как к некоторому множеству.

В рамках слоевой модели существует две конкретных реализации: векторно-топологическая и векторно-нетопологическая модели. Первая реализация - векторно-топологическая, помимо геометрии описывает также взаимное расположение объектов -- их топологические отношения («справа», «слева», «внутри», «примыкает» и т. п.). В этой модели есть ограничения: в один лист одного тематического слоя можно поместить объекты не всех геометрических типов одновременно.

Векторно-нетопологическая модель организации данных - это более гибкая модель, но часто в один слой помещаются только объекты одного геометрического типа. Число слоев при слоевой организации данных может быть весьма большим и зависит от конкретной реализации. При слоевой организации данных удобно манипулировать большими группами объектов, представленных слоями как единым целым. [6]

Следует отметить, что слоевая модель организации данных абсолютно преобладает в растровой модели данных.

Растровая модель -- представление, аппроксимирующее пространственные объекты и их непрерывные географические изменения совокупностью ячеек конечного размера -- растром.

Растровые модели удобны для хранения и анализа данных, распределенных непрерывно на некоторой области (объекты или явления -- на некоторой территории) в соответствии с моделью географических полей. Растр представляет собой матрицу элементов изображения (пикселов) с присвоенными им кодами, идентифицирующими либо цвет изображения, либо класс объекта. Значения пикселов могут быть результатами измерений, вычислений или интерполяции.

Регулярно-ячеистые модели - формально схожие с растровыми; создаются путем построения регулярной прямоугольной (гриды, GRID) или треугольной (триангуляция) сети, их построение в ГИС используют для задач географического анализа и моделированиянепрерывных распределений данных.

Размер растра (пиксела) или ячейки сети определяет пространственное разрешение данных - их пространственную детальность, и позволяет оценить точность (достоверность) моделирования. Разрешение связано с масштабом представления данных или сложностью рисунка местности или карты.

Наряду со слоевой моделью используют объектно-ориентированную модель. В этой модели используется иерархическая сетка.

В объектно-ориентированной модели акцент делается на положение объектов в какой-либо сложной иерархической схеме классификации и на взаимоотношения между объектами. Этот подход менее распространен, чем слоевая модель по причине трудности организации всей системы взаимосвязей между объектами.

Наиболее распространенным является послойный принцип. Однако более перспективным является объектно-ориентированный подход к представлению объектов на цифровой карте, так как он более близок к свойствам человеческого мышления, чем послойный принцип. Его применение ведет к более продуктивным построениям данных в ГИС при решении самых сложных задач. Использование объектно-ориентированной технологии позволяет решать задачи на порядок сложнее, чем при их решении с помощью послойной технологии организации данных ГИС. [8]

4. Накопление и хранение экологических данных в СУБД

Для сбора экоданных используются контрольно-измерительные системы и сети датчиков характеристик состояния ОС, которые устанавливаются для контроля качества воды, воздуха и почвы. В настоящее время все чаще и чаще для получения экологической информации используются данные со спутников. [2]

Массивы экологических данных являются большими и сложными. Управление ими требует мощных процессоров и эффективных способов хранения данных. Важно ускорить процесс сбора и обработки этих больших неструктурированных экологических данных, привести их в порядок с целью получения эффективной информации для принятия управленческих решений.

Таксономия (от греч. taxis - расположение - строй, порядок и nomos - закон), теория классификации и систематизации знаний (понятий, определений и т.п.) о сложноорганизованных областей действительности, имеющих обычно иерархическое строение (биологические объекты; объекты географии, геологии, языкознания, этнографии и т. д.).

Сбор экоданных - это процесс получения массивов информации от экологических объектов, где любой реальный объект может рассматриваться как экологический объект. Живые и неживые экологические объекты группируются во множество подклассов с типичными признаками (например, таксономия разновидностей). Более простые структуры таксономии окружающей среды даются для различных сред или подсистем ОС - почвы, воды и воздуха. Эта таксономия обычно используется правительственными экологическими учреждениями. Понимая ОС как единую и сложную систему, таксономия приводит к постановке междисциплинарных задач. Поэтому, постановка междисциплинарных задач создания целевых организационных групп и экологических сетей становятся все более необходимым.

Общие примеры таксономии объектов - это атмосфера, включающая все объекты, расположенные выше поверхности земли; гидросфера, содержащая все водные объекты; литосфера, включающая почвы, отложения и камни; биосфера, включающая все живое; техносфера, включающая искусственные техногенные объекты; социосфера, включающая социально-экономические взаимосвязи в пределах человеческого общества. [1]

5. Математические методы обработки экологических данных в СУБД

Главный вопрос, на который необходимо ответить при получении экологических данных состоит в определении, за какими экологическими объектами необходимо вести наблюдение и какие данные должны собираться. Существует множество способов получения данные об экологических объектах. Данные могут быть получены при измерении временных рядов или временных последовательностей. Поступающие исходные данные должны быть подвергнуты некоторой проблемно-ориентированной и определенной специальной обработке. В зависимости от источника данных обработка может включать некоторые преобразования, такие как оптическая корреляция, подавление шумов, фильтрация или усиление.

Обработка исходных данных включает сложные аналитические физико-химические методы (лабораторные методы), которые могут использоваться для анализа химических загрязнений в окружающей среде. Все чаще и чаще для контроля отдаленных областей и распознавания долговременных экологических нагрузок используются авиационные и спутниковые изображения-фотографии. Исходные изображения или образы обычно обрабатываются и представляются в виде тематических карт для визуализации распределения нагрузки. Лес, животные и растения являются часто самым надежным источником данных. Для объектов техносферы или социосферы исследование различной документации позволяет собрать и накопить необходимые данные об экологических объектах. [4]

6. Метод максимальной вероятности

Для обработки исходных данных необходимо классифицировать новые наблюдения с использованием определенной таксономии экосистем. Общие методы решения этой проблемы основаны на применении методов максимальной вероятности. Популяризатором данного метода считается Р. Фишер. Этот подход базируется на условии, что существует конечное число классов случайных величин w(i), которым новое наблюдение может принадлежать. Каждое наблюдение представлено точкой x в некотором n-мерном пространстве. Для каждого класса w(i) существуют n-мерное распределение вероятности p(x\w(i)), которое указывает вероятность того, что элемент, или член, класса w(i) ему принадлежит. Обычно в большинстве случаев закон распределения случайной величины неизвестен. Наиболее часто при обработке экоданных принимают нормальное распределение случайных величин. Как только нормальное распределение принимается, появляется задача оценки параметров закона распределения. Для каждого класса случайных величин w(i) должны быть оценены среднее значение m(i) и ковариация cov(i). Этого обычно достаточно для исследования собранных экоданных, когда неизвестно к какому классу случайных величин их отнести. [9]

7. Проверка достоверности экоданных

Основываясь на результатах классификации, можно сформировать первичный набор экологических данных, сжать их, и тогда более легко их интерпретировать, чем исходный набор данных. Из-за неопределенности, связанной с процессом получения данных, во избежание ошибок должны использоваться процедуры проверки достоверности.

Используются следующие виды проверки достоверности экоданных:

Временная достоверность: используются новые измерения для сравнения с предыдущими измерениями, полученными при одинаковых условиях.

Географическая достоверность: данные, не соответствующие установленным образцам имеют характеристики и параметры, полученные при измерении на другом оборудовании, измеряющем же самые параметры.

Пространственно-временная достоверность: данные сравниваются с предыдущими измерениями на том же самом оборудовании.

Параметрическая достоверность: данные, которые не соответствуют норме, передаются для проверки взаимной достоверности приборам или экспертным системам.

Для обработки и начальной оценки исходных экологических данных необходимо использовать интеллектуальные системы, или системы, основанные на знаниях, со значительным интеллектуальным и вычислительным потенциалом. [7]

8. Виды знания

Знания - это качественная смысловая информация об объектах, субъектах, процессах, ситуациях и явлениях некоторой предметной области. Знания отображаются в виде фраз и предложений естественного языка. Выделяют различные виды знания: обыденное («здравый смысл»), личностные, научные и др. Научному знанию присущи логическая обоснованность, доказательность, воспроизводимость познавательных результатов.

Представление и переработка знаний об экологических объектах могут быть выполнены с использованием различных моделей представления знаний (фреймов, предикатов, семантических графов и др.), которые программно отображаются в базах знаний, а также с использованием интеллектуальных баз данных на основе применения объектно-ориентированного программирования.

Статические знания, или декларативные знания, хранятся в специализированных объектно-ориентированных системах. Объектно-ориентированные данные дают пользователям возможность объединять подобные объекты в группы, а также в виде какой-либо иерархической структуры. Все объекты в каждой группе подразделяются по набору свойств или признаков; существуют специальные процедуры и методы, которые позволяют отбирать один или более объектов данного класса для дальнейшего их использования. Существует такое понятие как «наследование» - это такие свойства, признаки и методы, которые присущи определенному классу объектов «С» на высшем уровне иерархии и являются также присущими для всех подгрупп в поддереве ниже «C».

Декларативные знания - это знания об объектах, субъектах, процессах, ситуациях и явлениях некоторой предметной области.

Динамические знания, или продукционные знания отображают правила поведения или правила принятия решений в данной предметной области. Динамические или продукционные знания отображаются в экоинформационных системах (Ecological Information Systems - EIS) в виде продукционных или эвристических правил. Продукционное правило может быть представлено нотацией: «если (условие), то (действие)». Условием в продукционном правиле может быть некоторое начальное состояние экосистемы. Экспертные системы позволяют выработать приоритетные продукционные правила принятия организационно-управленческих решений.

Сбор и обработка экологических данных могут быть выполнены типовыми методами математической статистики с применением систем управления базами данных (СУБД) и систем искусственного интеллекта. Когда данные агрегированы, или объединены и оценены, они становятся входными данными, но это только одна часть количественной информации. Другая дополнительная информация также принимается во внимание для использования всех видов экологических данных, которыми интересуется лицо принимающее решение (ЛПР). Эксперты всегда принимают во внимание такую информацию, когда оценивают какой-либо объект окружающей среды. При этом многообещающая стратегия состоит в том, чтобы сформировать рабочую гипотезу и подтвердить эту гипотезу на основе доступной информации. При этом имеется в виду, что входная информация об объекте ОС может быть неполной и неопределенной. [9]

9. Подход Демпстера- Шафера

На основе таких неопределенных и неполных данных можно получить только вероятностные значения величин. Бейесовская статистика требует, чтобы случайные события (величины) были независимы друг от друга. Это предположение редко выполняется для экологических систем. Для определения вероятностных характеристик исходных наборов экологических данных можно использовать подход Демпстера- Шафера. Ключевая идея этого подхода состоит в том, что нужно логически отделить аргументы за и против данной гипотезы. Такое отделение аргументов осуществляется с помощью введения меры различия предполагаемой вероятности B(H) и правдоподобной, или действительной вероятности, P(H). Обе величины измеряются в пределах от 0 до 1. Предполагаемая вероятность представляет собой весовой фактор, который поддерживают рабочую гипотезу о замене распределения. В противоположность этого правдоподобная вероятность - отрицательный весовой фактор, представляющий гипотезу H. Поэтому величина предполагаемой вероятности гипотезы P(H)=1-B(H*), если H* обозначает гипотезу, что H является ложным. Вероятность противоположной гипотезы B(H*) обозначается иногда как недоверие, D(H) относительно рабочей гипотезы H. Поэтому величина P(H)=1-D(H). В Бейесовской теории вероятности предполагаемая вероятность и правдоподобная вероятность совпадают

p(H)=B(H)=P(H)=1-p(H*)

В теории Демпстера-Шафера: B(H)<P(H)

Разность между B(H) и P(H) представляет собой степень неопределенности U(H) о рабочей гипотезе. [7]

10. Статистическая гипотеза

Статистическая гипотеза - это утверждение о типе распределения случайной экологической переменной. Проверка статистической гипотезы состоит из сравнения статистических величин, называемых тестовыми критериями (или тестируемыми статистиками), полученными для образцов данных и сравнения с величинами этих критериев при условии, что данная гипотеза правильна.

В проверяемых гипотезах существует одна нулевая гипотеза, а также одна или более альтернативных гипотез Н1, Н2,… Нn, которые являются верными или неверными. Чтобы получить правильное решение о выборе гипотезы, для полученного произвольного уровня значимости, отбираются значения (0.05, 0.01 или 0.001). Коэффициент доверия S дается e=1-a. Для тестируемой гипотезы происходит выбор тестового критерия, критерия проверки, (т.е. тестируемая статистика). Если это статистика попадает в указанный диапазон, то нулевая гипотеза не может быть отклонена. С другой стороны, в случае выхода значения из этого диапазона гипотеза отклоняется. Вероятность тестируемой статистики не попадания в заданный диапазон равна S. Это выражается в процентном (%) отношении.

Рассмотрим сущность процедуры проверки гипотез. Должны быть сформулированы нулевая гипотеза и альтернативные гипотезы. Должен быть выбран уровень значимости. Область отклонения для тестовой статистики определяется на основе закона распределения вероятности и уровня значимости. Тестовая статистика рассчитывается из набора данных. Нулевая гипотеза отклоняется, и альтернативные гипотезы принимаются, если полученные значения тестовых статистик попадают в диапазон отклонений. Нулевая гипотеза принимается, если полученные величины не попадают в диапазон отклонения. [4]

11. Сравнение СУБД для ГИС

В настоящее время сложно разделить СУБД по каким-то конкретным типам и класса, т.к большинство из них интегрировались, слились и наладили взаимодействие между своими продуктами, ГИС продуктами, для корректной и быстрой работы разных систем. Многие СУБД являются альтернативными имеют множество инструментов, уровней и форм хранения информации.

Основными ГИС продуктами на рынке являются: gvSIG, Quantum GIS, ArcGIS, GRASS.

gvSIG - свободная геоинформационная система с открытым исходным кодом. Программа поддерживает все необходимые функции ГИС:

Pабота со слоями, благодаря которой можно отображать лишь необходимые в данный момент объекты;

Функции масштабирования карты;

Поддержка сохранения необходимых ракурсов карты;

Автоматические расчёты расстояния между объектами и площадей областей;

Размещение активных объектов на карту;

Создание профессиональных географических карт с необходимыми элементами, которые можно впоследствии печатать.

Поддерживает возможность работы с базами данных: MySQL, ArcSDE, Oracle, JDBC.

СУБД MySQL - свободная система управления базами данных. Разработку и поддержку MySQL осуществляет корпорация Oracle. MySQL является решением для малых и средних приложений. Входит в состав серверов WAMP, AppServ, LAMP и в портативные сборки серверов Денвер, XAMPP. Обычно MySQL используется в качестве сервера, к которому обращаются локальные или удалённые клиенты, однако в дистрибутив входит библиотека внутреннего сервера, позволяющая включать MySQL в автономные программы.

Гибкость СУБД MySQL обеспечивается поддержкой большого количества типов таблиц: пользователи могут выбрать как таблицы типа MyISAM, поддерживающие полнотекстовый поиск, так и таблицы InnoDB, поддерживающие транзакции на уровне отдельных записей. Более того, СУБД MySQL поставляется со специальным типом таблиц EXAMPLE, демонстрирующим принципы создания новых типов таблиц. Благодаря открытой архитектуре и GPL-лицензированию, в СУБД MySQL постоянно появляются новые типы таблиц. Максимальный размер таблиц в MySQL 3.22 до 4 ГБ, в последующих версиях максимальный размер до 8 млн. ТБ (263 байт). [7]

СУБД Oracle - объектно-реляционная система управления базами данных компании Oracle. Имеется возможность обработки XML-документов; технология Oracle RAC (Real Application Clusters), как замена Oracle Parallel Server (OPS); механизм создания репликаций Oracle Streams; скроллируемый курсор для программ на Си и C++; встроенная в СУБД поддержка OLAP и Data Mining; переименование столбцов и ограничений целостности; поддержка Java и Unicode. Возможность «горячего», без остановки сервера, внесения изменений в метаданные и бизнес-логику на PL/SQL. Автоматический мониторинг и диагностика БД для выявления проблем производительности и, возможно, автоматической корректировки. Подсказка в SQL-запросе. Многоверсионность данных для управления параллельными транзакциями.

СУБД JDBC - платформенно-независимый промышленный стандарт взаимодействия Java-приложений с различными СУБД, реализованный в виде пакета java.sql, входящего в состав Java SE. JDBC основан на концепции так называемых драйверов, позволяющих получать соединение с базой данных по специально описанному URL. Драйверы могут загружаться динамически (во время работы программы). Загрузившись, драйвер сам регистрирует себя и вызывается автоматически, когда программа требует URL, содержащий протокол, за который драйвер отвечает. Преимуществами JDBC считают:

Лёгкость разработки: разработчик может не знать специфики базы данных, с которой работает;

Код не меняется, если компания переходит на другую базу данных;

Не нужно устанавливать громоздкую клиентскую программу;

К любой базе можно подсоединиться через легко описываемый URL. [9]

Quantum GIS - свободная кроссплатформенная геоинформационная система. Можно просматривать и накладывать друг на друга векторные и растровые данные в различных форматах и проекциях без преобразования во внутренний или общий формат. Поддержка пространственных таблицы PostgreSQL.

СУБД PostgreSQL - свободная объектно-реляционная система управления базами данных (СУБД). PostgreSQL базируется на языке SQL и поддерживает многие из возможностей стандарта SQL:2003 (ISO/IEC 9075). Максимальный размер таблицы равен 32 Тбайт. Максимальный размер базы данных не имеет ограничений. Максимальный размер записи 1,6 Тбайт.

Сильными сторонами PostgreSQL считаются: поддержка БД практически неограниченного размера; мощные и надёжные механизмы транзакций и репликации.

Ррасширяемая система встроенных языков программирования: в стандартной поставке поддерживаются PL/pgSQL, PL/Perl, PL/Python и PL/Tcl; дополнительно можно использовать PL/Java, PL/PHP, PL/Py, PL/R, PL/Ruby, PL/Scheme и PL/sh, а также имеется поддержка загрузки C-совместимых модулей; наследование; легкая расширяемость.

ArcGIS - семейство программных продуктов американской компании ESRI, одного из лидеров мирового рынка геоинформационных систем. ArcGIS построена на основе технологий COM, .NET, Java, XML, SOAP. ArcGIS позволяет визуализировать (представить в виде цифровой карты) большие объёмы статистической информации, имеющей географическую привязку. В среде создаются и редактируются карты всех масштабов: от планов земельных участков до карты мира. Также в ArcGIS встроен широкий инструментарий анализа пространственной информации.

Основные используемые СУБД - Microsoft SQL Server, DB2, Informix. [10]

СУБД Microsoft SQL Server - система управления реляционными базами данных (СУБД), разработанная корпорацией Microsoft. Основной используемый язык запросов -- Transact-SQL, создан совместно Microsoft и Sybase. Transact-SQL является реализацией стандарта ANSI/ISO по структурированному языку запросов (SQL) с расширениями. Используется для работы с базами данных размером от персональных до крупных баз данных масштаба предприятия; конкурирует с другими СУБД в этом сегменте рынка.

СУБД DB2 - семейство систем управления реляционными базами данных, выпускаемых корпорацией IBM. Чаще всего, ссылаясь на DB2, имеют в виду реляционную систему управления базами данных DB2 Universal Database (DB2 UDB). Диалект языка SQL, используемый в DB2 за редкими исключениями строго декларативен, система снабжена многофазовым оптимизатором, строящий по этим декларативным конструкциям план выполнения запроса. В диалекте SQL DB2 практически отсутствуют подсказки оптимизатору, мало развит язык хранимых процедур, и, таким образом, всё направлено на поддержание декларативного стиля написания запросов. Язык SQL DB2 при этом является вычислительно полным, то есть потенциально позволяет в декларативной форме определять любые вычислимые соответствия между исходными данными и результатом. Это достигается в том числе за счёт использования табличных выражений, рекурсии и других развитых механизмов манипулирования данными.

Традиционно для написания хранимых процедур используются обычные языки программирования высокого уровня (Си, Java, PL/I, Кобол и т. д.), это позволяет программисту легко оформлять один и тот же код либо как часть приложения, либо как хранимую процедуру, в зависимости от того, на клиенте или на сервере его целесообразнее выполнять. В настоящее время в DB2 также реализовано процедурное расширение SQL для хранимых процедур в соответствии со стандартом ANSI SQL/PSM. DB2 является единственной реляционной СУБД общего назначения, имеющей реализации на аппаратно-программном уровне. Современные версии DB2 обеспечивают расширенную поддержку использования данных в формате XML, в том числе операции с отдельными элементами документов XML. Полезной особенностью SQL-сервера DB2 является возможность обработки ошибок. Для этой цели используется структура SQLCA, возвращающая информацию об ошибке прикладной программе после каждого выполнения SQL-выражения.

СУБД Informix - семейство систем управления реляционными базами данных (СУБД), выпускаемых компанией IBM. Informix позиционируется как флагман среди СУБД IBM, предназначенный для онлайновой обработки транзакций (OLTP), а также как СУБД для интегрированных решений. СУБД обладает алгоритмом обработки контрольной точки, возможность создания нескольких вторичных серверов в репликации. Имеется абсолютно новый уровень изоляции -- LAST COMMITTED READ, позволяющий получать самую последнюю принятую версию строк, даже если другой параллельный сеанс удерживает исключительную блокировку на уровне строк. Менеджер соединений, который динамически маршрутизирует требования приложений-клиентов об установлении соединений на наиболее подходящий сервер в кластере высокой доступности. [8]

GRASS - система для обработки географической информации. Геоинформационная система с открытым исходным кодом. Поддерживает большое количество форматов. Данная ГИС построена по принципу модульности и интегрирует в себя множество различных модулей, которые решают задачи от визуализации до импорта/экспорта в различные форматы данных. Изначально система ориентирована на работу с командной строкой, однако сейчас имеется два графических интерфейса к данной системе. Поддержка таких СУБД как PostgreSQL, MySQL и ODBC.

Стоит отметить Российскую СУБД ЛИНТЕР - реализующая стандарт SQL-92 и поддерживающая большинство операционных систем, в том числе семейство Windows (включая Windows CE), различные версии UNIX, ОС реального времени (включая QNX). Объем базы данных до 65535 таблиц каждая объёмом до 12Тб. Количество строк в одной таблице 2^30 (~1 млрд). Количество записей, выбираемых одним запросом 2^29 (~500 млн). Количество полей в записи 250. Защита данных - 2 класс защиты данных от несанкционированного доступа и 2 уровень контроля отсутствия недекларированных возможностей. Мандатный контроль доступа к данным на уровне таблиц, столбцов записей и отдельных полей записей. Управление доступом к рабочим станциям и устройствам хранения информации. Контроль доступа к СУБД по расписанию. Управление протоколированием операций над БД (аудит).

Геометрические функции по спецификации OpenGIS:

- функции для создания значений геометрических типов с помощью текстового и бинарного представления (GeomFromText, GeomFromWKB и множество других);

- функции для анализа свойств геометрических данных (как общие -- Dimension, Envelope, Boundary и др., так и специализированные для каждого из геометрических типов данных -- Length, Area, Centroid и др.);

- геометрические операторы (Union, Intersection и др.);

- функции, описывающие отношения между двумя значениями геометрических типов (Distance, Equals, Intersects и др.). [10]

Заключение

Выбор СУБД для создания ГИС является первоочередной и решающей задачей в реализации проектов. ГИС технологии как нельзя лучше подходят для решения проблем экологии: проведение мониторинга, картографирования, пеленгации, хранение и обработки результатов.

Необходимые алгоритмы реализуются по средствам математических методов обработки информации. Экологические задачи требуют использования таких приемов как: проверка знания, определение достоверности, статистических методов обработки, частные специальные модели и подходы.

Применение того или иного типа СУБД зависит от задач и предпочтений пользователя. Требуемые характеристики классифицируются, ставится задача, и на этой основе выделяется необходимый подход. Спектр задач в экологии довольно разнообразен. Практическое применение ГИС технологии находят как в узкоспециальных научных лабораториях и государственных организациях, так и на административном, общественном или частном уровне. Использование сетевых СУБД и создание собственной сети рабочих станций, а так же подключение продуктов к сети интернет и постоянное обновление, и обмен знаниями, значительно облегчает и ускоряет процесс, создания и реализации необходимых ГИС.

Список литературы

1. Гарсиа-Молина Г., Ульман Дж., Уидом Дж. Системы баз данных. Полный курс. - М.: Вильямс, 2003. - 1088 с.

2. Журкин И. Г., Шайтура С. В. Геоинформационные системы. -- Москва: КУДИЦ-ПРЕСС, 2009. -- 272 с.

3. Капралов Е.Г., Кошкарев А.В., Тикунов В.С. и др. Геоинформатика. Учебник для ВУЗов. - М.: Академия, 2005. - 479 с.

4. Кузнецов С.Д. Основы баз данных. / 2-е изд. - М.: Интернет-Университет Информационных Технологий; БИНОМ. Лаборатория знаний, 2007. - 484 с.

5. Ципилева Т.А. Геоинформационые системы. Учеб. пособие. - Томск, ТМЦДО, 2004. - 163 с.

Размещено на Allbest.ru

...

Подобные документы

  • Система управления базами данных как составная часть автоматизированного банка данных. Структура и функции системы управления базами данных. Классификация СУБД по способу доступа к базе данных. Язык SQL в системах управления базами данных, СУБД Microsoft.

    реферат [46,4 K], добавлен 01.11.2009

  • Алгоритмы обработки массивов данных. Система управления базами данных. Реляционная модель данных. Представление информации в виде таблицы. Система управления базами данных реляционного типа. Графический многооконный интерфейс.

    контрольная работа [2,8 M], добавлен 07.01.2007

  • Особенности управления информацией в экономике. Понятие и функции системы управления базами данных, использование стандартного реляционного языка запросов. Средства организации баз данных и работа с ними. Системы управления базами данных в экономике.

    контрольная работа [19,9 K], добавлен 16.11.2010

  • Хранение и обработка данных. Компоненты системы баз данных. Физическая структура данных. Создание таблиц в MS Access. Загрузка данных, запросы к базе данных. Разработка информационной системы с применением системы управления базами данных MS Access.

    курсовая работа [694,0 K], добавлен 17.12.2016

  • Основные классифицирующие признаки системы управления базами данных. Модель данных, вид программы и характер ее использования. Средства программирования для профессиональных разработчиков. Организация центров обработки данных в компьютерных сетях.

    презентация [6,8 K], добавлен 14.10.2013

  • Формы представляемой информации. Основные типы используемой модели данных. Уровни информационных процессов. Поиск информации и поиск данных. Сетевое хранилище данных. Проблемы разработки и сопровождения хранилищ данных. Технологии обработки данных.

    лекция [15,5 K], добавлен 19.08.2013

  • Системы управления базами данных в медицине. Основные идеи, которые лежат в основе концепции базы данных. Требования, предъявляемые к базам данных и системе управления базами данных. Архитектура информационной системы, организованной с помощью базы данных

    реферат [122,5 K], добавлен 11.01.2010

  • Основные возможности системы управления реляционными базами данных (СУБД) Microsoft Access. Пользовательский интерфейс MS Access 2003. Команды панели инструментов окна БД. Область возможных режимов создания объектов. Создание таблиц в базе данных.

    реферат [5,5 M], добавлен 08.11.2010

  • Важнейшая задача компьютерных систем управления - хранение и обработка данных. Особенности применения в ОАО "ММК" системы управления реляционными базами данных "Oracle", предназначенной для одновременного доступа к большим объемам хранимой информации.

    курсовая работа [87,6 K], добавлен 04.12.2014

  • Современные информационные технологии обработки данных, автоматизированного офиса и баз данных, сетевые интернет-технологии. Работа с системой управления базами данных (СУБД) MS Access, связанными списками MS Excel, текстовым редактором MS Word.

    методичка [5,6 M], добавлен 01.07.2014

  • Понятие информационных систем и принципы их проектирования. Изучение различных методов извлечения знаний, построение оптимальной информационной системы Data Mining, позволяющей разбивать набор данных, представленных реляционными базами данных на кластеры.

    аттестационная работа [4,7 M], добавлен 14.06.2010

  • Классификации баз данных по характеру сберегаемой информации, способу хранения данных и структуре их организации. Современные системы управления базами данных и программы для их создания: Microsoft Office Access, Cronos Plus, Base Editor, My SQL.

    презентация [244,3 K], добавлен 03.06.2014

  • Базы данных как составная часть информационных систем. Изучение взаимосвязи понятий информация и данные. Система управления базами данных. Пример структурированных данных. Обеспечение логической независимости. Безопасность операционной системы.

    контрольная работа [44,6 K], добавлен 15.06.2009

  • Тенденция развития систем управления базами данных. Иерархические и сетевые модели СУБД. Основные требования к распределенной базе данных. Обработка распределенных запросов, межоперабельность. Технология тиражирования данных и многозвенная архитектура.

    реферат [118,3 K], добавлен 29.11.2010

  • Устройства внешней памяти. Система управления базами данных. Создание, ведение и совместное использование баз данных многими пользователями. Понятие системы программирования. Страницы доступа к данным. Макросы и модули. Монопольный режим работы.

    реферат [27,5 K], добавлен 10.01.2011

  • Информационные банки данных, документов и знаний. Фактографические информационные системы управления базами данных. Прикладные программы и языковые средства, предназначенных для создания, ведения и использования баз данных. Механизмы обработки данных.

    презентация [14,0 K], добавлен 14.10.2013

  • Характеристика категорий современных баз данных. Исследование особенностей централизованных и распределенных баз данных. Классификация систем управления базами данных по видам программ и применению. Управление буферами оперативной памяти и транзакциями.

    курсовая работа [45,2 K], добавлен 10.03.2016

  • Понятие и назначение, принципы построения и внутренняя структура системы управления базами данных, их функциональные особенности и возможности, критерии оценки эффективности. Языковые и программные средства. Использование SQL, типы и модели данных.

    презентация [677,3 K], добавлен 18.03.2015

  • Автоматизация сбора и обработки данных. Основы, таблицы и средства для работы с базами данных. Инструментальные средства и компоненты. Технология создания приложения. Работа с псевдонимами и со связанными таблицами. Система управления базами данных.

    методичка [1,5 M], добавлен 06.07.2009

  • Иерархические, сетевые и реляционные модели данных. Различия между OLTP и OLAP системами. Обзор существующих систем управления базами данных. Основные приемы работы с MS Access. Система защиты базы данных, иерархия объектов. Язык программирования SQL.

    курс лекций [1,3 M], добавлен 16.12.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.