Методики оптимального выбора конфигурации и структурирования распределенной информационной системы сбора и хранения хронологических данных с несколькими центрами обработки данных
Методика распределения центров сбора данных по центрам обработки данных для однотипных каналов связи и с использованием нескольких типов каналов связи применяемых в системах ЖКХ. Оценка положительного экономического эффекта от применения методики.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 15.05.2017 |
Размер файла | 566,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ФГБОУ Кубанский государственный аграрный университет
Статья
на тему: Методики оптимального выбора конфигурации и структурирования распределенной информационной системы сбора и хранения хронологических данных с несколькими центрами обработки данных
Выполнил:
Сопильняк Юрий Николаевич
В статье рассматриваются методики оптимального выбора конфигурации и структурирования распределенной информационной системы сбора и хранения хронологических данных с несколькими центрами обработки данных.
Ключевые слова: система сбора и хранения данных, оптимальный выбор, центр обработки данных
The article discusses the methodology of optimal configuration selection and structuring of distributed information systems for collecting and storing historical data from multiple data centers
Keywords: collection and storage, optimal choice, data processing center
Введение
В настоящее время широко применяются информационные системы сбора и хранения хронологических данных.
В частности, такие системы применяются в сфере ЖКХ, информационных системах газораспределения, информационных системах энергокластеров и в других областях.
Построение таких систем сопровождается сложными процессами проектирования, оценки работоспособности решения, целесообразности его применения для каждого конкретного случая, а также управленческими решениями, связанными с выбором из предложенных возможных конфигураций системы.
Описанные сложности создают необходимость применения проверенных методик, предоставляющих инструменты для проектирования и внедрения таких систем, позволяющих получить наиболее приемлемую конфигурацию конечной системы, удовлетворяющую технические, временные и финансовые ограничения.
Таким образом, разработка методики оптимального выбора конфигурации и структурирования распределенной информационной системы сбора и хранения хронологических данных с несколькими центрами обработки данных, являются важной научно-практической задачей [1-3].
1. Методика распределения центров сбора данных по центрам обработки данных для однотипных каналов связи
Задача распределения центров сбора данных по центрам обработки данных для однотипных каналов связи сводится к распределению центров сбора данных по центрам обработки данных в условиях минимизации стоимости подключения и ограничениях на время сбора, передачи, хранения данных и надежность.
Таким образом, задача распределения центров сбора данных (ЦСД) по центрам обработки данных (ЦОД) формулируется в виде задачи минимизации затрат
Размещено на http://www.allbest.ru/
(1)
при ограничениях:
1) а однократность включения j-ого ЦСД к ЦОД:
Размещено на http://www.allbest.ru/
(2)
2) на обязательность использования всех центров обработки данных:
Размещено на http://www.allbest.ru/
(3)
3) на время сбора, передачи и записи темпоральной информации в хранилище данных [3]:
Размещено на http://www.allbest.ru/
(4)
где tmax - максимально допустимое время передачи информации от ЦСД к ЦОД. При поддержке ЦОД параллельной обработки запросов;
4) на надежность канала связи:
Размещено на http://www.allbest.ru/
(5)
где pmin - требуемое значение надежности канала передачи учетной информации.
Исходными данными для решения задачи являются матрицы:
1) матрица затрат на размещение центров сбора и обработки данных
Размещено на http://www.allbest.ru/
(6)
где сij - затраты на подключение j-ого ЦСД к i-му ЦОД (включая затраты на проектирование, прокладку канала связи, пуско-наладочные работы, оплату персонала), i?I, I = 1,...,n - множество индексов (номеров) ЦОД, j?J, J = 1,...,m - множество индексов (номеров) ЦСД;
2. матрица времени сбора, передачи и записи данных
Размещено на http://www.allbest.ru/
(7)
где tij - время сбора, передачи и записи данных при передачи учетной информации от j-ого ЦСД к i-му ЦОД;
3. матрица вероятностей безотказной работы каналов связи
Размещено на http://www.allbest.ru/
(8)
где pij - вероятность безотказной работы канала связи между j-м ЦСД к i-м ЦОД.
При формировании матрицы затрат на подключение j-ого ЦСД к i-му ЦОД учитываются следующие показатели: A1 - матрица стоимостей проектных работ;
A2 - матрица стоимостей коммуникационного оборудования, устанавливаемого на ЦСД; A3 - матрица стоимостей коммуникационного оборудования, устанавливаемого на ЦОД; A3 - матрица стоимостей оборудования канала связи между j-м ЦСД и i-м ЦОД; A4 - матрица стоимостей технических работ по установке коммуникационного оборудования и прокладке канала связи и A5 - матрица стоимостей пуско-наладочных работ. Капитальные затраты на подключение j-ого ЦСД к i-му ЦОД вычисляются следующим образом:
Размещено на http://www.allbest.ru/
(9)
Капитальные затраты на внедрение системы сбора и хранения данных:
Размещено на http://www.allbest.ru/
(10)
Решением поставленной задачи минимизации является бинарная матрица:
Размещено на http://www.allbest.ru/
(11)
где xij = 1 - если j-й ЦСД подключен к i-му ЦОД иxij = 0 в противном случае.
Поставленная задача минимизации может быть решена как методом перебора всех допустимых значений переменной X, так и, в случае большой размерности, другими методами нелинейной целочисленной оптимизации.
Методика, позволяющая решить задачу (1), состоит из следующих этапов:
1) формирование множества I (на основе схемы электроснабжения энергокластера);
2) формирование множества J (аналогично на основе схемы электроснабжения);
3) сбор стоимостной информации, расчет и формирование матрицы C;
4) формирование матрицы T (в случае если отсутствует возможность проведения реальных расчетов, можно использовать имитационную модель, описанную в главе 1);
5) определение максимально допустимого времени передачи информации от ЦСД к ЦОД tmax;
6) формирование матрицы P (описание одного из методов приведено в главе 3);
7) определение требуемого значения надежности канала передачи учетной информацииpmin;
8) решение задачи (4.1) методами целочисленной оптимизации.
Системно-аналитическое описание методики по технологии SADT представлено на IDEF-0диаграмме 1.
Рисунок 1 - IDEF-0 диаграмма методики конфигурации распределенной информационной системы с несколькими центрами обработки данных
На основе данной методики было разработано программное обеспечение, позволяющее автоматизировать процесс сбора данных, расчет матриц C,T,P и решения оптимизационной задачи (1).
Рисунок 2 - Интерфейс программы вычисления оптимального распределения ЦСД к ЦОД
2. Методика распределения центров сбора данных по центрам обработки данных с использованием нескольких типов каналов связи
Рассмотрим задачу распределения центров сбора данных по центрам обработки данных в условиях минимизации стоимости подключения и ограничениях на время сбора, передачи, хранения данных и надежность, но с возможностью применения различных типов каналов связи.
В таком случае задача распределения центров сбора данных по центрам обработки данных формулируется в виде задачи минимизации затрат
Размещено на http://www.allbest.ru/
(12)
при ограничениях:
1) на однократность включения j-ого ЦСД к ЦОД:
Размещено на http://www.allbest.ru/
(13)
2) на обязательность использования всех центров обработки данных:
Размещено на http://www.allbest.ru/
(14)
3) на время сбора, передачи и записи темпоральной информации в хранилище данных [3]:
Размещено на http://www.allbest.ru/
(15)
где tmax - максимально допустимое время передачи информации от ЦСД к ЦОД. При поддержке ЦОД параллельной обработки запросов;
4) на надежность канала связи:
Размещено на http://www.allbest.ru/
(16)
где pmin - требуемое значение надежности канала передачи учетной информации.
Исходными данными для решения задачи являются матрицы:
1) матрица затрат на размещение центров сбора и обработки данных Cijk, где cijk - затраты на подключение j-ого ЦСД к i-му ЦОД каналом связи k(включая затраты на проектирование, прокладку канала связи, пуско-наладочные работы, оплату персонала), i?I,I = 1,...,n - множество индексов (номеров) ЦОД,j?J, J = 1,...,m - множество индексов (номеров) ЦСД, k?K,К = 1,...,l - множество доступных каналов связи;
2) матрица времени сбора, передачи и записи данных Tijk, где tijk - время сбора, передачи и записи данных при передаче учетной информации от j-ого ЦСД к i-му ЦОД k-мканалом связи;
3) матрица вероятностей безотказной работы каналов связи Pijk где pijk - вероятность безотказной работы канала связи между j-м ЦСД к i-м ЦОД на k-м канале связи.
Каждая из матриц C, T и P имеет вид трехмерной матрицы в случае проектирования системы сбора и хранения хронологических данных с применением различных каналов связи. Для этого дополнительно вводится измерение k, К = 1,...,n- множество каналов связи между ЦОД и ЦСД.
Решением поставленной задачи минимизации является тринарная матрица Xijk где xijk = 1 - если j-й ЦСД подключен к i-му ЦОД k-м каналом связи и xijk = 0 в противном случае. обработка данных канал связи
Поставленная задача минимизации, также как и в случае использования одного типа канала связи, может быть также решена методом перебора всех допустимых значений переменной Xлибо, в случае большой размерности, другими методами нелинейной целочисленной оптимизации.
Методика, позволяющая решить задачу (12), состоит из следующих этапов:
1) формирование множества I (на основе схемы электроснабжения энергокластера);
2) формирование множества J (аналогично на основе схемы электроснабжения);
3) формирование множества K (на основе анализа допустимости применения конкретного типа канала связи);
4) сбор стоимостной информации, расчет и формирование матрицы C;
5) формирование матрицы T (в случае если отсутствует возможность про- ведения реальных расчетов, можно использовать имитационную модель, описанную в главе 1);
6) определение максимально допустимого времени передачи информации от ЦСД к ЦОД tmax;
7) формирование матрицы P (описание одного из методов приведено в главе 3);
8) определение требуемого значения надежности канала передачи учетной информацииpmin;
9) решение задачи (12) методами целочисленной оптимизации.
Системно-аналитическое описание методики по технологии SADT представлено на IDEF-0 диаграмме (рисунок3).
Рисунок 3 - IDEF-0 диаграмма методики конфигурации распределенной информационной системы с несколькими центрами обработки данных с применением различных типов каналов связи
Задача структурирования данных информационной системы сбора и хранения данных решена с помощью известных методик.
Для оценки положительного экономического эффекта от применения предложенной методики были рассмотрены два варианта внедрения системы сбора и хранения данных. Первый вариант использует метод распределения центров сбора данных по центрам обработки данных, использующий принцип подключения к ближайшему доступному узлу. Второй вариант использует для расчета разработанную методику оценки затрат внедрения системы сбора и хранения данных. Результаты проведенных экспериментов представлены в таблице1.
Таблица 1 - Оценка положительного экономического эффекта от применения предложенной методики
Объект эксперимента |
Эффект (снижение стоимости) |
|
Система учета электроэнергии |
-14.3% |
|
Система учета потребления газа |
-2.9% |
Полученные методики позволяют проектировать информационные системы сбора и хранения хронологических данных, применяемых в системах ЖКХ, информационных системах газораспределения, информационных системах энергокластеров и в других областях. Разработанное вспомогательное программное обеспечение позволяет автоматизировать вычисление конфигурации проектируемой системы при известной матрицы затрат на размещение центров сбора и обработки данных, матрицы времени сбора, передачи и записи данных и матрицы вероятностей безотказной работы каналов связи.
Список литературы
1. Дьяченко, Р. Моделирование систем сбора и передачи данных с применением цветных сетей Петри [Электронный ресурс] / Р.А. Дьяченко, А.В. Фишер, В.В. Богданов // Фундаментальные исследования. - 2013.- №11(6).-c. 1122-1126.
2. Лаптев В.Н. Вопросу повышения надежности системы сбора и хранения хронологических данных [Электронный ресурс] / Ю.Н. Сопильняк, Р.А. Дъяченко, Р.Х. Багдасарян // Политематический сетевой электронный научный журнал КубГАУ. - Краснодар: КубГАУ, 2014. №101(07), - 16с. - Режим доступа: http://ej.kubagro.ru/2014/ 07/pdf/162.pdf.
3. Фишер, А.В. Организация хранения хронологических данных в базах данных систем мониторинга и прогнозирования [Электронный ресурс] / А.В. Фишер, Р.А. Дьяченко, И.С. Лоба // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ).-2012.-№79(5).
References
1. D'jachenko, R. Modelirovanie sistem sbora i peredachi dannyh s primeneniem cvetnyh setej Petri [Jelektronnyj resurs] / R.A. D'jachenko, A.V. Fisher, V.V. Bogdanov // Fundamental'nye issledovanija. - 2013.- №11(6).-c. 1122-1126.
2. Laptev V.N. Voprosu povyshenija nadezhnosti sistemy sbora i hranenija hronologicheskih dannyh [Jelektronnyj resurs] / Ju.N. Sopil'njak, R.A. D#jachenko, R.H. Bagdasarjan // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal KubGAU. - Krasnodar: KubGAU, 2014. №101(07), - 16s.
3. Fisher, A.V. Organizacija hranenija hronologicheskih dannyh v bazah dannyh sistem monitoringa i prognozirovanija [Jelektronnyj resurs] / A.V. Fisher, R.A. D'jachenko, I.S. Loba // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU).-2012.-№79(5).
Размещено на Allbest.ru
...Подобные документы
Разработка структурной схемы системы. Выбор и обоснование не указанных в задании элементов. Анализ временных параметров системы. Разработка файла конфигурации для системы сбора-обработки данных на языке AHDL. Моделирование цифровой части системы.
курсовая работа [1,1 M], добавлен 26.10.2014Система компьютерной обработки данных для сбора, систематизации, статистической обработки, анализа результатов учебного процесса за четверть, полугодие, год. Модуль обработки данных о качестве обучения, итогов успеваемости и данных о движении учащихся.
реферат [22,5 K], добавлен 05.02.2011Информационные и автоматизированные системы управления технологическими процессами на промышленных предприятиях. Базы данных в автоматизированных системах управления. Системы планирования ресурсов предприятия, сбора и аналитической обработки данных.
контрольная работа [486,7 K], добавлен 29.10.2013Выбор инструментальной среды для разработки базы данных. Подсистема сбора, обработки и загрузки данных. Укрупненный алгоритм разрабатываемой информационной системы. Формирование области запросов базы, интерфейс ввода и редактирования входных данных.
курсовая работа [2,2 M], добавлен 25.12.2012Разработка структуры базы данных. Этапы разработки информационной системы. Моделирование сигналов в MatLab. Обмен данными в SQL-сервером. Генерация схемы базы данных для целевой СУБД. Редактирование параметров таблицы. Установка параметров генерации.
курсовая работа [5,3 M], добавлен 01.02.2013Структура автомата для сбора данных. Программы, реализующие заданный пользователем алгоритм автоматизации процедуры обработки журнальных данных. Описание микропроцессорной системы, ее упрощенная модель, система команд, блок-схема алгоритма обработки.
контрольная работа [65,8 K], добавлен 14.11.2010Расмотрение системы распределенной обработки данных подсистемы "Ведомственная статистика" АИС ФССП России. Основные формы отчётности, производимые подсистемой. Форматы передачи данных. Окно выгрузки шаблона отчетной формы. Тестирование системы приложения.
отчет по практике [879,5 K], добавлен 21.11.2014Технология сбора информации традиционными методами. Правила сбора оффлайновой информации. Технические средства сбора информации. Операции для быстрого восстановления данных в системах хранения. Технологический процесс и процедуры обработки информации.
курсовая работа [304,5 K], добавлен 02.04.2013Создание систем автоматизированного сбора и обработки данных. Разработка информационной системы гостиничного комплекса. Выбор требуемой СУБД и программного обеспечения. Концептуальное, логическое проектирование. Организация ввода данных в базу данных.
дипломная работа [790,1 K], добавлен 13.02.2016Термины "логический" и "физический" как отражение различия аспектов представления данных. Методы доступа к записям в файлах. Структура систем управления базами данных. Отличительные особенности обработки данных, характерные для файловых систем и СУБД.
лекция [169,7 K], добавлен 19.08.2013Определение базы данных и банков данных. Компоненты банка данных. Основные требования к технологии интегрированного хранения и обработки данных. Система управления и модели организации доступа к базам данных. Разработка приложений и администрирование.
презентация [17,1 K], добавлен 19.08.2013Обзор существующих решений на основе открытых данных. Технологии обработки данных и методы их визуализации. Социальные сети для извлечения данных. Ограничение географической локации. Выбор набора и формат хранения открытых данных, архитектура системы.
курсовая работа [129,5 K], добавлен 09.06.2017Понятие медицинской информационной системы, принципы и подходы ее формированию и организации. Структура хранения данных, их ввод и предоставление. Программные способы формализации и проверки. Реализация и концептуальная модель базы данных, ее интерфейс.
дипломная работа [1,0 M], добавлен 19.06.2015Порядок сбора данных с помощью программного обеспечения "ПРОЛОГ". Языки программирования VBA и HTML, их характерные особенности. Web-сервера Apache, принцип работы серверной системы. Реализация сбора данных и разработка сайта с показаниями приборов.
дипломная работа [4,4 M], добавлен 24.09.2014Основные понятия базы данных. Разработка сложной формы для обработки данных. Модели организации данных. Архитектура Microsoft Access. Реляционные связи между таблицами баз данных. Проектирование базы данных. Модификация данных с помощью запросов действий.
лабораторная работа [345,5 K], добавлен 20.12.2011Характеристика сущности и назначения автоматизированных информационных систем (АИС), под которыми понимают совокупность информационных массивов технических, программных и языковых средств, предназначенных для сбора, хранения, поиска, обработки данных.
контрольная работа [24,4 K], добавлен 29.08.2010Автоматизация сбора и обработки данных. Основы, таблицы и средства для работы с базами данных. Инструментальные средства и компоненты. Технология создания приложения. Работа с псевдонимами и со связанными таблицами. Система управления базами данных.
методичка [1,5 M], добавлен 06.07.2009Система управления базами данных задач и составляющих их процессов предприятия. Требования к информационной системе. Состав запросов к базе данных. Связи и отношения между информационными объектами. Алгоритмы работы и архитектура информационной системы.
курсовая работа [727,5 K], добавлен 02.02.2014Изучение особенностей информационного процесса обработки данных. Процессы, связанные с поиском, хранением, передачей, обработкой и использованием информации. Основные режимы обработки данных на ЭВМ. Организация обслуживания вычислительных задач.
реферат [130,9 K], добавлен 28.09.2014Современные базы данных – многофункциональные программные системы, работающие в открытой распределенной среде изучении администрирования базы данных. Способы организации внешней памяти баз данных. Системы управления базами данных для хранения информации.
курсовая работа [185,6 K], добавлен 07.12.2010