Анализ и прогнозирование показателей системы интеллектуального здания

Анализ системы управления подсистемами технического обеспечения интеллектуального здания. Особенность применения нейронных сетей. Сравнение методов случайных лесов, наивного байесовского классификатора и градиентного бустинга для задач прогнозирования.

Рубрика Программирование, компьютеры и кибернетика
Вид диссертация
Язык русский
Дата добавления 04.12.2019
Размер файла 3,8 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Пермский филиал федерального государственного автономного образовательного учреждения высшего образования

«Национальный исследовательский университет «Высшая школа экономики»

Факультет экономики, менеджмента и бизнес-информатики

Магистерская диссертация

АНАЛИЗ И ПРОГНОЗИРОВАНИЕ ПОКАЗАТЕЛЕЙ СИСТЕМЫ ИНТЕЛЛЕКТУАЛЬНОГО ЗДАНИЯ

Куклин Виталий Викторович

Пермь, 2019 год

Аннотация

Автор - Куклин Виталий Викторович, студент 2 курса магистратуры группы ИАУП 17-1 НИУ ВШЭ-Пермь. Тема магистерской диссертации - анализ и прогнозирование показателей системы интеллектуального здания. Работа содержит анализ систем управления техническими подсистемами интеллектуального здания, анализ аналогичных систем по управлению процессами здания, исследование методов для анализа данных, проектирование модуля анализа и прогнозирования для системы управления интеллектуального здания, реализацию модуля анализа и прогнозирования для системы управления ИЗ.

Текущее исследование включает в себя 3 главы:

1. Исследование системы управления техническими подсистемами ИЗ. Рассматриваются процессы управления техническими подсистемами ИЗ; проводится анализ данных системы управления ИЗ; исследуются существующие решения по управлению процессами здания.

2. Методы анализа данных. Рассматриваются методы, позволяющие работать с данными системы ИЗ, а также решать задачи прогнозирования и классификации; проводится проектирование модуля анализа и прогнозирования для системы управления ИЗ.

3. Разработка прототипа модуля анализа и прогнозирования для системы управления ИЗ. Для разработки рассматриваются несколько наборов данных, на основе которых строятся прогнозные модели с применением исследованных методов анализа данных.

Количество страниц - 84, количество иллюстраций - 43, количество таблиц - 10.

Оглавление

Введение

Глава 1. Исследование системы управления техническими подсистемами ИЗ

1.1 Анализ системы управления подсистемами технического обеспечения ИЗ

1.2 Анализ данных, используемых системой управления ИЗ

1.3 Анализ существующих систем управления процессами здания

1.3.1 NetPing

1.3.2 Crestron

1.3.3 Fibaro

1.3.4 ThingsBoard

1.3.5 Платформа «Стриж»

1.3.6 Сравнение существующих решений

Глава 2. Методы анализа данных

2.1 Обзор методов анализа данных

2.2 Методы анализа данных для прогнозирования и классификации

2.3 Сравнение методов анализа данных для задач прогнозирования и классификации

Глава 3. Разработка прототипа модуля анализа и прогнозирования для системы управления ИЗ

3.1 Проектирование модуля анализа и прогнозирования для системы управления ИЗ

3.2 Реализация прототипа модуля анализа и прогнозирования для системы управления ИЗ

3.2.1 Пример анализа данных температуры для управления зданием: задача прогнозирования температуры батареи

3.2.2 Пример анализа данных температуры для управления зданием: задача определения человека в помещении

Заключение

Библиографический список

Введение

Современные здания обладают сложной инфраструктурой, которая должна предоставлять комфортные и безопасные условия для её пользователей. Внутри здания содержатся такие компоненты, как кабельные системы, инженерно-технические системы, системы телекоммуникаций, а также информационные системы (документооборот, система видеонаблюдения и т.д.), которые требуют управления. С каждым годом количество подобных систем, а также устройств, увеличивается. Современное здание имеет большое количество устройств, следовательно, человеку становится сложно эффективно управлять каждым из них. Постоянный контроль и мониторинг устройств доставляет человеку неудобства, однако и пристальный контроль не гарантирует эффективное управление каждым из них. В связи с этим многие устройства потребляют значительно больше ресурсов, чем необходимо для создания комфортных условий. Для решения данных проблем в последние годы активно развиваются решения, получившие названия «Умный дом», «Умный офис» и «Интеллектуальное здания», которые направлены на удобное управление устройствами дома, а также на эффективное использование устройств для создания комфортных условий.

Недавние исследования определяют термин «интеллектуальное здание» (далее ИЗ) как современное здание, имеющее сложную инженерную архитектуру с автоматизированной информационной системой для управления и мониторинга [1]. Исследования в области ИЗ многочисленны, в работах авторы определяют следующую специфику ИЗ:

· возможность использования программных и аппаратных устройств разных производителей;

· использование таких устройств, как контроллеры, модули ввода-вывода, средства отображения информация и т.д. [2];

· возможность изменения инженерных систем;

· использование большого количества информационных датчиков для сбора информации о функционировании здания [3].

Информационная система (далее ИС) ИЗ работает с различными инженерными системами, содержащими большое количество датчиков и исполнительных механизмов. Показания этих датчиков необходимо постоянно контролировать и анализировать, что является достаточно сложной задачей, т.к. постоянно будет поступать колоссальный объем данных, которые необходимо доступным образом интерпретировать для пользователя. Кроме того, в соответствии с полученными данными ИС должна принимать решения о выполнении необходимых действия для обеспечения комфортных условий (например, увеличить мощность радиатора для увеличения температуры в доме).

Существующие решения по оптимизации расходов устройств дома, как правило, направлены на частные дома, а также имеют достаточно узкий круг потребителей из-за высокой стоимости установки и последующей поддержки информационной системы. Системы интеллектуального здания для многоквартирных домов начинают только появляться. Чаще всего такие системы проектируются ещё при постройке многоквартирного здания, т.е. инфраструктура дома создается с учётом требований для функционирования ИС. Подобные ИС можно внедрить только в строящиеся дома с необходимой инфраструктурой, т.е. решение не сможет получить глобальное распространение в виду описанных ограничений.

К проблемам обработки больших объемов данных относится следующее: колоссальных объемов данных для анализа; высокая частота обновления данных; не определены форматы хранения показаний датчиков. В рамках данного исследования проблема заключается в отсутствии методики для проектирования модуля анализа на основе методов для обработки показаний датчиков.

Перечисленные характеристики соответствуют задачам, на решение которых направлены методы анализа данных. Чаще всего методы анализа данных используются для разработки решений в системах бюджетирования, системах планирования материально-технического обеспечения, аналитических CRM-системах, системах управления инвестиционными проектами. В рамках данного исследования методы анализа данных будут применены для решения задач анализа и прогнозирования показаний датчиков ИЗ.

Развитие проектов, связанных с решением задач минимизации энергопотребления, поддерживаются государством. Этому свидетельствуют национальные программы по развитию проектов «Умные города» (Интеллектуальные города). Так, например, в 2019 года были утверждены семь городов на включение в программу федерального проекта «Умные города», был создан национальный центр компетенций «Умный город», кроме того, реализация проекта «Умный город», утвержденного Минстроем в 2018, уже находится на этапе разработки [4]. Не только в России, но в Европе и США происходит активная популяризация решений, подобных «Умному городу» [5]. Однако разрабатываемые решения, как правило, направлены на узкий круг потребителей и имеют достаточную высокую стоимость установки и дальнейшей поддержки.

Объектом исследования система управления техническими подсистемами интеллектуального здания.

Предметом исследования являются средства анализа и прогнозирования показателей ИЗ.

Цель работы - разработка прототипа модуля анализа показаний датчиков системы интеллектуального здания.

Для достижения поставленной цели необходимо решить следующие задачи:

1. Провести анализ предметной области:

a. проанализировать процессы управления зданием;

b. определить и выделить наиболее значимые для управления ИЗ параметры;

c. проанализировать существующие системы управления процессами здания.

2. Проанализировать методы анализа данных для обработки показателей системы ИЗ.

3. Спроектировать и реализовать прототип модуля анализа и прогнозирования для системы управления ИЗ.

4. Провести тестирование прототипа модуля на основе реальных данных.

При выполнении будут использованы следующие методы исследования: методы анализа данных, методы обработки временных рядов. На первом этапе работы необходимо исследовать методы, применяемые для обработки больших объёмов данных, а также рассмотреть примеры применения таких методов. В результате проведения исследования будут получены теоретические данные о необходимых для интеллектуального анализа больших объёмов данных, которые будут применены в последующих исследованиях.

Глава 1. Исследование системы управления техническими подсистемами ИЗ

В данной главе проведен анализ систем управления подсистемами технического обеспечения ИЗ. Затем рассматриваются данные, которые используются в системе управления ИЗ. Далее рассматриваются существующие системы управления процессами здания, проводится их сравнение.

1.1 Анализ системы управления подсистемами технического обеспечения ИЗ

Современные ИЗ характеризуются сложной инфраструктурой и множеством информационных точек, взаимодействующих между собой. К ИЗ относятся развлекательные и торговые центры, аэропорты, складские помещения, офисные здания и т.п. В крупных городах число и разновидности подобных сооружений увеличивается довольно быстро. ИЗ в ходе эксплуатации требуют учитывать такие факторы, как обеспечение комфортных условий отдыха и труда, безопасность, уменьшение потребления ресурсов. Учёт подобных факторов порождает ряд проблем, связанных с хранением и анализом накапливающихся больших объемов данных. Одним из способов решения данных проблем - автоматизация управления инженерными подсистемами (климат контроль, безопасность, освещение и т.п.) ИЗ с применением современных технологий Internet of Things (далее IoT).

ИЗ относится к категории человеко-машинных систем. По этой причине в рамках исследования предложено рассмотреть в качестве основополагающего метода - кибернетический подход. Данный подход подразумевает несколько базовых компонент: объект, субъект, алгоритм управление и среда. В соответствии с этим подходом алгоритм управления предполагает в воздействиях на управляющие механизмы, которые позволяют корректировать состояния объекта. Таким образом, управление ИЗ достигается за счёт воздействия на объект управления (далее ОУ) для корректировки состояния объекта (состав воздуха, влажность, температура, освещенность и т.д.). Стоит отметить, что в процессе принятия решения о воздействии на ОУ необходимо учитывать влияние окружающей среды, что позволит повысить точность прогнозирования подсистем ИЗ.

Итак, систему управления подсистемами ИЗ на основе кибернетического подхода в виде схемы (см. рис.1.1) можно изобразить [1]:

Рисунок 1.1. Система управления подсистемами технического управления интеллектуального здания

Данная схема требует более детального описания в виду многочисленных обозначений: V - окружающая среда, которая оказывает воздействие на ОУ (интеллектуальное здание). Показания с датчиков системы и текущее состояние окружающей среды - входные параметры для субъекта управления, который формирует решение о формировании воздействия (). Рассматриваемая схема предполагает три воздействий:

· - воздействие, поступающее с датчиков, которые передают показания в ИЗ.

· - воздействие, поступающее из системы формирования отчетов на субъект управления (далее СУ).

· - воздействие, поступает с датчиков, измеряющих состояние окружающей среды.

В рамках рассматриваемой системы выделяются два контура управления:

· контур А включает исполнительный механизм (далее ИМ), контроллер, ОУ с датчиками. В рамках контура А предусмотрена обратная связь по ОУ, реализованная в автоматическом режиме с помощью контроллера;

· контур B включает СУ, ИМ, контроллер ОУ с датчиками, и систему формирования отчётности. Контур В предполагает реализацию обратной связь по ОУ с применением системы формирования отчетности в ручном режиме.

В рассматриваемой схеме изменение параметров ИМ влияет на параметры ОУ. Кроме того, на ОУ влияют показания состояния окружающей среды. Таким образом, такие цели, как энергосбережение, снижение эксплуатационных расходов, можно достичь посредством минимизации затрачиваемых ресурсов (R). Достижение целей безопасности, обеспечение комфортных условий отдыха и труда будут достигаться установлением нормативных значений на ОУ и ИМ.

В существующих системах субъектом управления является оператор, который устанавливает нормативные значения параметров ИМ на основе информации системы. Однако существует ряд причин, в виду которых ручное управление ОУ становится весьма непростым процессом:

· параметры ОУ, ИМ и окружающей среды имеют разные законы изменения;

· неунифицированные нормативные значения, т.к. данные значения составлены с учётом усредненной статистики и не учитывают особенностей текущего состояния ОУ и окружающей среды;

· нетривиальная зависимость ОУ и ИМ, ОУ и окружающей среды;

· инертность системы, не позволяющая оперативно воздействовать на ОУ в соответствии с изменениями окружающей среды.

Разработка информационной системы, содержащую интеллектуальный модуль на основе методов Data Mining (субъект управления), может разрешить описанную выше проблему. Основной функцией модуля Data Mining (далее DM) будет поиск зависимостей между показаниями окружающей среды, ОУ и ИМ. Данный набор функций позволит прогнозировать параметры ОУ и ИМ для того, чтобы корректировать их параметры с учётом инертности системы. Таким образом, модуль DM позволит прогнозировать будущие значения параметров системы с учетом информации, поступающей с датчиков ИЗ. Другими словами интеллектуальный модуль позволит осуществлять предиктивное управления системой ИЗ. Схема системы управления подсистемами технического обеспечения ИЗ с модулем DM (контур С) показана ниже (см. рис. 1.2):

Рисунок 1.2. Система управления подсистемами технического управления интеллектуального здания с модулем анализа данных

Рассмотренная схема, отображенная на рис.1.1, может быть реализована в системе ИЗ следующим образом:

· информация о состоянии ИЗ собирается с датчиков ОУ с помощью специализированного программного обеспечения, например, с применением системы ThingsBoard (более подробное описание системы см. в разделе 1.2.4);

· собираемая информация сохраняется в виде файлов в формате csv или записывается в хранилище данных, например, Apache Cassandra или InfluxDB. В рамках исследования для упрощения информация с датчиков хранится в файлах в формате csv;

· для собранной информации необходима подготовка к анализу и формированию отчётов: удаление пропусков и аномальных значений, специальная подготовка для анализа (агрегация и др.), если есть необходимость. Далее необходим анализ данных и визуализация в виде отчётов. Функции, озвученные в данном пункте, могут быть реализованы посредством языка R или Python;

· сформированные отчёты направляются СУ, которым в данной схеме является человек. СУ принимает решение, каким образом скорректировать работу контроллера для изменения состояния ОУ;

· контроллер даёт команду ИМ, который оказывает воздействие на состояние ОУ, т.е. здания.

Схема, предполагающая модуль анализа «DM» (рис.1.2), отличается от схемы без модуля анализа тем, что СУ, т.е. человек в данном случае будет принимать минимальное участие в управлении ИЗ:

· информация с датчиков здания также будет собираться с помощью специализированного программного обеспечения, например, с применением системы ThingsBoard;

· информация будет сохраняться в виде файлов в формате csv или записываться в хранилище данных, например, Apache Cassandra или InfluxDB;

· далее предполагается очистка и трансформации данных, построение прогнозных, рекомендательных моделей, которые будут передавать данные непосредственно на контроллер. Контроллер с учётом составленных прогнозов будет отправлять сигнал на ИМ, таким образом, комфортные условия ОУ будут корректироваться без участия человека. Данные функции могут быть реализованы посредством языков R или Python;

· при необходимости человек может принять участие в процессе управления ИЗ, например, изменить параметры (температура, влажность и т.д.) для ОУ.

1.2 Анализ данных, используемых системой управления ИЗ

ИЗ включает огромное количество устройств, которые накапливают информацию в разрезе времени, т.е. данные представляют из себя временные ряды. Накапливаемые ИЗ данные имеют ряд следующих особенностей:

· высокая гранулярность данных. Показания датчиков измеряются, как правило, чаще одного измерения в минуту, поэтому данные имеют высокую степень детализации. Такая степень детализации не является необходимым условием для эффективного управления ИЗ.;

· однородность и повторяемость данных. Измерения имеют цикличный характер, повторяются через некоторые промежутки времени в зависимости от влияния внешних факторов;

· наличие пропусков и аномальных показаний. Показания снимаются с датчиков, которые передают информацию на сервер посредством интернета. Пропуски и аномалии могут появляться в связи с отсутствия интернета или, например, из-за выхода из строя датчика.

В текущем исследовании будут рассмотрены методы анализа данных, которые чаще всего работают с данными бизнеса. Бизнес для принятия эффективных решений требует сбора данных из различных систем и источников. Собираемая информация о бизнесе не имеет такую степень гранулярности, как в технических системах, к которым относится ИЗ. Однако поставляемые данные должны быть очень точны, достоверны и иметь определенный формат и структуру, т.к. при анализе любые ошибки окажут влияние на конечный результат, что может привести к большим потерям бизнеса. Кроме того, любые неопределенности в данных бизнеса не могут сглаживаться, так как они основаны на реальном положении дел компании и также влияют на конечный результат анализа. Однако подобные методы анализа данных имеют ряд рисков и ограничений, как отмечалось ранее:

· качество данных. Применение методов анализа данных не может гарантировать увеличение эффективности бизнеса, если поставляемые данные не будут должным образом очищены, преобразованы и консолидированы;

· динамика изменения технологий. Технологии имеют свойство быстрой изменчивости. Соответственно, требуется регулярно проводить апробацию новых решений, производить унификацию и типизацию, иначе бизнесом будут использованы неэффективные средства и инструменты.

Таким образом, применение методов анализа данных требует предварительной обработки данных, иначе их применение неэффективно. В рамках данного исследования будет проведена апробация методов анализа данных для прогнозирования показаний датчиков системы ИЗ, к основным задачам которого относятся:

· обеспечение комфортных условий. Данная задача подразумевает создание для человека условий, комфортных для повседневной жизни. К условиям, например, относится температура воздуха, влажность, содержание воздуха. Система ИЗ должна в автоматическом режиме поддерживать озвученные параметры в интервале значений, комфортном для человека (например, температура воздуха в пределах 18-20 градусов). Для управления рассматриваемой задачей необходим сбор информации со следующих датчиков: датчики измерения температур воздуха и батареи, датчики состава воздуха, датчики влажности;

· обеспечение безопасности. Критерий подразумевает принятие системой мер безопасности (оповещение владельцев здания, блокировка проникшего человека) в случае проникновения в здание злоумышленников, а также при возникновении аварийных ситуаций, таких как утечка газа, пожар. Для управления рассматриваемой задачей необходим сбор информации со следующих устройств: датчики пожарной сигнализации, датчики дыма, датчики утечки газа, датчики утечки воды, система распознавания лиц (для обнаружения посторонних лиц);

· энергосбережение. Одной из основных задач системы ИЗ является энергосбережение (оптимизация системы отопления, системы кондиционирования и др.). Существующие централизованные системы отопления ведут управление без учета особенностей конкретного помещения, что часто приводит к перегреванию помещений и, соответственно, к излишним затратам энергии. Система ИЗ должна автоматически регулировать температуру батареи, систему кондиционирования (в зависимости от присутствия человека в помещении, условий окружающей среды) в целях минимизации ресурсов и формирования комфортных условий. Для управления рассматриваемой задачей необходим сбор информации со следующих устройств: датчики температуры комнаты, окружающей среды и температуры батареи, датчики кондиционера (датчики давления кондиционера, датчик внутренней температуры, датчик внешней температуры), датчики освещения;

· снижение потребления ресурсов. Для системы ИЗ немаловажной задачей является минимизация ресурсов (освещение, холодная/горячая вода, газ) при условии поддержания комфортных условий. Зачастую, например, при достаточном освещении в помещениях работают световые приборы, которые затрачивают излишние ресурсы. В данной ситуации система ИЗ должна автоматически включать свет при недостаточном освещении и, соответственно, выключать при избыточном освещении. Для управления рассматриваемой задачей необходим сбор информации со следующих устройств: датчики воды (холодная, горячая), датчики газа, датчики освещения, датчики температуры воздуха в комнате и на улице, датчики температуры батареи, датчики освещения.

Для решения озвученных выше задач система ИЗ предполагает в объекте управления наличие большого количества датчиков, как и отмечено выше: датчики измерения температур, влажности воздуха, состава воздуха, освещенности помещения, измерения воды (горячей/холодной) и многие другие. Соответственно, требуется хранить большие объемы данных, необходимые для анализа, что является проблемой для систем такого типа и собираемые объёмы необходимо сокращать. Некоторые датчики, в частности датчики измерения температуры воздуха, измеряют показание ежесекундно, что и порождает большие объемы данных. Однако многие показания с датчиков не требуют такой (измерения каждую секунду) гранулярности. В зависимости от решения задачи необходимы данные различной гранулярности.

1.3 Анализ существующих систем управления процессами здания

Рассмотрим несколько существующих решений для управления процессами здания. Платформы должны иметь возможность сбора, хранения, визуализации, а также анализа данных.

1.3.1 NetPing

Система «NetPing» разработана для мониторинга показателей окружающей среды. Разработчик системы - отечественная компания «Alentis Electronics». Принцип работы системы, а также её компоненты показаны ниже на рис 1.3.

Рисунок 1.3. Компоненты и их взаимодействие в системе «NetPing»

NetPing предоставляет следующие функции:

· управление безопасностью за счёт считывания информации с датчиков (утечка газа, обнаружение дыма, протечка воды) и подсистем (антивандальная подсистема, подсистема видеонаблюдения);

· мониторинг и управление энергопотреблением;

· управление микроклиматом посредством считывания показаний с датчиков температуры и влажности;

· управление освещением по установленным пользователем параметрам;

· оповещение пользователей о чрезвычайных ситуациях и неполадках объекта управления с использованием электронной почты и SMS;

· предоставление доступа к системе в режиме онлайн через HTTP.

Система «NetPing» позволяет подключать на одно устройство до 16 датчиков [12]. Интерфейс системы интуитивно понятен, пример интерфейса системы см. на рис. 1.4.

Рисунок 1.4. Интерфейс для контроля датчиками в системе «NetPing»

Рассматриваемая система не привязана строго к ПО мониторинга «NetPing». В качестве систем мониторинга могут применяться системы таких производителей, как Zabbix, PRTG Network. Для пользователей это предоставляет дополнительное преимущество, например, в том, что он может выбрать наиболее удобное для него приложение (Android или iOS).

1.3.2 Crestron

Система Creston, разработанная в США, является одной из мировых лидеров подобных систем, так как она очень надежна и технологична. Кроме того, система имеет достаточно обширный спектр предоставляемых возможностей:

· управления. Решение интегрировано под iPad и IPhone (см. рис.1.5), кроме того вход также доступен через браузер с любого устройства;

· система управления освещением. Система гибка, т.к. использует надежную технологию управления освещением iLux, которая позволяет функционировать в 6 автоматических режимах. Также пользователь имеет возможность самостоятельно настраивать степень освещенности интересующих его зон помещения;

· система отопления (кондиционирования). Система позволяет сократить энергопотребление, не создавая некомфортных условий;

· система вентиляции позволяет в автоматическом режиме управлять циркуляцией воздуха в помещениях;

· управление мультимедиа. Используемая в системе технология ADMS позволяет связать все мультимедийные устройства дом.

Рисунок 1.5. Интерфейс системы «Creston»

Рассматриваемое решение является дорогостоящих, т.е. оно рассчитано лишь на узкий круг потребителей. Кроме того, в систему Creston могут быть привязаны только определенные устройства, что подчеркивает негибкость рассматриваемого решения [13].

1.3.3 Fibaro

Система Fibaro является системой интеллектуального здания, которая разработана на базе беспроводной технологии передачи данных Z-wave. Установка рассматриваемого решения не требует специализированного монтажа, поскольку взаимодействие модулей осуществлено также с использованием технологии Z-wave. Система непрерывно оценивает состояние помещения посредством установленных датчиков, при возникновении внештатных ситуаций отправляет уведомления владельцам здания. Fibaro имеет возможность интеграции со сторонними системами. Система Fibaro управляется посредством платформы «Home Center 2». Интерфейс «Home Center 2» (см. рис.1.6) интуитивно понятен неопытным пользователям и, как правило, без проблем позволяет владельцам осуществлять управление и мониторинг системой [15].

Рисунок 1.6. Интерфейс системы «Fibaro»

1.3.4 ThingsBoard

ThingsBoard представляет собой IoT платформу с открытым исходным кодом. Платформа позволяет осуществлять разработку, масштабирование и управление проектов IoT. Кроме того, к спектру функций, предоставляемых платформой, относятся:

· сбор и визуализация данных с устройств;

· возможность обработки нетривиальных событий и запуск аварийных сигналов;

· управление устройствами с помощью удаленного вызова процедур (RFC);

· передача собираемых данных в другие системы;

· создание динамических и гибких панелей.

Интерфейс программы интуитивно понятен (см. рис.1.7-1.8), разобраться с основными функциями платформы не составит труда даже неопытному пользователю [16].

Рисунок 1.7. Визуализация данных с датчиков в платформе «ThingsBoard»

Рисунок 1.8. Виджеты с датчиков в платформе «ThingsBoard»

1.3.5 Платформа «Стриж»

«Стриж» представляет собой решение отечественного производителя на основе технологии Low-Power Wide-Area Network (LPWAN), которая отличается низким энергопотреблением и обширным охватом. Основное предназначение системы - сбор данных с датчиков, счётчиков и т.п. «Стриж» не предназначен для работы с устройствами сторонних производителей. Для эксплуатации может использоваться только оборудование компании. С одной стороны это говорит о том, что решение не является гибким, однако с другой стороны компания несет ответственность за свои измерительные устройства, что, безусловно, стоит отнести к преимуществам платформы. Рассматриваемое решение обеспечивает развертывание, как в частных, так и в публичных секторах в короткие сроки, с небольшими затратами [17].

Рисунок 1.9. Пример интерфейса платформы «Стриж»

1.3.6 Сравнение существующих решений

Сравним рассмотренные выше аналогичные системы по нескольким выделенным критериям (см. табл.1.1): цена установки базового пакета информационной системы, простота настройки ИС, открытость системы, независимость от конкретного оборудования (возможность установки оборудования разных производителей), наличие мобильного приложения, возможность предиктивного управления.

Таблица 1.1. Сравнение систем управления процессами интеллектуального здания

Система

Критерий

NetPing

Home Sapiens

Major DoMo

Fibaro

Crestron

ThingsBoard

Стриж

Простота настройки

+

-

+

-

+

+

+

Открытость системы

-

-

+

-

-

+

-

Независимость от оборудования

+

+

+

-

-

+

-

Мобильное приложение

+

+

+

+

+

+

+

Возможность построения аналитических отчётов

-

-

-

-

+

+

+

Возможность предиктивного управления

-

-

-

-

-

-

-

Базовая цена (рубли)

от 1 500

от 2 000

от 0

От 23 000

от 130 000

От 0

От 200 000

По выделенным критериям ни одна из систем не может оказывать воздействия на исполнительные механизмы без участия человека с целью поддержания комфортных условий и минимизации затрачиваемых ресурсов. Рассмотренные системы не предполагают решение задач прогнозирования, т.е. в них отсутствует возможность предиктивного управления (отсутствует модуль «DM», изображенный на рис.1.2).

Глава 2. Методы анализа данных

Данная глава посвящена описание методов для анализа и прогнозирования показаний датчиков системы ИЗ. Первая часть главы посвящена рассмотрению групп методов анализа данных. Далее рассматриваются методы анализа данных, позволяющие решать задачи регрессии и классификации.

2.1 Обзор методов анализа данных

Для прогнозирования показателей системы ИЗ необходимо применение методов, которые позволяют анализировать большие объемы данных. К таким методам относятся методы анализа данных. Далее рассмотрим методы, которые часто используются для анализа больших объёмов данных.

Прогнозирование. Способность бизнес-аналитиков анализировать и прогнозировать направление будущего во многом определяет успех бизнеса, т.к. подобные знания - вектор развития компании. Соответственно, прогнозирование играет неоценимую роль в успехе бизнеса, позволяя эффективно планировать деятельность компании. Прогнозирование применяется с целью выявления закономерностей и тенденций. Чаще всего, точность рассматриваемого метода зависит от степени взаимозависимости данных: увеличение количества переменных при прогнозировании уменьшает точность предсказания, и наоборот. К методам прогнозирования относятся:

1. Анализ продолжительности или выживаемости.

2. Классификация и регрессионный анализ деревьев.

3. Многомерные адаптивные сплайны.

4. Методы машинного обучения (радикальные функции, нейронные сети, методы к-ближних соседей).

5. Метод регрессии (модель линейной регрессии).

6. Модель дискретного выбора (многокомпонентная логистическая регрессия, логистическая регрессия, пробит-регрессия).

Модель бизнес прогнозирования позволяет проводить анализ исторических данных с целью определения неявных паттернов данных. Модели бизнес прогнозирования могут применяться для выполнения транзакций и вычислений реального времени для внедрения решений, основанных на данных, что способствует увеличению эффективности бизнеса.

Комплексный анализ предполагает обработку данных с помощью On-Line Analytical Processing (OLAP). Преимуществами данного метода являются: возможность создания быстрых запросов, обход ограничений реляционных баз данных. Рассмотрим основные операции, предоставляемые комплексным анализом:

1. Анализ «Вдоль и поперёк» (Slice and Dice). Данная операция предполагает разбиение крупных сегментов данных на более мелкие с целью получения необходимого для анализа уровня детализации. Операция «Slice» - формирование объединений измерений для получения разных срезов данных. Операция «Dice» - разбиение данных инфо-куба на измерения.

2. Детализация и агрегация (Drill Down/Up). Данная операция позволяет работать с данными на разных уровнях детализации.

3. Вращение (Pilot). Операция позволяет изменять измерения отчётов. Например, менять местами строки и столбцы.

4. Вложение (Nesting). Данная операция позволяет отображать данные одного измерения внутри другого.

Data Mining (добыча данных) - это процесс обнаружения в «сырых данных» знаний, ранее неизвестных и практически полезных для принятия решений. Технология Data Mining предназначена для поиска неочевидных и практически полезных закономерностей в колоссальных объёмах данных. Рассмотрим основные задачи Data Mining:

Классификация. Наиболее простая задача DM. В процессе решения данной задачи проводится поиск характерных признаков для исследуемого набора данных, т.е. выделяются группы объектов (классы) с уникальными признаками. При этом новый объект согласно выделенным признакам относят к одному из классов. Задача классификации решается с помощью таких методов, как нейронные сети, байесовские сети, индукция деревьев решений, ближнего соседа, k - ближнего соседа.

Кластеризация. Задача кластеризации - логическое продолжение идеи классификации, однако она более сложна. Задача характеризуется тем, что в ней не предопределены заранее классы объектов. Результат кластеризации - группы объектов.

Ассоциация. Задача заключается в поиске закономерности между связанными объектами в рассматриваемом наборе данных. Поиск закономерностей осуществляется между несколькими событиями, происходящими одновременно. Наиболее распространенным алгоритмом решения задачи является алгоритм «Apriori».

Последовательность. Задача похожа на ассоциацию за исключением того, что поиск закономерностей осуществляется не между событиями, происходящими одновременно, а между событиями, которые связаны по времени.

Прогнозирование. Задача заключается в оценке будущих или пропущенных значений на основе особенностей исторических данных. Для решения задачи прогнозирования используются нейронные сети, методы математической статистики и другие.

Определение отклонений или выбросов. Целью метода является обнаружение данных, наиболее отличающихся от общего множества.

Визуализация. Задача необходима для отображения графического образа анализируемых данных. Примерами визуализации являются данные в 2D и 3D измерениях.

Регрессия. Задача предполагает определение некого значения параметра по известным характеристикам рассматриваемого объекта. Отличие от задачи классификации заключается в том, что значением искомого параметра является множество действительных чисел, а не конечное количество классов.

Системе ИЗ необходимо решать ряд задач, входящих в задачи DM и Прогнозирования, в частности необходимо решать задачи регрессии (например, для прогнозирования температуры батареи) и классификации (для определения присутствия человека, более подробно см. Главу 3). Ниже представлена табл.2.1. , обосновывающая выбор методов для анализа и прогнозирования показаний датчиков ИЗ из рассмотренных групп методов.

Таблица 2.1. Выбор групп методов анализа данных

Основные задачи системы ИЗ

Определение паттернов

Сопоставление паттернов с заданными шаблонами

Классификация событий (определение человека в помещении)

Группы методов

Комплексный анализ

Прогнозирование

+

+

Модель бизнес-прогнозирования

Data Mining

+

+

+

Необходимо использование методов, которые позволяют проводить прогнозирование и классификацию, к которым относятся методы DM, прогнозирование. Ниже представлена табл.2.2, отражающая выбор задач Data Mining, которые необходимо решать в системе ИЗ.

Таблица 2.2. Выбор методов анализа данных

Основные задачи системы ИЗ

Определение паттернов

Сопоставление паттернов с заданными шаблонами

Классификация событий (определение человека в помещении)

Методы

DM

Кластеризация

Класси-фикация

с учителем

+

+

без учителя

самообуч.

Ассоциация

Последовательность

Регрессия

+

+

Прогнозирование

Прогнозирование

Классификация и регрессионный анализ деревьев

+

+

Многомерные адаптивные сплайны

Методы машинного обучения

+

+

Модель линейной регрессии

+

Метод дискретного выбора

Итак, для решения задач ИЗ могут быть использованы методы прогнозирования и DM, которые и будут далее рассмотрены.

2.2 Методы анализа данных для прогнозирования и классификации

Нейронные сети

Под термином нейронных сетей скрывается целый набор техник, которые основаны на моделях обработки данных, позволяющих имитировать деятельность головного мозга. Подобно мозгу, они состоят из большого количества взаимосвязанных между собой элементов - нейронов, моделирующих нейроны мозга. На рис. 2.1 изображена функциональная схема нейрона. интеллектуальный здание нейронный сеть

Рисунок 2.1. Функциональная схема нейрона

Нейрон имеет несколько входов (x1, x2, …xn). На входы поступает сигнал, который по синапсам связывает их с ядром. Само ядро осуществляет обработку информации. Аксон - связующее звено нейрона с нейронами другого слоя. Если же скрытых уровней нет, то аксон представляет из себя выходной сигнал. Кроме того, синапс имеет вес, который определяет в какой степени определенный вход нейрона влияет на его состояние.

Нейронная сеть - соединение нескольких слоев нейронов, которые соединены между собой синапсами (см. рис. 2.2).

Рисунок 2.2. Шестислойная нейронная сеть

Нейронные сети могут использоваться как для описательных модельных данных, так и для моделей, решающих задачи прогнозирования. Популярность данного метода определяется в первую очередь возможностью обучения сети. Обучение нейронной сети подразумевает процесс настройки весов синапсов, так чтобы конечный прогноз сети был адекватен в рамках решаемой задачи. Для обучения сети формируется обучающая выборка. Для обучения сети чаще всего используют обучение с учителем, который подразумевает разбиение всего набора данных на тестовую и обучающую выборки данных, при этом разбиение на выборки может быть произвольным. В соответствии с таким методом обучения, обучающие данные используются для обучения нейронной сети, а тестовые - для определения отклонения результатов сети от реальных данных. При этом стоит отметить, что если ошибка на обучающих данных уменьшается, а на тестовых увеличивается, то принято говорить о переобучении сети. Кроме того, при обучении сети могут возникнуть и другие сложности, например, может возникнуть такая проблема, как попадание сети в локальный минимум поверхности ошибок. К сожалению, дать предсказание о возникновении той или иной проблемы при обучении сети невозможно, как и дать точные рекомендации по разрешению возникших проблем. Описанные выше алгоритмы относят к итерационным, обучение которых нельзя полностью автоматизировать. Однако также существуют не итерационные алгоритмы обучения, которые обладают высокой степенью устойчивости. Кроме того, не итерационные алгоритмы позволяют полностью автоматизировать процесс обучения сети.

Нейронные сети, имеющие несколько слоев в сравнении с однослойными, значительно превосходят их по способности распознавания. Однако и обучение многослойных сетей значительно сложнее. Процесс обучение сетей с обратной связью ещё более трудоемок, однако такие модели сетей дают более качественные прогнозы.

При применении нейронных сетей необходимо учитывать ряд особенностей, в частности, входными и выходными параметрами сети являются числа, поэтому при необходимости применения качественных характеристик необходимо их преобразовывать в числовой формат для получения приемлемых результатов.

Одним из основных преимуществ нейронных сетей является способность решения неформализованных задач. При этой сети позволяют достаточно просто моделировать различные ситуации, вводя на вход различные данные и получая на выходе результат сети [18].

Регрессионный анализ

Регрессионный анализ - это метод моделирования данных, который направлен на исследование их взаимосвязей. Одно из элементарных применений регрессионного анализа предполагает построение моделей для прогнозирования новых числовых значений, основываясь на известный набор данных. В частности, регрессионные модели позволяют выявлять особенности рассматриваемого объекта и на основе полученных данных достаточно точно предсказывать его поведение. При построении регрессионной модели данные подразделяются на пары: зависимая переменная - независимая переменная. Таким образом, регрессионная модель представляет собой функцию независимой переменной и параметров с добавленной случайной переменной. Чаще всего, основная задача построения модели сводится к настройке параметров таким образом, чтобы модель наиболее точно была приближена к данным. Качество построенной модели измеряют обычно среднеквадратичной ошибкой [19].

Регрессия может быть линейной и множественной. Тип регрессии определяется количеством независимых переменных. Кроме того, применяются и логистическая регрессия, которая представляет из себя метод построения классификатора. Отличие логистической регрессии от классической регрессии заключается в том, что логистическая регрессия не предполагает предсказание числовых значений на основе исходной выборки данных. Основная задача логистической регрессии - определение вероятности того, что искомое значение принадлежит к одному из рассматриваемых классов [20].

Применение регрессионного анализа достаточно обширно. Одной из главных задачах является прогнозирование временных рядов. Так типовыми задачами являются: предсказание температуры воздуха, предсказание биржевых курсов акций и другие подобные.

Дерево решений

Дерево решений - метод поддержки принятия решений, который используется в статистике и анализе для построения прогнозных моделей. Метод содержит в себе представление правил в виде дерева. При этом правило определяется как логистическая конструкция «если, то». Существуют различные алгоритмы для реализации рассматриваемого метода: алгоритм ID3, алгоритм C4.5, MARS, CART и т.д. Однако следующие алгоритмы являются наиболее популярными [21]:

· C4.5. Данный алгоритм не работает с непрерывными целевыми полями, следовательно, алгоритм направлен только на решение задач классификации;

· CART (Classification and Regression Tree). Алгоритм предполагает, что каждый узел дерева имеет строго двух потомков. CART позволяет решать задачи не только классификации, но и регрессии.

Для решения задач данного исследования необходимо разрешение задач регрессии и классификации. Поэтому выбран алгоритм CART, который будет реализован на языке R (подробнее в главе 3).

Метод случайных лесов

Метод случайных лесов (Random Forest) является разновидностью метода случайного подпространства. Алгоритм предусматривает два этапа: создание множеств деревьев принятия решения, сокращение корреляции между оценками в ансамбле с помощью обучению их случайным выборкам признаков. Random Forest позволяет решать задачи регрессии и классификации. К основным преимуществам рассматриваемого метода относится:

· эффективность обработки информации с большим набором признаков и классов;

· высокое качество обработки дискретных и непрерывных признаков;

· наличие встроенных методов для оценки значимости отдельных признаков;

· наличие внутренней оценки способности модели к обобщению [22] (тест

out-of-bag).

Метод наивного байесовского классификатора

Метод наивного байесовского классификатора представляет простой классификатор, в основе которого лежат теоремы Байеса со строгими предположениями о независимости. Другими словами, метод наивного Байеса предполагает, что наличие какого-то признака в классе не коррелирует с наличием какого-то другого признака. К преимуществам метода относится следующее:

· быстрота выполнения классификации, в том числе и многоклассовой;

· преобладание метода над другими алгоритмами, например логистической регрессии, при выполнении допущения о независимости переменных;

· метод наивного Байеса лучше работает с категориальными признаками, чем с непрерывными.

Недостатки метода следующие:

· если тестовая выборка содержит значение категориальной переменной, которое не встречалось в обучающей выборке, то присвоит в таком случае не сможет сделать прогноз;

· реальные наборы данных редко содержат полностью независимые переменные, а метод предполагает допущение о независимости переменных [23].

Метод градиентного бустинга

Метод градиентного бустинга основан на процедуре бустинга, которая представляет из себя последовательное построение алгоритмов машинного обучение, при условии, что каждый последующий алгоритм стремится ликвидировать неточности предыдущих алгоритмов. Рассматриваемый метод является жадным алгоритмом. Понятие бустинга берет истоки из работ по «Теории вероятно почти корректному обучению», которые затрагивают вопрос о возможности получения хорошего результата, имея множество некачественных алгоритмов.

В методе градиентного бустинга далеко не всегда качество модели увеличивается с увеличением количества деревьев. Количество деревьев, которое обеспечивает максимальное качество, зависит от скорости обучения: чем меньше скорость, тем больше деревьев необходимо. Для оптимизации работы алгоритма, чаще всего, фиксируют количество деревьев, подбирая далее скорость обучения и остальные параметры модели.

Немаловажными параметрами метода являются параметры, позволяющие ограничивать сложность базовых алгоритмов. Например, для деревьев - число листьев. Для градиентного бустинга, как правило, наиболее качественны модели над неглубокими деревьями, глубиной от 3 до 6 листьев.

2.3 Сравнение методов анализа данных для задач прогнозирования и классификации

Вторая глава посвящена рассмотрению методов анализа данных, которые могут быть применимы для решения задач анализа и прогнозирования показателей датчиков системы ИЗ. Сравним рассмотренные методы по следующим параметрам (см. табл.2.3): высокая сложность реализации, высокая скорость выполнения алгоритма, рост точности прогноза с добавлением зависимых переменных, решает задачу прогнозирования, решает задачу классификации.

Таблица 2.3. Сравнения методов анализа данных

Сравниваемая характеристика

Высокая сложность реализации

Увеличение точности с увеличением зависимых переменных

Быстрота выполнения алгоритма

Высокая интерпретируемость

Решает задачу прогнозирования

Решает задачу классификации

Методы анализа данных

Нейронные сети

+

+

+

+

Регрессионный анализ

+

+

+

+

Дерево решений

+

+

+

+

Метод случайных лесов

+

+

+

+

Метод наивного байесовского классификатора

+

+

+

Метод градиентного бустинга

+

+

+

+

Итак, табл.2.3 показывает, что каждый из рассмотренных методов имеет ряд преимуществ и недостатков, а также направлен на решение разных задач.

Для системы ИЗ рассмотренные методы могут быть использованы в качестве основного инструмента анализа данных (см. рис.2.3 - 2.4), т.е. для прогнозирования показателей датчиков системы ИЗ:

1. Определение зависимостей между переменными в исходных данных (например, влияние температур воздуха на улице на температуру батареи), определение значимостей переменных для прогнозирования определенного показателя. В том числе, на основе зависимостей параметров ИЗ могут формироваться отчёты, которые могут помочь СУ принять решение относительно управления ИЗ.

2. Задачи регрессии (например, прогнозирование температуры батареи).

3. Задачи классификации (например, определение человека в помещении, определение возникновения внештатной ситуации).

Рисунок 2.3 Место рассмотренных методов анализа данных в схеме управления ИЗ с модулем анализа данных

Рисунок 2.4 Место рассмотренных методов анализа данных в схеме управления ИЗ без модуля анализа данных

Глава 3. Разработка прототипа модуля анализа и прогнозирования для системы управления ИЗ

В данной главе проводится проектирование модуля анализа и прогнозирования для системы управления ИЗ. Далее на основе спроектированного модуля проводится реализация его прототипа на основе методов анализа данных, рассмотренных ранее.

3.1 Проектирование модуля анализа и прогнозирования для системы управления ИЗ

Модуль анализа и прогнозирования для системы управления ИЗ направлен на получение результата, направленного на упрощение управлением системой ИЗ для СУ или же автоматизацию управления за счёт внедрения интеллектуального модуля. В текущем исследовании рассматриваются два варианта:

1. формирование отчётов. В данном случае модуль анализа и прогнозирования предполагает вывод отчётов СУ (им является человек в данном случае) для принятия решения при настройке поведения контроллера. Данная ситуация описывает случай с наличием контуров А и В, если ссылаться на схему, изображенную на рис. 2.4, т.е. человек принимает активное участие в процессе управления ИЗ;

2. выбор сценария для контроллера. Под сценариями понимается набор правил установления параметров при определенных входных значениях для управления процессами ИЗ. Данный набор сценариев предоставляет контроллеру правила оказания воздействий на ИМ для минимизации потребляемых ресурсов и создани. комфортных условий ИЗ. Таким образом, система может функционировать эффективно с минимальным участием человека в процессе управления ИЗ. Ссылаясь на схему, изображенную на рис. 2.3, описанная ситуация подразумевает наличие трёх контуров: контур А, В и контур С («DM») - выбор сценария из набора сценариев для контроллера в целях эффективного управления системой ИЗ.

Далее рассмотрим более подробно, каким образом может быть спроектирован каждый из рассматриваемых вариантов модуля анализа и прогнозирования для системы управления ИЗ. Первый вариант - система отчётов (см. рис. 3.1) предполагает следующие этапы и последовательность выполнения процессов:

1. Сбор данных. Данные считываются с помощью специальных датчиков каждые несколько минут в зависимости от установленных настроек. Для сбора данных с датчиков необходимо специальное программное обеспечение, например, в качестве инструмента для сбора данных с датчика может быть использована система «ThingsBoard».

2. Хранение данных. Собираемые данные необходимо хранить либо в формате файлов с расширением «.csv», либо данные должны храниться в хранилище данных. В качестве возможных инструментов для хранения данных могут быть использованы такие программные продукты, как Apache Cassandra или InfluxDB;

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.