Разработка модели предиктивной аналитики работоспособности компрессорного оборудования, основанной на анализе диагностических данных
Возможности использования методов машинного обучения для анализа реальных данных по вибрации ключевых узлов центробежного компрессора. Дерево решения для массива данных, полученных в одном из нефтеперерабатывающих заводов. Критерии оценки отказа
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 09.09.2024 |
Размер файла | 448,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Разработка модели предиктивной аналитики работоспособности компрессорного оборудования, основанной на анализе диагностических данных
Садыков Ильгам Радикович, студент (магистрант), 2 курс, Институт нефтегазового инжиниринга и цифровых технологий Уфимский государственный нефтяной технический университет
Аннотация
В статье рассматриваются возможность использования известных методов машинного обучения для анализа отказов нефтегазового оборудования. В качестве исходных данных взят набор реальных данных с одного из нефтеперерабатывающих заводов г. Уфа. Для обработки и интерпретации результатов применен программный комплекс «Python».
Ключевые слова: нефтегазовое оборудование, анализ отказов оборудования, анализ данных, машинное обучение, «деревья принятия решений».
Annotation
The article discusses the possibility of using well-known machine learning methods for oil and gas equipment failure analysis. A set of real data from one of the oil refineries in Ufa was taken as the initial data. The Python software package was used to process and interpret the results.
Key words: oil and gas equipment, equipment failure analysis, data analysis, machine learning, «decision trees».
машинное обучение компрессор
Одним из главных экономических расходов любого нефтегазового предприятия, является ремонт и обслуживание оборудования, поскольку они часто выходят из строя и на их ремонт, зачастую, привлекаются большое количество рабочих и в ходе ремонта объект простаивает без работы. В связи с этим возникает следующая задача: научиться прогнозировать отказы оборудования для своевременной ревизии всех узлов и деталей, четкого планирования ремонтных работ (совмещая их с плановыми остановами оборудования), а также выявления скрытых закономерностей отказов.
Поскольку большинство современных предприятий оснащены высокоточными датчиками, тщательный анализ записанных значений может показать пути прогнозирования отказов.
В работе рассмотрены возможности использования методов машинного обучения для анализа реальных данных по вибрации ключевых узлов центробежного компрессора. Так как машинное обучение - это класс методов автоматического создания прогнозных моделей на основе большого массива данных этот инструмент лучше всего подходит для обработки вышеупомянутых параметров.
Одним из надежных методов машинного обучения является метод «деревьев решений», который представляет собой древовидную структуру, похожую на блок-схему, где внутренний узел представляет функцию, ветвь представляет правило решения, а каждый конечный узел представляет результат. Он учится разделять на основе значения атрибута, которое называется пороговым значением[1].
На рисунке 1 представлено дерево решения для массива данных, в котором «node №0» корневой узел с которого начинается расщепление значений. «Хп» означает параметр, по которому происходит расщепление. Например: Xi - возраст, Х2 - зарплата, Х3 - пол и т.д. «Samples» - количество либо доля значений, входящих в массив данных; «value» - количество либо доля значений, отнесенных в каждый класс (0 или 1). Цвета обозначают принадлежность узла (по большинству значений) к классам объектов. Чем темнее цвет, тем большая доля значений принадлежат к конкретному классу. Светлые цвета обозначают равенство, представленных в узле классов.
Рисунок 1. Дерево принятия решений
Описанный выше алгоритм в данном случае, обучаясь на тренировочных данных, выявил те диапазоны значений параметров, в которых ранее происходили остановы либо отказы оборудования. Опираясь на эти данные, дерево построило модель для вновь поступивших значений[2].
Предметом изучения данной исследовательской работы является массив реальных данных полученных в одном из нефтеперерабатывающих заводов г. Уфа. Данные представляют собой значения параметров вибрации (виброперемещения в мкм) центробежного компрессорного агрегата, которые были записаны в течение двух лет через каждые 12 часов, что составляет 1464 строк в программе «excel». Также известны даты, в которых произошли остановы оборудования.
Для исследования набора данных дни, в которых происходили остановы оборудования, промаркированы цифрой «1» безотказные дни цифрой «0». Для достоверного анализа массива данных было предположено, что дефект зарождался задолго до дня остановки. Поэтому цифрой «1» были пронумерованы предыдущие 15 значений до отказа. Данный прием позволил исключить влияние «выбросов» на конечный результат.
По причине отсутствия большого количества данных тестовый набор был спроектирован самостоятельно в отдельном файле «test», из имеющегося массива обучающей выборки «train», путем отбора 3-го и 10-го (из 15) строк остановов. По правилам машинного обучения тестовая выборка должна составлять 20% от обучающей выборки (в данном случае должно быть 293 строки). Поэтому, оставшиеся строки заполняем строками, метки которых равны нулю.
В начале исследований «дерево решений» показывает 45% точности прогнозов, что не является приемлемым результатом для прогнозирования отказов.
Для увеличения показателей точности вручную были подобраны значения внутренних параметров дерева, куда относится: глубина дерева и количество элементов в узле разбиения. Они составили 9 и 2 соответственно. После корректировки внутренних параметров «дерева решений» точность повысилась до 89%, что вполне приемлемый результат для условий ограниченных данных. В общем виде схема проведения исследований выглядит, как показано на рисунке 2.
Анализ результатов исследования показал, что остановы случались в те моменты, когда показания значений вибраций находились за пределами определенных значений. Так, параметр который зашифрован как «Х9» должен работать в диапазоне от 22,1 до 42,6 мкм; «Хв» - до 0,07 мкм; «Хо» - до 2,1 мкм; Х11 - от 50,4 до 60,5 мкм. Отклонения значений за пределы указанных могут привезти к отказам оборудования.
Модель рекомендуется применять в дальнейших анализах отказов оборудования как дополнительный критерий оценки отказа, так как на данном этапе недостаточная база данных работы динамического оборудования не позволяют провести гиперплоскость между данными безотказного режима работы и отказами оборудования. Для дальнейшего исследования требуется генерация новых признаков, из существующих наборов данных, и большее количество измерений.
Рисунок 2. Блок-схема исследовательской работы
Использованные источники
1. Хенрик Бринк, Машинное обучение/ Хенрик Бринк. - Санкт Петербург: Изд-во ООО «Питер Пресс», 2017. - С. 15-55.
2. Лекция 10. Деревья классификации и регрессии
Размещено на Allbest.ru
...Подобные документы
Понятие и критерии классификации баз данных. Характеристика совокупностей элементов данных: массив, дерево, запись. Компоненты любой модели данных. Способы размещения значений элементов в физической записи. Методы доступа к данным: дерево, хеширование.
реферат [84,7 K], добавлен 22.11.2010Сбор ключевой статистики по интерфейсам, проведение аналитики и выдвижение гипотез по улучшению продукта. Рассмотрение методов анализа данных на базе конкретного проекта. Расположение инструментов на экране и порядок взаимодействия с ними у пользователя.
курсовая работа [664,7 K], добавлен 01.01.2018Обзор архитектуры СУБД SQL Server. Описание и анализ областей применения средств бизнес-аналитики, таких как многомерный анализ данных и интеллектуальный анализ данных. Обзор языковых средств, методов и экспериментальное применение полученных сведений.
дипломная работа [2,2 M], добавлен 09.07.2014Понятие и назначение, принципы построения и внутренняя структура системы управления базами данных, их функциональные особенности и возможности, критерии оценки эффективности. Языковые и программные средства. Использование SQL, типы и модели данных.
презентация [677,3 K], добавлен 18.03.2015Разработка программного обеспечения для анализа полученных из хранилища данных. Система SAS Enterprise Miner и система Weka. Расчёт капитальных затрат на создание ПМК для анализа полученных из хранилища данных с использованием библиотеки XELOPES.
дипломная работа [1,4 M], добавлен 07.06.2012Определенная логическая структура данных, которые хранятся в базе данных. Основные модели данных. Элементы реляционной модели данных. Пример использования внешних ключей. Основные требования, предъявляемые к отношениям реляционной модели данных.
презентация [11,7 K], добавлен 14.10.2013Общая характеристика организации массива в виде двоичного дерева. Особенности линейного и двоичного поиска заданного элемента массива. Методика упорядочения массива методом сортировки деревом. Инструкции и текст программы для нечисленной обработки данных.
курсовая работа [242,3 K], добавлен 12.11.2010Разработка программной системы для поддержки генеалогических деревьев. Модели вариантов использования и анализа системы. Морфологическая и функциональная модели, диаграммы состояний, деятельности и взаимодействия. Хранение сведений в базах данных.
курсовая работа [535,2 K], добавлен 01.02.2013Автоматизированные информационные системы: понятие и структура, функции и методика разработки. История развития данных технологий, этапы и принципы их проектирования. Разработка и главные критерии оценки эффективности ER-модели базы данных магазина.
контрольная работа [443,2 K], добавлен 02.04.2015Разработка на языке ассемблера алгоритма контроля, на циклический CRC-код, массива данных хранящегося в некоторой области памяти. Сохранение кода для последующей периодической проверки массива данных. Сообщение об искажении данных. Описание алгоритма.
курсовая работа [453,0 K], добавлен 27.02.2009Организация данных с помощью бинарных деревьев. Определение бинарного дерева. Упорядоченное двоичное дерево поиска и его свойства. Программная реализация добавления данных в упорядоченное двоичное дерево с использованием динамических структур данных.
курсовая работа [459,0 K], добавлен 09.08.2012Определение базы данных и банков данных. Компоненты банка данных. Основные требования к технологии интегрированного хранения и обработки данных. Система управления и модели организации доступа к базам данных. Разработка приложений и администрирование.
презентация [17,1 K], добавлен 19.08.2013Определение многомерной модели данных для удовлетворения основных информационных потребностей предприятия. Экстракция, загрузка и перенос данных из различных источников данных. Разработка собственных ETL–систем. Оптимизация работы хранилища данных.
презентация [9,1 M], добавлен 25.09.2013Понятие базы данных, модели данных. Классификация баз данных. Системы управления базами данных. Этапы, подходы к проектированию базы данных. Разработка базы данных, которая позволит автоматизировать ведение документации, необходимой для деятельности ДЮСШ.
курсовая работа [1,7 M], добавлен 04.06.2015Описание процедуры выбора структуры хранения данных. Программная реализация одномерного неоднородного массива. Представление бинарного дерева в виде динамической структуры данных. Изучение способов поиска в упорядоченном дереве. Содержание базы данных.
практическая работа [850,0 K], добавлен 16.04.2015Рассмотрение правил записи, способов ввода и вывода, использования функций обработки символьных данных в Pascal. Описание алгоритмизации и программирования файловых структур данных, проектирования структуры файла. Ознакомление с работой данных массива.
курсовая работа [336,2 K], добавлен 27.06.2015Принципы и критерии построения распределенных баз данных. Ряд свойств, которым по К. Дейту должна удовлетворять распределенная база данных: независимость узлов, прозрачность расположения, обработка распределенных запросов. Типы распределенных баз данных.
реферат [131,5 K], добавлен 18.06.2013Модели баз данных. Локальная, файл-серверная, клиент-серверная и распределенная архитектуры. Технология BDE для доступа к данным. Драйверы баз данных. Создание таблицы, интерфейс программы, дерево объектов, инсталлятор. Системы визуальной разработки.
курсовая работа [989,5 K], добавлен 04.06.2013Представление (построение, создание) списка данных в виде линейного однонаправленного списка. Формирование массива данных. Вывод данных на экран. Алгоритм удаления, перемещения данных. Сортировка методом вставки. Алгоритм загрузки данных из файла.
курсовая работа [2,1 M], добавлен 16.05.2015Основные понятия реляционной модели данных. Отношение атрибутов внутри модели. Контроль ссылочной целостности (анализ содержимого ключевых полей связанных таблиц). Нормализация отношений реляционной базы данных. Теоретико-множественные операции.
реферат [69,8 K], добавлен 19.12.2011